ES2704701T3 - Nuevo protocolo de preparación de bibliotecas de secuenciación - Google Patents

Nuevo protocolo de preparación de bibliotecas de secuenciación Download PDF

Info

Publication number
ES2704701T3
ES2704701T3 ES17180803T ES17180803T ES2704701T3 ES 2704701 T3 ES2704701 T3 ES 2704701T3 ES 17180803 T ES17180803 T ES 17180803T ES 17180803 T ES17180803 T ES 17180803T ES 2704701 T3 ES2704701 T3 ES 2704701T3
Authority
ES
Spain
Prior art keywords
chromosome
sequencing
sequence
fetal
maternal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES17180803T
Other languages
English (en)
Inventor
Richard P Rava
Manjula Chinnappa
David A Comstock
Gabrielle Heilek
Brian Kent Rhees
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Verinata Health Inc
Original Assignee
Verinata Health Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44307118&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=ES2704701(T3) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Verinata Health Inc filed Critical Verinata Health Inc
Application granted granted Critical
Publication of ES2704701T3 publication Critical patent/ES2704701T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B99/00Subject matter not provided for in other groups of this subclass
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6872Methods for sequencing involving mass spectrometry
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B30/00Methods of screening libraries
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/40ICT specially adapted for the handling or processing of patient-related medical or healthcare data for data related to laboratory analysis, e.g. patient specimen analysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2545/00Reactions characterised by their quantitative nature
    • C12Q2545/10Reactions characterised by their quantitative nature the purpose being quantitative analysis
    • C12Q2545/101Reactions characterised by their quantitative nature the purpose being quantitative analysis with an internal standard/control
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)

Abstract

Un método para preparar una biblioteca de secuenciación a partir de una muestra de prueba que comprende moléculas de ácido nucleico, en donde el método comprende los pasos consecutivos de la reparación de extremos, la cola de dA y el adaptador que ligan dichos ácidos nucleicos, y en el que dichos pasos consecutivos excluyen la purificación de los productos reparados de forma final antes de la etapa de la cola de dA y excluyen la purificación de los productos de cola de dA antes del paso de ligadura del adaptador.

Description

DESCRIPCIÓN
Nuevo protocolo de preparación de bibliotecas de secuenciación
2. ANTECEDENTES DE LA INVENCIÓN.
[0001] La detección y el diagnóstico prenatales son una parte rutinaria de la atención prenatal. Actualmente, el diagnóstico prenatal de afecciones genéticas y cromosómicas involucra pruebas invasivas, como la amniocentesis o el muestreo de vellosidades coriónicas (CVS), realizadas a partir de las 11 semanas de gestación y con un riesgo de aborto > 1%. La existencia de ADN libre de células en circulación en la sangre materna (Lo et al., Lancet 350: 485­ 487 [1997]) se está explotando para desarrollar procesos no invasivos que utilizan ácidos nucleicos fetales de una muestra de sangre periférica materna para determinar anomalías del cromosoma fetal. (Fan HC y Quake SR Anal Chem 79: 7576-7579 [2007]; Fan et al., Proc Natl Acad Sci 105: 16266-16271 [2008]). Estos métodos ofrecen una fuente alternativa y más segura de material genético fetal para el diagnóstico prenatal, y podrían pronunciar de manera efectiva el final de los procedimientos invasivos.
[0002] La secuenciación de ácidos nucleicos está evolucionando rápidamente como una técnica de diagnóstico en el laboratorio clínico. Las aplicaciones que involucran la secuenciación se observan en varias áreas, incluidas las pruebas de cáncer que abarcan pruebas genéticas para la predisposición al cáncer y la evaluación de mutaciones genéticas en el cáncer; la genética abarca las pruebas de portador y el diagnóstico de enfermedades transmitidas genéticamente; y microbiología que abarca genotipos virales y secuencias asociadas con resistencia a fármacos.
[0003] El advenimiento de tecnologías de secuenciación de próxima generación (NGS) que permiten la secuenciación de genomas enteros en tiempo relativamente corto, ha proporcionado la oportunidad de comparar el material genético procedente de un cromosoma a ser comparada con la de otro sin los riesgos asociados con metodos de muestreo invasivo. Sin embargo, las limitaciones de los métodos existentes, que incluyen una sensibilidad insuficiente derivada de los niveles limitados de ADNcf, y el sesgo de secuenciación de la tecnología derivada de la naturaleza inherente de la información genómica, subyacen a la necesidad continua de métodos no invasivos que proporcionen cualquiera o todos de la especificidad, la sensibilidad y la aplicabilidad para diagnosticar de manera confiable las aneuploidías fetales en una variedad de entornos clínicos.
[0004] Ya que la secuenciación de ácido nucleico ha entrado en el área clínica para las pruebas de cáncer, organizaciones tales como la NCCLS (Consejo Nacional de Servicios de Laboratorio clínico) y la Asociación de la Citogenética Clínica han proporcionado pautas para la normalización de las pruebas basadas en secuenciación existentes que utilizan secuenciación de extensión de cebador, terminada en didesoxi, basada en PCR realizada en gel o capilar (NCCLS: Nucleic Acid Sequencing Methods in Diagnostic Laboratory Medicine MM9-A, Vol. 24 Núm.
40), Secuenciación de Sanger y QF-PCR (Asociación para la Sociedad de Citogenética Clínica y Genética Molecular Clínica, Guías de práctica para el análisis e interpretación de secuenciación de Sanger ratificada por el Comité Ejecutivo de CMGS el 7 de agosto de 2009, disponible en la dirección web cmgs.org/BPGs/pdfs%20current%20bpgs/Sequencingv2.pdf QF-PCR para el diagnóstico de las mejores guías de aneuploidía (2007) v2.01). Las directrices se basan en pruebas de consenso de varios protocolos y, entre otras cosas, tienen como objetivo reducir la aparición de eventos adversos en el laboratorio clínico, por ejemplo, mezclas de muestras, al tiempo que se preserva la calidad y la fiabilidad de los ensayos. Ya que los laboratorios clínicos ya están experimentando con NIPD, se desarrollarán procedimientos de calidad para implementar las nuevas tecnologías de secuenciación para proporcionar sistemas de atención de salud apropiados y seguros.
[0005] Chu et al. (Bioinformatics, 25 (10), mayo de 2009, páginas 1244-1250) describe un " Statistical model for whole genome sequencing and its application to minimally invasive diagnosis of fetal genetic disease".
[0006] La presente invención se refiere a métodos de secuenciación de nueva generación fiables que son aplicables al menos para la práctica de diagnóstico prenatal no invasivo, y abarca los procedimientos que aumentan la rapidez y la calidad de los métodos y reducir al mínimo la pérdida de material, y reducir la probabilidad de errores de muestra
3. RESUMEN DE LA INVENCION.
[0007] La invención se define por las reivindicaciones adjuntas. La invención proporciona un método para preparar una biblioteca de secuenciación a partir de una muestra de prueba que comprende moléculas de ácido nucleico, en donde el método comprende los pasos consecutivos de la reparación de los extremos, las colas de dA y el adaptador que ligan dichos ácidos nucleicos, y en donde dichos pasos consecutivos excluyen la purificación de los productos reparados de extremo antes de la etapa de colas de dA y excluyen la purificación de los productos de colas de dA antes de la etapa de ligadura adaptadora.
[0008] La invención también proporciona el uso de una biblioteca de secuenciación preparada de acuerdo con el método de la invención en un método de secuenciación de ácido nucleico.
[0009] La presente descripción también se refiere a métodos para determinar la aneuploidía y/o fracción fetal en muestras maternas comprenden ADNcf fetal y materna por secuenciación masiva en paralelo. El método comprende un protocolo novedoso para preparar bibliotecas de secuenciación que inesperadamente mejora la calidad del ADN de la biblioteca mientras que acelera el proceso de análisis de muestras para diagnósticos prenatales.
[0010] En una realización, se da a conocer en el presente documento un método para determinar una aneuploidía cromosómica fetal en una muestra de sangre materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en donde el método comprende: (a) preparar una biblioteca de secuenciación de la mezcla de moléculas de ácido nucleico maternas y fetales; en donde la preparación de dicha biblioteca comprende los pasos consecutivos de la reparación del extremo, la cola de dA y la unión del adaptador a dichos ácidos nucleicos; (b) secuenciar al menos una porción de las moléculas de ácido nucleico, obteniendo así información de secuencia para una pluralidad de moléculas de ácido nucleico maternas y fetales de una muestra de sangre materna; (c) usar la información de secuencia para obtener una dosis de cromosoma para un cromosoma aneuploide; y (d) comparar la dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal.
[0011] En otra realización, se da a conocer en el presente documento un método para determinar una aneuploidía cromosómica fetal en una muestra de sangre materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en donde el método comprende: (a) preparar una biblioteca de secuenciación de la mezcla de moléculas de ácido nucleico maternas y fetales; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos; (b) secuenciar al menos una porción de las moléculas de ácido nucleico, obteniendo así información de secuencia para una pluralidad de moléculas de ácido nucleico maternas y fetales de una muestra de sangre materna; (c) usar la información de secuencia para obtener una dosis de cromosoma para un cromosoma aneuploide; y (d) comparar la dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. El método comprende además usar la información de secuencia para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador y para un cromosoma aneuploide; y el uso del número de etiquetas de secuencia mapeadas identificadas para dicho cromosoma aneuploide y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador para calcular una dosis de cromosoma para dicho cromosoma aneuploide como una proporción del número de etiquetas de secuencia mapeadas identificadas para dicho cromosoma aneuploide y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador. Opcionalmente, el cálculo de la dosis cromosómica comprende (i) calcular una relación de densidad de etiqueta de secuencia para el cromosoma aneuploide, relacionando el número de etiquetas de secuencia mapeadas identificadas para el cromosoma aneuploide en el paso con la longitud de dicho cromosoma aneuploide; (ii) calcular una relación de densidad de etiqueta de secuencia para al menos un cromosoma normalizador, relacionando el número de etiquetas de secuencia mapeadas identificadas para dicho al menos un cromosoma normalizador con la longitud de al menos un cromosoma normalizador; y (iii) usar las relaciones de densidad de etiquetas de secuencia calculadas en los pasos (i) y (ii) para calcular una dosis de cromosoma para el cromosoma aneuploide, en donde la dosis de cromosoma se calcula como la proporción de la relación de densidad de etiquetas de secuencia para el cromosoma aneuploide y la relación de densidad de la etiqueta de secuencia para al menos un cromosoma normalizador.
[0012] En otra realización, se da a conocer en el presente documento un método para determinar una aneuploidía cromosómica fetal en una muestra de sangre materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en donde el método comprende: (a) preparar una biblioteca de secuenciación de la mezcla de moléculas de ácido nucleico maternas y fetales; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos; (b) secuenciar al menos una porción de las moléculas de ácido nucleico, obteniendo así información de secuencia para una pluralidad de moléculas de ácido nucleico maternas y fetales de una muestra de sangre materna; (c) usar la información de secuencia para obtener una dosis de cromosoma para un cromosoma aneuploide; y (d) comparar la dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. El método comprende además usar la información de secuencia para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador y para un cromosoma aneuploide; y el uso del número de etiquetas de secuencia mapeadas identificadas para dicho cromosoma aneuploide y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador para calcular una dosis de cromosoma para dicho cromosoma aneuploide como una proporción del número de etiquetas de secuencia mapeadas identificadas para dicho cromosoma aneuploide y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador. Al menos un cromosoma normalizador es un cromosoma que tiene la variabilidad más pequeña y/o la mayor diferenciabilidad. Opcionalmente, el cálculo de la dosis cromosómica comprende (i) calcular una relación de densidad de etiqueta de secuencia para el cromosoma aneuploide, relacionando el número de etiquetas de secuencia mapeadas identificadas para el cromosoma aneuploide en el paso con la longitud de dicho cromosoma aneuploide; (ii) calcular una relación de densidad de etiqueta de secuencia para al menos un cromosoma normalizador, relacionando el número de etiquetas de secuencia mapeadas identificadas para dicho al menos un cromosoma normalizador con la longitud de al menos un cromosoma normalizador; y (iii) usar las relaciones de densidad de etiquetas de secuencia calculadas en los pasos (i) y (ii) para calcular una dosis de cromosoma para el cromosoma aneuploide, en donde la dosis de cromosoma se calcula como la proporción de la relación de densidad de etiquetas de secuencia para el cromosoma aneuploide y la relación de densidad de la etiqueta de secuencia para al menos un cromosoma normalizador.
[0013] En otra realización, se da a conocer en el presente documento un método para determinar una aneuploidía cromosómica fetal en una muestra de sangre materna comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos, en donde el método comprende: (a) preparar una biblioteca de secuenciación de la mezcla de moléculas de ácido nucleico maternas y fetales; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos; (b) secuenciar al menos una porción de las moléculas de ácido nucleico, obteniendo así información de secuencia para una pluralidad de moléculas de ácido nucleico maternas y fetales de una muestra de sangre materna; (c) usar la información de secuencia para obtener una dosis de cromosoma para un cromosoma aneuploide; y (d) comparar la dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. El método comprende además usar la información de secuencia para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador y para un cromosoma aneuploide; y usando el número de etiquetas de secuencia mapeadas identificadas para dichos cromosomas aneuploides y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizado para calcular una dosis de cromosoma para dicho cromosoma aneuploide como una proporción de la cantidad de etiquetas de secuencia mapeadas identificadas para dicho cromosoma aneuploide y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizante. Opcionalmente, el cálculo de la dosis cromosómica comprende (i) calcular una relación de densidad de etiqueta de secuencia para el cromosoma aneuploide, relacionando el número de etiquetas de secuencia mapeadas identificadas para el cromosoma aneuploide en el paso con la longitud de dicho cromosoma aneuploide; (ii) calcular una relación de densidad de etiqueta de secuencia para al menos un cromosoma normalizador, relacionando el número de etiquetas de secuencia mapeadas identificadas para dicho al menos un cromosoma normalizador con la longitud de al menos un cromosoma normalizador; y (iii) usar las relaciones de densidad de etiquetas de secuencia calculadas en los pasos (i) y (ii) para calcular una dosis de cromosoma para el cromosoma aneuploide, en donde la dosis de cromosoma se calcula como la proporción de la relación de densidad de etiquetas de secuencia para el cromosoma aneuploide y la relación de densidad de la etiqueta de secuencia para al menos un cromosoma normalizador. En realizaciones en las que el cromosoma aneuploide es el cromosoma 21, al menos un cromosoma normalizante se selecciona entre el cromosoma 9, el cromosoma 1, el cromosoma 2, el cromosoma 11, el cromosoma 12 y el cromosoma 14. Alternativamente, el al menos un cromosoma normalizador para el cromosoma 21 es un grupo de cromosomas seleccionados entre el cromosoma 9, el cromosoma 1, el cromosoma 2, el cromosoma 11, el cromosoma 12 y el cromosoma 14. En realizaciones en las que el cromosoma aneuploide es el cromosoma 18, el al menos un cromosoma normalizador se selecciona del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 5, cromosoma 6, cromosoma 12 y cromosoma 14. Alternativamente, el al menos un cromosoma normalizador para el cromosoma 18 es un grupo de cromosomas seleccionados del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 5, cromosoma 6, el cromosoma 12 y el cromosoma 14. En realizaciones cuando el cromosoma aneuploide es el cromosoma 13, al menos un cromosoma normalizante se selecciona del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6 y cromosoma 8. Alternativamente, el al menos un cromosoma normalizador para el cromosoma 13 es un grupo de cromosomas seleccionados del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6 y cromosoma 8. En realizaciones en las que el cromosoma aneuploide es el cromosoma X, al menos un cromosoma normalizante se selecciona entre el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 5, el cromosoma 6 y el cromosoma 8. Alternativamente, el al menos un cromosoma normalizador para el cromosoma X es un grupo de cromosomas seleccionados entre el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 5, el cromosoma 6 y el cromosoma 8.
[0014] La muestra maternal utilizada en las realizaciones del método para determinar una aneuploidía cromosómica fetal es un fluido biológico seleccionado a partir de sangre, plasma, suero, orina y saliva. Preferiblemente, la muestra materna es una muestra de plasma. En algunas realizaciones, las moléculas de ácido nucleico comprendidas en la muestra materna son moléculas de ADN libres de células. En algunas realizaciones, los pasos consecutivos comprendidos en la preparación de la biblioteca de secuenciación se realizan en menos de una hora. Preferiblemente, los pasos consecutivos se realizan en ausencia de polietilenglicol. Más preferiblemente, los pasos consecutivos excluyen la purificación. La secuenciación de la biblioteca de secuenciación se realiza mediante los métodos de secuenciación de la próxima generación (NGS). En algunas realizaciones, la secuenciación comprende una amplificación. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela que utiliza la secuenciación por síntesis con terminadores de tinte reversibles. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela utilizando la secuenciación por ligadura. En otras realizaciones más, la secuenciación es la secuenciación de una sola molécula.
[0015] En otra realización, se da a conocer en el presente documento un método para determinar la presencia o ausencia de una aneuploidía en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) preparar una biblioteca de secuenciación a partir de la mezcla; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos maternos y fetales; (b) secuenciar al menos una parte de la biblioteca de secuenciación, en la que la secuencia comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) con base en la secuenciación, determinando la presencia o ausencia de aneuploidía en la muestra.
[0016] En otra realización, se da a conocer en el presente documento un método para determinar la presencia o ausencia de una aneuploidía cromosómica o parcial en una muestra materna que comprende una mezcla de ácidos nucleicos fetales y maternas, en donde el método comprende: (a) preparar una biblioteca de secuenciación de la mezcla; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos maternos y fetales; (b) secuenciar al menos una parte de la biblioteca de secuenciación, en la que la secuencia comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en función de la secuenciación, la determinación de la presencia o ausencia de la aneuploidía cromosómica o parcial en la muestra.
[0017] En otra realización, se da a conocer en el presente documento un método para determinar la presencia o ausencia de una aneuploidía cromosómica en una muestra materna que comprende una mezcla de ácidos nucleicos fetales y maternas, en donde el método comprende: (a) preparar una biblioteca de secuenciación a partir de la mezcla; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos maternos y fetales; (b) secuenciar al menos una parte de la biblioteca de secuenciación, en la que la secuencia comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) con base en la secuenciación, determinando la presencia o ausencia de la aneuploidía cromosómica en la muestra. Las aneuploidías cromosómicas que pueden determinarse de acuerdo con el método incluyen trisomía 8, trisomía 13, trisomía 15, trisomía 16, trisomía 18, trisomía 21, trisomía 22, monosomía X y XXX.
[0018] En otra realización, se da a conocer en el presente documento un método para determinar la presencia o ausencia de una aneuploidía cromosómica o parcial en una muestra materna que comprende una mezcla de ácidos nucleicos fetales y maternas, en donde el método comprende: (a) preparar una biblioteca de secuenciación de la mezcla; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos maternos y fetales; (b) secuenciar al menos una parte de la biblioteca de secuenciación, en la que la secuencia comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) en función de la secuenciación, la determinación de la presencia o ausencia del cromosoma o una aneuploidía parcial en la muestra que comprende calcular una dosis de cromosoma en función del número de dichas etiquetas de secuencia para un cromosoma de interés y para un cromosoma de normalización, y comparar dicha dosis a un valor umbral.
[0019] En otra realización, se da a conocer en el presente documento un método para determinar la presencia o ausencia de una aneuploidía cromosómica en una muestra materna que comprende una mezcla de ácidos nucleicos fetales y maternos, en donde el método comprende: (a) preparar una biblioteca de secuenciación a partir la mezcla; en donde la preparación de dicha biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichos ácidos nucleicos maternos y fetales; (b) secuenciar al menos una parte de la biblioteca de secuenciación, en la que la secuencia comprende proporcionar una pluralidad de etiquetas de secuencia; y (c) basándose en la secuenciación, determinar la presencia o ausencia de la aneuploidía cromosómica en la muestra que comprende calcular una dosis cromosómica basada en el número de dichas etiquetas de secuencia para un cromosoma de interés y para un cromosoma normalizador, y comparar dicha dosis con un valor de umbral. Las aneuploidías cromosómicas que pueden determinarse de acuerdo con el método incluyen trisomía 8, trisomía 13, trisomía 15, trisomía 16, trisomía 18, trisomía 21, trisomía 22, monosomía X y XXX.
[0020] La muestra maternal utilizada en las realizaciones del método para determinar la presencia o ausencia de una aneuploidía es un fluido biológico seleccionado a partir de sangre, plasma, suero, orina y saliva. Preferiblemente, la muestra materna es una muestra de plasma. En algunas realizaciones, las moléculas de ácido nucleico comprendidas en la muestra materna son moléculas de ADN libres de células. En algunas realizaciones, los pasos consecutivos comprendidos en la preparación de la biblioteca de secuenciación se realizan en menos de una hora. Preferiblemente, los pasos consecutivos se realizan en ausencia de polietilenglicol. Más preferiblemente, los pasos consecutivos excluyen la purificación. La secuenciación de la biblioteca de secuenciación se realiza mediante los métodos de secuenciación de la próxima generación (NGS). En algunas realizaciones, la secuenciación comprende una amplificación. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela que usa la secuenciación por síntesis con terminadores de tinte reversibles. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela utilizando la secuenciación por ligadura. En otras realizaciones más, la secuenciación es la secuenciación de una sola molécula.
[0021] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla; (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación final, cola de dA y adaptador de ligadura de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0022] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla; (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en donde la preparación de la biblioteca comprende las etapas consecutivas de reparación final, cola dA y adaptador de ligadura de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. La determinación de la fracción comprende determinar el número de etiquetas de secuencia fetal y materna mapeadas a un genoma diana de referencia que comprende al menos un ácido nucleico polimórfico. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0023] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de dicha pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de nucleótido único (SNP); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0024] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de dicha pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de nucleótido único (SNP); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a) en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación final, cola dA y adaptador de ligadura de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. La determinación de la fracción comprende determinar el número de etiquetas de secuencia fetal y materna mapeadas a un genoma diana de referencia que comprende al menos un ácido nucleico polimórfico. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0025] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de dicha pluralidad de ácido nucleico diana polimórfico comprende al menos una repetición corta en tándem (STR); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación final, cola dA y adaptador de ligadura de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0026] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de dicha pluralidad de ácido nucleico diana polimórfico comprende al menos una repetición corta en tándem (STR); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación final, cola dA y adaptador de ligadura de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. La determinación de la fracción comprende determinar el número de etiquetas de secuencia fetal y materna mapeadas a un genoma diana de referencia que comprende al menos un ácido nucleico polimórfico. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0027] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de la pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de nucleótido (SNP); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación final, cola dA y adaptador de ligadura de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. En realizaciones en las que cada uno de la pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de un solo nucleótido (SNP), el SNP se selecciona de entre rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. En realizaciones en las que cada uno de la pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de nucleótido (SNP), el al menos un SNP es un SNP en tándem seleccionado de pares de SNP en tándem rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959-rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0028] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de dicha pluralidad de ácido nucleico diana polimórfico comprende al menos una repetición corta en tándem (STR); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basado en dicha secuenciación, determinando la fracción del ácido nucleico fetal y moléculas. El al menos un STR se selecciona entre CSF1PO, FGA, TH01, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045. D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627, y D1GATA113. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0029] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de la pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de nucleótido (SNP); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. La determinación de la fracción comprende determinar el número de etiquetas de secuencia fetal y materna mapeadas a un genoma diana de referencia que comprende al menos un ácido nucleico polimórfico. En realizaciones en las que cada uno de la pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de un solo nucleótido (SNP), el SNP se selecciona de entre rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. En realizaciones en las que cada uno de la pluralidad de ácidos nucleicos diana polimórficos comprende al menos un polimorfismo de nucleótido (SNP), el al menos un SNP es un SNP en tándem seleccionado de pares de SNP en tándem rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989- rs13047336; rs987980-rs987981; rs4143392- rs4143391; rs1691324- rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102- rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986- rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0030] En otra realización, se da a conocer en el presente documento un método para determinar la fracción de moléculas de ácidos nucleicos fetales en una muestra materna que comprende una mezcla de moléculas de ácido nucleico fetal y materno, en donde el método comprende: (a) amplificar una pluralidad de ácidos nucleicos diana polimórficos en una porción de la mezcla, en donde cada uno de dicha pluralidad de ácido nucleico diana polimórfico comprende al menos una repetición corta en tándem (STR); (b) preparar una biblioteca de secuenciación del producto amplificado obtenido en la etapa (a), en la que la preparación de la biblioteca comprende las etapas consecutivas de reparación de extremos, colas de dA y ligadura con adaptador de dichas moléculas de ácido nucleico maternas y fetales; (c) secuenciar al menos una parte de la biblioteca de secuenciación; y (d) basándose en dicha secuenciación, determinando la fracción de las moléculas de ácido nucleico fetal. La determinación de la fracción comprende determinar el número de etiquetas de secuencia fetal y materna mapeadas a un genoma diana de referencia que comprende al menos un ácido nucleico polimórfico. El al menos un STR se selecciona entre CSF1PO, FGA, TH01, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627, and D1GATA113. Opcionalmente, el método puede comprender además determinar la presencia o ausencia de aneuploidía en la muestra materna.
[0031] La muestra materna utilizada en las realizaciones del método para determinar la fracción de moléculas de ácido nucleico fetal, es un fluido biológico seleccionado de sangre, plasma, suero, orina y saliva. Preferiblemente, la muestra materna es una muestra de plasma. En algunas realizaciones, las moléculas de ácido nucleico comprendidas en la muestra materna son moléculas de ADN libres de células. En algunas realizaciones, los pasos consecutivos comprendidos en la preparación de la biblioteca de secuenciación se realizan en menos de una hora. Preferiblemente, los pasos consecutivos se realizan en ausencia de polietilenglicol. Más preferiblemente, los pasos consecutivos excluyen la purificación. La secuenciación de la biblioteca de secuenciación se realiza mediante los métodos de secuenciación de la próxima generación (NGS). En algunas realizaciones, la secuenciación comprende una amplificación. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela que usa la secuenciación por síntesis con terminadores de tinte reversibles. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela utilizando la secuenciación por ligadura. En otras realizaciones más, la secuenciación es la secuenciación de una sola molécula.
[0032] En otra realización, se da a conocer en el presente documento un medio legible por ordenador que tiene almacenado en el mismo instrucciones legibles por computadora para llevar a cabo el método para determinar la presencia o ausencia de una aneuploidía por ejemplo una aneuploidía cromosómica fetal, en una muestra de sangre materna que comprende una mezcla de moléculas de ácidos nucleicos fetales y maternos.
[0033] En una realización, el medio legible por ordenador que ha almacenado en el mismo instrucciones legibles por ordenador para llevar a cabo el método comprende las etapas de (a) utilizar información de la secuencia obtenida a partir de una pluralidad de moléculas de ácido nucleico fetal y materno en una muestra de plasma materno a identificar una serie de etiquetas de secuencia mapeadas para un cromosoma de interés; (b) usar información de secuencia obtenida de una pluralidad de moléculas de ácido nucleico materno y fetal en una muestra de plasma materno para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador; (c) usar el número de etiquetas de secuencia mapeadas identificadas para un cromosoma de interés en el paso (a) y el número de etiquetas de secuencia mapeadas identificadas para el al menos un cromosoma normalizador en el paso (b) para calcular una dosis de cromosoma para dicho cromosoma de interés; y (d) comparar dicha dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. Los cromosomas de interés pueden ser cualquiera de los cromosomas 21, 13, 18 y X.
[0034] En otra realización, se da a conocer en el presente documento un sistema de procesamiento de ordenador que se adapta o configura para realizar el método para determinar la presencia o ausencia de una aneuploidía por ejemplo una aneuploidía cromosómica fetal, en una muestra de sangre materna comprende una mezcla de fetal y moléculas de ácidos nucleicos maternos.
[0035] En una realización, el sistema de procesamiento de ordenador está adaptado o configurado para realizar los pasos siguientes: (a) el uso de información de la secuencia obtenida a partir de una pluralidad de moléculas de ácido nucleico fetal y materno en una muestra de plasma materno para identificar un número de mapeado etiquetas de secuencia para un cromosoma de interés; (b) usar información de secuencia obtenida de una pluralidad de moléculas de ácido nucleico materno y fetal en una muestra de plasma materno para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador; (c) usar el número de etiquetas de secuencia mapeadas identificadas para un cromosoma de interés en el paso (a) y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizado en el paso (b) para calcular una dosis de cromosoma para un cromosoma interesar; y (d) comparar dicha dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. Los cromosomas de interés pueden ser cualquiera de los cromosomas 21, 13, 18 y X.
[0036] En otra realización, se da a conocer en el presente documento un aparato adaptado o configurado para identificar la aneuploidía fetal en una muestra de plasma materno que comprende moléculas de ácido nucleico fetal y materno, y en donde dicho aparato comprende: (a) un dispositivo de secuenciación adaptado o configurado para secuenciar al menos una porción de las moléculas de ácido nucleico en una muestra de plasma materno que comprende moléculas de ácido nucleico materno y fetal, generando así información de secuencia; y (b) un sistema de procesamiento computacional configurado para realizar los siguientes pasos: (i) usar la información de secuencia generada por el dispositivo de secuenciación para identificar un número de etiquetas de secuencia mapeadas para un cromosoma de interés; (ii) usar la información de secuencia generada por el dispositivo de secuenciación para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador; (iii) usar el número de etiquetas de secuencia mapeadas identificadas para un cromosoma de interés en el paso (i) y el número de etiquetas de secuencia mapeadas identificadas para el al menos un cromosoma normalizador en el paso (ii) para calcular una dosis de cromosoma para un cromosoma interesar; y (iv) comparar dicha dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. Los cromosomas de interés pueden ser cualquiera de los cromosomas 21, 13, 18 y X.
[0037] Aunque los ejemplos en el presente documento se refieren a seres humanos y la lengua se dirige principalmente a las preocupaciones humanas, el concepto de esta invención es aplicable a genomas de cualquier planta o animal.
4. BREVE DESCRIPCIÓN DE LOS DIBUJOS
[0038]
La Figura 1 es un diagrama de flujo de un método 100 para determinar la presencia o ausencia de una aneuploidía cromosómica en una muestra de prueba que comprende una mezcla de ácidos nucleicos.
La Figura 2 es un diagrama de flujo de un método 200 para determinar simultáneamente la presencia o ausencia de aneuploidía y la fracción fetal en una muestra de prueba materna que comprende una mezcla de ácidos nucleicos fetales y maternos.
La Figura 3 es un diagrama de flujo de un método 300 para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la fracción fetal en una muestra de prueba de plasma materno enriquecida con ácidos nucleicos polimórficos.
La Figura 4 es un diagrama de flujo de un método 400 para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la fracción fetal en una muestra de prueba de ADNcf purificada materna que ha sido enriquecida con ácidos nucleicos polimórficos.
La Figura 5 es un diagrama de flujo de un método 500 para determinar simultáneamente la presencia o ausencia de aneuploidía fetal y la fracción fetal en una biblioteca de secuenciación construida a partir de ácidos nucleicos maternos y fetales derivados de una muestra de prueba materna y enriquecida con ácidos nucleicos polimórficos.
La Figura 6 es un diagrama de flujo de un método 600 para determinar la fracción fetal mediante la secuenciación de una biblioteca de ácidos nucleicos diana polimórficos amplificados a partir de una porción de una mezcla purificada de ácidos nucleicos maternos y fetales.
La Figura 7 muestra los electroferogramas de una biblioteca de secuenciación de ADNcf preparada de acuerdo con el protocolo abreviado descrito en el Ejemplo 2a (A), y el protocolo descrito en el Ejemplo 2b (B).
La Figura 8 muestra en el eje Y la proporción del número de etiquetas de secuencia asignadas a cada cromosoma (eje X) y el número total de etiquetas asignadas a todos los cromosomas (1-22, X e Y) para la muestra M11281 cuando la biblioteca se preparó utilizando el protocolo abreviado del Ejemplo 2a (♦) y cuando se preparó de acuerdo con el protocolo de longitud completa del Ejemplo 2b (H). También se muestran las relaciones de las etiquetas para la muestra M11297 obtenidas de la secuenciación de una biblioteca preparada de acuerdo con el protocolo abreviado del Ejemplo 2a (A) y de acuerdo con el protocolo de longitud completa del Ejemplo 2b (X).
La Figura 9 muestra la distribución de la dosis de cromosoma para el cromosoma 21 determinada a partir de la secuenciación del ADNfc extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos, cada una de ellas con un feto masculino o femenino. Dosis de cromosoma 21 para muestras de ensayo calificadas es decir, normales para el cromosoma 21 (O), y la trisomía 21 se muestran (A) para los cromosomas 1-12 y X (A), y para los cromosomas 1-22 y X (B).
La Figura 10 muestra la distribución de la dosis de cromosoma para el cromosoma 18 determinada a partir de la secuenciación del ADNfc extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos, cada uno de ellos con un feto masculino o femenino. Dosis de cromosoma 18 para muestras de ensayo cualificadas, es decir, normales para el cromosoma 18 (O), y la trisomía 18 (A) se muestran para los cromosomas 1-12 y X (A), y para los cromosomas 1-22 y X (B).
La Figura 11 muestra la distribución de la dosis de cromosoma para el cromosoma 13 determinada a partir de la secuenciación del ADNfc extraído de un conjunto de 48 muestras de sangre obtenidas de sujetos humanos, cada una de ellas con un feto masculino o femenino. Dosis de cromosoma 13 para muestras de ensayo cualificadas, es decir, normales para el cromosoma 13 (O), y la trisomía 13 (A) se muestran para los cromosomas 1-12 y X (A), y para los cromosomas 13-21 y Y (B).
La Figura 12 muestra la distribución de las dosis de cromosomas para el cromosoma X determinada a partir de la secuenciación del ADNfc extraído de un conjunto de 48 muestras de sangre analizadas de sujetos humanos, cada una de ellas con un feto masculino o femenino. Cromosoma X dosis para hombres (46, XY; (O)), mujeres (46, XX; (A)); se muestran muestras de monosomía X (45, X; (+)) y cariotipos complejos (Cplx (X)) para los cromosomas 1-12 y X (A) y para los cromosomas 1-22 y X (B). La Figura 13 muestra la distribución de las dosis de cromosomas para el cromosoma Y determinada a partir de la secuenciación del ADNfc extraído de un conjunto de 48 muestras de sangre de prueba obtenidas de sujetos humanos, cada una de ellas con un feto masculino o femenino. Dosis de cromosoma Y para hombres (46, XY; (A)), mujeres (46, XX; (O)); se muestran muestras de monosomía X (45, X; (+)) y cariotipos complejos (Cplx (X)) para los cromosomas 1-12 (A) y para los cromosomas 1-22 (B).
La Figura 14 muestra el coeficiente de variación (CV) para los cromosomas 21 (H), 18
Figure imgf000010_0001
y 13 (A) que se determinó a partir de las dosis mostradas en las Figuras 9,10 y 11, respectivamente.
La Figura 15 muestra el coeficiente de variación (CV) para los cromosomas X (* ) e Y
Figure imgf000010_0002
que se determinó a partir de las dosis mostradas en las Figuras 12 y 13, respectivamente.
La Figura 16 muestra la secuencia de dosis (eje Y) para un segmento del cromosoma 11 (81000082-103000103bp) determinada a partir de la secuenciación del ADNcf extraído de un conjunto de 7 muestras calificadas (O) obtenidas y 1 muestra de prueba (♦) de mujeres embarazadas. Se identificó una muestra de un sujeto que llevaba un feto con una aneuploidía parcial del cromosoma 11 (♦).
La Figura 17 muestra un gráfico de la proporción del número de etiquetas de secuencia asignadas a cada cromosoma y el número total de etiquetas asignadas a todos los cromosomas (1-22, X e Y) obtenidos de la secuenciación de una biblioteca de ADNcf no enriquecida (•'), y biblioteca ADNcf enriquecida con 5% (H) o 10% (♦) de biblioteca SNP multiplex amplificada.
La Figura 18 muestra un diagrama de barras que muestra la identificación de las secuencias polimórficas fetales y maternas (SNP) utilizadas para determinar la fracción fetal en una muestra de prueba. Se muestra el número total de lecturas de secuencia (eje Y) mapeadas a las secuencias SNP identificadas por números rs (eje X), y el nivel relativo de ácidos nucleicos fetales (*).
La Figura 19 representa una realización del uso de la fracción fetal para determinar los umbrales de corte para la detección de aneuploidía.
La Figura 20 ilustra la distribución de las dosis de cromosomas normalizados para el cromosoma 21 (A), el cromosoma 18 (B), el cromosoma 13 (C), el cromosoma X (D) y el cromosoma Y (E) en relación con la desviación estándar de la media (eje Y) para la dosis de cromosomas correspondiente en muestras no afectadas.
5. DESCRIPCIÓN DETALLADA DE LA INVENCIÓN
[0039] La descripción se refiere a métodos para determinar la presencia o ausencia de una aneuploidía por ejemplo aneuploidía cromosómica o parcial, y/o fracción fetal en muestras maternas que comprenden ácidos nucleicos fetales y maternos por secuenciación masiva en paralelo. El método comprende un nuevo protocolo para preparar bibliotecas de secuenciación que mejora inesperadamente la calidad del ADN de la biblioteca mientras que acelera el proceso de análisis de muestras para diagnósticos prenatales. Los métodos también permiten determinar las variaciones en el número de copias (CNV) de cualquier secuencia de interés en una muestra de prueba que comprende una mezcla de ácidos nucleicos que se conocen o se sospecha que difieren en la cantidad de una o más secuencias de interés, y/o la determinación de la fracción de una de al menos dos poblaciones de ácidos nucleicos contribuyó a la muestra por diferentes genomas. Las secuencias de interés incluyen secuencias genómicas que van desde cientos de bases hasta decenas de megabases hasta cromosomas completos que se sabe o se sospecha que están asociados con una condición genética o de enfermedad. Ejemplos de secuencias de interés incluyen cromosomas asociados con aneuploidías bien conocidas, por ejemplo, trisomía 21 y segmentos de cromosomas que se multiplican en enfermedades como el cáncer, por ejemplo, trisomía parcial 8 en la leucemia mieloide aguda. El método comprende un enfoque estadístico que tiene en cuenta la variabilidad acumulada que se deriva de la variabilidad relacionada con el proceso, intercromosómica o de inter-secuenciación. El método es aplicable para determinar la CNV de cualquier aneuploidía fetal, y se sabe o se sospecha que las CNV están asociadas con una variedad de afecciones médicas.
[0040] A menos que se indique lo contrario, la práctica de la presente invención implica técnicas convencionales comúnmente utilizadas en biología molecular, microbiología, purificación de proteínas, ingeniería de proteínas, secuenciación de proteínas y ADN, y campos de ADN recombinante, que están dentro de los conocimientos de la técnica. Tales técnicas son conocidas por los expertos en la técnica y se describen en numerosos textos estándar y trabajos de referencia.
[0041] Los intervalos numéricos son inclusive de los números que definen el rango. Se pretende que cada limitación numérica máxima dada a lo largo de esta especificación incluya todas las limitaciones numéricas inferiores, como si dichas limitaciones numéricas más bajas estuvieran expresamente escritas en este documento. Cada limitación numérica mínima dada a lo largo de esta especificación incluirá cada limitación numérica superior, como si tales limitaciones numéricas superiores estuvieran expresamente escritas en este documento. Cada rango numérico dado a lo largo de esta especificación incluirá cada rango numérico más estrecho que caiga dentro de un rango numérico más amplio, como si dichos rangos numéricos más estrechos estuvieran expresamente escritos aquí.
5.1 DEFINICIONES
[0042] Como se usa en este documento, los términos singulares "un", "una", "el" y "ella" incluyen la referencia plural a menos que el contexto indique claramente lo contrario. A menos que se indique lo contrario, los ácidos nucleicos se escriben de izquierda a derecha en la orientación de 5' a 3' y las secuencias de aminoácidos se escriben de izquierda a derecha en la orientación de amino a carboxi, respectivamente.
[0043] El término "evaluación" en el presente documento se refiere a la caracterización de la situación de una aneuploidía cromosómica por uno de los tres tipos de llamadas: "normal", "afectadas", y "no-llamadas". Por ejemplo, en presencia de trisomía, la llamada "normal" está determinada por el valor de un parámetro, por ejemplo, una dosis de cromosoma de prueba que está por debajo de un umbral de confiabilidad definido por el usuario, la llamada "afectada" está determinada por un parámetro, por ejemplo una dosis de cromosoma de prueba, que está por encima de un umbral de confiabilidad definido por el usuario, y el resultado de "no llamada" se determina mediante un parámetro, por ejemplo, una dosis de cromosoma de prueba, que se encuentra entre los umbrales de confiabilidad definidos por el usuario para hacer una llamada "normal" o "afectada".
[0044] El término "variación del número de copia" en el presente documento se refiere a la variación en el número de copias de una secuencia de ácido nucleico que es 1 kb o más grandes presentes en una muestra de prueba en comparación con el número de copias de la secuencia de ácido nucleico presente en una muestra cualificada. Una "variante del número de copias" se refiere a la secuencia de ácido nucleico de 1 kb o más en la que se encuentran las diferencias en los números de copias al comparar una secuencia de interés en la muestra de prueba con la presente en una muestra calificada. Las variantes/variaciones del número de copias incluyen supresiones, incluidas microdelecciones, inserciones, incluidas microinserciones, duplicaciones, multiplicaciones, inversiones, translocaciones y variantes complejas de sitios múltiples. La CNV abarca aneuploidías cromosómicas y aneuploidías parciales.
[0045] El término "aneuploidía" aquí se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de un cromosoma, o una parte de un cromosoma.
[0046] El término "aneuploidía cromosómica" aquí se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de un cromosoma completo, e incluye la aneuploidía de la línea germinal y aneuploidía mosaico.
[0047] El término "aneuploidía parcial" en el presente documento se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de parte de un cromosoma, por ejemplo monosomía parcial y trisomía parcial, y abarca los desequilibrios que resultan de translocaciones, deleciones e inserciones.
[0048] El término "pluralidad" se usa en el presente documento en referencia a un número de moléculas de ácido nucleico o secuencia de etiquetas que es suficiente para identificar diferencias significativas en la variación en el número de copias (e. G. Dosis de cromosomas) en muestras de ensayo y las muestras cualificados utilizando en Los métodos descritos en este documento. En algunas realizaciones, al menos aproximadamente 3 x 106 etiquetas de secuencia, al menos aproximadamente 5 x 106 etiquetas de secuencia, al menos aproximadamente 8 x 106 etiquetas de secuencia, al menos aproximadamente 10 x 106 etiquetas de secuencia, al menos aproximadamente 15 x 106 etiquetas de secuencia, al menos aproximadamente 20 x 106 etiquetas de secuencia, al menos aproximadamente 30 x 106 etiquetas de secuencia, al menos aproximadamente 40 x 106 etiquetas de secuencia, o al menos aproximadamente 50 x 106 etiquetas de secuencia que comprenden entre 20 y 40 pb de lectura Se obtienen para cada muestra de prueba.
[0049] Los términos "polinucleótido", "ácido nucleico" y "moléculas de ácido nucleico" se usan indistintamente y se refieren a una secuencia unida covalentemente de nucleótidos (es decir, ribonucleótidos para ARN y desoxirribonucleótidos para ADN) en la que la posición 3' de la la pentosa de un nucleótido está unida por un grupo fosfodiéster a la posición 5' de la pentosa del siguiente, incluye secuencias de cualquier forma de ácido nucleico, incluidas, entre otras, moléculas de ARN, ADN y ADNcf. El término "polinucleótido" incluye, sin limitación, polinucleótido de cadena simple y doble.
[0050] El término "parte" se usa en el presente documento en referencia a la cantidad de información de la secuencia de moléculas de ácido nucleico fetal y materno en una muestra biológica que en cantidad suma a menos que la información de la secuencia de <1 genoma humano.
[0051] El término "muestra de ensayo" en el presente documento se refiere a una muestra que comprende una mezcla de ácidos nucleicos que comprenden al menos una secuencia de ácido nucleico cuyo número de copias es sospechoso de haber sufrido variación. Los ácidos nucleicos presentes en una muestra de prueba se conocen como "ácidos nucleicos de prueba".
[0052] El término "muestra calificado" aquí se refiere a una muestra que comprende una mezcla de ácidos nucleicos que están presentes en un número de copias conocido al que se comparan los ácidos nucleicos en una muestra de ensayo, y es una muestra que es normal, es decir no aneuploide, para la secuencia de interés, por ejemplo, una muestra calificada utilizada para identificar un cromosoma normalizador para el cromosoma 21 es una muestra que no es una muestra de trisomía 21.
[0053] El término "ácido nucleico calificado" se usa indistintamente con "secuencia calificada" es una secuencia contra la que se compara la cantidad de una secuencia de prueba o ensayo de ácido nucleico. Una secuencia calificada es una presente en una muestra biológica, preferiblemente en una representación conocida, es decir. Se conoce la cantidad de una secuencia calificada. Una "secuencia de interés calificada" es una secuencia calificada para la cual se conoce la cantidad en una muestra calificada, y es una secuencia que se asocia con una diferencia en la representación de la secuencia en un individuo con una condición médica.
[0054] El término "secuencia de interés" en el presente documento se refiere a una secuencia de ácido nucleico que está asociada con una diferencia en la secuencia de representación en individuos sanos frente a enfermos. Una secuencia de interés puede ser una secuencia en un cromosoma que está tergiversado, es decir, sobre o subrepresentado, en una enfermedad o condición genética. Una secuencia de interés también puede ser una porción de un cromosoma o un cromosoma. Por ejemplo, una secuencia de interés puede ser un cromosoma que está sobrerepresentado en una condición de aneuploidía, o un gen que codifica un supresor de tumores que está poco representado en un cáncer. Las secuencias de interés incluyen secuencias que están representadas de forma excesiva o insuficiente en la población total, o una subpoblación de células de un sujeto. Una "secuencia de interés calificada" es una secuencia de interés en una muestra calificada. Una "secuencia de prueba de interés" es una secuencia de interés en una muestra de prueba.
[0055] El término "secuencia normalizadora" aquí se refiere a una secuencia que muestra una variabilidad en el número de etiquetas de secuencia que se asignan a la misma entre las muestras y series de secuenciación que mejor se aproximan a las de la secuencia de interés para las que se utiliza como un parámetro de normalización, y eso puede diferenciar mejor una muestra afectada de una o más muestras no afectadas. Un "cromosoma de normalización" es un ejemplo de una "secuencia de normalización".
[0056] El término "diferenciabilidad" aquí se refiere a la característica de un cromosoma de normalización que permite distinguir una o más muestras no afectadas es decir, normales, de una o más muestras afectadas, es decir aneuploides.
[0057] El término "dosis de secuencia" en el presente documento se refiere a un parámetro que relaciona la densidad de etiqueta de secuencia de una secuencia de interés a la densidad de la etiqueta de una secuencia de normalización. Una "dosis de secuencia de prueba" es un parámetro que relaciona la densidad de la etiqueta de secuencia de una secuencia de interés, por ejemplo, el cromosoma 21, con la de una secuencia de normalización, por ejemplo, el cromosoma 9, determinado en una muestra de prueba. De manera similar, una "dosis de secuencia calificada" es un parámetro que relaciona la densidad de la etiqueta de secuencia de una secuencia de interés con la de una secuencia de normalización determinada en una muestra calificada.
[0058] El término "densidad de etiqueta de secuencia" en el presente documento se refiere al número de lecturas de secuencia que se asignan a una secuencia de referencia del genoma por ejemplo, la densidad de etiqueta de secuencia para el cromosoma 21 es el número de lecturas de secuencia generado por el método de secuenciación que es mapeado en el cromosoma 21 del genoma de referencia. El término "relación de densidad de etiqueta de secuencia" en el presente documento se refiere a la proporción del número de etiquetas de secuencia que se asignan a un cromosoma del genoma de referencia, por ejemplo el cromosoma 21, a la longitud del genosoma de referencia cromosoma 21.
[0059] El término "parámetro" en el presente documento se refiere a un valor numérico que caracteriza un conjunto de datos cuantitativos y/o una relación numérica entre los conjuntos de datos cuantitativos. Por ejemplo, una relación (o función de una relación) entre el número de etiquetas de secuencia asignadas a un cromosoma y la longitud del cromosoma al que se asignan las etiquetas, es un parámetro.
[0060] Los términos "valor umbral" y "valor umbral calificado" en el presente documento se refieren a cualquier número que se calcula usando un conjunto de datos de aceptación establecidos y sirve como un límite de diagnóstico de una variación del número de copias por ejemplo una aneuploidía, en un organismo. Si los resultados obtenidos de la práctica de los métodos descritos en este documento exceden un umbral, se puede diagnosticar a un sujeto con una variación en el número de copias, por ejemplo, trisomía 21.
[0061] El término "lectura" se refiere a una secuencia de ADN de longitud suficiente (p. ej., al menos aproximadamente 30 pb) que se puede utilizar para identificar una secuencia o región más grande, p. ej. que se pueden alinear y específicamente asignar a un cromosoma o región genómica o gen.
[0062] El término "etiqueta de secuencia" se usa aquí de forma intercambiable con el término "etiqueta de secuencia mapeada" para referirse a una lectura de secuencia que ha sido asignada específicamente es decir asignada, a una secuencia más grande, por ejemplo un genoma de referencia, por la alineación. Las etiquetas de secuencia asignadas se asignan de forma única a un genoma de referencia, es decir, se asignan a una única ubicación para el genoma de referencia. Las etiquetas que se pueden asignar a más de una ubicación en un genoma de referencia, es decir, las etiquetas que no se asignan de forma única, no se incluyen en el análisis.
[0063] Como se usa en el presente documento, los términos "alineado", "alineación", o "alinear" se refieren a una o más secuencias que se identifican como un partido en términos de la orden de sus moléculas de ácido nucleico a una secuencia conocida a partir de un genoma de referencia. Dicha alineación se puede hacer manualmente o mediante un algoritmo de computadora, siendo ejemplos de ello el programa de computadora Efficient Local Alignment of Nucleotide Data (ELAND) distribuido como parte de la tubería de Illumina Genomics Analysis. La coincidencia de una secuencia leída en alineación puede ser una coincidencia de secuencia del 100% o menos del 100% (coincidencia no perfecta).
[0064] Tal como se utiliza aquí, el término "genoma de referencia" se refiere a cualquier secuencia del genoma particular conocido, ya sea parcial o completa, de cualquier organismo o virus que puede ser utilizado para hacer referencia a secuencias identificadas a partir de un sujeto. Por ejemplo, un genoma de referencia utilizado para sujetos humanos, así como muchos otros organismos, se encuentra en el Centro Nacional de Información Biotecnológica en www.ncbi.nlm.nih.gov. Un "genoma" se refiere a la información genética completa de un organismo o virus, expresado en secuencias de ácidos nucleicos.
[0065] Los términos "genoma de secuencias diana artificiales" y "genoma de referencia artificial" en el presente documento se refieren a una agrupación de secuencias conocidas que abarcan alelos de sitios polimórficos conocidos. Por ejemplo, un "genoma de referencia de SNP" es un genoma de secuencias diana artificiales que comprende una agrupación de secuencias que abarcan alelos de SNP conocidos.
[0066] El término "secuencia clínicamente relevante" en el presente documento se refiere a una secuencia de ácido nucleico que se sabe o se sospecha que estar asociado o implicado con una condición genética o enfermedad. La determinación de la ausencia o presencia de una secuencia clínicamente relevante puede ser útil para determinar un diagnóstico o confirmar un diagnóstico de una afección médica, o proporcionar un pronóstico para el desarrollo de una enfermedad.
[0067] El término "derivado" cuando se usa en el contexto de un ácido nucleico o una mezcla de ácidos nucleicos, en este documento se refiere a los medios por los cuales el (los) ácido(s) nucleico(s) se obtiene(n) de la fuente de la que se originan. Por ejemplo, en una realización, una mezcla de ácidos nucleicos que se deriva de dos genomas diferentes significa que los ácidos nucleicos, por ejemplo, ADNcf, fueron liberados naturalmente por las células a través de procesos naturales como la necrosis o la apoptosis. En otra realización, una mezcla de ácidos nucleicos que se deriva de dos genomas diferentes significa que los ácidos nucleicos se extrajeron de dos tipos diferentes de células de un sujeto.
[0068] El término "muestra mixta" aquí se refiere a una muestra que contiene una mezcla de ácidos nucleicos, que se derivan de diferentes genomas.
[0069] El término "muestra materna" aquí se refiere a una muestra biológica obtenida de un sujeto embarazado, por ejemplo, una mujer.
[0070] El término "muestra materna original" en este documento se refiere a una muestra biológica obtenida de un sujeto embarazado, por ejemplo, una mujer, que sirve como fuente de la cual se extrae una porción para amplificar los ácidos nucleicos diana polimórficos. La "muestra original" puede ser cualquier muestra obtenida de un sujeto embarazado, y las fracciones procesadas de la misma, por ejemplo, una muestra de ADNcf purificada extraída de una muestra de plasma materno.
[0071] El término "fluido biológico" se refiere aquí a un líquido tomado de una fuente biológica e incluye, por ejemplo, sangre, suero, plasma, esputo, fluido de lavado, líquido cefalorraquídeo, orina, semen, sudor, lágrimas, saliva, y similares. Como se usa en el presente documento, los términos "sangre", "plasma" y "suero" abarcan expresamente las fracciones o porciones procesadas de los mismos. Del mismo modo, donde se toma una muestra de una biopsia, un hisopo, frotis, etc., la "muestra" abarca expresamente una fracción o porción transformadas derivadas de la biopsia, un hisopo, frotis, etc.
[0072] Los términos "ácidos nucleicos maternos" y "ácidos nucleicos fetales" en el presente documento se refieren a los ácidos nucleicos de una mujer embarazada y a los ácidos nucleicos del feto que son transportados por la hembra embarazada, respectivamente.
[0073] Tal como se utiliza aquí, el término “correspondiente a" se refiere a una secuencia de ácido nucleico, por ejemplo, un gen o un cromosoma, que está presente en el genoma de diferentes temas, y que no necesariamente tienen la misma secuencia en todos los genomas, pero sirve para proporcionar la identidad en lugar de la información genética de una secuencia de interés, por ejemplo, un gen o cromosoma.
[0074] Tal como se utiliza aquí, el término "sustancialmente libre de células" abarca preparaciones de la muestra deseada de la que se eliminan los componentes que normalmente están asociados con ella. Por ejemplo, una muestra de plasma se vuelve esencialmente libre de células mediante la eliminación de células sanguíneas, por ejemplo, células rojas, que normalmente están asociadas con ella. En algunas realizaciones, se procesan muestras sustancialmente libres para eliminar las células que de otro modo contribuirían al material genético deseado que se va a analizar para una CNV.
[0075] Tal como se utiliza aquí, el término "fracción fetal" se refiere a la fracción de ácidos nucleicos fetales presentes en una muestra que comprende ácido nucleico fetal y materno.
[0076] Tal como se utiliza aquí, el término "cromosoma" se refiere al portador del gen herencia de soporte de una célula viva que se deriva de la cromatina y que comprende ADN y proteínas componentes (especialmente histonas). El sistema de numeración de cromosomas del genoma humano individual convencional reconocido internacionalmente se emplea aquí.
[0077] Tal como se utiliza aquí, el término "longitud de polinucleótido" se refiere a que el número absoluto de moléculas de ácido nucleico (nucleótidos) en una secuencia o en una región de un genoma de referencia. El término "longitud del cromosoma" se refiere a la longitud conocida del cromosoma dado en pares de bases, por ejemplo, proporcionado en el ensamblaje NCBI36/hg18 del cromosoma humano encontrado en la red mundial en genome.ucsc.edu/cgi-bin/hgTracks?hgsid=167155613 &chromInfoPage=
[0078] El término "sujeto" se refiere a un sujeto humano así como a un sujeto no humano tal como un mamífero, un invertebrado, un vertebrado, un hongo, una levadura, una bacteria y un virus. Aunque los ejemplos en este documento se refieren a seres humanos y el lenguaje se dirige principalmente a preocupaciones humanas, el concepto de esta invención es aplicable a genomas de cualquier planta o animal, y es útil en los campos de la medicina veterinaria, ciencias animales, laboratorios de investigación y otros.
[0079] El término “condición" en este documento se refiere a “condición médica" como un término amplio que incluye todas las enfermedades y trastornos, pero pueden incluir lesiones y situaciones de salud normales, como el embarazo, que pueden afectar a la salud de una persona, se benefician de la asistencia médica, o tienen implicaciones para tratamientos médicos.
[0080] El término "cromosoma aneuploides" aquí se refiere a un cromosoma que está implicado en una aneuploidía.
[0081] El término "aneuploidía" aquí se refiere a un desequilibrio de material genético causado por una pérdida o ganancia de un todo cromosoma, o parte de un cromosoma.
[0082] Los términos "biblioteca" y "biblioteca de secuenciación" en el presente documento se refieren a una colección o pluralidad de moléculas de plantilla que comparten secuencias comunes en sus extremos 5' y secuencias comunes en sus extremos 3'.
[0083] Los términos "extremos romos" y de "reparación de extremos" se usan aquí de forma intercambiable para referirse a un proceso enzimático que se traduce en ambas cadenas de una molécula de ADN de doble cadena para terminar en un par de bases, y no incluye la purificación de productos de extremos romos de la enzima de extremos romos.
[0084] El término "cola de dA" aquí se refiere a un proceso enzimático que añade al menos una base de adenina al extremo 3' del ADN, y no incluye la purificación del producto dA de cola de la enzima de cola de dA.
[0085] El término "adaptador de ligadura" aquí se refiere a un proceso enzimático que se liga una secuencia adaptadora de ADN a los fragmentos de ADN, y no incluye purificar el producto ligado al adaptador de la enzima de ligadura.
[0086] El término "recipiente de reacción" se refiere aquí a un recipiente de cualquier forma, tamaño, capacidad o material que puede ser utilizado para el procesamiento de una muestra durante un laboratorio procedimiento por ejemplo, investigación o clínico.
[0087] El término "pasos consecutivos" se usa aquí en referencia a las sucesivas etapas enzimáticas de extremo romo de cola de dA y ADN ligado al adaptador que no están interpuestos por etapas de purificación.
[0088] Tal como se utiliza aquí, el término "purificado" se refiere a material (por ejemplo, un polinucleótido aislado) que está en un estado relativamente puro, por ejemplo, al menos aproximadamente el 80% puro, al menos aproximadamente el 85% puro, al menos aproximadamente 90% puro, al menos aproximadamente el 95% puro, al menos aproximadamente el 98% puro, o incluso al menos aproximadamente el 99% puro.
[0089] Los términos "extraído", "recuperado", "aislado" y "separado", se refieren a un compuesto, proteína, célula, ácido nucleico o de aminoácidos que se retira de al menos un componente con el que está asociado de forma natural y se encuentra en la naturaleza.
[0090] El término "SNP en tándem" aquí se refiere a dos o más SNP que están presentes dentro de una secuencia de ácido nucleico diana polimórfico.
[0091] Los términos "ácido nucleico diana polimórfico", "secuencia polimórfica", "secuencia de ácido nucleico diana polimórfico" y "ácido nucleico polimórfico" se usan indistintamente en este documento para referirse a una secuencia de ácido nucleico por ejemplo, una secuencia de ADN, que comprende uno o más sitios polimórficos.
[0092] El término "sitio polimórfico" en el presente documento se refiere a un polimorfismo de nucleótido único (SNP), una pequeña escala deleción multi-base o de inserción, un polimorfismo de multi-nucleótidos (MNP) o una repetición corta en tándem (STR).
[0093] El término "pluralidad de ácidos nucleicos diana polimórficos" aquí se refiere a una serie de secuencias de ácido nucleico que comprende cada uno al menos un sitio polimórfico tal que al menos 1,2, 3, 4,5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40 o más sitios polimórficos diferentes se amplifican a partir de los ácidos nucleicos diana polimórficos para identificar y/o cuantificar los alelos fetales presentes en muestras maternas que comprenden ácidos nucleicos fetales y maternos.
[0094] El término "enriquecer" en el presente documento se refiere al proceso de amplificación de ácidos nucleicos diana polimórficos contenidos en una porción de una muestra materna, y combinar el producto amplificado con el resto de la muestra maternal de la que se eliminó la porción.
[0095] El término "densidad de etiqueta de secuencia" en el presente documento se refiere al número de lecturas de secuencia que se asignan a una secuencia de referencia del genoma por ejemplo, la densidad de etiqueta de secuencia para el cromosoma 21 es el número de lecturas de secuencia generado por el método de secuenciación que es mapeado en el cromosoma 21 del genoma de referencia. El término "relación de densidad de etiqueta de secuencia" en el presente documento se refiere a la proporción del número de etiquetas de secuencia que se asignan a un cromosoma del genoma de referencia, por ejemplo el cromosoma 21, a la longitud del genosoma de referencia cromosoma 21.
[0096] Tal como se utiliza aquí, el término "amplificación en fase sólida", como se usa en el presente documento se refiere a cualquier reacción de amplificación de ácido nucleico aplicada en o en asociación con un soporte sólido tal que la totalidad o una parte de los productos amplificados se inmovilizan en el soporte sólido a medida que se forman. En particular, el término abarca la reacción en cadena de la polimerasa en fase sólida (PCR en fase sólida) y la amplificación isotérmica en fase sólida, que son reacciones análogas a la amplificación en fase de solución estándar, excepto que uno o ambos de los cebadores de amplificación directa e inversa se inmovilizan en el soporte sólido. La PCR en fase sólida cubre sistemas como las emulsiones, en donde un cebador se ancla a una cuenta y el otro se encuentra en solución libre, y la formación de colonias en matrices de gel de fase sólida donde un cebador se ancla a la superficie y el otro se encuentra en solución libre. El término fase sólida, o superficie, se usa para significar una matriz plana en la que los cebadores se unen a una superficie plana, por ejemplo, portaobjetos de microscopio de vidrio, sílice o plástico o dispositivos de células de flujo similares; perlas, en donde uno o dos cebadores se unen a las perlas y se amplifican las perlas; o una serie de cuentas sobre una superficie después de que las cuentas hayan sido amplificadas.
[0097] Como se usa en el presente documento, el término "grupo de cromosomas" aquí se refiere a un grupo de dos o más cromosomas.
[0098] Un "polimorfismo de nucleótido único" (SNP) se produce en un sitio polimórfico ocupado por un único nucleótido, que es el sitio de variación entre secuencias alélicas. El sitio suele ir precedido y seguido por secuencias altamente conservadas del alelo (por ejemplo, secuencias que varían en menos de 1/100 o 1/1000 miembros de las poblaciones). Un SNP generalmente surge debido a la sustitución de un nucleótido por otro en el sitio polimórfico. Una transición es el reemplazo de una purina por otra purina o una pirimidin por otra pirimidin. Una transversión es el reemplazo de una purina por una pirimidin o viceversa. Los SNP también pueden surgir de una eliminación de un nucleótido o una inserción de un nucleótido en relación con un alelo de referencia. Los polimorfismos de un solo nucleótido (SNP) son posiciones en las cuales dos bases alternativas ocurren con una frecuencia apreciable (>1%) en la población humana, y son el tipo más común de variación genética humana.
[0099] Tal como se utiliza aquí, el término "repetición corta en tándem" o "STR" tal como se utiliza aquí, se refiere a una clase de polimorfismos que se produce cuando un patrón de dos o más nucleótidos se repiten y las secuencias repetidas son directamente adyacentes entre sí. El patrón puede variar en longitud de 2 a 10 pares de bases (pb) (por ejemplo (CATG)n en una región genómica) y está típicamente en la región intrón no codificadora. Al examinar varios loci STR y al contar cuántas repeticiones de una secuencia STR específica en un locus dado, es posible crear un perfil genético único de un individuo.
[0100] Tal como se utiliza aquí, el término "miniSTR" aquí se refiere a la repetición en tándem de cuatro o más pares de bases que se extiende por menos de aproximadamente 300 pares de bases, menos de aproximadamente 250 aires de bases, menos de aproximadamente 200 pares de bases, menos de aproximadamente 150 pares de bases, menos de unos 100 pares de bases, menos de unos 50 pares de bases, o menos de unos 25 pares de bases. "miniSTRs" son STR que son amplificables a partir de plantillas ADNcf.
[0101] El término "tándem SNPs" aquí se refiere a dos o más SNPs que están presentes dentro de una secuencia de ácido nucleico diana polimórfico.
[0102] Tal como se utiliza aquí, el término "biblioteca enriquecida" en el presente documento se refiere a una biblioteca de secuenciación que comprende secuencias de ácido nucleico diana polimórfico amplificado. Un ejemplo de una biblioteca enriquecida es una biblioteca de secuenciación que comprende secuencias de ADNcf de origen natural y secuencias de ácido nucleico diana amplificadas. Una "biblioteca no enriquecida" en el presente documento se refiere a una biblioteca de secuenciación que no comprende, es decir, una biblioteca generada a partir de secuencias de ADNcf que ocurren naturalmente. Una "biblioteca polimórfica de ácidos nucleicos diana" es una biblioteca generada a partir de ácidos nucleicos diana amplificados”.
[0103] Como se usa en este documento, el término "secuencias ADNcf de origen natural" en el presente documento se refiere a fragmentos ADNcf ya que están presentes en una muestra, y en contraste con fragmentos de ADN genómico que se obtienen por métodos de fragmentación descritos en este documento.
5.2 DESCRIPCION
[0104] La descripción se refiere a métodos para determinar la presencia o ausencia de una aneuploidía por ejemplo aneuploidía cromosómica o parcial, y/o fracción fetal en muestras maternas que comprenden ácidos nucleicos fetales y maternos por secuenciación masiva en paralelo. El método comprende un nuevo protocolo para preparar bibliotecas de secuenciación que mejora inesperadamente la calidad del ADN de la biblioteca mientras acelera el proceso de análisis de muestras para diagnósticos prenatales. Los métodos permiten determinar las variaciones en el número de copias (CNV) de cualquier secuencia de interés en una muestra de prueba que comprende una mezcla de ácidos nucleicos que se conocen o se sospecha que difieren en la cantidad de una o más secuencias de interés, y/o determinan la fracción de una de al menos dos poblaciones de ácidos nucleicos contribuyó a la muestra por diferentes genomas.
Métodos de secuenciación
[0105] En una realización, el método descrito aquí emplea la tecnología de secuenciación de próxima generación (NGS) en la que plantillas de ADN clonalmente amplificadas o moléculas de ADN individuales se secuencian de forma masiva en paralelo dentro de una célula de flujo (por ejemplo, como se describe en Volkerding et al. Clin Chem 55: 641-658 [2009]; Metzker M Nature Rev 11: 31-46 [2010]). Además de la información de secuencia de alto rendimiento, NGS proporciona información cuantitativa digital, en el sentido de que cada secuencia leída es una "etiqueta de secuencia" contable que representa una plantilla de ADN clonal individual o una molécula de ADN individual. Esta cuantificación permite a NGS expandir el concepto de PCR digital de conteo de moléculas de ADN libres de células (Fan et al., Proc Natl Acad Sci EE.UU. 105: 16266-16271 [2008]; Chiu et al., Proc Natl Acad Sci EE.UU. 2008; 105: 20458-20463 [2008]). Las tecnologías de secuenciación de NGS incluyen pirosecuenciación, secuenciación por síntesis con terminadores de tinte reversibles, secuenciación por ligadura de sonda de oligonucleótidos y secuenciación en tiempo real.
[0106] Algunas de las tecnologías de secuenciación están disponibles comercialmente, tales como la plataforma de secuenciación por hibridación de Affymetrix Inc. (Sunnyvale, CA) y las plataformas de secuenciación por síntesis a partir de 454 Life Sciences (Brad- ford, CT), Illumina/Solexa (Hayward, CA) y Helicos Biosciences (Cambridge, MA), y la plataforma de secuenciación por ligación de Applied Biosystems (Foster City, CA), como se describe a continuación. Además de la secuenciación de una sola molécula realizada mediante la secuenciación por síntesis de Helicos Biosciences, otras tecnologías de secuenciación de una sola molécula están abarcadas por el método de la invención e incluyen la tecnología SMRTtm de Pacific Biosciences, la tecnología Ion Torrent™ y la secuenciación de nanoporos en desarrollo. por ejemplo, por Oxford Nanoporo Technologies.
[0107] Mientras que el método automatizado de Sanger se considera una tecnología de "primera generación", la secuenciación de Sanger que incluye la secuenciación automática de Sanger también puede emplearse mediante el método de la invención. Los métodos de secuenciación adicionales que comprenden el uso de tecnologías de obtención de imágenes de ácido nucleico en desarrollo, por ejemplo, microscopía de fuerza atómica (AFM) o microscopía electrónica de transmisión (TEM), también se incluyen en el método de la invención. Tecnologías de secuenciación ejemplares se describen a continuación.
[0108] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es la Secuenciación de Moléculas Únicas Verdaderas de Helicos (tSMS) (por ejemplo, como se describe en Harris TD et al., Science 320: 106-109 [2008]). En la técnica tSMS, una muestra de ADN se divide en cadenas de aproximadamente 100 a 200 nucleótidos, y se agrega una secuencia poliA al extremo 3' de cada cadena de ADN. Cada hebra se marca mediante la adición de un nucleótido de adenosina marcado de forma fluorescente. Las cadenas de ADN se hibridan luego con una célula de flujo, que contiene millones de sitios de captura de oligo-T que se inmovilizan en la superficie de la célula de flujo. Las plantillas pueden tener una densidad de aproximadamente 100 millones de plantillas/cm2 La célula de flujo se carga en un instrumento, por ejemplo, el secuenciador Heliscope™, y un láser ilumina la superficie de la célula de flujo, revelando la posición de cada plantilla. Una cámara CCD puede asignar la posición de las plantillas en la superficie de la célula de flujo. La plantilla de la etiqueta fluorescente se escinde y se lava. La reacción de secuenciación comienza con la introducción de una ADN polimerasa y un nucleótido marcado con fluorescencia. El ácido nucleico oligo-T sirve como cebador. La polimerasa incorpora los nucleótidos marcados al cebador en una forma dirigida por la plantilla. Se eliminan la polimerasa y los nucleótidos no incorporados. Las plantillas que tienen incorporación directa del nucleótido marcado con fluorescencia se diferencian por la obtención de imágenes de la superficie de la célula de flujo. Después de la obtención de imágenes, una etapa de escisión elimina la etiqueta fluorescente, y el proceso se repite con otros nucleótidos marcados con fluorescencia hasta que se alcanza la longitud de lectura deseada. La información de secuencia se recopila con cada paso de adición de nucleótidos.
[0109] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es la secuencia 454 (Roche) (por ejemplo, como se describe en Margulies, M. y otros, Nature 437:. 376-380 [2005]). La secuenciación 454 implica dos pasos. En el primer paso, el ADN se corta en fragmentos de aproximadamente 300­ 800 pares de bases, y los fragmentos son romos. Los adaptadores de oligonucleótidos se ligan a los extremos de los fragmentos. Los adaptadores sirven como cebadores para la amplificación y secuenciación de los fragmentos. Los fragmentos pueden unirse a las perlas de captura de ADN, por ejemplo, perlas recubiertas con estreptavidina usando, por ejemplo, el Adaptador B, que contiene la etiqueta 5'-biotina. Los fragmentos unidos a las perlas se amplifican por pCr dentro de gotitas de una emulsión de aceite-agua. El resultado son múltiples copias de fragmentos de ADN amplificados clonalmente en cada cuenta. En el segundo paso, las cuentas se capturan en pozos (tamaño pico-litro). La pirosecuenciación se realiza en cada fragmento de ADN en paralelo. La adición de uno o más nucleótidos genera una señal de luz que es grabada por una cámara CCD en un instrumento de secuenciación. La intensidad de la señal es proporcional al número de nucleótidos incorporados. La pirosecuenciación hace uso del pirofosfato (PPi) que se libera tras la adición de nucleótidos. El PPi se convierte en ATP por la ATP sulfurilasa en presencia de adenosina 5' fosfosulfato. La luciferasa usa ATP para convertir la luciferina en oxiluciferina, y esta reacción genera luz que se discierne y analiza.
[0110] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es la tecnología SOLiD™ (Applied Biosystems). En la secuenciación por ligación de SOLiD™, el ADN genómico se divide en fragmentos, y los adaptadores se unen a los extremos 5' y 3' de los fragmentos para generar una biblioteca de fragmentos. Alternativamente, pueden introducirse adaptadores internos ligando los adaptadores a los extremos 5' y 3' de los fragmentos, circularizando los fragmentos, digiriendo el fragmento circularizado para generar un adaptador interno, y uniendo adaptadores a los extremos 5' y 3' de los extremos resultantes. Fragmentos para generar una biblioteca emparejada. A continuación, se preparan poblaciones de perlas clonales en microrreactores que contienen perlas, cebadores, plantilla y componentes de PCR. Después de la PCR, las plantillas se desnaturalizan y las perlas se enriquecen para separar las perlas con plantillas extendidas. Las plantillas en las perlas seleccionadas se someten a una modificación 3' que permite la unión a un portaobjetos de vidrio. La secuencia se puede determinar por hibridación secuencial y ligación de oligonucleótidos parcialmente aleatorios con una base determinada central (o un par de bases) que se identifica por un fluoróforo específico. Después de registrar un color, el oligonucleótido ligado se escinde y se elimina, y luego se repite el proceso.
[0111] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es la tecnología de secuenciación de una sola molécula, en tiempo real (SMRTtm) de Pacific Biosciences. En la secuenciación SMRT, la incorporación continua de nucleótidos marcados con colorante se visualiza durante la síntesis de ADN. Las moléculas de ADN polimerasa individuales se unen a la superficie inferior de los identificadores individuales de longitud de onda de modo cero (identificadores de ZMW) que obtienen información de la secuencia mientras que los nucleótidos fosforizados se incorporan a la cadena de cebadores en crecimiento. Una ZMW es una estructura de confinamiento que permite la observación de la incorporación de un solo nucleótido por la ADN polimerasa en el contexto de nucleótidos fluorescentes que se difunden rápidamente en una salida de la ZMW (en microsegundos). Se requieren varios milisegundos para incorporar un nucleótido en una hebra en crecimiento. Durante este tiempo, la etiqueta fluorescente se excita y produce una señal fluorescente, y la etiqueta fluorescente se separa. La identificación de la fluorescencia correspondiente del tinte indica qué base se incorporó. El proceso se repite.
[0112] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es secuenciación de nanoporos (por ejemplo, como se describe en Soni GV y Meller A. Clin Chem 53: 1996-2001 [2007]). Las técnicas de análisis de ADN de secuenciación de Nanoporo están siendo desarrolladas industrialmente por varias compañías, incluida Oxford Nanoporo Technologies (Oxford, Reino Unido). La secuenciación de nanoporos es una tecnología de secuenciación de una sola molécula mediante la cual una única molécula de ADN se secuencia directamente cuando pasa a través de un nanoporo. Un nanoporo es un agujero pequeño, del orden de 1 nanómetro de diámetro. La inmersión de un nanoporo en un fluido conductor y la aplicación de un potencial (voltaje) a través de él produce una ligera corriente eléctrica debido a la conducción de iones a través del nanoporo. La cantidad de corriente que fluye es sensible al tamaño y forma del nanoporo. A medida que una molécula de ADN pasa a través de un nanoporo, cada nucleótido en la molécula de ADN obstruye el nanoporo en un grado diferente, cambiando la magnitud de la corriente a través del nanoporo en diferentes grados. Por lo tanto, este cambio en la corriente, a medida que la molécula de ADN pasa a través del nanoporo, representa una lectura de la secuencia de ADN.
[0113] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es la matriz de transistor de efecto de campo sensible (chemFET) a los productos químicos (por ejemplo, como se describe en la Publicación de la Solicitud de Patente de Estados Unidos N° 20090026082). En un ejemplo de la técnica, las moléculas de ADN se pueden colocar en cámaras de reacción, y las moléculas de plantilla se pueden hibridar con un cebador de secuenciación unido a una polimerasa. La incorporación de uno o más trifosfatos en una nueva cadena de ácido nucleico en el extremo 3' del cebador de secuenciación puede discernirse por un cambio en la corriente por parte de un chemFET. Una matriz puede tener múltiples sensores chemFET. En otro ejemplo, pueden unirse ácidos nucleicos individuales a las perlas, y los ácidos nucleicos pueden amplificarse en la perla, y las perlas individuales pueden transferirse a cámaras de reacción individuales en una matriz chemFET, teniendo cada cámara un sensor chemFET, y los ácidos nucleicos pueden secuenciarse.
[0114] En una realización, la tecnología de secuenciación de ADN que se utiliza en el método de la invención es el método de la Halcyon Molecular que utiliza microscopía electrónica de transmisión (TEM). El método, denominado Individual Molecule Placement Rapid Nano Transfer (IMPRNT), comprende utilizar imágenes de microscopía electrónica de transmisión de resolución de un solo átomo de ADN de alto peso molecular (150 kb o más) etiquetadas selectivamente con marcadores de átomos pesados y disponer estas moléculas en películas ultradelgadas en matrices paralelas ultra-densas (3nm de hebra a hebra) con espaciado constante de base a base. El microscopio electrónico se utiliza para obtener imágenes de las moléculas en las películas para determinar la posición de los marcadores de los átomos pesados y para extraer información de la secuencia de bases del ADN. El método se describe con más detalle en la publicación de patente PCT WO 2009/046445. El método permite secuenciar genomas humanos completos en menos de diez minutos.
[0115] En una realización, la tecnología de secuenciación de ADN es la secuenciación de molécula única de Ion Torrent, que combina la tecnología de semiconductores con una química de secuenciación simple para traducir directamente la información codificada químicamente (A, C, G, T) en información digital (0, 1) en un chip semiconductor. En la naturaleza, cuando un nucleótido se incorpora a una cadena de ADN por una polimerasa, se libera un ión de hidrógeno como un subproducto. Ion Torrent utiliza una matriz de alta densidad de pozos micromecanizados para realizar este proceso bioquímico de forma masivamente paralela. Cada pozo contiene una molécula de ADN diferente. Debajo de los pozos hay una capa sensible a los iones y, por debajo, un sensor de iones. Cuando un nucleótido, por ejemplo una C, se agrega a una plantilla de ADN y luego se incorpora a una hebra de ADN, se liberará un ion hidrógeno. La carga de ese ion cambiará el pH de la solución, que puede identificarse mediante el sensor de iones de Ion Torrent. El secuenciador, esencialmente el medidor de pH de estado sólido más pequeño del mundo, llama a la base y va directamente de la información química a la información digital. El secuenciador de la máquina de genoma personal de Ion (PGMTM) luego inunda secuencialmente el chip con un nucleótido tras otro. Si el siguiente nucleótido que inunda el chip no coincide. No se registrará ningún cambio de voltaje y no se llamará ninguna base. Si hay dos bases idénticas en la cadena de ADN, el voltaje será doble y el chip registrará dos bases idénticas llamadas. La identificación directa permite el registro de la incorporación de nucleótidos en segundos.
[0116] Otros métodos de secuenciación incluyen PCR digital y secuenciación por hibridación. La reacción en cadena de la polimerasa digital (PCR digital o dPCR) se puede usar para identificar y cuantificar directamente los ácidos nucleicos en una muestra. La PCR digital se puede realizar en una emulsión. Los ácidos nucleicos individuales se separan, por ejemplo, en un dispositivo de cámara microfluídica, y cada lata nucleica se amplifica individualmente por PCR. Los ácidos nucleicos pueden separarse, por lo que hay un promedio de aproximadamente 0,5 ácidos nucleicos/pocillo, o no más de un ácido nucleico/pocillo. Se pueden utilizar diferentes sondas para distinguir los alelos fetales y los alelos maternos. Los alelos se pueden enumerar para determinar el número de copias. En la secuenciación por hibridación, la hibridación comprende poner en contacto la pluralidad de secuencias polinucleotídicas con una pluralidad de sondas polinucleotídicas, en donde cada una de la pluralidad de sondas polinucleotídicas puede unirse opcionalmente a un sustrato. El sustrato podría ser una superficie plana que comprende una serie de secuencias de nucleótidos conocidas. El patrón de hibridación con la matriz se puede usar para determinar las secuencias polinucleotídicas presentes en la muestra. En otras realizaciones, cada sonda está atada a un cordón, por ejemplo, un cordón magnético o similar. La hibridación a las perlas puede identificarse y usarse para identificar la pluralidad de secuencias de polinucleótidos dentro de la muestra.
[0117] En una realización, el método emplea una secuenciación masiva paralela de millones de fragmentos de ADN utilizando la secuenciación de Illumina por síntesis y la química de la secuenciación basada en terminador reversible (por ejemplo, como se describe en Bentley et al., Nature 6: 53-59 [2009]). El ADN de plantilla puede ser ADN genómico, por ejemplo, ADNcf. En algunas realizaciones, el ADN genómico de células aisladas se utiliza como plantilla y se fragmenta en longitudes de varios cientos de pares de bases. En otras realizaciones, se utiliza ADNcf como plantilla, y no se requiere fragmentación ya que ADNcf existe como fragmentos cortos. Por ejemplo, el ADNcf fetal circula en el torrente sanguíneo como fragmentos de <300 pb, y se estima que el ADNcf materno circula como fragmentos de entre aproximadamente 0,5 y 1 Kb (Li et al., Clin Chem, 50: 1002-1011 [2004]). La tecnología de secuenciación de Illumina se basa en la unión de ADN genómico fragmentado a una superficie plana, ópticamente transparente sobre la cual se unen los anclajes de oligonucleótidos. El ADN de plantilla se repara en el extremo para generar extremos romos fosforilados en 5', y la actividad de la polimerasa del fragmento Klenow se usa para agregar una sola base A al extremo 3' de los fragmentos de ADN fosforilados romos. Esta adición prepara los fragmentos de ADN para la ligadura de los adaptadores de oligonucleótidos, que tienen un saliente de una sola base T en su extremo 3' para aumentar la eficiencia de la ligadura. Los oligonucleótidos adaptadores son complementarios a los anclajes de las células de flujo. En condiciones de dilución limitante, el ADN de plantilla monocatenaria modificada por adaptador se agrega a la célula de flujo y se inmoviliza por hibridación a los anclajes. Los fragmentos de ADN adjuntos se extienden y se amplifican en puente para crear una célula de flujo de secuenciación de densidad ultraalta con cientos de millones de agrupaciones, cada una de las cuales contiene ~ 1.000 copias de la misma plantilla. En una realización, el ADN genómico fragmentado aleatoriamente, por ejemplo, el ADNcf, se amplifica utilizando la PCR antes de someterse a la amplificación por grupos. Alternativamente, se utiliza una preparación de biblioteca genómica libre de amplificación, y el ADN genómico fragmentado aleatoriamente, por ejemplo, ADNcf se enriquece utilizando la amplificación de agrupación sola (Kozarewa et al., Nature Methods 6: 291-295 [2009]). Las plantillas se secuencian utilizando una robusta tecnología de secuenciación por síntesis de ADN de cuatro colores que emplea terminadores reversibles con tintes fluorescentes removibles. La identificación de fluorescencia de alta sensibilidad se logra mediante la excitación con láser y la óptica de reflexión interna total. Lecturas de secuencias cortas de aproximadamente 20-40 pb, p. ej., 36 pb, están alineadas con un genoma de referencia con repetición enmascarada y las diferencias genéticas se denominan mediante el uso de software de pipeline de análisis de datos especialmente desarrollado. Después de completar la primera lectura, las plantillas pueden regenerarse in situ para permitir una segunda lectura desde el extremo opuesto de los fragmentos. De este modo, según el método, se utiliza la secuenciación de un solo extremo o un extremo de los fragmentos de ADN. Se realiza la secuenciación parcial de los fragmentos de ADN presentes en la muestra, y se cuentan las etiquetas de secuencia que comprenden lecturas de longitud predeterminada, por ejemplo, 36 pb, que se asignan a un genoma de referencia conocido.
[0118] La longitud de la secuencia de lectura está asociada con la tecnología de secuenciación particular. Los métodos NGS proporcionan lecturas de secuencia que varían en tamaño desde decenas hasta cientos de pares de bases. En algunas realizaciones del método descrito en el presente documento, las lecturas de la secuencia son de aproximadamente 20 pb, aproximadamente 25 pb, aproximadamente 30 pb, aproximadamente 35 pb aproximadamente 40 pb, aproximadamente 45 pb, aproximadamente 50 pb, aproximadamente 60 pb aproximadamente 65 pb, aproximadamente 70 pb, aproximadamente 75 pb, aproximadamente 80 pb aproximadamente 85 pb, aproximadamente 90 pb, aproximadamente 95 pb, aproximadamente 100 pb aproximadamente 110 pb, aproximadamente 120 pb, aproximadamente 130, aproximadamente 140 pb aproximadamente 150 pb, aproximadamente 250 pb, aproximadamente 300 pb, aproximadamente 350 pb aproximadamente 400 pb, aproximadamente 450 pb o aproximadamente 500 pb. Se espera que los avances tecnológicos permitan lecturas de un solo extremo de más de 500 pb, permitiendo lecturas de más de aproximadamente 1.000 pb cuando se generan lecturas de extremos emparejados. En una realización, las lecturas de secuencia son 36 pb. Otros métodos de secuenciación que pueden emplearse por el método de la invención incluyen los métodos de secuenciación de una sola molécula que pueden secuenciar moléculas de ácidos nucleicos >5000 pb. La cantidad masiva de salida de secuencia se transfiere mediante una tubería de análisis que transforma la salida de imágenes primarias del secuenciador en cadenas de bases. Un paquete de algoritmos integrados realiza los pasos principales de la transformación de datos primarios: análisis de imágenes, puntuación de intensidad, llamada de base y alineación.
[0119] En una realización, se lleva a cabo la secuenciación parcial de fragmentos de ADN presentes en la muestra, y las etiquetas de secuencia que comprende lecturas de longitud predeterminadas, por ejemplo 36 pb, que mapa para un genoma de referencia conocida se cuentan. Solo las lecturas de secuencia que se alinean de forma única con el genoma de referencia se cuentan como etiquetas de secuencia. En una realización, el genoma de referencia es la secuencia del genoma de referencia humano NCBI36/hg18, que está disponible en la web en genome.ucsc.edu/cgi-bin/hgGateway?org=Human&db=hg18&hgsid=166260105). Otras fuentes de información de secuencias públicas incluyen GenBank, dbEST, dbSTS, EMBL (Laboratorio Europeo de Biología Molecular) y DDBJ (el Banco de Datos de ADN de Japón). En otra realización, el genoma de referencia comprende la secuencia de genoma de referencia humano NCBI36/hg18 y un genoma de secuencias diana artificial, que incluye secuencias diana polimórficas, por ejemplo, un genoma de SNP que comprende las SEQ ID NO: 1-56. En otra realización más, el genoma de referencia es un genoma de secuencia diana artificial que comprende secuencias diana polimórficas, por ejemplo, secuencias de SNP de SEQ ID NO: 1-56.
[0120] El mapeo de las etiquetas de secuencia se logra comparando la secuencia de la etiqueta con la secuencia del genoma de referencia para determinar el origen cromosómico de la molécula de ácido nucleico secuenciado (por ejemplo, ADNcf), y no se necesita información específica de la secuencia genética. Hay una serie de algoritmos informáticos disponibles para alinear secuencias, incluyendo, entre otros, BLAST (Altschul et al., 1990), BLITZ (MPsrch) (Sturrock y collins, 1993), FASTA (Person & Lipman, 1988), BOWTIE (Langmead) et al., Genome Biology 10: R25.1-R25,10 [2009]), o ELAND (Illumina, Inc., San Diego, CA, E e . U U . ) . En una realización, un extremo de las copias expandidas clonalmente de las moléculas de ADNcrc de plasma se secuencia y procesa mediante análisis de alineación bioinformática para el Analizador del Genoma de Illumina, que utiliza el software Efficient Large Scale Alignment of Nucleotide Databases (ELAND). El análisis de la información de secuenciación para la determinación de aneuploidía puede permitir que un pequeño grado de desajuste (0-2 desajustes por etiqueta de secuencia) tenga en cuenta los polimorfismos menores que pueden existir entre el genoma de referencia y los genomas en la muestra mixta. El análisis de la información de secuenciación para la determinación de la fracción fetal puede permitir un pequeño grado de desajuste en función de la secuencia polimórfica. Por ejemplo, se puede permitir un pequeño grado de desajuste si la secuencia polimórfica es un STR. En los casos en que la secuencia polimórfica es un SNP, todas las secuencias que coinciden exactamente con cualquiera de los dos alelos en el sitio de SNP se cuentan primero y se filtran de las lecturas restantes, por lo que se puede permitir un pequeño grado de falta de coincidencia.
Preparación de la biblioteca de secuenciación
[0121] Secuenciadores de ADN de próxima generación, como los 454-FLX (Roche; en la dirección web 454.com), SOLiDTM3 (Applied Biosystems; en la dirección web solid.appliedbiosystems.com), y el Genome Analyzer (Illumina; http://www.ilumina.com/pages.ilmn?ID=204) han transformado el panorama de la genética a través de su capacidad para producir cientos de megabases de información de secuencia en una sola ejecución.
[0122] Los métodos de secuenciación requieren la preparación de bibliotecas de secuenciación. La preparación de la biblioteca de secuenciación implica la producción de una colección aleatoria de fragmentos de a Dn modificados por adaptadores, que están listos para ser secuenciados. Las bibliotecas de secuenciación de polinucleótidos pueden prepararse a partir de ADN o ARN, incluidos equivalentes, análogos de ADN o ADNc, que es complementario o copia de ADN producido a partir de una plantilla de ARN, por ejemplo, por la acción de la transcriptasa inversa. Los polinucleótidos pueden originarse en la forma de ADN de doble cadena (ADNds) (por ejemplo, fragmentos de ADN genómico, productos de PCR y amplificación) o polinucleótidos que pueden haberse originado en forma de cadena simple, como ADN o ARN, y se han convertido en la forma de ADN de doble cadena. A modo de ejemplo, las moléculas de ARNm pueden copiarse en ADNc de doble cadena adecuados para usar en la preparación de una biblioteca de secuenciación. La secuencia precisa de las moléculas de polinucleótido primarias generalmente no es material para el método de preparación de bibliotecas, y puede ser conocida o desconocida. En una realización, las moléculas de polinucleótido son moléculas de ADN. Más particularmente, las moléculas de polinucleótido representan el complemento genético completo de un organismo, y son moléculas de ADN genómico, por ejemplo, moléculas de ADNnc, que incluyen secuencias tanto de intrones como de exones (secuencia codificadora), así como secuencias reguladoras no codificantes, tales como secuencias promotoras y potenciadoras. Aún más particularmente, las moléculas de polinucleótido primarias son moléculas de ADN genómico humano, por ejemplo, moléculas de ADNcf presentes en la sangre periférica de un sujeto preñado. La preparación de bibliotecas de secuenciación para algunas plataformas de secuenciación NGS requiere que los polinucleótidos sean de un rango específico de tamaños de fragmentos, por ejemplo, 0-1200 pb. Por lo tanto, puede requerirse la fragmentación de polinucleótidos, por ejemplo, ADN genómico. ADNcf existe como fragmentos de <300 pares de bases. Por lo tanto, la fragmentación de ADNcf no es necesaria para generar una biblioteca de secuenciación utilizando muestras de ADNcf. Fragmentación de moléculas de polinucleótidos por medios mecánicos p. ej. nebulización, sonicación e hidrosial, da como resultado fragmentos con una mezcla heterogénea de extremos romos y extremos sobresalientes en 3' y 5'. Ya sea que los polinucleótidos estén fragmentados a la fuerza o existan naturalmente como fragmentos, se convierten en ADN de extremos romos que tienen 5-fosfatos y 3'-hidroxilo.
[0123] Típicamente, los extremos de los fragmentos se reparan al final, es decir, con extremos romos utilizando métodos o kits conocidos en la técnica. Los fragmentos de extremos romos se pueden fosforilar mediantetratamiento enzimático, por ejemplo, utilizando polinucleótido quinasa. En algunas realizaciones, se agrega un único desoxinucleótido, por ejemplo, desoxiadenosina (A) a los extremos 3' de los polinucleótidos, por ejemplo, por la actividad de ciertos tipos de ADN polimerasa, como la Taq polimerasa o Klenow exo menos polimerasa. Los productos con cola de dA son compatibles con el saliente "T" presente en el extremo 3' de cada región dúplex de adaptadores a los que se ligan en una etapa posterior. Cola de dA evita la auto-ligación de ambos polinucleótidos de extremos romos, de manera que existe un sesgo hacia la formación de las secuencias ligadas al adaptador. Los polinucleótidos con cola de dA se ligan a secuencias de polinucleótidos adaptadores de doble cadena. Se puede usar el mismo adaptador para ambos extremos del polinucleótido, o se pueden utilizar dos conjuntos de adaptadores. Los métodos de ligación son conocidos en la técnica y utilizan enzimas ligasa, como la a Dn ligasa, para enlazar covalentemente el adaptador al polinucleótido de cola dA. El adaptador puede contener un resto 5'-fosfato para facilitar la ligadura al 3'-OH diana. El polinucleótido con cola de dA contiene un resto 5'-fosfato, ya sea residual del proceso de cizallamiento, o agregado mediante una etapa de tratamiento enzimático, y se ha reparado al final, y opcionalmente se ha extendido por una base o bases sobresalientes, para dar una 3'-OH adecuada para la ligadura. Los productos de la reacción de ligadura se purifican para eliminar los adaptadores no ligados, adaptadores que pueden estar ligados entre sí, y para seleccionar un rango de tamaños de plantillas para la generación de agrupaciones, que puede ir precedida de una amplificación, por ejemplo, una amplificación por PCR. La purificación de los productos de ligadura se puede obtener mediante métodos que incluyen electroforesis en gel e inmovilización reversible en fase sólida (SPRI).
[0124] Los protocolos estándar, por ejemplo, los protocolos para la secuenciación usando, por ejemplo, la plataforma Illumina, instruir a los usuarios para purificar los productos de reparación de extremos antes de cola de dA, y para purificar los productos de cola de dA antes de las etapas de adaptador de ligadura de la preparación de la biblioteca. La purificación de los productos reparados en el extremo y los productos con cola de dA eliminan las enzimas, tampones, sales y similares para proporcionar condiciones de reacción favorables para la etapa enzimática posterior. En una forma de realización, las etapas de reparación de extremos, ligadura de dA y ligadura del adaptador excluyen las etapas de purificación. Por lo tanto, en una realización, el método de la invención abarca la preparación de una biblioteca de secuenciación que comprende los pasos consecutivos de reparación de extremo, cola de dA y ligadura de adaptador. En las formas de realización para preparar bibliotecas de secuenciación que no requieren la etapa de seguimiento dA, por ejemplo, los protocolos para la secuenciación utilizando las plataformas de Roche 454 y SOLIDTM3, las etapas de reparación de extremos y ligadura del adaptador excluyen la etapa de purificación de los productos reparados antes de la adaptación de la ligación de adaptador.
[0125] En un paso siguiente de una realización del método, se prepara una reacción de amplificación. La etapa de amplificación introduce en las moléculas de plantilla ligadas por el adaptador las secuencias de oligonucleótidos requeridas para la hibridación con la célula de flujo. Los contenidos de una reacción de amplificación son conocidos por un experto en la técnica e incluyen sustratos apropiados (Como los dNTP), enzimas (por ejemplo, una polimerasa ADN) y componentes de tampón necesarios para una reacción de amplificación. Opcionalmente, se puede omitir la amplificación de polinucleótidos ligados al adaptador. En general, las reacciones de amplificación requieren al menos dos cebadores de amplificación, es decir, oligonucleótidos de cebador, que pueden ser idénticos, e incluyen una "porción específica del adaptador", capaz de hibridar con una secuencia de unión a cebador en la molécula de polinucleótido que se amplificará (o su complemento si la plantilla se ve como una sola hebra) durante el paso de recocido. Una vez formados, la biblioteca de plantillas preparada de acuerdo con los métodos descritos anteriormente se puede usar para la amplificación de ácido nucleico en fase sólida. El término "amplificación en fase sólida", como se usa en el presente documento, se refiere a cualquier reacción de amplificación de ácido nucleico llevada a cabo en o en asociación con un soporte sólido, de manera tal que todos o una parte de los productos amplificados se inmovilicen en el soporte sólido a medida que se forman. En particular, el término abarca la reacción en cadena de la polimerasa en fase sólida (PCR en fase sólida) y la amplificación isotérmica en fase sólida, que son reacciones análogas a la amplificación en fase de solución estándar, excepto que uno o ambos de los cebadores de amplificación directa e inversa se inmovilizan en el soporte sólido. La PCR en fase sólida cubre sistemas como las emulsiones, en donde un cebador se ancla a una perla y el otro se encuentra en solución libre, y la formación de colonias en matrices de gel de fase sólida donde un cebador se ancla a la superficie y el otro se encuentra en solución libre. Después de la amplificación, y las bibliotecas de secuenciación se pueden analizar mediante electroforesis capilar microfluídica para garantizar que la biblioteca esté libre de dímeros adaptadores o ADN de cadena sencilla. La biblioteca de moléculas de polinucleótido de plantilla es particularmente adecuada para uso en métodos de secuenciación en fase sólida. Además de proporcionar plantillas para la secuenciación en fase sólida y la PCR en fase sólida, las plantillas de biblioteca proporcionan plantillas para la amplificación del genoma completo.
[0126] En una realización, la biblioteca de polinucleótidos ligados al adaptador se somete a secuenciación masiva en paralelo, que incluye técnicas para la secuenciación de millones de fragmentos de ácidos nucleicos, por ejemplo, el uso de la unión de ADN genómico fragmentado aleatoriamente a una superficie plana, ópticamente transparente y amplificación de fase sólida para crear una célula de flujo de secuenciación de alta densidad con millones de agrupaciones. Los arreglos agrupados se pueden preparar usando un proceso de termociclado, como se describe en la patente WO9844151, o un proceso por el cual la temperatura se mantiene constante, y los ciclos de extensión y desnaturalización se realizan usando cambios de reactivos. El método de Solexa/Illumina al que se hace referencia aquí se basa en la unión de ADN genómico fragmentado aleatoriamente a una superficie plana, ópticamente transparente. Los fragmentos de ADN adjuntos se extienden y se amplifican en puente para crear una célula de flujo de secuenciación de densidad ultraalta con millones de agrupaciones que contienen miles de copias de la misma plantilla (WO 00/18957 y WO 98/44151). Las plantillas de grupos se secuencian utilizando una robusta tecnología de secuenciación por síntesis de ADN de cuatro colores que emplea terminadores reversibles con tintes fluorescentes removibles. Alternativamente, la biblioteca puede amplificarse en perlas en las que cada perla contiene un cebador de amplificación directa e inversa.
[0127] La secuenciación de las bibliotecas amplificadas se puede llevar a cabo usando cualquier técnica de secuenciación adecuada como se describe en el presente documento. En una realización, la secuenciación es una secuenciación masivamente paralela que usa secuenciación por síntesis con terminadores de tinte reversibles. En otras realizaciones, la secuenciación es una secuenciación masivamente paralela utilizando la secuenciación por ligación. En otras realizaciones, la secuenciación es la secuenciación de una sola molécula.
Determinación de la aneuploidía
[0128] La precisión requerida para determinar correctamente si una aneuploidía está presente o ausente en una muestra, se basa en parte en la variación del número de etiquetas de secuencia que se mapean en el genoma de referencia entre las muestras dentro de una secuenciación (variabilidad inter-cromosómica), y la variación del número de etiquetas de secuencia que se asignan al genoma de referencia en diferentes ejecuciones de secuenciación (variabilidad entre secuencias). Por ejemplo, las variaciones pueden ser particularmente pronunciadas para las etiquetas que se asignan a secuencias de referencia ricas en GC o pobres en GC. En una realización, el método utiliza la información de secuenciación para calcular la dosis de cromosoma, lo que explica de manera intrínseca la variabilidad acumulada derivada de la variabilidad inter-cromosómica, inter-secuenciación y dependiente de la plataforma. Las dosis de cromosomas se determinan a partir de la información de secuenciación, es decir, el número de etiquetas de secuencia, para la secuencia de interés, por ejemplo, el cromosoma 21, y el número de etiquetas de secuencia para una secuencia de normalización. La identificación de una secuencia de normalización se realiza en un conjunto de muestras calificadas que se sabe que no contienen una aneuploidía de la secuencia de interés. El diagrama de flujo proporcionado en la Figura 1 muestra una realización del método 100 mediante el cual se identifican secuencias normalizantes, por ejemplo, cromosomas normalizadores, y se determina la presencia o ausencia de una aneuploidía.
[0129] En el paso 110, se obtiene un conjunto de muestras maternas calificadas para identificar secuencias de normalización cualificadas, por ejemplo, cromosomas de normalización, y para proporcionar valores de varianza para el uso en la determinación de la identificación estadísticamente significativa de una aneuploidía en muestras de ensayo. En la etapa 110, una pluralidad de muestras biológicas calificadas se obtienen de una pluralidad de sujetos que se sabe que comprenden células que tienen un número de copias normal para cualquier secuencia de interés, por ejemplo, un cromosoma de interés tal como un cromosoma asociado con una aneuploidía. En una realización, las muestras calificadas se obtienen de madres embarazadas con un feto que se ha confirmado usando medios citogenéticos para tener un número normal de copias de cromosomas en relación con el cromosoma de interés. Las muestras maternas biológicas calificadas pueden ser muestras de fluidos biológicos, por ejemplo, muestras de plasma, o cualquier muestra adecuada como se describe anteriormente que contenga una mezcla de moléculas de ADNfc fetal y maternal. La muestra es una muestra materna que se obtiene de una mujer embarazada, por ejemplo, una mujer embarazada. Cualquier muestra biológica materna se puede usar como una fuente de ácidos nucleicos fetales y maternos que están contenidos en las células o que están "libres de células". En algunas realizaciones, es ventajoso obtener una muestra materna que comprenda ácidos nucleicos libres de células, por ejemplo, ADNcf. Preferiblemente, la muestra biológica materna es una muestra de fluido biológico. Un fluido biológico incluye, como ejemplos no limitativos, sangre, plasma, suero, sudor, lágrimas, esputo, orina, esputo, flujo de oído, linfa, saliva, líquido cefalorraquídeo, estragos, suspensión de médula ósea, flujo vaginal, lavado transcervical, líquido cerebral, ascitis, leche, secreciones de vías respiratorias, intestinales y genitourinarias, muestras de líquido amniótico y leucoforesis. En algunas realizaciones, la muestra de fluido biológico es una muestra que se puede obtener fácilmente mediante procedimientos no invasivos, por ejemplo, sangre, plasma, suero, sudor, lágrimas, esputo, orina, esputo, flujo del oído y saliva. En algunas realizaciones, la muestra biológica es una muestra de sangre periférica, o el plasma y/o sus fracciones de suero. En otra realización, la muestra es una mezcla de dos o más muestras biológicas, por ejemplo, una muestra biológica puede comprender dos o más muestras de un fluido biológico. Tal como se usa en el presente documento, los términos "sangre", "plasma" y "suero" abarcan expresamente las fracciones o partes procesadas de los mismos. En algunas realizaciones, la muestra biológica se procesa para obtener una fracción de muestra, por ejemplo, plasma, que contiene la mezcla de ácidos nucleicos maternos y fetales. En algunas realizaciones, la mezcla de ácidos nucleicos maternos y fetales se procesa adicionalmente a partir de la fracción de muestra, por ejemplo, plasma, para obtener una muestra que comprende una mezcla purificada de ácidos nucleicos maternos y fetales, por ejemplo, ADNcf. Los ácidos nucleicos libres de células, incluido el ADN libre de células, pueden obtenerse mediante diversos métodos conocidos en la técnica a partir de muestras biológicas que incluyen, entre otras, plasma, suero y orina (Fan et al., Proc Natl Acad Sci 105: 16266-16271). [2008]; Koide et al., Prenatal Diagnosis 25: 604-607 [2005]; Chen et al., Nature Med. 2:1033-1035 [1996]; Lo et al., Lancet 350: 485-487 [1997). Para separar el ADNfc de las células, fraccionamiento, centrifugación (p. ej., Centrifugación en gradiente de densidad), precipitación específica de ADN o clasificación de células y/o métodos de separación de células de alto rendimiento pueden ser utilizados. Los kits disponibles comercialmente para la separación manual y automática de ADNcf están disponibles (Roche Diagnostics, Indianapolis, IN, Qiagen, Valencia, CA, Macherey-Nagel, Duren, DE). En algunos casos, puede ser ventajoso fragmentar las moléculas de ácido nucleico en la muestra de ácido nucleico. La fragmentación puede ser aleatoria o específica, como se logra, por ejemplo, mediante la digestión con endonucleasas de restricción. Los métodos para la fragmentación aleatoria son bien conocidos en la técnica e incluyen, por ejemplo, la digestión con DNAsa limitada, el tratamiento con álcali y la cizalladura física. En una realización, los ácidos nucleicos de la muestra se obtienen a partir de ADNcf, que no está sujeto a fragmentación. En otras realizaciones, los ácidos nucleicos de la muestra se obtienen como ADN genómico, que se somete a fragmentación en fragmentos de aproximadamente 500 o más pares de bases, y a los cuales se pueden aplicar fácilmente los métodos de NGS. Se prepara una biblioteca de secuenciación a partir de ADN naturalmente fragmentado o fragmentado por la fuerza. En una realización, la preparación de la biblioteca de secuenciación comprende los pasos consecutivos de la reparación del extremo, la cola de dA y el ligamiento con adaptador de los fragmentos de ADN. En otra realización, la preparación de la biblioteca de secuenciación comprende los pasos consecutivos de la reparación final y la ligadura adaptadora de los fragmentos de ADN.
[0130] En el paso 120, al menos una porción de cada uno de todos los ácidos nucleicos calificados contenidos en las muestras maternas calificadas están secuenciados. Antes de la secuenciación, la mezcla de ácidos nucleicos fetales y maternos, por ejemplo, ADNcf purificado, se modifica para preparar una biblioteca de secuenciación para generar lecturas de secuencia de entre 20 y 40 pb, por ejemplo, 36 pb, que están alineadas con un genoma de referencia, por ejemplo, hg18. En algunas realizaciones, las lecturas de secuencias comprenden aproximadamente 20 pb, aproximadamente 25 pb, aproximadamente 30 pb, aproximadamente 35 pb, aproximadamente 40 pb, aproximadamente 45 pb, aproximadamente 50 pb, aproximadamente 55 pb, aproximadamente 65 pb, aproximadamente 70 pb, aproximadamente 75 pb, aproximadamente 80 pb, aproximadamente 85 pb, aproximadamente 90 pb, aproximadamente 95 pb, aproximadamente 100 pb, aproximadamente 110 pb, aproximadamente 120 pb, aproximadamente 130, aproximadamente 140 pb, aproximadamente 150 pb, aproximadamente 200 pb, aproximadamente 250 pb, aproximadamente 300 pb, aproximadamente 350 pb, aproximadamente 400 pb, aproximadamente 450 pb, aproximadamente 500 pb. Se espera que los avances tecnológicos permitan lecturas de un solo extremo de más de 500 pb, permitiendo lecturas de más de aproximadamente 1.000 pb cuando se generan lecturas de extremos emparejados. En una realización, las lecturas de secuencia comprenden 36 pb. Las lecturas de secuencia se alinean con un genoma de referencia humano, y las lecturas que se asignan de forma única al genoma de referencia humano se cuentan como etiquetas de secuencia. En una realización, al menos aproximadamente 3 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 5 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 8 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 10 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 15 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 20 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 30 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 40 x 106 etiquetas de secuencia calificadas, o al menos aproximadamente 50 x 106 las etiquetas de secuencia calificada que comprenden entre 20 y 40 pb de lectura se obtienen de lecturas que se asignan de forma única a un genoma de referencia.
[0131] En el paso 130, todas las etiquetas obtenidas a partir de la secuenciación de los ácidos nucleicos en las muestras maternas calificados se cuentan para determinar una densidad de etiqueta de secuencia calificada. En una realización, la densidad de la etiqueta de secuencia se determina como el número de etiquetas de secuencia calificadas asignadas a la secuencia de interés en el genoma de referencia. En otra realización, la densidad de etiquetas de secuencia calificada se determina como el número de etiquetas de secuencia calificadas asignadas a una secuencia de interés normalizada a la longitud de la secuencia de interés calificada a la que se asignan. Las densidades de etiqueta de secuencia que se determinan como una relación de la densidad de etiqueta con respecto a la longitud de la secuencia de interés se denominan en este documento relaciones de densidad de etiqueta. No se requiere la normalización de la longitud de la secuencia de interés, y puede incluirse como un paso para reducir el número de dígitos en un número para simplificarlo para la interpretación humana. Ya que todas las etiquetas de secuencia calificadas se mapean y se cuentan en cada una de las muestras calificadas, se determina la densidad de la etiqueta de secuencia para una secuencia de interés, por ejemplo, el cromosoma de interés, en las muestras calificadas, así como las densidades de la etiqueta de secuencia para secuencias adicionales a partir de las cuales secuencias normalizadas p. ej. cromosomas, se identifican posteriormente. En una realización, la secuencia de interés es un cromosoma que está asociado con una aneuploidía cromosómica, por ejemplo, el cromosoma 21, y la secuencia de normalización calificada es un cromosoma que no está asociado con una aneuploidía cromosómica y cuya variación en la densidad de la etiqueta de la secuencia se aproxima mejor que del cromosoma 21. Por ejemplo, una secuencia de normalización calificada es una secuencia que tiene la variabilidad más pequeña. En algunas realizaciones, la secuencia de normalización es una secuencia que distingue mejor una o más muestras calificadas de una o más muestras afectadas, es decir, la secuencia de normalización es una secuencia que tiene la mayor diferenciabilidad. El nivel de diferenciabilidad se puede determinar como una diferencia estadística entre las dosis de cromosomas en una población de muestras calificadas y las dosis de cromosomas en una o más muestras de prueba. En otra realización, la secuencia de interés es un segmento de un cromosoma asociado con una aneuploidía parcial, por ejemplo, una deleción o inserción cromosómica, o una translocación cromosómica desequilibrada, y la secuencia normalizada es un segmento cromosómico que no está asociado con la aneuploidía parcial y cuya variación en la densidad de la etiqueta de secuencia se aproxima mejor a la del segmento cromosómico asociado con la aneuploidía parcial.
[0132] En el paso 140, en base a las densidades de etiquetas calificadas calculadas, una dosis de secuencia calificada para una secuencia de interés se determina como la relación de la densidad de etiqueta de secuencia para la secuencia de interés y la densidad de etiqueta de secuencia calificada para secuencias adicionales de las cuales se identifican posteriormente las secuencias normalizadoras. En una realización, las dosis para el cromosoma de interés, por ejemplo, el cromosoma 21, se determinan como una proporción de la densidad de la etiqueta de secuencia del cromosoma 21 y la densidad de la etiqueta de secuencia para cada uno de los cromosomas restantes, es decir, los cromosomas 1-20, cromosoma 22, cromosoma X y cromosoma Y (véase Ejemplos 3-5 y Figuras 9-15).
[0133] En el paso 145, una secuencia de normalización, por ejemplo, un cromosoma de normalización, se identifica por una secuencia de interés, por ejemplo el cromosoma 21, en una muestra calificada en base a las dosis de secuencia calculadas. El método identifica secuencias que inherentemente tienen características similares y que son propensas a variaciones similares entre las muestras y las ejecuciones de secuenciación, y que son útiles para determinar las dosis de secuencia en muestras de prueba. En algunas realizaciones, la secuencia de normalización es la que mejor diferencia una muestra afectada, es decir, una muestra aneuploide, de una o más muestras calificadas. En otras realizaciones, una secuencia de normalización es una secuencia que muestra una variabilidad en el número de etiquetas de secuencia que se asignan a ella entre muestras y ejecuciones de secuenciación que se aproximan mejor a la secuencia de interés para la cual se utiliza como parámetro de normalización, y/o que puede diferenciar mejor una muestra afectada de una o más muestras no afectadas.
[0134] En algunas realizaciones, se identifica más de una secuencia de normalización. Por ejemplo, la variación, por ejemplo, el coeficiente de variación en la dosis de cromosoma para el cromosoma de interés 21 es mínimo cuando se utiliza la densidad de la etiqueta de secuencia del cromosoma 14. En otras realizaciones, se identifican dos, tres, cuatro, cinco, seis, siete, ocho o más secuencias de normalización para uso en la determinación de una dosis de secuencia para una secuencia de interés en una muestra de prueba.
[0135] En una realización, la secuencia de normalización para el cromosoma 21 se selecciona a partir del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma
7, cromosoma 8, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, cromosoma 16 y cromosoma 17. Preferiblemente, la secuencia de normalización para el cromosoma 21 se selecciona del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 11, cromosoma 12 y cromosoma 14.
Alternativamente, la secuencia de normalización para el cromosoma 21 es un grupo de cromosomas seleccionados del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, cromosoma 16 y cromosoma 17. En otras realizaciones, la secuencia de normalización para el cromosoma 21 es un grupo de cromosomas seleccionados del cromosoma 9, cromosoma 1, cromosoma 2, cromosoma 11, cromosoma 12 y cromosoma 14.
[0136] En una realización, la secuencia de normalización para el cromosoma 18 se selecciona cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 9, cromosoma
10, cromosoma 11, cromosoma 12, cromosoma 12 y el cromosoma 14. Preferiblemente, la secuencia de normalización para el cromosoma 18 es cromosoma 8, el cromosoma 2, el cromosoma 3, el cromosoma 5, el cromosoma 6, el cromosoma 12 y el cromosoma 14 seleccionados. Alternativamente, la secuencia de normalización para el cromosoma 18 es un grupo de los cromosomas seleccionados del cromosoma 8, cromosoma 2, cromosoma
3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13 y cromosoma 14. En otras realizaciones, la secuencia de normalización para el cromosoma 18 es un grupo de cromosomas seleccionados del cromosoma 8, cromosoma 2, cromosoma 3, cromosoma 5, cromosoma 6, cromosoma 12, y el cromosoma 14.
[0137] En una realización, la secuencia de normalización para el cromosoma X se selecciona entre el cromosoma 1, el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 4, el cromosoma 7, el cromosoma 8, el cromosoma 8, el cromosoma 8, el cromosoma 12, el cromosoma 12, el cromosoma 12 y el cromosoma cromosoma 16. Preferiblemente, la secuencia de normalización para el cromosoma X se selecciona entre el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 5, el cromosoma 6 y el cromosoma 8.
Alternativamente, la secuencia de normalización para el cromosoma X es un grupo de los cromosomas seleccionados del cromosoma 1, cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 13, cromosoma 14, cromosoma 15, y cromosoma 16. En otras realizaciones, la secuencia de normalización para el cromosoma X es un grupo de cromosomas seleccionados entre el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 5, el cromosoma 6 y el cromosoma 8.
[0138] En una realización, la secuencia de normalización para el cromosoma 13 es un cromosoma seleccionado del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma
9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 14, cromosoma 18 y cromosoma 21. Preferiblemente, la secuencia de normalización para el cromosoma 13 se selecciona de entre el cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6 y cromosoma 8. En otra realización, la secuencia normalizadora para el cromosoma 13 es un grupo de cromosomas seleccionados del cromosoma 2, cromosoma 3, cromosoma 4, cromosoma 5, cromosoma 6, cromosoma 7, cromosoma 8, cromosoma 9, cromosoma 10, cromosoma 11, cromosoma 12, cromosoma 14, cromosoma 18, y cromosoma 21. En otras realizaciones, la secuencia de normalización para el cromosoma 13 es un grupo de cromosomas seleccionados entre el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 5, el cromosoma 6 y el cromosoma 8.
[0139] La variación en la dosis de cromosoma para el cromosoma Y es mayor que 30 independientemente de que se utiliza el cromosoma normalizador en la determinación de la dosis de cromosoma Y. Por lo tanto, cualquier cromosoma, o un grupo de dos o más cromosomas seleccionados de los cromosomas 1-22 y el cromosoma X se pueden usar como la secuencia de normalización para el cromosoma Y. En una realización, el al menos un cromosoma de normalización es un grupo de cromosomas que consiste en los cromosomas 1-22 y el cromosoma X.
En otra realización, el al menos un cromosoma normalizador es un grupo de cromosomas seleccionados entre el cromosoma 2, el cromosoma 3, el cromosoma 4, el cromosoma 5 y el cromosoma 6.
[0140] Basado en la identificación de la(s) secuencia(es) de normalización en muestras calificadas, una dosis de secuencia se determina para una secuencia de interés en una muestra de prueba que comprende una mezcla de ácidos nucleicos derivados de genomas que difieren en una o más secuencias de interés.
[0141] En el paso 115, una muestra de ensayo por ejemplo, muestra de plasma, que comprende ácidos nucleicos fetales y maternos por ejemplo ADNcf, se obtiene de un sujeto embarazado por ejemplo, una mujer embarazada, para la que debe determinarse la presencia o ausencia de una aneuploidía fetal.
[0142] Una biblioteca de secuenciación se preparó como se describe para el paso 120, y en el paso 125, al menos una porción de los ácidos nucleicos de prueba en la muestra de ensayo se secuencia para generar millones de lecturas de secuencia que comprende entre 20 y 500 pb por ejemplo de 36 pb. como en el paso 120, las lecturas generadas a partir de la secuenciación de los ácidos nucleicos en la muestra de prueba se mapean de forma única a un genoma de referencia humano y se cuentan. Como se describe en el paso 120, al menos aproximadamente 3 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 5 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 8 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 10 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 15 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 20 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 30 x 106 etiquetas de secuencia calificadas, al menos aproximadamente 40 x 106 etiquetas de secuencia calificadas, o al menos aproximadamente 50 x 106 etiquetas de secuencia calificadas que comprenden entre 20 y 40 lecturas de pb se obtienen de lecturas que se asignan de forma única al genoma de referencia humano.
[0143] En el paso 135, todas las etiquetas obtenidas a partir de la secuenciación de los ácidos nucleicos en las muestras de ensayo se cuentan para determinar una densidad de etiqueta de secuencia de prueba. En una realización, el número de etiquetas de secuencia de prueba mapeadas a una secuencia de interés se normaliza a la longitud conocida de una secuencia de interés a la que se mapean para proporcionar una densidad de etiqueta de secuencia de prueba. Como se describe para las muestras calificadas, no se requiere la normalización a la longitud conocida de una secuencia de interés, y puede incluirse como un paso para reducir el número de dígitos en un número para simplificarlo para la interpretación humana. Ya que todas las etiquetas de secuencia de prueba mapeadas se cuentan en la muestra de prueba, se determina la densidad de etiqueta de secuencia para una secuencia de interés, por ejemplo, una secuencia clínicamente relevante, como el cromosoma 21, en las muestras de prueba, al igual que las densidades de etiqueta de secuencia para secuencias adicionales que corresponden a al menos una secuencia de normalización identificada en las muestras calificadas.
[0144] En el paso 150, basándose en la identidad de al menos una secuencia de normalización en las muestras calificadas, una dosis de secuencia de prueba se determina para una secuencia de interés en la muestra de ensayo. La dosis de secuencia, por ejemplo, la dosis de cromosoma, para una secuencia de interés en una muestra de prueba es una relación de la densidad de la etiqueta de secuencia determinada para la secuencia de interés en la muestra de prueba y la densidad de la etiqueta de secuencia de al menos una secuencia de normalización determinada en la muestra de prueba, en donde la secuencia de normalización en la muestra de prueba corresponde a la secuencia de normalización identificada en las muestras calificadas para la secuencia particular de interés. Por ejemplo, si se determina que la secuencia de normalización identificada para el cromosoma 21 en las muestras calificadas es el cromosoma 14, entonces la dosis de secuencia de prueba para el cromosoma 21 (secuencia de interés) se determina como la relación de la densidad de la etiqueta de secuencia para el cromosoma 21 y la densidad de la etiqueta de secuencia para el cromosoma 14 se determinó en la muestra de prueba. De manera similar, se determinan las dosis de cromosomas para los cromosomas 13, 18, X, Y y otros cromosomas asociados con aneuploidías cromosómicas. como se describió anteriormente, una secuencia de interés puede ser parte de un cromosoma, por ejemplo, un segmento de cromosoma. Por consiguiente, la dosis para un segmento cromosómico se puede determinar como la proporción de la densidad de la etiqueta de secuencia determinada para l segmento en la muestra de prueba y la densidad de la etiqueta de secuencia para el segmento de cromosoma normalizado en la muestra de prueba, en donde el segmento de normalización en la muestra de prueba corresponde al segmento de normalización identificado en las muestras calificadas para el segmento de interés particular.
[0145] En el paso 155, los valores de umbral son derivados de valores de desviación estándar establecidos para una pluralidad de dosis de secuencia calificadas. La clasificación precisa depende de las diferencias entre las distribuciones de probabilidad para las diferentes clases, es decir, el tipo de aneuploidía. Preferiblemente, los umbrales se eligen de la distribución empírica para cada tipo de aneuploidía, por ejemplo, trisomía 21. Los posibles valores de umbral que se establecieron para clasificar la trisomía 13, la trisomía 18, la trisomía 21 y las aneuploidías de monosomía X como se describe en los Ejemplos, que describen el uso de método para determinar las aneuploidías cromosómicas mediante la secuenciación del ADNfc extraído de una muestra materna que comprende una mezcla de ácidos nucleicos fetales y maternos.
[0146] En el paso 160, la variación del número de copias de la secuencia de interés por ejemplo, aneuploidía cromosómica o parcial, se determina en la muestra de ensayo mediante la comparación de la dosis de secuencia de prueba para la secuencia de interés a al menos un valor umbral establecido a partir de la secuencia cualificado dosis.
[0147] En el paso 160, la dosis calculada para una secuencia de prueba de interés se compara con el conjunto como los valores de umbral que se eligen de acuerdo con un umbral definido por el usuario de fiabilidad para clasificar la muestra como "normal", "afectada" o "no llamada" en el paso 165. Las muestras "sin llamada" son muestras para las que no se puede hacer un diagnóstico definitivo con fiabilidad.
[0148] Otra realización descrita en el presente documento es un método para proporcionar el diagnóstico prenatal de una aneuploidía cromosómica fetal en una muestra biológica que comprende moléculas de ácido nucleico fetal y materno. El diagnóstico se realiza sobre la base de recibir los datos de la secuenciación de al menos una parte de la mezcla de las moléculas de ácido nucleico materno y fetal derivadas de una muestra de prueba biológica, por ejemplo, una muestra de plasma materno, computando a partir de los datos de secuenciación una dosis de cromosoma normalizante para uno o más cromosomas de interés, determinando una diferencia estadísticamente significativa entre la dosis de cromosoma normalizante para el cromosoma de interés en la muestra de prueba y un valor umbral establecido en una pluralidad de muestras calificadas (normales), y proporcionando el diagnóstico prenatal basado en la diferencia estadística. como se describe en el paso 165 del método, se realiza un diagnóstico de normal o afectado. Se proporciona una "no llamada" en caso de que el diagnóstico de normal o afectado no se pueda realizar con confianza.
Determinación de la NVC para diagnósticos prenatales.
[0149] El ADN fetal libre de células y el ARN que circula en la sangre materna se pueden usar para el diagnóstico prenatal no invasivo temprano (NIPD) de un número creciente de afecciones genéticas, tanto para el manejo del embarazo como para ayudar a la toma de decisiones reproductivas. La presencia de ADN libre de células que circula en el torrente sanguíneo se conoce desde hace más de 50 años. Más recientemente, se descubrió la presencia de pequeñas cantidades de ADN fetal circulante en el torrente sanguíneo materno durante el embarazo (Lo et al., Lancet 350: 485-487 [1997]). Se cree que se origina a partir de células placentarias moribundas, el ADN fetal libre de células (ADNcf) consiste en fragmentos cortos que suelen tener menos de 200 pb de longitud (Chan et al., Clin Chem 50: 88-92 [2004]), que pueden ser discernidos desde las 4 semanas de gestación (Illanes et al., Early Human Dev 83: 563-566 [2007]), y se sabe que se eliminó de la circulación materna a las pocas horas de la administración (Lo et al., Am J Hum Genet 64: 218-224 [1999]). Además de ADNcf, los fragmentos de RNA fetal libre de células (ARNcf) también pueden discernirse en el torrente sanguíneo materno, que se originan a partir de genes que se transcriben en el feto o la placenta. La extracción y el posterior análisis de estos elementos genéticos fetales a partir de una muestra de sangre materna ofrece nuevas oportunidades para la NIPD.
[0150] El presente método es un método independiente de polimorfismo que para su uso en NIPD y que no requiere que el ADNcf fetal se distinga de la ADNcf materna para permitir la determinación de una aneuploidía fetal. En algunas realizaciones, la aneuploidía es una trisomía o monosomía cromosómica completa, o una trisomía o monosomía parcial. Las aneuploidías parciales son causadas por la pérdida o ganancia de parte de un cromosoma, y abarcan desequilibrios cromosómicos resultantes de translocaciones desequilibradas, inversiones desequilibradas, deleciones e inserciones. Por el momento, la aneuploidía conocida más común compatible con la vida es la trisomía 21, es decir, el síndrome de Down (SD), que se debe a la presencia de una parte o la totalidad del cromosoma 21. En raras ocasiones, la SD puede ser causada por un defecto hereditario o esporádico, por el cual se presenta un defecto adicional. Una copia de todo o parte del cromosoma 21 se une a otro cromosoma (generalmente el cromosoma 14) para formar un solo cromosoma aberrante. La SD se asocia con deterioro intelectual, graves dificultades de aprendizaje y el exceso de mortalidad causado por problemas de salud a largo plazo, como las enfermedades del corazón. Otras aneuploidías con importancia clínica conocida incluyen el síndrome de Edward (trisomía 18) y el síndrome de Patau (trisomía 13), que con frecuencia son fatales en los primeros meses de vida. Las anomalías asociadas con la cantidad de cromosomas sexuales también son conocidas e incluyen monosomía X, por ejemplo, síndrome de Turner (XO) y síndrome de triple X (XXX) en partos femeninos y síndrome de Kleinefelter (XXY) y síndrome de XYY en partos masculinos, todos los cuales están asociados con diversos fenotipos incluyendo la esterilidad y la reducción de las habilidades intelectuales. El método de la divulgación se puede utilizar para diagnosticar estas y otras anomalías cromosómicas antes del nacimiento.
[0151] Según las realizaciones de la presente divulgación, la trisomía se selecciona de trisomía 21 (T21; Síndrome de Down), trisomía 18 (T18; Síndrome de Edward), trisomía 16 (T16), trisomía 22 (T22; Síndrome de ojo de gato), trisomía 15 (T15; Síndrome de Prader Willi), trisomía 13 (T13; Síndrome de Patau), trisomía 8 (T8; Síndrome de Warkany) y XXY (Síndrome de Kleinefelter), XYY o XXX trisomías. Se apreciará que varias otras trisomías y trisomías parciales se pueden determinar en ADNcf fetal de acuerdo con las enseñanzas de la presente invención. Estos incluyen, pero no se limitan a, trisomía parcial 1q32-44, trisomía 9 p con trisomía, mosaicismo de trisomía 4, trisomía 17p, trisomía parcial 4q26-qter, trisomía 9, trisomía parcial 2p, trisomía parcial 1q y/o trisomía parcial 6p/monosomia 6q.
[0152] El método de la presente descripción también se pueden utilizar para determinar monosomía X cromosómica, y monosomías parciales tales como, monosomía 13, monosomía 15, monosomía 16, monosomía 21, y monosomía 22, que son conocidas por estar involucradas en aborto involuntario. La monosomía parcial de los cromosomas que participan típicamente en la aneuploidía completa también se puede determinar por el método de la invención. La monosomía 18p es un trastorno cromosómico raro en el que se elimina todo (o parte) del brazo corto (p) del cromosoma 18 (monosómico). El trastorno se caracteriza típicamente por estatura baja, grados variables de retraso mental, retrasos en el habla, malformaciones del cráneo y la región facial (craneofacial) y/o anomalías físicas adicionales. Los defectos craneofaciales asociados pueden variar mucho en rango y severidad de un caso a otro. Las afecciones causadas por los cambios en la estructura o el número de copias del cromosoma 15 incluyen el síndrome de Angelman y el síndrome de Prader-Willi, que implican una pérdida de la actividad genética en la misma parte del cromosoma 15, la región 15q11-q13. Se apreciará que varias translocaciones y microdeleciones pueden ser asintomáticas en el progenitor portador, pero pueden causar una enfermedad genética importante en la descendencia. Por ejemplo, una madre sana que lleva la microdeleción 15q11-q13 puede dar a luz a un niño con síndrome de Angelman, un trastorno neurodegenerativo grave. Por lo tanto, la presente invención se puede usar para identificar tal supresión en el feto. La monosomía parcial 13q es un trastorno cromosómico raro que se produce cuando falta una parte del brazo largo (q) del cromosoma 13 (monosómico). Los bebés que nacen con monosomía parcial 13q pueden presentar bajo peso al nacer, malformaciones de la cabeza y la cara (región craneofacial), anomalías esqueléticas (especialmente de las manos y los pies) y otras anomalías físicas. El retraso mental es característico de esta condición. La tasa de mortalidad durante la infancia es alta entre las personas nacidas con este trastorno. Casi todos los casos de monosomía parcial 13q ocurren al azar sin ninguna razón aparente (esporádica). El síndrome de deleción 22q11,2, también conocido como síndrome de DiGeorge, es un síndrome causado por la eliminación de una pequeña pieza del cromosoma 22. La eliminación (22 q11.2) ocurre cerca de la mitad del cromosoma en el brazo largo de uno de los par de cromosomas. Las características de este síndrome varían ampliamente, incluso entre los miembros de la misma familia, y afectan a muchas partes del cuerpo. Los signos y síntomas característicos pueden incluir defectos de nacimiento, como cardiopatía congénita, defectos en el paladar, más comúnmente relacionados con problemas neuromusculares con el cierre (insuficiencia velo-faríngea), problemas de aprendizaje, diferencias leves en la características faciales, e infecciones recurrentes. Las microdeleciones en la región cromosómica 22q11,2 se asocian con un riesgo 20 a 30 veces mayor de esquizofrenia. En una realización, el método de la invención se usa para determinar monosomías parciales que incluyen pero no se limitan a monosomía 18p, monosomía parcial del cromosoma 15 (15q11-q13), monosomía parcial 13q y monosomía parcial del cromosoma 22 también puede determinarse usando método. El Ejemplo 6 y la Figura 16 ilustran el uso del método de la divulgación para determinar esa presencia de una eliminación parcial del cromosoma 11.
[0153] El método de la divulgación también se puede utilizar para determinar cualquier aneuploidía si uno de los padres es un portador conocido de dicha anormalidad. Estos incluyen, pero no se limitan a, mosaico para un pequeño cromosoma marcador supernumerario (SMC); t(11;14)(p15;p13) translocación; translocación desequilibrada t(8;11)(p23.2;p15.5); microdeleción 11q23; supresión del síndrome de Smith-Magenis 17p11.2; deleción 22q13.3; microdeleción Xp22.3; supresión 10p14; microdeleción 20p, síndrome de Di-George [del(22) (q11.2q11,23)], síndrome de Williams (deleciones 7q11,23 y 7q36); supresión 1p36; micro-eliminación 2p; neurofibromatosis tipo 1 (17q11,2 microdeleción), deleción Yq; síndrome de Wolf-Hirschhorn (WHS, microdeleción 4p16.3); 1p36,2 microdeleción; supresión 11q14; 19q13,2 microdeleción; Rubinstein-Taybi (16 p13,3 microdeleción); microdeleción 7p21; síndrome de Miller-dieker (17p13.3), deleción 17p11.2; y microdeleción 2q37.
Determinación de la NVC de trastornos clínicos.
[0154] Además de la determinación temprana de defectos de nacimiento, los métodos descritos en el presente documento se pueden aplicar a la determinación de cualquier anomalía en la representación de secuencias genéticas dentro del genoma. Se ha demostrado que el plasma sanguíneo y el ADN sérico de pacientes con cáncer contienen cantidades medibles de ADN tumoral, que pueden recuperarse y usarse como fuente sustituta de ADN tumoral. Los tumores se caracterizan por aneuploidía, o números inapropiados de secuencias de genes o incluso cromosomas completos. La determinación de una diferencia en la cantidad de una secuencia dada, es decir, una secuencia de interés, en una muestra de un individuo puede, por lo tanto, usarse en el diagnóstico de una condición médica, por ejemplo, cáncer.
[0155] Las realizaciones de la divulgación proporcionan un método para evaluar la variación del número de copias de una secuencia de interés, por ejemplo, una secuencia clínicamente relevante, en una muestra de prueba que comprende una mezcla de ácidos nucleicos derivados de dos genomas diferentes, y que son conocidos o se sospecha que difieren en la cantidad de una o más secuencias de interés. La mezcla de ácidos nucleicos se deriva de dos o más tipos de células. En una realización, la mezcla de ácidos nucleicos se deriva de células normales y cancerosas derivadas de un sujeto que padece una afección médica, por ejemplo, cáncer.
[0156] Se cree que muchos tumores sólidos, como el cáncer de mama, progresan desde el inicio hasta la metástasis a través de la acumulación de varias aberraciones genéticas. [Sato et al., Cancer Res., 50: 7184-7189 [1990]; Jongsma et al., J Clin PAthol: Mol Path 55: 305-309 [2002])]. Dichas aberraciones genéticas, a medida que se acumulan, pueden conferir ventajas proliferativas, inestabilidad genética y la capacidad concomitante para desarrollar rápidamente la resistencia al fármaco, y una mayor angiogénesis, proteolisis y metástasis. Las aberraciones genéticas pueden afectar a los "genes supresores de tumores" recesivos o a los oncogenes de acción dominante. Se cree que las supresiones y la recombinación que conducen a la pérdida de heterocigosidad (LOH) desempeñan un papel importante en la progresión del tumor al descubrir alelos supresores de tumores mutados.
[0157] ADNcf se ha encontrado en la circulación de pacientes diagnosticados con tumores malignos que incluyen pero no se limitan a cáncer de pulmón (Pathak et al. Clin Chem 52: 1833-1842 [2006]), cáncer de próstata (Schwartzenbach et al. Clin Cancer Res 15: 1032-8 [2009]), y cáncer de mama (Schwartzenbach et al. Disponible en línea en breast-cancer-research.com/COn-ent/11/5/R71 [2009]). La identificación de las inestabilidades genómicas asociadas con los cánceres que pueden determinarse en la circulación del ADNcf en pacientes con cáncer es una herramienta potencial de diagnóstico y pronóstico. En una realización, el método de la divulgación evalúa la CNV de una secuencia de interés en una muestra que comprende una mezcla de ácidos nucleicos derivados de un sujeto que se sospecha o se sabe que tiene cáncer, por ejemplo, carcinoma, sarcoma, linfoma, leucemia, tumores de células germinales y blastoma. En una realización, la muestra es una muestra de plasma derivada (procesos) de sangre periférica y que comprende una mezcla de ADNcf derivado de células normales y cancerosas. En otra realización, la muestra biológica que se necesita para determinar si una CNV está presente se deriva de una mezcla de células cancerosas y no cancerosas de otros fluidos biológicos que incluyen, entre otros, suero, sudor, lágrimas, esputo, orina, esputo. flujo del oído, linfa, saliva, líquido cefalorraquídeo, estragos, suspensión de la médula ósea, flujo vaginal, lavado transcervical, líquido cerebral, ascitis, leche, secreciones de las vías respiratorias, tracto intestinal y genitourinario, y muestras de leucoforesis, o en biopsias de tejidos, hisopos o frotis.
[0158] La secuencia de interés es una secuencia de ácido nucleico que se sabe o se sospecha que desempeñar un papel en el desarrollo y/o progresión del cáncer. Los ejemplos de una secuencia de interés incluyen secuencias de ácidos nucleicos que se amplifican o eliminan en células cancerosas como se describe a continuación.
[0159] Los genes de acción dominante asociados con tumores sólidos humanos típicamente ejercen su efecto por sobreexpresión o expresión alterada. La amplificación de genes es un mecanismo común que conduce a la regulación positiva de la expresión génica. La evidencia de los estudios citogenéticos indica que se produce una amplificación significativa en más del 50% de los cánceres de mama humanos. En particular, la amplificación del receptor 2 del factor de crecimiento epidérmico humano protooncogénico (HER2) ubicado en el cromosoma 17 (17(17q21-q22)) produce una sobreexpresión de los receptores HER2 en la superficie celular, lo que lleva a una señalización excesiva y desregulada en cáncer de mama y otras neoplasias malignas (Park et al., Clinical Breast Cancer 8: 392-401 [2008]). Se ha encontrado que una variedad de oncogenes se amplifican en otras neoplasias malignas humanas. Ejemplos de la amplificación de oncogenes celulares en tumores humanos incluyen amplificaciones de: c-myc en la línea celular HL60 de leucemia promielocítica, y en líneas celulares de carcinoma de pulmón de células pequeñas, N-myc en neuroblastomas primarios (etapas III y IV), líneas celulares de neuroblastoma, línea celular de retinoblastoma y tumores primarios, líneas de carcinoma de pulmón de células pequeñas y tumores, L-myc en líneas de células de carcinoma de pulmón de células pequeñas y tumores, c-myb en leucemia mieloide aguda y en líneas de células de carcinoma de colon, c-erbb en células de carcinoma epidermoide, y gliomas primarios, cK-ras-2 en carcinomas primarios de pulmón, vejiga y recto, N-ras en la línea celular de carcinoma mamario (Varmus H., Ann Rev Genetics 18: 553-612 (1984) [citado en Watson et al. al., Molecular Biologia of the Gene (4a ed.; Benjamin/Cummings Publishing co. 1987)].
[0160] Deleciones cromosómicas que implican genes supresores de tumores pueden desempeñar un papel importante en el desarrollo y progresión de tumores sólidos. El gen supresor de tumores más ampliamente caracterizado es el gen supresor de tumores del retinoblastoma (Rb-1), ubicado en el cromosoma 13q14. El producto del gen Rb-1, una fosfoproteína nuclear de 105 kDa, aparentemente desempeña un papel importante en la regulación del ciclo celular (Howe et al., Proc Natl Acad Sci (EE.UU.) 87: 5883-5887 [1990]). La expresión alterada o perdida de la proteína Rb es causada por la inactivación de ambos alelos genéticos ya sea a través de una mutación puntual o una deleción cromosómica. Se ha encontrado que las alteraciones del gen Rb-i están presentes no solo en los retinoblastomas sino también en otras neoplasias malignas como los osteosarcomas, el cáncer de pulmón de células pequeñas (Rygaard et al., Cancer Res 50: 5312-5317 [1990)]) y el cáncer de mama. Los estudios de polimorfismo de longitud de fragmentos de restricción (RFLP, por sus siglas en inglés) han indicado que estos tipos de tumores con frecuencia pierden heterocigosidad a 13q, lo que sugiere que uno de los alelos del gen Rb-1 se ha perdido debido a una deleción cromosómica macroscópica (Bowcock et al., Am J Hum). Genet, 46: 12 [1990]). Las anomalías del cromosoma 1, incluidas las duplicaciones, las eliminaciones y las translocaciones desequilibradas que involucran el cromosoma 6 y otros cromosomas asociados, indican que las regiones del cromosoma 1, en particular 1q21-1q32 y 1p11-13, pueden albergar oncogenes o genes supresores de tumores que son patogénicamente relevantes tanto para la enfermedad crónica como para la avanzada. Fases de las neoplasias mieloproliferativas (Caramazza et al., Eur J Hematol84: 191-200 [2010]). Las neoplasias mieloproliferativas también se asocian con deleciones del cromosoma 5. La pérdida completa o las deleciones intersticiales del cromosoma 5 son las anomalías cariotípicas más comunes en los síndromes mielodisplásicos (SMD). Los pacientes con del(5q)/5q-MDS aislada tienen un pronóstico más favorable que aquellos con defectos cariotípicos adicionales, que tienden a desarrollar neoplasmas mieloproliferativos (MPN) y leucemia mieloide aguda. La frecuencia de las eliminaciones desequilibradas del cromosoma 5 ha llevado a la idea de que 5q alberga uno o más genes supresores de tumores que tienen funciones fundamentales en el control del crecimiento de las células madre/progenitoras hematopoyéticas (HSCs/HPC). El mapeo citogenético de las regiones comúnmente eliminadas (CDR) centradas en 5q31 y 5q32 identificaron genes supresores de tumores candidatos, que incluyen la subunidad ribosomal RPS14, el factor de transcripción Egr1/Krox20 y la proteína de remodelación del citoesqueleto, alfa-catenina (Eisenmann et al., OnCOgene 28).: 3429-3441 [2009]). Las estudios citogenéticos y alelotipados de tumores frescos y líneas celulares tumorales han demostrado que la pérdida alélica de varias regiones distintas en el cromosoma 3p, incluidas 3p25, 3p21-22, 3p21,3, 3p12-13 y 3p14, son las anomalías genómicas más tempranas y más frecuentes involucradas en un amplio espectro de cánceres epiteliales principales de pulmón, mama, riñón, cabeza y cuello, ovario, cuello uterino, colon, páncreas, esófago, vejiga y otros órganos. Varios genes supresores de tumores se han mapeado en la región del cromosoma 3p, y se cree que las deleciones intersticiales o la hipermetilación del promotor preceden a la pérdida del 3p o todo el cromosoma 3 en el desarrollo de carcinomas (Angeloni D., Briefings Functional Genomics 6:19- 39 [2007]).
[0161] Los recién nacidos y los niños con síndrome de Down (SD) a menudo presentan leucemia congénita transitoria y tienen un mayor riesgo de leucemia mieloide aguda y leucemia linfoblástica aguda. El cromosoma 21, que alberga alrededor de 300 genes, puede estar involucrado en numerosas aberraciones estructurales, por ejemplo, translocaciones, deleciones y amplificaciones, en leucemias, linfomas y tumores sólidos. Además, se han identificado genes ubicados en el cromosoma 21 que juegan un papel importante en la tumorigénesis. Las aberraciones somáticas tanto del cromosoma 21 como del cromosoma se asocian con leucemias, y genes específicos que incluyen RUNX1, TMPRSS2 y TFF, que se encuentran en 21q, desempeñan un papel en la tumorigénesis (gen de Fonatsch C, cromosomas, cáncer, 49: 497-508 [2010]).
[0162] En una realización, el método se refiere a un medio para evaluar la asociación entre la amplificación génica y el alcance de la evolución del tumor. La correlación entre la amplificación y/o la eliminación y la etapa o grado de un cáncer puede ser importante desde el punto de vista del pronóstico, ya que dicha información puede contribuir a la definición de un grado tumoral de base genética que predice mejor el curso futuro de la enfermedad con tumores más avanzados que tienen el peor pronóstico. Además, la información sobre la amplificación temprana y/o los eventos de eliminación puede ser útil para asociar esos eventos como predictores de la progresión posterior de la enfermedad. La amplificación de genes y las deleciones identificadas por el método pueden asociarse con otros parámetros conocidos como el grado del tumor, la histología, el índice de marcación Brd/Urd, el estado hormonal, la afectación nodal, el tamaño del tumor, la duración de la supervivencia y otras propiedades tumorales disponibles en estudios epidemiológicos y bioestadísticos. Por ejemplo, el ADN tumoral que se analizará con el método podría incluir hiperplasia atípica, carcinoma ductal in situ, cáncer en etapa I-III y ganglios linfáticos metastásicos para permitir la identificación de asociaciones entre amplificaciones y deleciones y etapa. Las asociaciones realizadas pueden posibilitar una efectiva intervención terapéutica. Por ejemplo, las regiones amplificadas consistentemente pueden contener un gen sobreexpresado, cuyo producto puede ser atacado terapéuticamente (por ejemplo, el receptor del factor de crecimiento de quinasa de tirosina, p185HER2).
[0163] El método puede ser utilizado para identificar eventos de amplificación y/o deleción que están asociados con la resistencia a fármacos mediante la determinación de la variación del número de copias de ácidos nucleicos a partir de cánceres primarios a los de células que han producido metástasis en otros sitios. Si la amplificación y/o eliminación de genes es una manifestación de inestabilidad cariotípica que permite un rápido desarrollo de la resistencia al fármaco, se esperaría más amplificación y/o eliminación en tumores primarios de pacientes quimiorresistentes que en tumores en pacientes quimiosensibles. Por ejemplo, si la amplificación de genes específicos es responsable del desarrollo de la resistencia al fármaco, se esperaría que las regiones que rodean a esos genes se amplifiquen consistentemente en células tumorales de derrames pleurales de pacientes quimiorresistentes pero no en los tumores primarios. El descubrimiento de asociaciones entre la amplificación y/o eliminación de genes y el desarrollo de resistencia farmacológica puede permitir la identificación de pacientes que se beneficiarán o no de la terapia adyuvante.
Determinación simultánea de aneuploidía y fracción fetal
[0164] En otra realización, el método permite la determinación simultánea de la fracción del componente de ácido nucleico fetal menor, es decir, fracción fetal, en una muestra que comprende una mezcla de ácidos nucleicos fetales y maternos. En particular, el método permite la determinación de la fracción de ADNcf contribuido por un feto a la mezcla de ADNcf fetal y materno en una muestra materna, por ejemplo, una muestra de plasma. La diferencia entre la fracción materna y fetal se determina por la contribución relativa de un alelo polimórfico derivado del genoma fetal a la contribución del correspondiente alelo polimórfico derivado del genoma materno. Las secuencias polimórficas se pueden usar junto con pruebas de diagnóstico clínicamente relevantes como control positivo de la presencia de ADNcf para resaltar los resultados falsos negativos o falsos positivos derivados de niveles bajos de ADNcf por debajo del límite de identificación. El método descrito es útil en un rango de edades gestacionales.
[0165] Las formas de realización ejemplares del método para determinar simultáneamente la fracción fetal y la presencia o ausencia de una aneuploidía se representan en las Figuras 2-5 de la siguiente manera.
[0166] La Figura 2 proporciona un diagrama de flujo de una realización del método de la divulgación 200 para determinar simultáneamente una aneuploidía fetal y la fracción de ácidos nucleicos fetales en una muestra biológica materna. En la etapa 210, se obtiene de un sujeto una muestra de prueba que comprende una mezcla de ácidos nucleicos maternos y fetales. Las muestras de prueba incluyen muestras descritas en la etapa 110 de la realización del método 100. En algunas realizaciones, la muestra de prueba es una muestra de sangre periférica obtenida de una hembra embarazada, por ejemplo, una mujer. En la etapa 220, la mezcla de ácidos nucleicos presente en la muestra se enriquece para ácidos nucleicos diana polimórficos, comprendiendo cada uno un sitio polimórfico. En algunas realizaciones, los ácidos nucleicos que están enriquecidos son ADNcf. Los ácidos nucleicos diana son segmentos de material genético que se sabe que comprenden al menos un sitio polimórfico. En algunas realizaciones, los ácidos nucleicos diana comprenden un SNP. En otras realizaciones, el ácido nucleico diana comprende un STR. En otras realizaciones más, los ácidos nucleicos diana comprenden un STR en tándem. El enriquecimiento de una mezcla de ácidos nucleicos maternos y fetales comprende la amplificación de secuencias diana de una porción de ácidos nucleicos contenidos en la muestra materna original, y la combinación parcial o total del producto amplificado con el resto de la muestra materna original. En la etapa 230, al menos una porción de la mezcla enriquecida se secuencia, se identifican las diferencias de secuencia derivadas de la naturaleza polimórfica de las secuencias diana, y la contribución relativa de las secuencias polimórficas derivadas del genoma fetal, es decir, la fracción fetal, se determina en la etapa 240. En algunas realizaciones, la muestra de prueba materna original es una muestra de fluido biológico, por ejemplo, plasma. En otras realizaciones, la muestra materna original es una fracción procesada de plasma que comprende ADNcf fetal y materno purificado.
Secuencias polimorfas
[0167] Los sitios polimórficos que están contenidos en los ácidos nucleicos diana incluyen, sin limitación, polimorfismos de un solo nucleótido (SNP), SNP en tándem, deleciones o inserciones multibásicas a pequeña escala, llamadas IN-DELS (también llamados polimorfismos de inserción de eliminación o DIP), polimorfismos multinucleótidos (MNP) y repeticiones cortas en tándem (STR). Los sitios polimórficos que se incluyen en el método de la enfermedad se ubican en cromosomas autosómicos, lo que permite la determinación de la fracción fetal independientemente del sexo del feto. Cualquier sitio polimórfico que pueda ser abarcado por las lecturas generadas por los métodos de secuenciación descritos en este documento se puede usar para determinar simultáneamente la fracción fetal y la presencia o ausencia de una aneuploidía en una muestra materna.
[0168] En una realización, la mezcla de ácidos nucleicos fetales y maternos en la muestra está enriquecida en ácidos nucleico diana que comprenden al menos un SNP. En algunas realizaciones, cada ácido nucleico diana comprende un al menos un SNP. Las secuencias de ácido nucleico diana que comprenden SNP están disponibles en bases de datos de acceso público que incluyen, entre otras, la base de datos de SNP humano en la dirección de Internet de wi.mit.edu, página NCBI dbSNP en la dirección de Internet ncbi.nlm.nih.gov, en la dirección de Internet lifesciences.perkinelmer.com, la base de datos de SNP de Celera Human en la dirección de Internet de gran alcance celera.com, la base de datos de SNP del Grupo de Análisis del Genoma (GAN) en la dirección de Internet gan.iarc.fr. En una realización, los SNP elegidos para enriquecer el ADNcf fetal y materno se seleccionan del grupo de 92 SNP de identificación individual (IISNPs) descritos por Pakstis el al. (Pakstis et al. Hum Genet 127: 315-324 [2010]), que ha demostrado tener una variación muy pequeña en la frecuencia entre las poblaciones (Fst<0,06), y es altamente informativo en todo el mundo con una heterocigosidad promedia > 0,4. Los s Np que están abarcados por el método de la divulgación incluyen los SNP vinculados y no vinculados. Cada ácido nucleico diana comprende al menos un sitio polimórfico, por ejemplo, un solo SNP, que difiere del presente en otro ácido nucleico diana para generar un panel de sitios polimórficos, por ejemplo SNP, que contienen un número suficiente de sitios polimórficos de los cuales al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 o más son informativos. Por ejemplo, un panel de SNP puede configurarse para que incluya al menos un SNP informativo.
[0169] En una realización, las fuentes que son seleccionadas para la amplificación se seleccionan de entre rs560681, rs7041158, rs70478, rs7409098, rs7409098, rs740908, rs7409098, rs740598, rs7409098, rs740598, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005 y rs530022.
[0170] En otras realizaciones, cada ácido nucleico diana comprende dos o más SNPs es decir, cada diana de ácido nucleico comprende SNPs en tándem. Preferiblemente, cada ácido nucleico diana comprende dos SNP en tándem. Los SNP en tándem se analizan como una sola unidad como haplotipos cortos, y se proporcionan aquí como conjuntos de dos SNP. Para identificar secuencias SNP en tándem adecuadas, se puede buscar en la base de datos del consorcio Internacional HapMap (The International HapMap Project, Nature 426: 789-796 [2003]). La base de datos está disponible en la web en hapmap.org. En una realización, los SNP en tándem que se dirigen a la amplificación se seleccionan de los siguientes conjuntos de pares en tándem de SNPs rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672.
[0171] En otra realización, la mezcla de ácidos nucleicos fetales y maternos en la muestra está enriquecida en ácidos nucleicos diana que comprenden al menos un STR. Los loci STR se encuentran en casi todos los cromosomas del genoma y pueden amplificarse utilizando una variedad de cebadores de reacción en cadena de la polimerasa (PCR). Las repeticiones de tetranucleótidos se han preferido entre los científicos forenses debido a su fidelidad en la amplificación por PCR, aunque también se utilizan algunas repeticiones de tri- y pentanucleótidos. Se compila una lista completa de referencias, hechos e información de secuencias sobre los STR, los cebadores de PCR publicados, los sistemas múltiplex comunes y los datos de población relacionados en STRBase, a la que se puede acceder a través del Internet en ibm4.carb.nist.gov:8800/dna/home.htm. También se puede acceder a la información de secuencia de GenBank® (http://www2.ncbi.nlm.nih.gov/cgi-bin/genbank) para los loci STR de uso común a través de STRBase. La naturaleza polimórfica de las secuencias de ADN repetidas en tándem que se extienden por todo el genoma humano las ha convertido en importantes marcadores genéticos para los estudios de mapeo de genes, análisis de ligamiento y pruebas de identidad humana. Debido al alto polimorfismo de los STR, la mayoría de los individuos serán heterocigotos, es decir, la mayoría de las personas poseerán dos alelos (versiones) de cada uno heredado de cada padre, con un número diferente de repeticiones. Por lo tanto, la secuencia de STR fetal no hereditaria por maternidad diferirá en el número de repeticiones de la secuencia materna. La amplificación de estas secuencias de STR dará como resultado dos productos principales de amplificación correspondientes a los alelos maternos (y el alelo fetal de herencia materna) y un producto secundario correspondiente al alelo fetal de herencia no materna. Esta técnica se informó por primera vez en 2.000 (Pertl et al., Human Genetics 106: 45-49 [2002]) y posteriormente se desarrolló utilizando la identificación simultánea de múltiples regiones STR diferentes mediante PCR en tiempo real (Liu et al., Acta Obset Gyn Scand 86: 535-541 [2007]). Por lo tanto, la fracción de ácido nucleico fetal en una muestra materna también se puede determinar mediante la secuenciación de ácidos nucleicos diana polimórficos que comprenden STR, que varían entre los individuos en el número de unidades repetidas en tándem entre alelos. En una realización, la determinación simultánea de aneuploidía y fracción fetal comprende la secuenciación de al menos una porción de los ácidos nucleicos maternos y fetales presentes en una muestra materna que se ha enriquecido para secuencias polimórficas que comprenden STR. Dado que el tamaño del ADNcf fetal es <300 pb, las secuencias polimórficas comprenden miniSTR, que se puede amplificar para generar amplicones que tienen longitudes aproximadamente del tamaño de los fragmentos de ADN fetal circulantes. El método puede usar uno o una combinación de cualquier número de miniSTR informativos para determinar la fracción de ácido nucleico fetal. Por ejemplo, se puede utilizar cualquiera o una combinación de cualquier número de miniSTR, por ejemplo, los miniSTR descritos en la Tabla 22. En una realización, la fracción de ácido nucleico fetal en una muestra materna se realiza utilizando un método que incluye la determinación del número de copias del ácido nucleico materno y fetal presente en la muestra materna amplificando al menos una miniSTR autosómica elegida de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358,D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, Penta D, Penta E, D2S1338, D1S1677, D2S441, D4S2364, D10S1248, D14S1434, D22S1045, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627, y D1GATA113. En otra realización, el al menos un miniSTR autosómico es el grupo de miniSTR CSF1PO, FGA, D13S317, D16S539, D18S51, D2S1338, D21S11 y D7S820.
[0172] El enriquecimiento de la muestra para los ácidos nucleicos diana se realiza mediante métodos que comprenden específicamente la amplificación de secuencias de ácido nucleico diana que comprenden el sitio polimórfico. La amplificación de las secuencias diana se puede realizar mediante cualquier método que utilice PCR o variaciones del método que incluyen, entre otros, la PCR asimétrica, la amplificación dependiente de helicasa, la PCR de arranque en caliente, la qPCR, la PCR en fase sólida y la PCR de toma de contacto. Alternativamente, la replicación de secuencias de ácido nucleico diana puede obtenerse mediante métodos independientes de la enzima, por ejemplo, síntesis química en fase sólida utilizando las fosforamiditas. La amplificación de las secuencias diana se logra utilizando pares de cebadores, cada uno capaz de amplificar una secuencia de ácido nucleico diana que comprende el sitio polimórfico, por ejemplo, SNP, en una reacción de PCR multiplex. Las reacciones de PCR multiplex incluyen combinar al menos 2, al menos tres, al menos 3, al menos 5, al menos 10, al menos 15, al menos 20, al menos 25, al menos 30 al menos 30, al menos 35, al menos 40 o más conjuntos de cebadores en la misma reacción para cuantificar los ácidos nucleicos diana amplificados que comprenden al menos dos, al menos tres, al menos 5, al menos 10, al menos 15, al menos 20, al menos 25, al menos 30, al menos 30, al menos 35, al menos 40 o más sitios polimórficos en la misma reacción de secuenciación. Cualquier panel de conjuntos de cebadores puede configurarse para amplificar al menos una secuencia polimórfica informativa.
Amplificación de secuencias polimórficas.
[0173] Un número de cebadores de ácidos nucleicos están ya disponibles para amplificar fragmentos de ADN que contienen polimorfismos de SNP y sus secuencias se pueden obtener, por ejemplo, de las bases de datos identificadas anteriormente. También se pueden diseñar cebadores adicionales, por ejemplo, utilizando un método similar al publicado por Vieux, EF, Kwok, PY y Miller, RD en BioTechniques (junio de 2002), vol. 32. Suplemento: "SNPs: Discovery of Marker Disease, pp. 28-32. En una realización, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 o más conjuntos de cebadores se eligen para amplificar un ácido nucleico diana que comprende al menos un SNP informativo en una porción de una mezcla de ADNcf fetal y materno. Los conjuntos son de: los primos incluyen los cebadores directos e inversos que abarcan al menos uno de los siguientes: los tipos de pasajes se incluyen entre los siguientes: los elementos que se incluyen entre los siguientes: los elementos que se incluyen entre los siguientes: rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3182957, rs3182957, rs3182957 y rs3182957 y rs3182957 y los conjuntos de cebadores que se utilizan para amplificar los SNP descritos en este documento se proporcionan en el Ejemplo 7 y en las Tablas 10 y 11, y se describen como SEQ ID NO: 57-112. En otra realización, el grupo de 13 conjuntos de cebadores SEQ ID NO: 57-82 se usa para amplificar un ácido nucleico diana que comprende al menos un SNP, por ejemplo, un solo SNP, en una porción de una mezcla de ADNcf fetal y materno.
[0174] En otra realización, al menos un conjunto de cebadores se usa para amplificar un ácido nucleico diana que comprenden cada uno al menos un tándem SNP por ejemplo, un conjunto de dos SNP en tándem, en una porción de una mezcla de ADNcf fetal y materna. En una realización, los conjuntos son de cebadores que comprenden cebadores directos e inversos que abarcan al menos un SNP en tándem informativo seleccionado de rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs13050434; rs11909758-rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. Los cebadores utilizados para amplificar las secuencias de destino que comprenden los SNP en tándem están diseñados para abarcar ambos sitios de SNP. Conjuntos ejemplares de cebadores utilizados para amplificar los SNP en tándem descritos en este documento se proporcionan en el Ejemplo 12 y se describen como SEQ ID NO: 197-310.
[0175] La amplificación de los ácidos nucleicos diana se realiza usando cebadores específicos de secuencia que permiten la amplificación específica de secuencia. Por ejemplo, los cebadores de PCR están diseñados para discriminar contra la amplificación de genes o parálogos similares que se encuentran en otros cromosomas aprovechando las diferencias de secuencia entre el ácido nucleico diana y cualquier parálisis de otros cromosomas. Los cebadores de PCR directos o inversos están diseñados para ser recocidos cerca del sitio de SNP y para amplificar una secuencia de ácido nucleico de longitud suficiente como para abarcarse en las lecturas generadas por métodos de secuenciación masivamente paralelos. Algunos métodos de secuenciación masivamente paralelos requieren que la secuencia de ácido nucleico tenga una longitud mínima (pb) para permitir la amplificación de puente que puede usarse opcionalmente antes de la secuenciación. Por lo tanto, los cebadores de PCR utilizados para amplificar los ácidos nucleicos diana están diseñados para amplificar secuencias que son de longitud suficiente para amplificarse en puente e identificar los SNP que están comprendidos en las lecturas de secuencia. En algunas realizaciones, el primero de los dos cebadores en el conjunto de cebadores que comprende el cebador directo y el inverso para amplificar el ácido nucleico diana está diseñado para identificar un único SNP presente dentro de una secuencia leída de aproximadamente 20 pb, aproximadamente 25 pb, aproximadamente 30 pb, aproximadamente 35 pb, aproximadamente 40 pb, aproximadamente 45 pb, aproximadamente 50 pb, aproximadamente 55 pb, aproximadamente 60 pb, aproximadamente 65 pb, aproximadamente 70 pb, aproximadamente 75 pb, aproximadamente 80 pb, aproximadamente 85 pb, aproximadamente 90 pb, aproximadamente 95 pb, aproximadamente 100 pb, aproximadamente 110 pb, aproximadamente 120 pb, aproximadamente 140 pb., aproximadamente 150 pb, aproximadamente 200 pb, aproximadamente 250 pb, aproximadamente 300 pb, aproximadamente 350 pb, aproximadamente 400 pb, aproximadamente 450 pb, o aproximadamente 500 pb. Se espera que los avances tecnológicos en tecnologías de secuenciación masivamente paralelas permitan lecturas de un solo extremo de más de 500 pb. En una realización, uno de los cebadores de PCR está diseñado para amplificar los SNP que se incluyen en lecturas de secuencia de 36 pb. El segundo cebador está diseñado para amplificar el ácido nucleico diana como un amplicón de longitud suficiente para permitir la amplificación del puente. En una realización, los cebadores de PCR a modo de ejemplo están diseñados para amplificar los ácidos nucleicos diana que contienen un solo SNP seleccionado de los SNPs rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005, y rs530022. En otras realizaciones, los cebadores directo e inverso están diseñados para amplificar ácidos nucleicos diana, cada uno de los cuales comprende un conjunto de dos SNP en tándem, cada uno de los cuales está presente dentro de una secuencia leída de aproximadamente 20 pb, aproximadamente 25 pb, aproximadamente 30 pb, aproximadamente 35 pb, aproximadamente 40 pb, aproximadamente 45 pb, aproximadamente 50 pb, aproximadamente 55 pb, aproximadamente 60 pb, aproximadamente 65 pb, aproximadamente 70 pb, aproximadamente 75 pb, aproximadamente 80 pb, aproximadamente 85 pb, aproximadamente 90 pb, aproximadamente 95 pb, aproximadamente 100 pb, aproximadamente 110 pb, aproximadamente 120 pb, aproximadamente 130 pb, aproximadamente 150 pb, aproximadamente 150 pb, aproximadamente 200 pb, aproximadamente 250 pb, aproximadamente 300 pb, aproximadamente 350 pb, aproximadamente 400 pb, aproximadamente 450 pb, o aproximadamente 500 pb. En una realización, al menos uno de los cebadores está diseñado para amplificar el ácido nucleico diana que comprende un conjunto de dos SNP en tándem como un amplicón de longitud suficiente para permitir la amplificación del puente.
[0176] Los SNP, SNP únicos o en tándem, están contenidos en amplicones de ácido nucleico diana amplificados de al menos aproximadamente 100 pb, al menos aproximadamente 150 pb, al menos aproximadamente 200 pb, al menos aproximadamente 250bp, al menos aproximadamente 300 pb, al menos aproximadamente 350 bp, o al menos aproximadamente 400 pb. En una realización, los ácidos nucleicos diana que comprenden un sitio polimórfico, por ejemplo, un SNP, se amplifican como amplicones de al menos aproximadamente 110 pb, y que comprenden un SNP dentro de 36 pb desde el extremo 3' o 5' del amplicón. En otra realización, los ácidos nucleicos diana que comprenden dos o más sitios polimórficos, por ejemplo, dos SNP en tándem, se amplifican como amplicones de al menos aproximadamente 110 pb, y que comprenden el primer SNP dentro de 36 pb desde el extremo 3' del amplicón, y/o el segundo SNP dentro de 36 pb desde el extremo 5' del amplicón.
[0177] En una realización, al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 35, al menos 40 o más conjuntos de cebadores se eligen para amplificar un ácido nucleico diana que comprende al menos un SNP en tándem informativo en una porción de una mezcla de ADNcf fetal y materno.
Amplificación de STR
[0178] Un número de cebadores de ácidos nucleicos están ya disponibles para amplificar fragmentos de ADN que contienen los RTS y sus secuencias se pueden obtener, por ejemplo, de las bases de datos identificadas anteriormente. Se han utilizado amplicones de PCR de varios tamaños para discernir las respectivas distribuciones de tamaño de las especies de ADN materno y fetal circulantes, y han demostrado que las moléculas de ADN fetal en el plasma de las mujeres embarazadas son generalmente más cortas que las moléculas de ADN maternas (Chan et al., Clin Chem. 50: 8892 [2004]). El fraccionamiento por tamaño del ADN fetal circulante ha confirmado que la longitud promedio de los fragmentos de ADN fetal circulante es <300 pb, mientras que el ADN materno se ha estimado entre aproximadamente 0,5 y 1 Kb (Li et al., Clin Chem, 50: 1002-1011 [2004]). Estos hallazgos son consistentes con los de Fan et al., quienes determinaron mediante el uso de NGS que el ADNcf fetal rara vez es >340 pb (Fan et al., Clin Chem 56: 1279-1286 [2010]). El método de la divulgación abarca la determinación de la fracción de ácido nucleico fetal en una muestra materna que se ha enriquecido con ácidos nucleicos diana, comprendiendo cada uno un miniSTR que comprende cuantificar al menos un alelo fetal y uno materno en un miniSTR polimórfico, que puede amplificarse para generar amplicones que tienen longitudes aproximadamente del tamaño de los fragmentos de ADN fetal circulantes.
[0179] En una realización, el método comprende determinar el número de copias de al menos un alelo fetal y al menos materno al menos en un miniSTR polimórfico que se amplifica para generar amplicones que son menos de aproximadamente 300 pb, menos de aproximadamente 250 pb. bp, menos de aproximadamente 200 bp, menos de aproximadamente 150 bp, menos de aproximadamente 100 bp, o menos de aproximadamente 50 bp. En otra realización, los amplicones que se generan al amplificar los miniSTR son menores que aproximadamente 300 pb. En otra realización, los amplicones que se generan al amplificar los miniSTR son menores que aproximadamente 250 pb. En otra realización, los amplicones que se generan al amplificar los miniSTR son menores que aproximadamente 200 pb. La amplificación del alelo informativo incluye el uso de cebadores miniSTR, que permiten la amplificación de los amplicones de tamaño reducido para discernir los alelos STR que son menos de aproximadamente 500 pb, menos de aproximadamente 450 pb, menos de aproximadamente 400 pb, menos de aproximadamente 350 pb, menos de unos 300 pares de bases (pb), menos de unos 250 pb, menos de unos 200 pb, menos de unos 150 pb, menos de unos 100 pb o menos de unos 50 pb. Los amplicones de tamaño reducido generados utilizando los cebadores miniSTR se conocen como miniSTR que se identifican de acuerdo con el nombre del marcador correspondiente al lugar al que se asignaron. En una realización, los cebadores miniSTR incluyen cebadores mini STR que han permitido la reducción máxima de tamaño en el tamaño del amplicón para los 13 loci coDIS STR además del D2S1338, Pentady pentaE que se encuentran en los kits STR disponibles comercialmente (Butler et al., J Forensic Sci 48: 1054-1064 [2003]), loci miniSTR que no están vinculados a los marcadores coDIS como lo describen coble y Butler (COble y Butler, J Forensic Sci 50: 43-53 [2005]), y otros minSTR que se han caracterizado en el NIST. La información sobre los miniSTRs caracterizados en NIST se puede acceder a través de Internet en cstl.nist.gov/biotech/strbase/newSTRs.htm. Se puede usar cualquier par o una combinación de dos o más pares de cebadores miniSTR para amplificar al menos un miniSTR. Por ejemplo, al menos un conjunto de cebadores se selecciona de los conjuntos de cebadores proporcionados en la Tabla 22 (Ejemplo 11) y se describe como SEQ ID NO: 113-196 se pueden usar para amplificar secuencias diana polimórficas que comprenden un STR.
[0180] El enriquecimiento de la muestra se obtiene amplificando los ácidos nucleicos diana contenidos en una porción de la mezcla de ácidos nucleicos maternos y fetales en la muestra original, y combinando al menos una porción o todo el producto amplificado con el resto de la muestra original no amplificada. El enriquecimiento comprende amplificar los ácidos nucleicos diana que están contenidos en una porción de muestra de fluido biológico. En una realización, la muestra que se enriquece es la fracción plasmática de una muestra de sangre (consulte la Figura 3). Por ejemplo, una porción de una muestra de plasma materno original se usa para amplificar secuencias de ácido nucleico diana. Posteriormente, parte o la totalidad del producto amplificado se combina con la muestra de plasma original no amplificada restante, lo que lo enriquece (véase Ejemplo 10). En otra realización, la muestra que se enriquece es la muestra de ADNcf purificado que se extrae del plasma (consulte la Figura 4). Por ejemplo, el enriquecimiento comprende amplificar los ácidos nucleicos diana que están contenidos en una porción de una muestra original de mezcla purificada de ácidos nucleicos maternos y fetales, por ejemplo, ADNcf que se ha purificado de una muestra de plasma materno, y posteriormente combinar algunos o todos los amplificados producto con la muestra purificada original sin amplificar restante (véase Ejemplo 9). En otra realización más, la muestra que está enriquecida es una muestra de biblioteca de secuenciación preparada a partir de una mezcla purificada de ácidos nucleicos maternos y fetales (véase la Figura 5). Por ejemplo, el enriquecimiento comprende amplificar los ácidos nucleicos diana que están contenidos en una porción de una muestra original de mezcla purificada de ácidos nucleicos maternos y fetales, por ejemplo, el ADNcf que se ha purificado de una muestra de plasma materno, preparando una primera biblioteca de secuenciación de secuencias de ácido nucleico no amplificadas, preparando una segunda biblioteca de secuenciación de ácidos nucleicos diana polimórficos amplificados y, posteriormente, combinando parte o la totalidad de la segunda biblioteca de secuenciación con alguna o toda la primera biblioteca de secuenciación (véase Ejemplo 8). La cantidad de producto amplificado que se utiliza para enriquecer la muestra original se selecciona para obtener información de secuencia suficiente para determinar la presencia o ausencia de aneuploidía y la fracción fetal de la misma serie de secuencia. Al menos aproximadamente el 3%, al menos aproximadamente el 5%, al menos aproximadamente el 7%, al menos aproximadamente el 10%, al menos aproximadamente el 15%, al menos aproximadamente el 20%, al menos aproximadamente el 25%, al menos aproximadamente el 30% o más del número total de etiquetas de secuencia obtenidas de la secuenciación se asigna para determinar la fracción fetal.
[0181] En una realización, la etapa de enriquecer la mezcla de ácidos nucleicos fetales y maternos para los ácidos nucleicos diana polimórficos comprende la amplificación de los ácidos nucleicos diana en una porción de una muestra de ensayo, por ejemplo una muestra de ensayo de plasma, y la combinación de todos o una parte del producto amplificado con la muestra de prueba de plasma restante. La realización del método 300 se representa en el diagrama de flujo que se muestra en la Figura 3. En el paso 310, una muestra de prueba, por ejemplo, una muestra de fluido biológico, tal como una muestra de sangre, se obtiene de una mujer embarazada, y en el paso 320 una porción del ADNcf contenida en la fracción plasmática de la muestra de sangre se utiliza para amplificar ácidos nucleicos diana que comprenden sitios polimórficos, por ejemplo, SNP. En una realización, al menos aproximadamente el 1%, al menos aproximadamente el 1,5%, al menos aproximadamente el 2%, al menos aproximadamente el 10% del plasma materno se usó para amplificar los ácidos nucleicos diana. En el paso 330, una porción o la totalidad de los ácidos nucleicos diana amplificados se combinan con la mezcla de ADNcf fetal y materno presente en la muestra materna, y el ADNcf combinado y los ácidos nucleicos amplificados se purifican en el paso 340, y se usan para preparar una biblioteca que se secuenció en el paso 350. La biblioteca se preparó a partir de ADNcf purificado y que comprende al menos aproximadamente el 10%, al menos aproximadamente el 15%, al menos aproximadamente el 20%, al menos aproximadamente el 25%, al menos aproximadamente el 30%, al menos aproximadamente el 35% %, al menos aproximadamente el 40%, al menos aproximadamente el 45%, o al menos aproximadamente el 50% del producto amplificado. En el paso 360, se analizan los datos de las ejecuciones de secuenciación y se realiza la determinación simultánea de la fracción fetal y la presencia o ausencia de aneuploidía.
[0182] En una realización, el paso de enriquecer la mezcla de ácidos nucleicos fetales y maternos para los ácidos nucleicos diana polimórficos comprende una pluralidad de ácidos nucleicos diana polimórficos en una porción de una mezcla de ácidos nucleicos fetales y maternos purificados a partir de una muestra de ensayo materna. En una realización, una porción de una mezcla de ácidos nucleicos maternos y fetales, por ejemplo, el ADNc, purificado de una muestra de plasma materno se usa para amplificar secuencias de ácido nucleico polimórfico, y una porción del producto amplificado se combina con la mezcla no amplificada de ácidos nucleicos fetales y maternos purificados, p. ej., ADNcf (véase Figura 4). La realización del método 400 se representa en el diagrama de flujo que se muestra en la Figura 4. En el paso 410, una muestra de prueba, por ejemplo, una muestra de fluido biológico, como una muestra de sangre, que comprende una mezcla de ácidos nucleicos maternos y fetales se obtiene de una mujer embarazada, y la mezcla de ácidos nucleicos maternos y fetales se purifica a partir de la fracción plasmática en el paso 420. Como se describió anteriormente, los métodos para la separación de ADN libre de células del plasma son bien conocidos. En el paso 430, una porción del ADNcf contenido en la muestra purificada se usa para amplificar ácidos nucleicos diana que comprenden sitios polimórficos, por ejemplo, SNP. Al menos aproximadamente el 5%, al menos aproximadamente el 10%, al menos aproximadamente el 15%, al menos aproximadamente el 20%, al menos aproximadamente el 25%, al menos aproximadamente el 30%, al menos aproximadamente el 35%, al menos aproximadamente el 40%, al menos aproximadamente el 45%, o al menos aproximadamente el 50% de ADNcf purificado se utiliza para amplificar los ácidos nucleicos diana. Preferiblemente, la amplificación de las secuencias diana se puede realizar mediante cualquier método que use PCR o variaciones del método que incluyen pero no se limitan a PCR asimétrica, amplificación dependiente de helicasa, PCR de arranque en caliente, qPCR, pCr en fase sólida y PCR de toma de contacto. En el paso 440, una porción, por ejemplo, al menos aproximadamente el 0,01% del producto amplificado se combina con la muestra de ADNc purificada no amplificada, y la mezcla de ácidos nucleicos maternos y fetales amplificados y no amplificados se secuencia en el paso 450. En una realización, se realiza la secuenciación utilizando cualquiera de las tecnologías NGS. En el paso 460, se analizan los datos de las secuencias de secuenciación y se realiza la determinación simultánea de la fracción fetal y la presencia o ausencia de aneuploidía como se describe en el paso 140 de la realización representada en la Figura 1.
[0183] En otra realización, el paso 220 de enriquecer la mezcla de ácidos nucleicos fetales y maternos para los ácidos nucleicos diana polimórficos (Figura 2) comprende la combinación de al menos una porción de una primera biblioteca de secuenciación de moléculas de ácido nucleico fetal y materno no amplificados con al menos una parte de una segunda biblioteca de secuenciación de ácidos nucleicos diana polimórficos amplificados. Por lo tanto, la muestra que se enriquece es la muestra de la biblioteca que se prepara para la secuenciación (Figura 5). El enriquecimiento de la muestra de la biblioteca para los ácidos nucleicos diana se realiza mediante métodos que comprenden amplificar específicamente las secuencias de ácido nucleico que comprenden el sitio polimórfico. En el paso 510, una muestra de prueba, por ejemplo, una muestra de fluido biológico tal como una muestra de sangre, que comprende una mezcla de ácidos nucleicos maternos y fetales, se obtiene de una mujer embarazada, y la mezcla de ácidos nucleicos maternos y fetales se purifica de la fracción plasmática en el paso 520. En el paso 530, una porción del ADNfc contenida en la muestra purificada se usa para amplificar ácidos nucleicos diana que comprenden sitios polimórficos, por ejemplo, SNP. Al menos aproximadamente el 5%, al menos aproximadamente el 10%, al menos aproximadamente el 15%, al menos aproximadamente el 20%, al menos aproximadamente el 25%, o al menos aproximadamente el 30% del ADNcf purificado se usa para amplificar secuencias de ácido nucleico diana. Preferiblemente, la amplificación de las secuencias diana se puede realizar mediante cualquier método que use PCR o variaciones del método que incluyen, entre otros, la PCR asimétrica, la amplificación dependiente de la helicasa, la PCR de arranque en caliente, la qPCR, la PCR en fase sólida y la PCR de toma de contacto. En el paso 540, los ácidos nucleicos diana amplificados que comprenden los sitios polimórficos, por ejemplo, SNP, se usan para preparar una biblioteca de secuenciación de ácido nucleico diana. De manera similar, la porción de ADNcf no amplificado purificado se usa para preparar una biblioteca de secuenciación primaria en el paso 550. En el paso 560, una porción de la biblioteca diana se combina con la biblioteca primaria generada a partir de la mezcla no amplificada de ácidos nucleicos, y la mezcla de los ácidos nucleicos fetales y maternos comprendidos en las dos bibliotecas se secuencian en el paso 570. La biblioteca enriquecida comprende al menos aproximadamente el 5%, al menos aproximadamente el 10%, al menos aproximadamente el 15%, al menos aproximadamente el 20%, o al menos aproximadamente el 25% de la biblioteca diana. En el paso 580, se analizan los datos de las secuencias de secuenciación y se realiza la determinación simultánea de la fracción fetal y la presencia o ausencia de aneuploidía como se describe en el paso 140 de la realización representada en la Figura 1.
Determinación de la aneuploidía a partir de la secuenciación de bibliotecas enriquecidas
[0184] La presencia o ausencia de aneuploidía se determina a partir de secuenciación de la biblioteca enriquecida para secuencias polimórficas diana como se describe para la biblioteca no enriquecida descrita en el método 100.
Determinación de la fracción fetal a partir de la secuenciación de bibliotecas enriquecidas
[0185] La determinación de la fracción fetal en los pasos 240 (Figura 2), 360 (Figura 3), 480 (Figura 4), y 580 (Figura 5) se basa en el número total de etiquetas que se asignan al primer alelo y el número total de etiquetas que se asignan al segundo alelo en un sitio polimórfico informativo, por ejemplo, un SNP, contenido en un genoma de referencia. Por ejemplo, el genoma de referencia es la secuencia del genoma de referencia humano NCBI36/hg18, o el genoma de referencia comprende la secuencia del genoma de referencia humano NCBI36/hg18 y un genoma de secuencias diana artificial, que incluye las secuencias polimórficas diana. En una realización, el genoma artificial de la diana abarca secuencias polimórficas que comprenden los SNPs rs560681, rs1109037, rs13182883, rs13218440, r as, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005 y rs530022. En una realización, el genoma artificial incluye las secuencias diana polimórficas de las SEQ ID NO: 1-56. En otra realización, el genoma artificial incluye las secuencias diana polimórficas de las SEQ ID NO: 1-26 (véase Ejemplo 7). En otra forma de realización, el genoma artificial de diana abarca secuencias polimórficas que comprenden STR seleccionados de CSF1PO, FGA, TH01, TPOX, vWA, D3S1358,D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, Penta D, Penta E, D2S1338, D1S1677, D2S441, D4S2364, D10S1248, D14S1434, D22S1045, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627, y D1GATA113. En otra realización más, el genoma diana artificial abarca secuencias polimórficas que comprenden uno o más SNP en tándem (SEQ ID NO: 1-56). La composición del genoma de las secuencias diana artificiales variará dependiendo de las secuencias polimórficas que se utilizan para determinar la fracción fetal. Por consiguiente, un genoma de secuencias diana artificiales no está limitado a las secuencias SNP o STR ejemplificadas en este documento.
[0186] El sitio informativo polimórfico por ejemplo SNP se identifica por la diferencia en las secuencias alélicas y la cantidad de cada uno de los posibles alelos. El ADNcf fetal está presente en una concentración que es <10% del ADNcf materno. Por lo tanto, la presencia de una contribución menor de un alelo a la mezcla de ácidos nucleicos maternos y fetales en relación con la contribución principal del alelo materno puede ser asignada al feto. Los alelos que se derivan del genoma materno se denominan aquí alelos principales, y los alelos que se derivan del genoma fetal se denominan aquí alelos menores. Los alelos que están representados por niveles similares de etiquetas de secuencia mapeadas representan alelos maternos. Los resultados de un ejemplo de amplificación múltiple de ácidos nucleicos diana que comprenden SNP y derivados de una muestra de plasma materno se muestran en la Figura 18.
Los SNP informativos se distinguen del cambio de un solo nucleótido en un sitio polimórfico predeterminado, y los alelos fetales se distinguen por su contribución menor relativa a la mezcla de ácidos nucleicos maternos y fetales en la muestra en comparación con la contribución principal a la mezcla por los ácidos nucleicos maternos, es decir, las secuencias de SNP son informativas cuando la madre es heterocigótica y está presente un tercer alelo paterno, lo que permite una comparación cuantitativa entre el alelo heredado maternalmente y el alelo heredado paternalmente para calcular la fracción fetal. Por consiguiente, la abundancia relativa de ADNcf fetal en la muestra materna se determina como un parámetro del número total de etiquetas de secuencia únicas mapeadas a la secuencia de ácido nucleico diana en un genoma de referencia para cada uno de los dos alelos del sitio polimórfico predeterminado. En una realización, la fracción de ácidos nucleicos fetales en la mezcla de ácidos nucleicos maternos y fetales se calcula para cada uno de los alelos informativos (alelox) de la siguiente manera:
% de fracción fetal alelox = ((Zetiquetas de secuencia fetal para alelox) / (Zetiquetas de secuencia materna para alelox)) x 100
y la fracción fetal para la muestra se calcula como el promedio de la fracción fetal de todos los alelos informativos.
[0187] Opcionalmente, la fracción de ácidos nucleicos fetales en la mezcla de ácidos nucleicos fetales y maternos se calcula para cada uno de los alelos informativos (alelox) como sigue:
% de fracción fetal alelox = ((2 X Zetiquetas de secuencia fetal para alelox) / (Zetiquetas de secuencia materna para alelox)) x 100,
para compensar la presencia de 2 alelos fetales, uno de ellos enmascarado por el fondo materno.
[0188] La fracción fetal porcentual se calcula para al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20 o más alelos informativos. En una realización, la fracción fetal es la fracción fetal promedio determinada para al menos 3 alelos informativos.
[0189] De manera similar, la fracción fetal se puede calcular a partir del número de etiquetas asignadas a los alelos SNP en tándem, como se hace para los SNP únicos, pero teniendo en cuenta las etiquetas asignadas a los dos alelos SNP en tándem x e y están presentes en cada una de las secuencias de ácido nucleico polimórficas amplificadas que se amplifican para enriquecer las muestras, es decir
% de fracción fetal alelox+y = ((Zetiquetas de secuencia fetal para alelox-y) / (Zetiquetas de secuencia materna para alelox-y)) x 100
[0190] Opcionalmente, la fracción de ácidos nucleicos fetales en la mezcla de ácidos nucleicos maternos y fetales se calcula para cada uno de los alelos informativos (alelox-y) de la siguiente manera:
% de fracción fetal alelox+y = ((2 X Zetiquetas de secuencia fetal para alelox-y) / (Zetiquetas de secuencia materna para alelox-y)) x 100,
[0191] Para compensar la presencia de 2 conjuntos de alelos fetales en tándem, uno de ellos enmascarado por el fondo materno. Las secuencias SNP en tándem son informativas cuando la madre es heterocigótica y está presente un tercer haplotipo paterno, lo que permite una comparación cuantitativa entre el haplotipo heredado maternalmente y el haplotipo heredado paternalmente para calcular la fracción fetal.
[0192] La fracción fetal puede determinarse a partir de bibliotecas de secuenciación que comprenden secuencias amplificadas polimórficas diana que comprenden STR contando el número de etiquetas asignadas a un alelo mayor (materna) y menor (fetal). Las etiquetas comprenden secuencias de longitud suficiente para abarcar los alelos sTr . Los alelos STR informativos pueden dar como resultado una o dos secuencias de etiquetas principales correspondientes a los alelos maternos (y el alelo fetal de herencia materna) y una secuencia de etiquetas secundaria correspondiente al alelo fetal de herencia no materna. La fracción fetal se calcula como una proporción del número de etiquetas asignadas a los alelos fetales y maternos.
Determinación de la fracción fetal por secuenciación masivamente paralela
[0193] Además de usar el presente método para determinar simultáneamente la fracción fetal y la aneuploidía, la fracción fetal se puede determinar independientemente de la determinación de aneuploidía como se describe aquí, pero se puede determinar de forma independiente y/o junto con otros métodos utilizados para la determinación de la aneuploidía, como los métodos descritos en las publicaciones de solicitud de patente US2010/0112575A1, US2009/0087847A1; US2009/0029377A1; US2008/0220422A1; US2008/0138809A1, US2008/0153090A1, y la patente de EE.UU. 7.645.576. El método para determinar la fracción fetal también se puede combinar con ensayos para determinar otras afecciones prenatales asociadas con la madre y/o el feto. Por ejemplo, el método se puede utilizar junto con los análisis prenatales, por ejemplo, como se describe en las publicaciones de solicitud de patente de EE.UU. Números US2010/0112590A1, US2009/0162842A1, US2007/0207466A1 y US2001/0051341A1.
[0194] La Figura 6 muestra un diagrama de flujo de una realización del método de la enfermedad para determinar la fracción de ácidos nucleicos fetales en una muestra biológica materna mediante secuenciación masivamente paralela de ácidos nucleicos diana polimorfos amplificados por PCR independientemente de la determinación simultánea de aneuploidía. El método comprende la secuenciación de una biblioteca de secuenciación de ácido nucleico diana polimórfica como sigue. En el paso 610 se obtiene de un sujeto una muestra materna que comprende una mezcla de ácidos nucleicos fetales y maternos. La muestra es una muestra materna que se obtiene de una mujer embarazada, por ejemplo, una mujer embarazada. Otras muestras maternas pueden ser de mamíferos, por ejemplo, vaca, caballo, perro o gato. Si el sujeto es un humano, la muestra se puede tomar en el primer o segundo trimestre del embarazo. Ejemplos de muestras biológicas maternas son las descritas anteriormente. En el paso 620, la mezcla de ácidos nucleicos fetales y maternos se procesa adicionalmente de la muestra de fracción por ejemplo, plasma, para obtener una muestra que comprende una mezcla purificada de ácidos nucleicos fetales y maternos por ejemplo ADNcf, como se describe para forma de realización 100. En el paso 630, una porción de la mezcla purificada de ADNcf fetal y materno se usa para amplificar una pluralidad de ácidos nucleicos diana polimórficos, cada uno de los cuales comprende un sitio polimórfico. Los sitios polimórficos que están contenidos en los ácidos nucleicos diana incluyen, sin limitación, polimorfismos de nucleótido único (SNP), SNP en tándem, eliminaciones o inserciones de múltiples bases a pequeña escala, llamadas IN-dELS (también llamados polimorfismos de inserción de deleción o DIP), Polimorfismos Multi-Nucleótidos (MNP), repeticiones cortas en tándem (STR), polimorfismo de longitud de fragmentos de restricción (RFLP), o un polimorfismo que comprende cualquier otro cambio de secuencia en un cromosoma. Las secuencias polimórficas ejemplares y los métodos para amplificarlas son como se describen para las realizaciones que se muestran en las Figuras 2-5. En algunas realizaciones, los sitios polimórficos se ubican en cromosomas autosómicos, lo que permite la determinación de la fracción fetal independientemente del sexo del feto. Los polimorfismos asociados con cromosomas distintos de los cromosomas 13, 18, 21 e Y también se pueden usar en los métodos descritos en este documento.
[0195] En el paso 640, una porción o la totalidad de las secuencias polimórficas amplificadas se utilizan para preparar una biblioteca de secuenciación para la secuenciación de un modo paralelo como se describe. En una realización, la biblioteca se prepara para la secuenciación por síntesis utilizando la química de secuenciación basada en el terminador reversible de Illumina, como se describe en el Ejemplo 13. En el paso 640, la información de secuencia que se necesita para determinar la fracción fetal se obtiene usando un método NGS. En el paso 650, la fracción fetal se determina según el número total de etiquetas que se asignan al primer alelo y la cantidad total de etiquetas que se asignan al segundo alelo en un sitio polimórfico informativo, por ejemplo, un SNP, contenido en un genoma de referencia artificial, por ejemplo, un SNP genoma de referencia. Los genomas diana artificiales son como se describen aquí. Se identifican los sitios polimórficos informativos, y la fracción fetal se calcula como se describe.
[0196] La determinación de la fracción fetal de acuerdo con el presente se puede usar junto con pruebas de diagnóstico clínicamente relevantes como control positivo de la presencia de ADNcf para resaltar resultados falsos negativos o falsos positivos derivados de niveles bajos de ADNcf a continuación. El límite de identificación. En una realización, la información de la fracción fetal se puede usar para establecer umbrales y estimar el tamaño mínimo de la muestra en la detección de aneuploidía. Tal uso se describe en el Ejemplo 16 a continuación. La información de la fracción fetal se puede utilizar junto con la información de secuenciación. Por ejemplo, los ácidos nucleicos de una muestra libre de células, por ejemplo, una muestra materna de plasma o suero, pueden usarse para enumerar secuencias en una muestra. Las secuencias se pueden enumerar usando cualquiera de las técnicas de secuencia descritas anteriormente. El conocimiento de la fracción fetal se puede utilizar para establecer los umbrales de "corte" para llamar a los estados "aneuploidía", "normal" o "marginal/sin llamada" (incierto). Luego, se pueden realizar cálculos para estimar el número mínimo de secuencias requeridas para lograr una sensibilidad adecuada (es decir, la probabilidad de identificar correctamente un estado de aneuploidía).
[0197] Los presentes métodos se pueden aplicar para determinar la fracción de cualquier población de ácidos nucleicos en una mezcla de ácidos nucleicos aportados por diferentes genomas. Además de determinar la fracción contribuida a una muestra por dos individuos, por ejemplo, el feto y la madre que lleva el feto contribuyen con los diferentes genomas, los métodos pueden usarse para determinar la fracción de un genoma en una mezcla derivada de dos células diferentes de un individuo, por ejemplo, los genomas son contribuidos a la muestra por células cancerosas aneuploides y células euploides normales del mismo sujeto.
Composiciones y kits
[0198] También se describen en este documento composiciones y kits o sistemas de reactivos útiles para practicar los métodos descritos en el presente documento.
[0199] Las composiciones descritas en este documento pueden ser incluidas en kits para las mezclas de secuenciación masivamente paralelas de moléculas de ácidos nucleicos fetales y maternos por ejemplo ADNcf, presente en una muestra materna por ejemplo una muestra de plasma. Los kits comprenden una composición que comprende al menos un conjunto de cebadores para amplificar al menos un ácido nucleico diana polimórfico en dichas moléculas de ácido nucleico materno y fetal. Los ácidos nucleicos polimórficos pueden comprender, sin limitación, polimorfismos de un solo nucleótido (SNP), SNP en tándem, deleciones o inserciones de múltiples bases a pequeña escala, llamadas IN-dELS (también denominados polimorfismos de inserción o DIP), polimorfismos de múltiples nucleótidos (MNP), repeticiones cortas en tándem (STR), polimorfismo de la longitud del fragmento de restricción (RFLP), o un polimorfismo que comprende cualquier otro cambio de secuencia en un cromosoma. Los métodos de secuenciación son métodos NGS de moléculas de ácido nucleico único o moléculas de ácido nucleico amplificadas clonalmente como se describe en el presente documento. Los métodos NGS son métodos de secuenciación masivamente paralelos que incluyen pirosecuenciación, secuenciación por síntesis con terminadores de colorante reversibles, secuenciación en tiempo real, secuenciación por ligadura de la sonda oligonucleótida o secuenciación de una sola molécula.
[0200] En una realización, la composición incluye cebadores para amplificar ácidos nucleicos diana polimórficos que comprenden cada uno al menos un SNP. El al menos un SNP se selecciona entre SNP rs560681, rs1109037, rs9866013, rs13182883, rs13218440, rs7041158, rs740598, rs10773760, rs 4530059, rs7205345, rs8078417, rs576261, rs2567608, rs430046, rs9951171, rs338882, rs10776839, rs9905977, rs1277284, rs258684, rs1347696, rs508485, rs9788670, rs8137254, rs3143, rs2182957, rs3739005 y rs530022. Los conjuntos correspondientes de cebadores para amplificar los SNP se proporcionan como SEQ ID NO: 57-112.
[0201] En otra realización, la composición comprende cebadores para amplificar ácidos nucleicos diana polimórficos que comprenden cada uno al menos un SNP en tándem. Los SNP en tándem ejemplares incluyen rs7277033-rs2110153; rs2822654- rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340- rs2824097; rs418989- rs13047336; rs987980- rs987981; rs4143392- rs4143391; rs1691324-rs13050434; rs11909758- rs9980111; rs2826842-rs232414; rs1980969-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629- rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301- rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769- rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997; rs2831899-rs2831900; rs2831902- rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959 -rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. En una realización, la composición incluye cebadores para amplificar los SNP en tándem ejemplares descritos en el presente documento, y la composición comprende los cebadores ejemplares correspondientes de SEQ ID NO: 197-310.
[0202] En otra realización, la composición comprende cebadores para amplificar ácidos nucleicos diana polimórficos que comprenden cada uno al menos un STR. Los STR ejemplares incluyen CSF1PO, FGA, TH01, TPOX, vWA, D3S1358, D5S818, D7S820, D8S1179, D13S317, D16S539, D18S51, D21S11, D2S1338, Penta D, Penta E, D22S1045, D20S1082, D20S482, D18S853, D17S1301, D17S974, D14S1434, D12ATA63, D11S4463, D10S1435, D10S1248, D9S2157, D9S1122, D8S1115, D6S1017, D6S474, D5S2500, D4S2408, D4S2364, D3S4529, D3S3053, D2S1776, D2S441, D1S1677, D1S1627 y D1GATA113. En una realización, la composición incluye cebadores para amplificar los STR en tándem ejemplares descritos en el presente documento, y la composición comprende los cebadores ejemplares correspondientes de las SEQ ID NO: 113-196.
[0203] Los kits pueden contener una combinación de reactivos que incluye los elementos necesarios para realizar un ensayo de acuerdo con los métodos descritos en el presente documento. El sistema de reactivos se presenta en una forma comercial empaquetada, como una composición o mezcla donde la compatibilidad de los reactivos permitirá, en una configuración de dispositivo de prueba, o más típicamente como un kit de prueba, es decir, una combinación empaquetada de uno o más contenedores, dispositivos o dispositivos similares que contienen los reactivos necesarios y, de preferencia, incluyen instrucciones escritas para la realización de los ensayos. El kit descrito en el presente documento puede adaptarse para cualquier configuración de ensayo y puede incluir composiciones para realizar cualquiera de los diversos formatos de ensayo descritos en el presente documento. Los kits para determinar la fracción fetal comprenden composiciones que incluyen conjuntos de cebadores para amplificar ácidos nucleicos polimórficos presentes en una muestra materna como se describe y, cuando corresponde, los reactivos para purificar el ADNcf, están dentro del alcance de la divulgación. En una realización, un kit diseñado para permitir la cuantificación de secuencias polimórficas fetales y maternas, por ejemplo, STR y/o SNP y/o SNP en tándem, en una muestra de plasma de ADNcf, incluye al menos un conjunto de oligo-nucleótidos específicos de alelo específicos para un SNP seleccionado y/o región de repeticiones en tándem. Preferiblemente, el kit incluye una pluralidad de conjuntos de cebadores para amplificar un panel de secuencias polimórficas. Un kit puede comprender otros reactivos e/o información para genotipar o cuantificar alelos en una muestra (por ejemplo, tampones, nucleótidos, instrucciones). Los kits también incluyen una pluralidad de contenedores de tampones y reactivos apropiados.
Productos informáticos
[0204] La determinación de aneuploidía y/o la determinación de la fracción fetal se deriva computacionalmente de la gran cantidad de información de secuencia que se obtiene de acuerdo con los métodos descritos en el presente documento. En una realización, se describe en este documento un medio legible por computadora que tiene almacenado en él instrucciones legibles por computadora para determinar la presencia o ausencia de aneuploidía a partir de la información obtenida de la secuenciación de ácidos nucleicos fetales y maternos en una muestra materna. En una realización, el medio legible por computadora utiliza información de secuencia obtenida de una pluralidad de moléculas de ácido nucleico maternas y fetales en una muestra de plasma materno para identificar una serie de etiquetas de secuencia mapeadas para un cromosoma de interés y para un cromosoma de normalización. Utilizando el número de etiquetas de secuencia mapeadas identificadas para un cromosoma de interés y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador, el medio legible por computadora calcula una dosis de cromosoma para un cromosoma de interés; y compara la dosis de cromosoma con al menos un valor umbral, y de ese modo identifica la presencia o ausencia de aneuploidía fetal. Ejemplos de cromosomas de interés incluyen, sin limitación de los cromosomas 21, 13, 18 y X.
[0205] En otra realización, se da a conocer en el presente documento un sistema de procesamiento de ordenador que se adapta o configura para determinar la presencia o ausencia de aneuploidía de la información obtenida de la secuenciación Ácidos nucleicos fetales y maternos en una muestra materna. El sistema de procesamiento informático está adaptado o configurado para (a) utilizar información de secuencia obtenida de una pluralidad de moléculas de ácido nucleico maternas y fetales en una muestra de plasma materno para identificar una serie de etiquetas de secuencia mapeadas para un cromosoma de interés; (b) utilizar la información de secuencia obtenida de una pluralidad de moléculas de ácido nucleico materno y fetal en una muestra de plasma materno para identificar una serie de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador; (c) utilizar el número de etiquetas de secuencia mapeadas identificadas para un cromosoma de interés en el paso (a) y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador en el paso (b) para calcular una dosis de cromosoma para un cromosoma de interés; y (d) comparar la dosis de cromosoma con al menos un valor de umbral y, de ese modo, identificar la presencia o ausencia de aneuploidía fetal. Los ejemplos de cromosomas de interés incluyen, sin limitación, los cromosomas 21, 13, 18 y X.
[0206] En otra realización, se da a conocer en el presente documento el aparato adaptado o configurado para determinar la presencia o ausencia de aneuploidía de la información obtenida de la secuenciación de ácidos nucleicos fetales y maternos en una muestra materna. El aparato está adaptado o configurado para comprender (a) un dispositivo de secuenciación adaptado o configurado para secuenciar al menos una porción de las moléculas de ácido nucleico en una muestra de plasma materno que comprende moléculas de ácido nucleico materno y fetal, generando así información de secuencia; y (b) un sistema de procesamiento informático configurado para realizar los pasos de: (i) utilizar la información de secuencia generada por el dispositivo de secuenciación para identificar un número de etiquetas de secuencia mapeadas para un cromosoma de interés; (ii) usar la información de secuencia generada por el dispositivo de secuenciación para identificar un número de etiquetas de secuencia mapeadas para al menos un cromosoma normalizador; (iii) usar el número de etiquetas de secuencia mapeadas identificadas para un cromosoma de interés en el paso (i) y el número de etiquetas de secuencia mapeadas identificadas para al menos un cromosoma normalizador en el paso (ii) para calcular una dosis de cromosoma para un cromosoma interesar; y (iv) comparar dicha dosis de cromosoma con al menos un valor umbral, y de ese modo identificar la presencia o ausencia de aneuploidía fetal. Los ejemplos de cromosomas de interés incluyen, sin limitación, los cromosomas 21, 13, 18 y X.
Ejemplo 1
Procesamiento de muestras y extracción de ADNcf
[0207] Muestras de sangre periférica se obtuvieron de las mujeres embarazadas en su primer o segundo trimestre del embarazo y que fueron considerados en riesgo de aneuploidía fetal. El consentimiento informado se obtuvo de cada participante antes de la extracción de sangre. La sangre se extrajo antes de la amniocentesis o de las muestras de vellosidades coriónicas. El análisis del cariotipo se realizó con vellosidades coriónicas o muestras de amniocentesis para confirmar el cariotipo fetal.
[0208] Sangre periférica extraída de cada sujeto se recogió en tubos ACD. Un tubo de muestra de sangre (aproximadamente 6-9 ml/tubo) se transfirió a un tubo de centrifugación de baja velocidad de 15 ml. La sangre se centrifugó a 2640 rpm, 4°C durante 10 min usando la centrífuga Beckman Allegra 6 R y el modelo con rotor GA 3.8.
[0209] Para la extracción de plasma libre de células, la capa superior de plasma se transfirió a un tubo de centrífuga de 15 ml de alta velocidad y se centrifugó a 16.000 x g, 4°C durante 10 min usando centrífuga Beckman Coulter Avanti J-E, y rotor JA-14. Los dos pasos de centrifugación se realizaron dentro de las 72 h posteriores a la extracción de sangre. El plasma libre de células que comprende ADNcf se almacenó a -80°C y se descongeló solo una vez antes de la amplificación de ADNcf en plasma o para la purificación de ADNcf.
[0210] El ADN libre de células purificado (cfDNA) se extrajo del plasma libre de células utilizando el Mini kit de ADN en sangre QIAamp (Qiagen) esencialmente de acuerdo con las instrucciones del fabricante. Se añadieron un mililitro de tampón AL y 100 |jl de solución de proteasa a 1 ml de plasma. La mezcla se incubó durante 15 minutos a 56°C. Se añadió un mililitro de etanol al 100% a la digestión de plasma. La mezcla resultante se transfirió a mini columnas QIAamp que se ensamblaron con VacVálvulas y VacConectores que se proporcionan en el conjunto de columna QIAvac 24 Plus (Qiagen). Se aplicó vacío a las muestras y el ADNcf retenido en los filtros de la columna se lavó a vacío con 750 j l de tampón AW1, seguido de un segundo lavado con 750 j l de tampón AW24. La columna se centrifugó a 14.000 RPM durante 5 minutos para eliminar cualquier tampón residual del filtro. El ADNcf se eluyó con tampón AE mediante centrifugación a 14.000 RPM, y la concentración se determinó utilizando la Plataforma de cuantificación QubitTM (Invitrogen).
Ejemplo 2
Preparación y secuenciación de bibliotecas de secuenciación primarias y enriquecidas
a. Preparación de bibliotecas de secuenciación - protocolo abreviado
[0211] Todas las bibliotecas de secuenciación, es decir, las bibliotecas primarias y enriquecidas, se prepararon a partir de aproximadamente 2 ng de ADNcf purificado que se extraía de plasma materno. La preparación de la biblioteca se realizó utilizando los reactivos del conjunto de reactivos de ADN de preparación de muestra de ADN NEBNext™, serie 1 (número de pieza E6000L; New England Biolabs, Ipswich, MA), para Illumina® de la siguiente manera. Debido a que el ADN plasmático libre de células es de naturaleza fragmentada, no se realizó una fragmentación adicional por nebulización o sonicación en las muestras de ADN plasmático. Los salientes de aproximadamente 2 ng de fragmentos de ADNfc purificados contenidos en 40 j l se convirtieron en extremos romos fosforilados de acuerdo con el módulo de reparación del extremo NEBNext® incubando en un tubo de microcentrífuga de 1,5 ml el ADNcf con 5 j l de tampón de fosforilación 10X, 2 j l de mezcla de solución de desoxinucleótido (10 mM cada dNTP), 1 j l de una dilución 1:5 de ADN polimerasa I, 1 j l de ADN polimerasa T4 y 1 j l de quinasa de polinucleótido T4 proporcionada en el conjunto de reactivos de ADN de preparación de muestras de ADN NEBNext™ 1 durante 15 minutos a 20°C. Las enzimas se inactivaron por calor mediante la incubación de la mezcla de reacción a 75°C durante 5 minutos. La mezcla se enfrió a 4°C, y la cola de dA del ADN de extremos romos se realizó utilizando 10 j l de la mezcla maestra de cola de dA que contiene el fragmento Klenow (3' a 5' exo menos) (NEBNext™ DNA Sample Prep DNA Reagent Set 1), e incubación durante 15 minutos a 37°C. Posteriormente, el fragmento Klenow se inactivó por calor mediante la incubación de la mezcla de reacción a 75°C durante 5 minutos. Después de la inactivación del fragmento Klenow, se usó 1 j l de una dilución 1:5 de Oligo Mix del Adaptador Genómico de Illumina (Núm. de Parte 1000521; Illumina Inc., Hayward, CA) para ligar los adaptadores de Illumina (Adaptadores Y Sin Índice) al ADN con cola de dA utilizando 4 j l de la ligasa de ADN T4 provista en el conjunto de reactivos de ADN 1 de preparación de muestra de ADN NEBNext™, incubando la mezcla de reacción durante 15 minutos a 25°C. La mezcla se enfrió a 4°C y el ADNcf ligado con el adaptador se purificó a partir de adaptadores no dilatados, dímeros adaptadores y otros reactivos utilizando perlas magnéticas proporcionadas en el sistema de purificación Agencourt AMPure XP PCR (Parte N° A63881; Beckman Coulter Genomics, Danvers, MA). Se realizaron dieciocho ciclos de PCR para enriquecer selectivamente el ADNcf ligado con adaptador (25 jl) utilizando la mezcla maestra de alta fidelidad Phusion ® (25 jl; Finnzymes, Woburn, MA) y los cebadores de PCR de Illumina (0,5 jm cada uno) complementarios a adaptadores (n.° de pieza 1000537 y 1000537). El ADN ligado con el adaptador se sometió a PCR (98°C durante 30 segundos; 18 ciclos de 98°C durante 10 segundos, 65°C durante 30 segundos y 72°C durante 30; extensión final a 72°C durante 5 minutos y manténgalo a 4°C) usando Illumina Genomic PCR Primers (números de pieza 100537 y 1000538) y la mezcla maestra PhusionHFPCR incluida en el conjunto de reactivos de ADN de preparación de muestras de ADN NEBNext™, conjunto 1, de acuerdo con las instrucciones del fabricante. El producto amplificado se purificó utilizando el sistema de purificación por PCR Agencourt AMPure XP (Agencourt Bioscience corporation, Beverly, MA) de acuerdo con las instrucciones del fabricante disponibles en www.beckmangenomics.com/products/AMPureXPProtocol_000387v001.pdf. El producto amplificado purificado se eluyó en 40 j l de Qiagen EB Buffer, y se analizó la concentración y la distribución de tamaños de las bibliotecas amplificadas utilizando el kit Agilent DNA 1000 para el bioanalizador 2100 (Agilent technologies Inc., Santa Clara, CA).
b. Preparación de bibliotecas de secuenciación de protocolo de longitud completa.
[0212] El protocolo de longitud completa descrito es esencialmente el protocolo estándar proporcionado por Illumina, y sólo difiere del protocolo Illumina en la purificación de la biblioteca amplificada: el protocolo Illumina instruye que la biblioteca amplificada se purificó usando electroforesis en gel, mientras que el protocolo aquí descrito usa perlas magnéticas para el mismo paso de purificación. Aproximadamente 2 ng de ADNcf purificado que se había extraído del plasma materno se usaron para preparar una biblioteca de secuenciación primaria utilizando el conjunto de reactivos 1 de ADN de preparación de muestra NEBNext™ (N° de pieza E6000L; New England Biolabs, Ipswich, MA) para Illumina® esencialmente de acuerdo con las instrucciones del fabricante. Todos los pasos, excepto la purificación final de los productos ligados con adaptador, que se realizaron con perlas magnéticas y reactivos de Agencourt en lugar de la columna de purificación, se realizaron de acuerdo con el protocolo que acompaña a los reactivos NEBNext™ para la preparación de muestras para una biblioteca de ADN genómico secuenciada utilizando el Illumina® GAII. El protocolo NEBNext™ sigue esencialmente el proporcionado por Illumina, que está disponible en grcf.jhml.edu/hts/protocols/11257047_ChIP_Sample_Prep.pdf.
[0213] Los salientes de aproximadamente 2 ng de fragmentos de ADNcf purificados contenidos en 40 |jl se convirtieron en extremos romos fosforilados de acuerdo con el módulo de reparación de extremo NEBNext® incubando los 40 j l de ADNcf con 5 j l de tampón de fosforilación 10X, 2 j l de mezcla de solución de desoxinucleótidos (10 mM cada dNTP), 1 j l de una dilución 1:5 de ADN polimerasa I, 1 j l de ADN polimerasa T4 y 1 j l de quinasa de polinucleótido T4 proporcionada en el conjunto de reactivos de ADN de preparación de muestra de NEBNext™ un tubo de microcentrífuga de 200 j l en un termociclador durante 30 minutos a 20°C. La muestra se enfrió a 4°C y se purificó utilizando una columna QIAQuick proporcionada en el kit de purificación por PCR QIAQuick (QIAGEN Inc., Valencia, CA) de la siguiente manera. La reacción de 50 j l se transfirió a un tubo de microcentrífuga de 1,5 ml y se agregaron 250 j l de tampón Qiagen PB. Los 300 j l resultantes se transfirieron a una columna QIAquick, que se centrifugó a 13.000 RPM durante 1 minuto en una microcentrífuga. La columna se lavó con 750 j l de Qiagen Buffer PE y se volvió a centrifugar. El etanol residual se eliminó mediante una centrifugación adicional durante 5 minutos a 13.000 RPM. El ADN se eluyó en 39 j l de Qiagen Buffer EB por centrifugación. La cola de dA de 34 j l del ADN de extremos romos se logró utilizando 16 j l de la mezcla maestra de colas de dA que contiene el fragmento Klenow (3' a 5' menos) (incubación de muestra de ADN NEBNext™ Conjunto 1 de reactivos de ADN), e incubación durante 30 minutos a 37°C de acuerdo con el NEBNext® dA-Tailing Module del fabricante. La muestra se enfrió a 4°C y se purificó utilizando una columna provista en el Kit de purificación de PCR MinElute (QIAGEN Inc., Valencia, CA) de la siguiente manera. Los 50 j l de reacción se transfirieron a 1,5 ml de tubo de microcentrífuga y se agregaron 250 j l de Qiagen Buffer PB. Los 300 j l se transfirieron a la columna MinElute, que se centrifugó a 13.000 RPM durante 1 minuto en una microcentrífuga. La columna se lavó con 750 j l de Qiagen Buffer PE y se volvió a centrifugar. El etanol residual se eliminó mediante una centrifugación adicional durante 5 minutos a 13.000 RPM. El ADN se eluyó en 15 j l de Qiagen Buffer EB por centrifugación. Diez microlitros del eluido de ADN se incubaron con 1 j l de una dilución 1:5 de la Illumina Genomic Adapter Oligo Mix (Parte N° 1.000.521), 15 j l de 2X Quick Ligation Reaction Buffer, y 4 j l Quick T4 DNA Ligase, durante 15 minutos a 25°C según el módulo de ligadura rápida NEBNext®. La muestra se enfrió a 4°C y se purificó utilizando una columna MinElute de la siguiente manera. Ciento cincuenta microlitros de Qiagen Buffer PE se agregaron a la reacción de 30 jl, y todo el volumen se transfirió a una columna MinElute a una columna MinElute, que se centrifugó a 13.000 RPM durante 1 minuto en una microcentrífuga. La columna se lavó con 750 j l de Qiagen Buffer PE y se volvió a centrifugar. El etanol residual se eliminó mediante una centrifugación adicional durante 5 minutos a 13.000 RPM. El ADN se eluyó en 28 j l de Qiagen Buffer EB por centrifugación. Veintitrés microlitros del eluato de ADN ligado al adaptador se sometieron a 18 ciclos de PCR (98°C durante 30 segundos; 18 ciclos de 98°C durante 10 segundos, 65°C durante 30 segundos y 72°C durante 30; extensión final a 72°C durante 5 minutos, y mantener a 4°C) usando Illumina Genomic PCR Primers (números de pieza 100537 y 1000538) y la mezcla maestra de Phusion HF PCR proporcionada en el conjunto de reactivos de ADN de preparación de muestras de ADN NEBNext™, de acuerdo con las instrucciones del fabricante. El producto amplificado se purificó utilizando el sistema de purificación por PCR Agencourt AMPure XP (Agencourt Bioscience Corporation, Beverly, MA) de acuerdo con las instrucciones del fabricante disponibles en www.beckmangenomics.com/products/AMPureXPProtocol_000387v001.pdf. El sistema de purificación por PCR Agencourt AMPure XP elimina los dNTP, cebadores, dímeros de cebadores, sales y otros contaminantes no incorporados, y recupera los amplicones mayores de 100 pb. El producto amplificado purificado se eluyó de las perlas de Agencourt en 40 j l de Qiagen EB Buffer y se analizó la distribución de tamaños de las bibliotecas utilizando el kit Agilent DNA 1.000 para el bioanalizador 2100 (Agilent technologies Inc., Santa Clara, CA).
c. Análisis de las bibliotecas de secuenciación preparadas de acuerdo con los protocolos abreviados (a) y completos (b)
[0214] Los elctropherograms generados por el Bioanalizador se muestran en la Figura 7. La Figura 7 (A) muestra el electroferograma de la ADN de biblioteca preparada a partir de ADNcf purificada a partir de muestra de plasma M24228 utilizando el protocolo de longitud completa descrito en (a), y la Figura 7 (B) muestra el electroferograma del ADN de la biblioteca preparado a partir de ADNcf purificado de la muestra de plasma M24228 utilizando el protocolo de longitud completa descrito en (b). En ambas figuras, los picos 1 y 4 representan el marcador inferior de 15 pb y el marcador superior de 1.500, respectivamente; los números sobre los picos indican los tiempos de migración para los fragmentos de la biblioteca; y las líneas horizontales indican el umbral establecido para la integración. El electroforegrama en la Figura 7 (A) muestra un pico menor de fragmentos de 187 pb y un pico mayor de fragmentos de 263 pb, mientras que el electroferograma en la Figura 7 (B) muestra solo un pico a 265 pb. La integración de las áreas de los picos dio como resultado una concentración calculada de 0,40 ng/jl para el a Dn del pico de 187 pb en la Figura 7 (A), una concentración de 7,34 ng/jl para el ADN del pico de 263 pb en la Figura 7 (A), y una concentración de 14,72 ng/jl para el ADN del pico de 265 pb en la Figura 7 (B). Se sabe que los adaptadores de Illumina que se ligaron al ADNcf tienen 92 pb, que cuando se sustraen del 265 pb, indican que el tamaño máximo de pfcNA es de 173 pb. Es posible que el pico menor a 187 pb represente fragmentos de dos cebadores que se ligaron de extremo a extremo. Los fragmentos de dos cebadores lineales se eliminan del producto de la biblioteca final cuando se usa el protocolo abreviado. El protocolo abreviado también elimina otros fragmentos más pequeños de menos de 187 pb. En este ejemplo, la concentración de ADNcf ligado con adaptador purificado es el doble que la del ADNcf ligado con adaptador producido utilizando el protocolo de longitud completa. Se ha observado que la concentración de los fragmentos de ADNcf ligados con el adaptador es siempre mayor que la obtenida utilizando el protocolo de longitud completa (datos no mostrados).
[0215] Por lo tanto, una ventaja de la preparación de la biblioteca de secuenciación utilizando el protocolo abreviado es que la biblioteca obtenida consistentemente comprende sólo un pico principal en el intervalo 262-267bp mientras que la calidad de la biblioteca preparada usando el protocolo de longitud completa varía como se refleja por el número y la movilidad de picos distintos de los que representan el ADNcf. Los productos que no son de ADNcf ocuparían espacio en la célula de flujo y disminuirían la calidad de la amplificación del grupo y la imagen posterior de las reacciones de secuenciación, lo que subyace a la asignación general del estado de aneuploidía. Se demostró que el protocolo abreviado no afecta la secuenciación de la biblioteca (consulte la Figura 8).
[0216] Otra ventaja de la preparación de la biblioteca de secuenciación utilizando el protocolo abreviado es que los tres pasos enzimáticos de extremos romos, cola del dA, y el adaptador de la ligación, tardan menos de una hora para completar para apoyar la validación y la aplicación de un servicio de diagnostico de aneuploides rápida [0217] Otra ventaja es que los tres pasos enzimáticos de extremos romos, cola de dA y ligadura del adaptador, se realizan en el mismo tubo de reacción, evitando así múltiples transferencias de muestras que potencialmente conducirían a la pérdida de material y, lo que es más importante, mezclar muestras y contaminación de la muestra.
Ejemplo 3
Secuenciación masiva paralela y determinación de aneuploidía
[0218] Muestras de sangre periférica se obtuvieron de mujeres embarazadas y ADNcf se purificó de la fracción de plasma como se describe en el Ejemplo 1. Todas las bibliotecas de secuenciación se prepararon utilizando el protocolo de preparación de biblioteca abreviado descrito en el Ejemplo 2. El ADN amplificado se secuenció utilizando Genoma Analizador de Illumina II para obtener lecturas de un solo extremo de 36 pb. Solo se necesitan aproximadamente 30 pb de información de secuencia aleatoria para identificar una secuencia como perteneciente a un cromosoma humano específico. Las secuencias más largas pueden identificar de forma única objetivos más particulares. En el presente caso, se obtuvo un gran número de lecturas de 36 pb, que cubren aproximadamente el 10% del genoma. La secuenciación del ADN de la biblioteca se realizó utilizando el Analizador de Genoma II (Illumina Inc., San Diego, CA, EE.UU.) según los protocolos estándar del fabricante. Las copias del protocolo para la secuenciación del genoma completo utilizando la tecnología Illumina/Solexa se pueden encontrar en BioTechniques.RTM. Protocol Guide 2007, publicado en diciembre de 2006: p. 29, y en la web en biotechniques.com/default.asp? page=Protocol&subsection=article_display&id=112378. La biblioteca de ADN se diluyó a InM y se desnaturalizó. El ADN de biblioteca (5 pM) se sometió a amplificación de grupo de acuerdo con el procedimiento descrito en Cluster Station User Guide y Cluster Station Operations Guide de Illumina, disponible en Internet en illumina.com/systems/genome_analyzer/cluster_station.ilmn. Al finalizar la secuenciación de la muestra, el "Software de control del secuenciador" de Illumina transfirió los archivos de imagen y de llamada base a un servidor Unix que ejecuta el software Illumina Analyzer Pipeline de Illumina versión 1.51. El programa Illumina "Gerald" se ejecutó para alinear secuencias con el genoma humano de referencia que se deriva del genoma hg18 proporcionado por el Centro Nacional de Información Biotecnológica (NCBI36/hg18, disponible en la web en http://genome.ucsc.edu/cgi-bin/hgGateway?org=Human&db=hg18&hgsid=166260105). Los datos de secuencia generados por el procedimiento anterior que se alinearon de forma única con el genoma se leyeron desde la salida de Gerald (archivos export.txt) por un programa (c2c.pl) que se ejecuta en una computadora que ejecuta el sistema operativo Linnux. Las alineaciones de secuencia con desajustes de base se permitieron e incluyeron en los recuentos de alineación solo si se alineaban de forma única con el genoma. Se excluyeron las alineaciones de secuencia con coordenadas de inicio y final idénticas (duplicados).
[0219] Entre aproximadamente 5 y 15 millones de etiquetas de 36 pb con 2 o menos desajustes se asignaron de forma única al genoma humano. Todas las etiquetas mapeadas se contaron e incluyeron en el cálculo de las dosis de cromosomas en las muestras de prueba y de calificación. Las regiones que se extienden desde la base 0 hasta la base 2 x 106, la base 10 x 106 hasta la base 13 x 106 y la base 23 x 106 hasta el final del cromosoma Y, se excluyeron específicamente del análisis porque las etiquetas derivadas de fetos masculinos o femeninos se asignan a estas regiones del cromosoma Y.
[0220] Se observó que alguna variación en el número total de etiquetas de secuencia mapeadas a cromosomas individuales a través de muestras secuenciadas en la misma serie (variación inter-cromosómica), pero se observó una variación substancialmente mayor entre las diferentes secuencias de secuenciación (variación de ejecución de inter-secuenciación).
Ejemplo 4
Dosis y varianza para los cromosomas 13, 18, 21, X e Y
[0221] Para examinar la extensión de la variación inter-cromosómica y de inter-secuenciación en el número de etiquetas de secuencia mapeadas para todos los cromosomas, plasma de ADNpc de la sangre periférica obtenido de 48 pacientes embarazadas voluntarias se extrajo y se secuenció como se describe en el Ejemplo 1, y se analizó como sigue.
[0222] Se determinó el número total de etiquetas de secuencias que fueron asignadas a cada cromosoma (densidad de etiqueta de secuencia). Alternativamente, el número de etiquetas de secuencia mapeadas puede normalizarse a la longitud del cromosoma para generar una relación de densidad de etiqueta de secuencia. La normalización a la longitud del cromosoma no es un paso necesario, y se puede realizar únicamente para reducir el número de dígitos en un número para simplificarlo para la interpretación humana. Las longitudes de cromosomas que se pueden usar para normalizar los recuentos de etiquetas de secuencia pueden ser las longitudes proporcionadas en Internet en gnome.ucsc.edu/goldenPath/stats.html#hg18.
[0223] La densidad de etiqueta de secuencia resultante para cada cromosoma estaba relacionado con la densidad de etiqueta de secuencia de cada uno de los cromosomas restantes para derivar una dosis de cromosoma cualificado, que se calculó como la relación de la densidad de etiqueta de secuencia para el cromosoma de interés por ejemplo, cromosoma 21, y la densidad de la etiqueta de secuencia de cada uno de los cromosomas restantes, es decir, los cromosomas 1-20, 22 y X. La Tabla 1 proporciona un ejemplo de la dosis de cromosoma calificada calculada para los cromosomas de interés 13, 18, 21, X e Y, determinada en una de las muestras calificadas. Las dosis de cromosomas se determinaron para todos los cromosomas en todas las muestras, y las dosis promedio para los cromosomas de interés 13, 18, 21, X e Y en las muestras calificadas se proporcionan en las Tablas 2 y 3, y se representan en las Figuras 9-13. Las Figuras 9-13 también representan las dosis de cromosomas para las muestras de prueba. Las dosis de cromosomas para cada uno de los cromosomas de interés en las muestras calificadas proporcionan una medida de la variación en el número total de etiquetas de secuencia mapeadas para cada cromosoma de interés en relación con la de cada uno de los cromosomas restantes. Así, las dosis de cromosomas calificadas pueden identificar el cromosoma o un grupo de cromosomas, es decir, un cromosoma normalizador, que tiene una variación entre las muestras más cercana a la variación del cromosoma de interés y que serviría como secuencias ideales para normalizar los valores para una evaluación estadística adicional. Las figuras 14 y 15 representan las dosis promedio calculadas de cromosomas determinadas en una población de muestras calificadas para los cromosomas 13, 18 y 21, y los cromosomas X e Y.
[0224] En algunos casos, el mejor cromosoma normalizador puede no tener la menor variación, pero puede tener una distribución de dosis calificadas que distinga mejor una muestra de prueba o muestras de las muestras calificadas, es decir, el mejor cromosoma normalizador puede no tener la más baja variación, pero puede tener la mayor diferenciabilidad. Por lo tanto, la diferenciabilidad explica la variación en la dosis de cromosoma y la distribución de las dosis en las muestras calificadas.
[0225] Las tablas 2 y 3 proporcionan el coeficiente de variación como la medida de la variabilidad y los valores de la prueba t de Student como una medida de la diferenciabilidad para los cromosomas 18, 21, X e Y, en donde, cuanto más pequeño sea el valor de la prueba T, mayor la diferenciabilidad. La diferenciabilidad para el cromosoma 13 se determinó como la proporción de la diferencia entre la dosis media del cromosoma en las muestras calificadas y la dosis para el cromosoma 13 en la única muestra de prueba T13, y la desviación estándar de la media de la dosis calificada.
[0226] Las dosis de cromosomas cualificados también sirven como la base para determinar los valores de umbral cuando la identificación de aneuploidías en muestras de ensayo como se describe en lo siguiente.
TABLA 1
Figure imgf000044_0001
TABLA 2
Figure imgf000044_0002
Figure imgf000045_0001
TABLA 3
Figure imgf000045_0002
[0227] Los ejemplos de diagnósticos de T21, T13, T18 y un caso de síndrome de Turner obtenidos usando los cromosomas normalizadores, las dosis de cromosomas y la diferenciabilidad para cada uno de los cromosomas de interés se describen en el Ejemplo 3.
Ejemplo 5
Diagnóstico de la aneuploidía fetal mediante el uso de cromosomas normalizadores
[0228] Para aplicar el uso de dosis de cromosomas para evaluar la aneuploidía en una muestra de prueba biológica, se obtuvieron muestras de sangre materna de voluntarias embarazadas y se preparó el ADNcf, y se secuenció una biblioteca de secuenciación según el Protocolo abreviado descrito en el Ejemplo 2 y analizado.
Trisomia 21
[0229] La Tabla 4 proporciona la dosis calculada para el cromosoma 21 en una muestra de prueba ejemplar (n° 11403). El umbral calculado para el diagnóstico positivo de la aneuploidía T21 se estableció en >2 desviaciones estándar de la media de las muestras calificadas (normales). Se proporcionó un diagnóstico para T21 basado en que la dosis de cromosoma en la muestra de prueba fue mayor que el umbral establecido. Los cromosomas 14 y 15 se usaron como cromosomas normalizadores en cálculos separados para mostrar que cualquiera de los cromosomas tiene la variabilidad más baja p. ej. el cromosoma 14, o un cromosoma que tiene la mayor diferenciabilidad p. ej. el cromosoma 15, se puede utilizar para identificar la aneuploidía. Trece muestras de T21 fueron identificadas usando las dosis de cromosomas calculadas y las muestras de aneuploidía eran T21 por cariotipo.
TABLA 4
Figure imgf000046_0001
Trisomia 18
[0230] La Tabla 5 proporciona la dosis calculada para el cromosoma 18 en una muestra de prueba (n° 11390). El umbral calculado para el diagnóstico positivo de la aneuploidía T18 se estableció en 2 desviaciones estándar de la media de las muestras calificadas (normales). Se proporcionó un diagnóstico para T18 basado en que la dosis de cromosoma en la muestra de prueba fue mayor que el umbral establecido. El cromosoma 8 se utilizó como cromosoma normalizador. En este caso, el cromosoma 8 tuvo la variabilidad más baja y la mayor diferenciabilidad. Se identificaron ocho muestras de T18 utilizando dosis de cromosomas, y se confirmó que eran T18 por cariotipo.
[0231] Estos datos muestran que un cromosoma normalizador puede tener tanto la variabilidad más baja como la mayor diferencia.
TABLA 5
Figure imgf000046_0003
Trisomia 13
[0232] La tabla 6 proporciona la dosis calculada para el cromosoma 13 en una muestra de prueba (n° 51236). El umbral calculado para el diagnóstico positivo de aneuploidía T13 se estableció en 2 desviaciones estándar de la media de las muestras calificadas. Se proporcionó un diagnóstico para T13 basado en que la dosis de cromosoma en la muestra de prueba fue mayor que el umbral establecido. La dosis de cromosoma para el cromosoma 13 se calculó utilizando el cromosoma 5 o el grupo de cromosomas 3, 4, 5 y 6 como el cromosoma normalizador. Se identificó una muestra de T13.
TABLA 6
Figure imgf000046_0002
[0233] La densidad de etiqueta de secuencia para los cromosomas 3-6 es los recuentos promedio de etiqueta para los cromosomas 3-6.
[0234] Los datos muestran que la combinación de los cromosomas 3, 4, 5 y 6 proporciona una variabilidad menor que la del cromosoma 5, y la mayor diferenciabilidad que cualquiera de los otros cromosomas.
[0235] Por lo tanto, se puede usar un grupo de cromosomas como el cromosoma normalizador para determinar las dosis de cromosomas e identificar aneuploidías.
Síndrome de Turner (monosomía X)
[0236] La Tabla 7 proporciona la dosis calculada para los cromosomas X e Y en una muestra de prueba (n° 51238). El umbral calculado para el diagnóstico positivo del Síndrome de Turner (monosomía X) se estableció para el cromosoma X en < -2 desviaciones estándar de la media, y para la ausencia del cromosoma Y en < -2 desviaciones estándar de la media para muestras calificadas (normales).
TABLA 7
Figure imgf000047_0001
[0237] Se comprobó que una muestra que tiene una dosis del cromosoma X menor que la del umbral conjunto tenía menos de un cromosoma X. Se determinó que la misma muestra tenía una dosis de cromosoma Y que era menor que el umbral establecido, lo que indica que la muestra no tenía un cromosoma Y. Por lo tanto, la combinación de dosis de cromosomas para X e Y se usó para identificar las muestras del Síndrome de Turner (monosomía X).
[0238] Por lo tanto, el método descrito en el presente documento permite la determinación de CNV de cromosomas. En particular, el método permite la determinación de aneuploidías cromosómicas por encima y por debajo de la representación mediante la secuenciación masiva en paralelo del plasma de la madre ADNcf y la identificación de cromosomas normalizados para el análisis estadístico de los datos de secuenciación. La sensibilidad y la fiabilidad del método permiten realizar pruebas precisas de aneuploidía en el primer y segundo trimestre.
Ejemplo 6
Determinación de la aneuploidía parcial.
[0239] Se aplicó el uso de dosis de secuencia para la evaluación de la aneuploidía parcial en una muestra de ensayo biológica de ADNcf que fue preparada a partir de plasma de sangre, y se secuenció como se describe en el Ejemplo 1. Se confirmó r cariotipo que la muestra se derivó de un sujeto con una eliminación parcial del cromosoma 11.
[0240] El análisis de los datos de secuenciación para la aneuploidía parcial (eliminación parcial del cromosoma 11, es decir, q21-q23) se realizó como se describe para las aneuploidías cromosómicas en los ejemplos anteriores. El mapeo de las etiquetas de secuencia al cromosoma 11 en una muestra de prueba reveló una notable pérdida de conteos de etiquetas entre los pares de bases 81000082-103000103 en el brazo q del cromosoma en relación con los conteos de etiquetas obtenidos para la secuencia correspondiente en el cromosoma 11 en las muestras calificadas (datos no mostrados). Las etiquetas de secuencia asignadas a la secuencia de interés en el cromosoma 11 (810000082-103000103bp) en cada una de las muestras calificadas, y las etiquetas de secuencia asignadas a todos los segmentos de 20 megabases en todo el genoma en las muestras calificadas, es decir, densidades de etiquetas de secuencia calificadas, se utilizaron para determinar las dosis de secuencias calificadas como relaciones de densidades de etiquetas en todas las muestras calificadas. La dosis media de secuencia, la desviación estándar y el coeficiente de variación se calcularon para los 20 segmentos de megabase en todo el genoma, y la secuencia de 20 megabase que tuvo la menor variabilidad fue la secuencia de normalización identificada en el cromosoma 5 (13000014-33000033bp) (véase tabla 8), que se utilizó para calcular la dosis para la secuencia de interés en la muestra de prueba (consulte la Tabla 9). La Tabla 8 proporciona la secuencia de dosis para la secuencia de interés en el cromosoma 11 (810000082-103000103bp) en la muestra de prueba que se calculó como la proporción de etiquetas de secuencia asignadas a la secuencia de interés y las etiquetas de secuencia asignadas a la secuencia de normalización identificada. La Figura 16 muestra las dosis de secuencia para la secuencia de interés en las 7 muestras calificadas (O) y la dosis de secuencia para la secuencia correspondiente en la muestra de prueba (0). La media se muestra mediante la línea continua y el umbral calculado para el diagnóstico positivo de aneuploidía parcial que se estableció en 5 desviaciones estándar de la media se muestra mediante la línea discontinua. El diagnóstico de aneuploidía parcial se basó en que la dosis de secuencia en la muestra de prueba era inferior al umbral establecido. La muestra de prueba se verificó mediante cariotipo para tener una eliminación q21-q23 en el cromosoma 11.
[0241] Por lo tanto, además de la identificación de aneuploidías cromosómicas, el método de la descripción se puede utilizar para identificar aneuploidías parciales.
TABLA 8
Figure imgf000048_0001
TABLA 9
Figure imgf000048_0002
Ejemplo 7
Determinación simultánea de aneuploidía y fracción fetal mediante secuenciación masivamente paralela: selección de SNP autosómicos para la determinación de fracción fetal
[0242] Un conjunto de 28 SNP autosómicos fueron seleccionados de una lista de 92 SNP (Pakstis et al, Hum Genet 127: 315-324 [2010]), y a partir de secuencias de SNP disponibles en Applied Biosystems en dirección de Internet appliedbiosystems.com, y validado para su uso en amplificación por PCR multiplexada y para secuenciación masivamente paralela para determinar la fracción fetal con o sin determinar simultáneamente la presencia o ausencia de aneuploidía. Los cebadores se diseñaron para hibridar con una secuencia cercana al sitio de los SNP en el ADNcf para asegurar que se incluya en la lectura de 36 pb generada a partir de la secuenciación masivamente paralela en el Analizador GII de Illumina, y para generar amplicones de longitud suficiente para sufrir una amplificación de puente durante la formación de racimos. Por lo tanto, los cebadores se diseñaron para generar amplicones que tenían al menos 110 pb, que cuando se combinaron con los adaptadores universales (Illumina Inc., San Diego, CA) utilizados para la amplificación de grupos, dieron como resultado moléculas de ADN de al menos 200 pb. Se identificaron secuencias de los cebadores, y conjuntos de cebadores, es decir, cebadores directo e inversos, fueron sintetizados por Integrated DNA Technologies (San Diego, CA), y se almacenaron como una solución de 1|jM para ser utilizado para la amplificación de secuencias diana polimórficas como se describe en los Ejemplos 5-8. La Tabla 10 proporciona los números de ID de acceso de RefSNP (rs), los cebadores utilizados para amplificar la secuencia de Ad Nc de destino y las secuencias de los amplicones que comprenden los posibles alelos de SNP que se generarían utilizando los cebadores. Los SNP dados en la Tabla 10 se usaron para la amplificación simultánea de 13 secuencias diana en un ensayo multiplexado para determinar simultáneamente la fracción fetal y la presencia o ausencia de una aneuploidía en muestras de ADNcf derivadas de mujeres embarazadas. El panel proporcionado en la Tabla 10 es un panel de SNP ejemplar. Se pueden emplear menos o más SNP para enriquecer el ADN fetal y materno para ácidos nucleicos diana polimórficos. Los SNP adicionales que se pueden usar incluyen los SNP que figuran en la Tabla 11. Los SNP en la Tabla 11 se validaron en amplificaciones de PCR multiplex, y se secuenciaron con el analizador GenomeII A como se describe anteriormente. Los alelos SNP en las Tablas 10 y 11 se muestran en negrita y están subrayados.
Ċ
TABLA 10
Figure imgf000049_0001
Figure imgf000050_0001
Figure imgf000051_0001
Figure imgf000052_0001
Figure imgf000053_0001
Ċ
TABLA 11
Figure imgf000054_0001
Figure imgf000055_0001
Figure imgf000056_0001
Figure imgf000057_0001
Figure imgf000058_0001
Ejemplo 8
Determinación simultánea de aneuploidía y fracción fetal: enriquecimiento de los ácidos nucleicos maternos y fetales en una muestra de la biblioteca de secuenciación de ADNcf.
[0243] Para determinar simultáneamente la fracción fetal y la presencia o ausencia de una aneuploidía en una muestra materna, se enriqueció una biblioteca de secuenciación primaria de ácidos nucleicos maternos y fetales para las secuencias de ácido nucleico diana polimórficas, y se secuenció como sigue.
[0244] ADNcf purificada se preparó a partir de una muestra de plasma materno como se describe en el Ejemplo 1. Se utilizó una primera porción de la muestra ADNcf purificado para preparar una biblioteca de secuenciación primaria utilizando el protocolo abreviado descrito en el Ejemplo 2. Una segunda porción de la ADNcf purificada la muestra se usó para amplificar secuencias de ácido nucleico diana polimórficas, es decir, SNP, y preparar una biblioteca de secuencia de destino de la siguiente manera. El ADNcf contenido en 5pl de ADNcf purificado se amplificó en un volumen de reacción de 50 pl que contenía 7,5 pl de una mezcla de cebador 1 pm (Tabla 5), 10 pl de NEB 5X Mastermix y 27 pl de agua. El ciclo térmico se realizó con el Gene Amp9700 (Applied Biosystems). Usando las siguientes condiciones de ciclado: incubación a 95°C durante 1 minuto, seguido de 30 ciclos a 95°C durante 20 segundos, 68°C durante 1 minuto y 68°C durante 30s, seguido de una incubación final a 68°C durante 5 minutos. Se agregó una retención final a 4°C hasta que las muestras se retiraron para combinar con la porción no amplificada de la muestra de ADNc purificada. El producto amplificado se purificó utilizando el sistema de purificación por PCR Agencourt AMPure XP (Pieza N° A63881; Beckman Coulter Genomics, Danvers, MA). Se agregó una retención final a 4°C hasta que las muestras se retiraron para preparar la biblioteca diana. El producto amplificado se analizó con un bioanalizador 2100 (Agilent Technologies, Sunnyvale, CA) y se determinó la concentración del producto amplificado. Una quinta parte del producto amplificado purificado se usó para preparar una biblioteca de secuenciación diana de ácidos nucleicos polimórficos amplificados como se describe en el Ejemplo 2. Las bibliotecas de secuenciación principal y la diana se diluyeron cada una a 10 nM, y la biblioteca diana se combinó en una proporción de 1:9 con la biblioteca de secuenciación para proporcionar una biblioteca de secuenciación enriquecida. La secuenciación de la biblioteca enriquecida se realizó como se describe en el Ejemplo. El análisis de los datos de secuenciación para determinar la aneuploidía se realizó como se describe en el Ejemplo 3 utilizando el genoma humano hg18 como genoma de referencia. El análisis de los datos de secuenciación para determinar la fracción fetal se realizó de la siguiente manera concomitante con el análisis para determinar la aneuploidía, se analizaron los datos de secuenciación para determinar la fracción fetal. Tras la transferencia de la imagen y los archivos de llamada base al servidor Unix que ejecuta la versión 1,51 del software Illumina "Genoma Analyzer Pipeline", como se describe en el Ejemplo 2c., las lecturas de 36 pb se alinearon con un "genoma SNP" utilizando el programa BOWTIE. El genoma de SNP se identificó como la agrupación de las secuencias de ADN polimórficas, es decir, las SEQ ID NO: 1-56, que abarcan los alelos de los 13 SNP descritos en la Tabla 10 en el Ejemplo 7. Sólo se utilizaron las lecturas que se asignaron de forma única al genoma de SNP para el análisis de la fracción fetal. Las lecturas que coincidían perfectamente con el genoma de SNP se contaron como etiquetas y se filtraron. De las lecturas restantes, solo las lecturas con uno o dos desajustes se contaron como etiquetas y se incluyeron en el análisis. Se contaron las etiquetas asignadas a cada uno de los alelos SNP y se determinó la fracción fetal. Aproximadamente un millón del número total de etiquetas de secuencia obtenidas de la secuenciación de la biblioteca enriquecida correspondió a las etiquetas que se asignan al genoma de referencia de SNP. La Figura 17 muestra un gráfico de la proporción del número de etiquetas de secuencia asignadas a cada cromosoma y el número total de etiquetas asignadas a todos los cromosomas (1-22, X e Y) obtenidos de la secuenciación de una biblioteca de ADNcf no enriquecida (•), y biblioteca ADNcf enriquecida con 5% (j) o 10% (♦) biblioteca SNP multiplex amplificada. El gráfico indica que la combinación de una biblioteca de secuencias polimórficas amplificadas con una biblioteca de secuencias no amplificadas de la muestra materna no afecta la información de secuenciación utilizada para determinar la aneuploidía. Los ejemplos de determinación de la fracción fetal para muestras obtenidas de sujetos que portan un feto con una aneuploidía cromosómica se dan en las Tablas 12, 13 y 14 a continuación.
a. Determinación de la fracción fetal
[0245] La fracción fetal se calculó como:
% fracción fetal alelox = ((ZEtiquetas de secuencia fetal para alelox) / (ZEtiquetas de secuencia materna para alelox)) x 100
donde alelox es un alelo informativo.
TABLA 12
Figure imgf000060_0001
Figure imgf000061_0002
b. Determinación de la aneuploidía.
[0246] La determinación de la aneuploidía de los cromosomas 21, 13, 18 y X se realizó utilizando las dosis de cromosoma como se describe en el Ejemplo 4. La dosis de cromosoma calificada, la varianza y la diferenciabilidad para los cromosomas 21, 18, 13, X e Y se dan en las Tablas X y Y. La clasificación de los cromosomas normalizados identificados por las dosis de cromosomas determinadas a partir de la secuenciación de la biblioteca enriquecida fue la misma que la determinada por la secuenciación de una biblioteca primaria (no enriquecida) del Ejemplo 4. La Figura 17 muestra la secuenciación de una biblioteca que ha sido enriquecida por secuencias diana de polimorfos. p. ej. SNP, no se ve afectada por la inclusión de los productos SNP amplificados.
TABLA 13
Figure imgf000061_0001
TABLA 14
Figure imgf000062_0001
[0247] La dosis del cromosoma 21 se determinó utilizando el cromosoma 14 como el cromosoma de normalización; La dosis del cromosoma 13 se determinó utilizando el grupo de los cromosomas 3, 4, 5 y 6 como el cromosoma normalizador; la dosis del cromosoma 18 se determinó utilizando el cromosoma 8 como cromosoma normalizador; y la dosis del cromosoma X se determinó utilizando el cromosoma 4 como cromosoma normalizador. Los umbrales se calcularon para ser 2 desviaciones estándar por encima y por debajo de la media determinada en las muestras calificadas.
[0248] La tabla 12 muestra los datos para la determinación de la fracción fetal en muestras ejemplares. Los valores de dosis de cromosomas calculados para los cromosomas 21, 18, 13, X e Y en muestras de prueba ejemplares correspondientes se dan en las Tablas 15, 16, 17 y 18, respectivamente.
Trisomia 21
[0249] La Tabla 8 proporciona la dosis calculada para el cromosoma 21 en la muestra de prueba (11409). El cromosoma 14 se utilizó como cromosomas normalizadores. El umbral calculado para el diagnóstico positivo de la aneuploidía T21 se estableció en 2 desviaciones estándar de la media de las muestras calificadas (normales). Se proporcionó un diagnóstico para T21 basado en que la dosis de cromosoma en la muestra de prueba fue mayor que el umbral establecido. Las doce muestras de T21 que se confirmaron como T21 por cariotipo se identificaron en una población de 48 muestras de sangre.
TABLA 15
Figure imgf000063_0001
Trisomia 18
[0250] La Tabla 9 proporciona la dosis calculada para el cromosoma 18 en una muestra de prueba (95133). El cromosoma 8 se utilizó como cromosoma normalizador. En este caso, el cromosoma 8 tuvo la variabilidad más baja y la mayor diferenciabilidad. El umbral calculado para el diagnóstico positivo de la aneuploidía T18 se estableció en >2 desviaciones estándar de la media de las muestras calificadas (no T18). Se proporcionó un diagnóstico para T18 basado en la dosis de cromosoma en la muestra de prueba es mayor que el umbral establecido. Se identificaron ocho muestras de T18 utilizando dosis de cromosomas, y se confirmó que eran T18 mediante cariotipo.
TABLA 16
Figure imgf000063_0002
Trisomia 13
[0251] Las Tablas 10 y 11 proporcionan la dosis calculada para el cromosoma 13 en una muestra de prueba (51236). El umbral calculado para el diagnóstico positivo de aneuploidía T13 se estableció en 2 desviaciones estándar de la media de las muestras calificadas (no T13). La dosis de cromosoma para el cromosoma 13 proporcionada en la Tabla 10 se calculó utilizando la densidad de la etiqueta de secuencia para el cromosoma 4 como el cromosoma normalizador, mientras que la dosis dada en la Tabla 11 se determinó utilizando el promedio de las relaciones de densidades de la etiqueta de secuencia para el grupo de cromosomas 3, 4, 5, y 6 como el cromosoma normalizante. Se proporcionó un diagnóstico para T13 basado en que la dosis de cromosoma en la muestra de prueba fue mayor que el umbral establecido. Se identificó una muestra de T13 utilizando dosis de cromosomas, y se confirmó que eran T13 mediante cariotipo.
[0252] Los datos muestran que la combinación de los cromosomas 3, 4, 5, y 6 proporcionan una variabilidad (1,06) que es similar a la del cromosoma 4 (1,01), lo que demuestra que un grupo de cromosomas se puede utilizar como cromosoma normalizador para determinar las dosis de cromosomas e identificar aneuploidías.
TABLA 17
Figure imgf000063_0003
TABLA 18
Figure imgf000063_0004
Síndrome de Turner (monosomía X)
[0253] Se identificaron tres muestras con una dosis de cromosoma inferior a la del umbral establecido que tenían menos de un cromosoma X. Se determinó que las mismas muestras tenían una dosis de cromosoma Y que era menor que el umbral establecido, lo que indicaba que las muestras no tenían un cromosoma Y.
[0254] Las dosis calculadas para los cromosomas X e Y en la muestra de ensayo de monosomía X ejemplar (54430) se dan en la Tabla 12. El cromosoma 4 fue seleccionado como el cromosoma de normalización para calcular la dosis para el cromosoma X; y todos los cromosomas, es decir, 1-22, e Y, se utilizaron como los cromosomas normalizadores. El umbral calculado para el diagnóstico positivo del Síndrome de Turner (monosomía X) se estableció para el cromosoma X en < -2 desviaciones estándar de la media, y para la ausencia del cromosoma Y en <- 2 desviaciones estándar de la media para muestras calificadas (no monosomia X).
TABLA 19
Figure imgf000064_0001
[0255] De este modo, el método permite la determinación simultánea de aneuploidías cromosómicas y la fracción fetal por secuenciación masivamente paralela de una muestra materna que comprende una mezcla de ADNcf fetal y materno que se ha enriquecido para una pluralidad de secuencias polimórficas, comprendiendo cada una de ellas un SNP. En este ejemplo, la mezcla de ácidos nucleicos maternos y fetales se enriqueció mediante la combinación de una porción de una biblioteca de secuenciación que se construyó a partir de secuencias polimorfas maternas y fetales amplificadas con una biblioteca de secuenciación que se construyó a partir de la mezcla original de ADNcf fetal y materna no amplificada.
Ejemplo 9
Determinación simultánea de aneuploidía y fetal fracción: Enriquecimiento de los ácidos nucleicos maternos y fetales en una muestra de ADNcf purificada
[0256] Para enriquecer el ADNcf fetal y materno contenido en una muestra purificada de ADNcf extraída de una muestra de plasma materno, se usó una porción del ADNcf purificado para amplificar secuencias de ácido nucleico diana polimórficas, comprendiendo cada una de ellas un SNP seleccionado del panel de SNP dado en la Tabla 6.
[0257] Se obtuvo plasma libre de células de una muestra de sangre materna, y ADNcf se purificó a partir de la muestra de plasma como se describe en el Ejemplo 1. Se determinó que la concentración final era 92,8pg/pl.
[0258] El ADNcf contenido en 5 pl de ADNcf purificado se amplificó en un volumen de reacción de 50 pl que contenía 7,5 pl de una mezcla de cebador 1uM (Tabla 5), 10 pl de NEB 5X Mastermix y 27 pl de agua. El ciclo térmico se realizó con el Gene Amp9700 (Applied Biosystems). Usando las siguientes condiciones de ciclado: incubación a 95°C durante 1 minuto, seguido de 30 ciclos a 95°C durante 20 segundos, 68°C durante 1 minuto y 68°C durante 30s, seguido de una incubación final a 68°C durante 5 minutos. Se agregó una retención final a 4°C hasta que las muestras se retiraron para combinar con la porción no amplificada de la muestra de ADNc purificada. El producto amplificado se purificó utilizando el sistema de purificación por PCR Agencourt AMPure XP (Pieza N° A63881; Beckman Coulter Genomics, Danvers, MA), y la concentración se cuantificó utilizando el Nanodrop 2.000 (Thermo Scientific, Wilmington, DE). El producto de amplificación purificado se diluyó 1:10 en agua y se agregaron 0,9 pl (371 pg) a 40 pl de muestra de ADNcp purificada para obtener un pico del 10%. El ADNcf enriquecido fetal y materno presente en la muestra de ADNcf purificada se usó para preparar una biblioteca de secuenciación, y se secuenció como se describe en el Ejemplo 2.
[0259] La Tabla 13 proporciona los recuentos de etiquetas obtenidos para cada uno de los cromosomas 21, 18, 13, X e Y, es decir. densidad de la etiqueta de secuencia, y los recuentos de etiquetas obtenidos para las secuencias polimórficas informativas contenidas en el genoma de referencia de SNP, es decir, densidad de etiquetas SNP. Los datos muestran que la información de secuenciación puede obtenerse a partir de la secuenciación de una biblioteca única construida a partir de una muestra de ADNcf materna purificada que se ha enriquecido para secuencias que comprenden SNP para determinar simultáneamente la presencia o ausencia de aneuploidía y la fracción fetal. En el ejemplo dado, los datos muestran que la fracción de a Dn fetal en la muestra de plasma AFR105 fue cuantificable a partir de los resultados de la secuenciación de cinco SNP informativos y se determinó que era del 3,84%. Se proporcionan densidades de etiquetas de secuencia para los cromosomas 21, 13, 18, X e Y. La muestra AFR105 fue la única muestra que se sometió al protocolo de enriquecimiento de ADNcf purificado para secuencias polimórficas amplificadas. Por lo tanto, no se proporcionaron los coeficientes de variación y las pruebas de diferenciabilidad. Sin embargo, el ejemplo muestra que el protocolo de enriquecimiento proporciona los recuentos de etiquetas necesarios para determinar la aneuploidía y la fracción fetal a partir de un solo proceso de secuenciación.
TABLA 20
Figure imgf000065_0001
Ejemplo 10
Determinación simultánea de aneuploidía y fracción fetal: enriquecimiento de ácidos nucleicos maternos y fetales en una muestra de plasma
[0260] Para enriquecer el ADNcf fetal y materno contenido en una muestra de plasma original derivada de una mujer embarazada, una porción de la muestra de plasma original se usó para amplificar secuencias de ácido nucleico diana polimórficas, comprendiendo cada una de ellas un SNP elegido del panel de SNP que figura en la Tabla 14, y una porción del producto amplificado se combinó con la muestra de plasma original restante.
[0261] ADNcf contenido en 15 pl de plasma libre de células se amplificó en un volumen de reacción de 50 pl que contenía 9 ul de una mezcla 1 pm de cebadores (15 plexTabla 5), 1 pl de polimerasa ADN de Phusion, 25 pl del tampón de PCR en sangre 2X Phusion que contiene trifosfatos de desoxinucleótidos (dNTPs: dATP, dCTP, dGTP y dTTP). El ciclo térmico se realizó con el Gene Amp9700 (Applied Biosystems) utilizando las siguientes condiciones de ciclo: incubación a 95°C durante 3 minutos, seguido de 35 ciclos a 95°C durante 20 segundos, 55°C durante 30 segundos y 70°C durante 1 minuto, seguido de una incubación final a 68°C durante 5 minutos. Se agregó una retención final a 4°C hasta que las muestras se retiraron para combinarlas con la porción no amplificada del plasma libre de células. El producto amplificado se diluyó 1:2 con agua y se analizó utilizando el Bioanalizador. Se diluyeron 3 pl adicionales de producto amplificado con 11,85 pl de agua para obtener una concentración final de 2 ng/pl. Se combinaron 2,2 pl del producto amplificado diluido con la muestra de plasma restante. El ADNcf fetal y materno enriquecido presente en la muestra de plasma se purificó como se describe en el Ejemplo 1, y se usó para preparar una biblioteca de secuenciación. La secuenciación y el análisis de los datos de secuenciación se realizaron como se describe en los Ejemplos 2 y 3.
[0262] Los resultados se dan en la Tabla 21. En el ejemplo dado, los datos muestran que la fracción de ADN fetal en muestra de plasma SAC2517 fue cuantificable a partir de los resultados de la secuenciación de un SNP informativo y se determinó que era 9,5%. En el ejemplo dado, se demostró que la muestra SAC2517 por cariotipo no se ve afectada por las aneuploidías de los cromosomas 21, 13, 18, X e Y. Se proporcionan densidades de etiquetas de secuencia para los cromosomas 21, 13, 18, X e Y. La muestra SAC2517 fue la única muestra que se sometió al protocolo de enriquecimiento de ADNcfc para secuencias polimórficas amplificadas. Por lo tanto, no se pudieron determinar los coeficientes de variación y las pruebas de diferenciabilidad. El ejemplo demuestra que enriquecer la mezcla de ADNcf fetal y materno presente en una muestra de plasma para las secuencias de ácido nucleico que comprenden al menos un SNP informativo puede usarse para proporcionar la secuencia necesaria y los recuentos de etiquetas de SNP para determinar la aneuploidía y la fracción fetal de un solo proceso de secuenciación.
TABLA 21
Figure imgf000066_0001
Ejemplo 11
Determinación simultánea de aneuploidía y fracción fetal en muestras maternas enriquecidas para secuencias polimórficas que comprenden STR
[0263] Para determinar simultáneamente la presencia o ausencia de una aneuploidía y la fracción fetal en una mezcla de ADNcf fetal y materno obtenida de una muestra materna, la mezcla se enriquece para secuencias polimórficas que comprenden STR, se secuencia y se analizan los datos. El enriquecimiento puede ser de una biblioteca de secuenciación como se describe en el Ejemplo 8, de una muestra de ADNcf purificada como se describe en el Ejemplo 9, o de una muestra de plasma como se describe en el Ejemplo 10. En cada caso, la información de secuenciación se obtiene de la secuenciación de una sola biblioteca, que permite determinar simultáneamente la presencia o ausencia de una aneuploidía y la fracción fetal. Preferiblemente, la biblioteca de secuenciación se prepara utilizando el protocolo abreviado proporcionado en el Ejemplo 2.
[0264] Los STR que se amplifican se seleccionan de los STR codis y no codis descritos en la Tabla 22, y la amplificación de las secuencias polimórficas de STR se obtiene utilizando los conjuntos correspondientes de cebadores proporcionados. Algunos de los STR se han descrito y/o analizado previamente para determinar la fracción fetal, se enumeran en la Tabla 22 y se describen en las solicitudes provisionales de e E.UU. 61/296.358 y 61/360.837.
TABLA 22
Figure imgf000067_0001
Figure imgf000068_0001
Figure imgf000069_0001
Figure imgf000070_0001
[0265] Los miniSTR proporcionados en la Tabla 22 se han utilizado con éxito para determinar la fracción fetal en muestras de ADNcf de plasma obtenidas de mujeres embarazadas con fetos masculinos o femeninos, utilizando electroforesis capilar (consulte la Tabla 24 en el Ejemplo 15) para identificar y cuantificar los alelos de fetalidad y la maternidad. Por lo tanto, se espera que las secuencias polimórficas que comprenden otros STR, por ejemplo, los STR restantes de la Tabla 22 se puedan usar para determinar la fracción fetal mediante métodos de secuenciación masivamente paralelos.
[0266] La secuenciación de la biblioteca enriquecida para secuencias polimórficas de STR se realiza usando una tecnología NGS, por ejemplo, secuenciación masivamente paralela por síntesis. Las lecturas de secuencia de longitudes de al menos 100 pb se alinean con un genoma de referencia, por ejemplo, la secuencia del genoma humano de referencia NCBI36/hg18, y con un genoma de STR, y el número de etiquetas de secuencia asignadas al genoma humano de referencia y el genoma de referencia de STR obtenido para alelos informativos se utiliza para determinar la presencia o ausencia de aneuploidía y la fracción fetal, respectivamente. El genoma de referencia de STR incluye las secuencias de amplicones amplificados a partir de los cebadores dados.
Ejemplo 12
Determinación simultánea de aneuploidía y fracción fetal mediante secuenciación masiva en paralelo de muestras maternas enriquecidas para secuencias polimórficas que comprenden SNP en tándem
[0267] Para determinar simultáneamente la aneuploidía y la fracción fetal en muestras maternas que comprenden ácidos nucleicos maternos y fetales, las muestras de plasma, las muestras de ADNcf purificadas y las muestras de la biblioteca de secuenciación se enriquecen para las secuencias de ácido nucleico diana polimórficas, comprendiendo cada una de ellas un par de SNP en tándem seleccionados entre rs7277033-rs2110153; rs2822654-rs1882882; rs368657-rs376635; rs2822731-rs2822732; rs1475881-rs7275487; rs1735976-rs2827016; rs447340-rs2824097; rs418989-rs13047336; rs987980-rs987981; rs4143392-rs4143391; rs1691324-rs1305434; rs11909758-rs9980111; rs2826842-rs232414; rs1980869-rs1980970; rs9978999-rs9979175; rs1034346-rs12481852; rs7509629-rs2828358; rs4817013-rs7277036; rs9981121-rs2829696; rs455921-rs2898102; rs2898102-rs458848; rs961301-rs2830208; rs2174536-rs458076; rs11088023-rs11088024; rs1011734-rs1011733; rs2831244-rs9789838; rs8132769-rs2831440; rs8134080-rs2831524; rs4817219-rs4817220; rs2250911-rs2250997, rs2831899-rs2831900; rs2831902-rs2831903; rs11088086-rs2251447; rs2832040-rs11088088; rs2832141-rs2246777; rs2832959-rs9980934; rs2833734-rs2833735; rs933121-rs933122; rs2834140-rs12626953; rs2834485-rs3453; rs9974986-rs2834703; rs2776266-rs2835001; rs1984014-rs1984015; rs7281674-rs2835316; rs13047304-rs13047322; rs2835545-rs4816551; rs2835735-rs2835736; rs13047608-rs2835826; rs2836550-rs2212596; rs2836660-rs2836661; rs465612-rs8131220; rs9980072-rs8130031; rs418359-rs2836926; rs7278447-rs7278858; rs385787-rs367001; rs367001-rs386095; rs2837296-rs2837297; y rs2837381-rs4816672. Los cebadores utilizados para amplificar las secuencias de destino que comprenden los SNP en tándem están diseñados para abarcar ambos sitios de SNP. Por ejemplo, el cebador directo está diseñado para abarcar el primer SNP, y el cebador inverso está diseñado para abarcar el segundo par de SNP en tándem, es decir, cada uno de los sitios de SNP en el par en tándem se engloba dentro de los 36 pb generados por el método de secuenciación. La secuenciación de extremos emparejados se puede usar para identificar todas las secuencias que abarcan los sitios SNP en tándem. Los conjuntos ejemplares de cebadores que se utilizan para amplificar los SNP en tándem descritos en este documento son: rs7277033-rs2110153_F: TCCTGGAAACAAAGTATT (SEQ ID NO: 197) y rs7277033-rs2110153_R: AACCTTACAACAAAGCTAGAA (SEQ ID NO:198), conjunto rs2822654-rsl882882_F: ACTAAGCCTTGGGGATCCAG (SEQ ID NO: 199) y rs2822654-rs1882882_R: TGCTGTGGAAATACTAAAAGG (SEQ ID NO:200), conjunto rs368657-rs376635_F:CTCCAGAGGTAATCCTGTGA (SEQ ID NO:201) y rs368657-rs376635_R:TGGTGTGAGATGGTATCTAGG (SEQ ID NO:202), rs2822731-rs2822732_F:GTATAATCCATGAATCTTGTTT (SEQ ID NC:203) y rs2822731-rs2822732_R:TTCAAATTGTATATAAGAGAGT (SEQ ID NO:204), rs1475881-rs7275487_F:GCAGGAAAGTTATTTTTAAT (SEQ ID NO:205) y rs1475881-rs7275487_R:TGCTTGA-GAAAGCTAACACTT (SEQ ID NO:206), rs1735976-rs2827016F:CAGTGTTTGGAAATTGTCTG (SEQ ID NO:207) y rs1735976-rs2827016_R: GGCACTGGGAGATTATTGTA (SEQ ID NO: 208), rs447349-rs2824097_F: TCCTGTTGTTAAGTACACAT (SEQ ID NO: 209) y rs447349-rs2824097_R: GGGCCGTAATTACTTTTG (SEQ ID NO: 210), rs418989-rs13047336_F: ACTCAGTAGG CACTTTGTGTC (SEQ ID NO: 211) y rs418989-rs13047336_R: TCTTCCACCACACCAATC (SEQ ID NO: 212), rs987980-rs987981_F:TGGCTTTTCAAAGGTAAAA (SEQ ID NO:213) y rs987980-rs987981_R: GCAACGTTAACATCTGAATTT (SEQ ID NO:214), rs4143392-rs4143391_F: rs4143392-rs4143391 (SEQ ID NO: 215) y rs4143392-rs4143391_R: ATTTTATATGTCATGATCTAAG (SEQ ID NO 216), rs1691324-rs13050434_F: AGAGATTACAGGTGTGAGC (SEQ ID NO: 217) y rs1691324-rs1305O434_R: ATGATCCTCAACTGCCTCT (SEQ ID NO:218), rs11909758-rs9980111_F: TGAAACTCAAAAGAGAAAAG (SEQ ID NO:219) y rs11909758-rs9980111_R: ACAGATTTCTACTTAAAATT (SEQ ID NO:220), rs2826842-rs232414_F: TGAAACTCAAAAGAGAAAAG (SEQ ID NO:221) y rs2826842-rs232414_R: ACAGATTTCTACTTAAAATT (SEQ ID NO:22), rs2826842-rs232414_F: GCAAAGGGGTACTCTATGTA (SEQ ID NO:223) y rs2826842-rs232414_R: TATCGGGTCATCTTGTTAAA (SEQ ID NO:224), rs1980969-rs1980970_F: TCTAACAAAGCTCTGTCCAAAA (SEQ ID NO:225) y rs1980969-rs1980970_R: CCACACTGAATAACTGGAACA (SEQ ID NO:226), rs9978999-rs9979175_F: GCAAGCAAGCTCTCTACCTTC (SEQ ID NO:227) y rs9978999-rs9979175_R: TGTTCTTCCAAAATTCACATGC (SEQ ID NO:228), rs1034346-rs12481852_F: ATTTCACTATTCCTTCATTTT (SEQ ID NO:229) y rs1034346-rs12481852_R: TAATTGTTGCACACTAAATTAC (SEQ ID NO:230), rs4817013-rs7277036_F: AAAAAGCCACAGAAATCAGTC (SEQ ID NO:231) y rs4817013-rs7277036_R: TTCTTATATCTCACTGGGCATT (SEQ ID NO:232), rs9981121rs2829696_F: GGATGGTAGAAGAGAAGAAAGG (SEQ ID NO:233) y rs9981121-rs2829696_R: GGATGGTAGAAGAGAAGAAAGG (SEQ ID NO:234), rs455921-rs2898102_F: TGCAAAGATGCAGAACCAAC (SEQ ID NO:235) y rs455921-rs2898102_R: TTTTGTTCCTTGTCCTGGCTGA (SEQ ID NO:236), rs2898102-rs458848_F: TGCAAAGATGCAGAACCAAC (SEQ ID NO:237) y rs2898102rs458848_R: GCCTCCAGCTCTATCCAAGTT (SEQ ID NO:238), rs961301-rs2830208_F: CCTTAATATCTTCCCATGTCCA (SEQ ID NO:239) y rs961301-rs2830208_R: ATTGTTAGTGCCTCTTCTGCTT (SEQ ID NO:240), rs2174536-rs458076_F: GAGAAGTGAGGTCAGCAGCT (SEQ ID NO:241) y rs2174536-rs458076_R: TTTCTAAATTTCCATTGAACAG (SEQ ID NO:242), rs11088023-rs11088024_F: GAAATTGGCAATCTGATTCT (SEQ ID NO:243) y rs11088023-rsl1088024_R: CAACTTGTCCTTTATTGATGT (SEQ ID NO:244), rs1011734-rs1011733_F: CTATGTTGATAAAACATTGAAA (SEQ ID NO:245) y rs1011734rs1011733_R: GCCTGTCTGGAATATAGTTT (SEQ ID NO:246), rs2831244-rs9789838_F: CAGGGCATATAATCTAAGCTGT (SEQ ID NO:247) y rs2831244-rs9789838_R: CAATGACTCTGAGTTGAGCAC (SEQ ID NO:248), rs8132769-rs2831440_F: ACTCTCTCCCTCCCCTCT (SEQ ID NO:249) y rs8132769-rs2831440_R: TATGGCCCCAAAACTATTCT (SEQ ID NO:250), rs8134080-rs2831524_F: ACAAGTACTGGGCAGATTGA (SEQ ID NO:251) y rs8134080-rs2831524_R: GCCAGGTTTAGCTTTCAAGT (SEQ ID NO:252), rs4817219-rs4817220_F: TTTTATATCAGGAGAAACACTG (SEQ ID NO:253) y rs4817219-rs4817220_R: CCAGAATTTTGGAGGTTTAAT (SEQ ID NO:254), rs2250911-rs2250997_F: TGTCATTCCTCCTTTATCTCCA (SEQ ID NO:255) y rs2250911rs2250997_R: TTCTTTTGCCTCTCCCAAAG (SEQ ID NO:256), rs2831899-rs2831900_F: ACCCTGGCACAGTGTTGACT (SEQ ID NO:257) y rs2831899-rs2831900_R: TGGGCCTGAGTTGAGAAGAT (SEQ ID NO:258), rs2831902rs2831903_F: AATTTGTAAGTATGTGCAACG (SEQ ID NO:259) y rs2831902-rs2831903_R: TTTTTCCCATTTCCAACTCT (SEQ ID NO:260), rs11088086-rs2251447_F: AAAAGATGAGACAGGCAGGT (SEQ ID NO:261) y rs11088086-rs2251447 _R: ACCCCTGTGAATCTCAAAAT (SEQ ID NO:262), rs2832040-rs11088088_F: GCACTTGCTTCTATTGTTTGT (SEQ ID NO:263) y rs2832040-rs11088088_R: CCCTTCCTCTCTTCCATTCT (SEQ ID NO:264), rs2832141-rs2246777_F: AGCACTGCAGGTA (SEQ ID NO:265) y rs2832141-rs2246777_R: ACAGATACCAAAGAACTGCAA (SEQ ID NO:266), rs2832959 rs9980934_F: TGGACACCTTTCAACTTAGA (SEQ ID NO:267) y rs2832959 -rs9980934_R: GAACAGTAATGTTGAACTTTTT (SEQ ID NO:268), rs2833734-rs2833735_F: TCTTGCAAAAAGCTTAGCACA (SEQ ID NO:269) y rs2833734-rs2833735_R: AAAAAGATCTCAAAGGGTCCA (SEQ ID NO:270), rs933121-rs933122_F: GCTTTTGCTGAACATCAAGT (SEQ ID NO:271) y rs933121-rs933122_R: CCTTCCAGCAGCATAGTCT (SEQ ID NO:272), rs2834140-rs12626953_F: AAATCCAGGATGTGCAGT (SEQ ID NO:273) y rs2834140-rsl2626953_R: ATGATGAGGTCAGTGGTGT (SEQ ID NO:274), rs2834485-rs3453_F: CATCACAGATCATAGTAAATGG (SEQ ID NO:275) y rs2834485-rs3453_R: AATTATTATTTTGCAGGCAAT (SEQ ID NO:276), rs9974986-rs2834703_F: CATGAGGCAAACACCTTTCC (SEQ ID NO:277) y rs9974986-rs2834703_R: GCTGGACTCAGGATAAAGAACA (SEQ ID NO:278), rs2776266-rs2835001_F: TGGAAGCCTGAGCTGACTAA (SEQ ID NO:279) y rs2776266-rs2835001_R:CCTTCTTTTCCCCCAGAATC (SEQ ID NO:280), rs1984014rs1984015_F:TAGGAGAACAGAAGATCAGAG (SEQ ID NO:281) y rs1984014-rs1984015_R:AAAGACTATTGCTAAATGCTTG (SEQ ID NO:282), rs7281674-rs2835316_F: TAAGCGTAGGGCTGTGTGTG (SEQ ID NO:283) yrs7281674-rs2835316_R: GGACGGATAGACTCCAGAAGG (SEQ ID NO:284), rs13047304-rs13O47322_F: GAATGACCTTGGCACTTTTATCA (SEQ ID NO:285) y rs13047304-rs13O47322_R: AAGGATAGAGATATACAGATGAATGGA (SEQ ID NO:286), rs2835735-rs2835736_F: CATGCACCGCGCAAATAC (SEQ ID NO:287) y rs2835735rs2835736_R: ATGCCTCACCCACAAACAC (SEQ ID NO:288), rs13047608-rs2835826_F: TCCAAGCCCTTCTCACTCAC (SEQ ID NO:289) y rs13047608-rs2835826_R: CTGGGACGGTGACATTTTCT (SEQ ID NO:290), rs2836550rs2212596_F: CCCAGGAAGAGTGGAAAGATT (SEQ ID NO:291) y rs2836550-rs2212596_R: TTAGCTTGCATGTACCTGTGT (SEQ ID NO:292), rs2836660-rs2836661_F: AGCTAGATGGGGTGAATTTT (SEQ ID NO:293) y_R: TGGGCTGAGGGGAGATTC (SEQ ID NO:294), rs465612-rs8131220_F: ATCAAGCTAATTAATGTTATCT (SEQ ID NO:295) y rs465612-rs8131220_R: AATGAATAAGGTCCTCAGAG (SEQ ID NO:296), rs9980072-rs8130031_F:TTTAATCTGATCATTGCCCTA (SEQ ID NO:297) y rs9980072-rs8130031_R: AGCTGTGGGTGACCTTGA (SEQ ID NO:298), rs418359-rs2836926_F: TGTCCCACCATTGTGTATTA (SEQ ID NO:299) y rs418359-rs2836926_R: TCAGACTTGAAGTCCAGGAT (SEQ ID NO:300), rs7278447-rs7278858_F: GCTTCAGGGGTGTTAGTTTT (SEQ ID NO:301) y rs7278447-rs7278858_R: CTTTGTGAAAAGTCGTCCAG (SEQ ID NO:302), rs385787rs367001_F:CCATCATGGAAAGCATGG (SEQ ID NO:303) y rs385787-rs367001_R: TCATCTCCATGACTGCACTA (SEQ ID NO:304), rs367001-rs386095_F: GAGATGACGGAGTAGCTCAT (SEQ ID NO:305) y rs367001rs386095_R: CCCAGCTGCACTGTCTAC (SEQ ID NO:306), rs2837296-rs2837297_F: TCTTGTTCCAATCACAGGAC (SEQ ID NO:307) y rs2837296-rs2837297_R: ATGCTGTTAGCTGAAGCTCT (SEQ ID NO:308), y rs2837381rs4816672_F: TGAAAGCTCCTAAAGCAGAG (SEQ ID NO:309) y rs2837381-rs4816672_R:TTGAAGAGATGTGCTATCAT (SEQ ID NO:310). Se pueden incluir secuencias de polinucleótidos, por ejemplo, secuencias de fijación de GC, para garantizar la hibridación específica de cebadores ricos en AT (Ghanta et al., PLOS ONA 5 (10): doi10,1371/journal.pone.0013184 [2010], disponible en Internet en plosone.org). Un ejemplo de una secuencia de fijación de GC que puede incluir 5' del cebador directo o 3' del cebador inverso es GCCGCCTGCAGCCCGCGCCCCCCGTGCCCCCGCCCCGCCGCCGGCCCGGGCGCC (SEQ ID NO: 311).
[0268] Preparación de la muestra y el enriquecimiento de la biblioteca de secuenciación ADNcf, una muestra ADNcf purificada, y una muestra de plasma se lleva a cabo de acuerdo con el método descrito en los Ejemplos 8, 9 y 10, respectivamente. Todas las bibliotecas de secuenciación se preparan como se describe en el Ejemplo 2a, y la secuenciación se realiza como se describe en el Ejemplo 2b e incluye la secuenciación de extremos pareados. El análisis de los datos de secuenciación para la determinación de la aneuploidía fetal se realiza como se describe en los Ejemplos 4 y 5. Concomitante al análisis para determinar la aneuploidía, los datos de secuenciación se analizan para determinar la fracción fetal de la siguiente manera. Tras la transferencia de la imagen y los archivos de llamada base al servidor Unix que ejecuta el software Illumina "Genome Analyzer Pipeline" versión 1.51 como se describe, las lecturas de 36 pb se alinean con un "genoma SNP en tándem" mediante el programa BOWTIE. El genoma de SNP en tándem se identifica como la agrupación de las secuencias de ADN que abarcan los alelos de los 58 pares de SNP en tándem descritos anteriormente. Solo las lecturas que se asignan de forma única al genoma de s Np en tándem se utilizan para el análisis de la fracción fetal. Las lecturas que coinciden perfectamente con el genoma SNP en tándem se cuentan como etiquetas y se filtran. De las lecturas restantes, solo las lecturas que tienen uno o dos desajustes se cuentan como etiquetas y se incluyen en el análisis. Las etiquetas asignadas a cada uno de los alelos SNP en tándem se cuentan, y la fracción fetal se determina esencialmente como se describe en el Ejemplo 6 anterior, pero se tienen en cuenta las etiquetas asignadas a los dos alelos x e y SNP en tándem presentes en cada una de las secuencias de ácido nucleico diana polimórficas amplificadas que se amplifican para enriquecer las muestras maternas, es decir. % fracción fetal alelox+y = ((^etiquetas de secuencias fetales para alelox+y)/(¿etiquetas de secuencias para alelox+y)) x 100 Opcionalmente, la fracción de ácidos nucleicos fetales en la mezcla de ácidos nucleicos fetales y maternos se calculan para cada uno de los alelos informativos (alelox+y) de la siguiente manera: % fracción fetal alelox+y = ((2 X ^etiquetas de secuencias fetales para alelox+y) / (^etiquetas de secuencias maternas para alelox+y)) x 100,
para compensar la presencia de 2 conjuntos de alelos fetales en tándem, uno de ellos enmascarado por el fondo materno. Las secuencias SNP en tándem son informativas cuando la madre es heterocigótica y está presente un tercer haplotipo paterno, lo que permite una comparación cuantitativa entre el haplotipo heredado maternalmente y el haplotipo heredado paternalmente para calcular la fracción fetal mediante el cálculo de una relación de haplotipo (HR). El porcentaje de fracción fetal se calcula para al menos 1, al menos 2, al menos 3, al menos 4, al menos 5, al menos 6, al menos 7, al menos 8, al menos 9, al menos 10, al menos 11, al menos 12, al menos 13, al menos 14, al menos 15, al menos 16, al menos 17, al menos 18, al menos 19, al menos 20, al menos 25, al menos 30, al menos 40 o más conjuntos informativos de alelos en tándem. En una realización, la fracción fetal es la fracción fetal promedio determinada para al menos 3 conjuntos informativos de alelos en tándem.
Ejemplo 13
Determinación de la fracción fetal por secuenciación masivamente paralela de una biblioteca de destino que comprende ácidos nucleicos polimórficos que comprenden SNP
[0269] Para determinar la fracción de ADNcf fetal en una muestra materna, las secuencias de ácido nucleico polimórficas diana que comprenden cada una SNP se amplificaron y se usaron para preparar una biblioteca diana para la secuenciación masivamente paralela.
[0270] ADNcf se extrajo como se describe en el Ejemplo 1. Se preparó una biblioteca de secuenciación de la siguiente manera. El ADNcf contenido en 5 pl de ADNcf purificado se amplificó en un volumen de reacción de 50 pl que contenía 7,5 pl de una mezcla de cebador 1 pm (Tabla 10), 10 pl de NEB 5X Mastermix y 27 pl de agua. El ciclo térmico se realizó con el Gene Amp9700 (Applied Biosystems) utilizando las siguientes condiciones de ciclo: incubación a 95°C durante 1 minuto, seguido de 20-30 ciclos a 95°C durante 20 segundos, 68°C durante 1 minuto y 68°C durante 30s, seguido de una incubación final a 68°C durante 5 minutos. Se agregó una retención final a 4°C hasta que las muestras se retiraron para combinar con la porción no amplificada de la muestra de ADNc purificada. El producto amplificado se purificó utilizando el sistema de purificación por PCR Agencourt AMPure XP (Pieza N° A63881; Beckman coulter Genomics, Danvers, MA), y la concentración se cuantificó utilizando el Nanodrop 2.000 (Thermo Scientific, Wilmington, DE). Se agregó una retención final a 4°C hasta que las muestras se retiraron para preparar la biblioteca diana. El producto amplificado se analizó con un bioanalizador 2100 (Agilent Technologies, Sunnyvale, CA) y se determinó la concentración del producto amplificado. Se preparó una biblioteca de secuenciación de ácidos nucleicos diana amplificados utilizando el protocolo abreviado descrito en el Ejemplo 2, y se secuenció de manera masivamente paralela utilizando secuenciación por síntesis con terminadores de colorantes reversibles y de acuerdo con el protocolo de Illumina. El análisis y el recuento de las etiquetas asignadas a un genoma de referencia que consta de 26 secuencias (13 pares cada uno que representa dos alelos) que comprenden un SNP, es decir, la SEQ ID NO: 1-56 se realizó como se describe.
[0271] La Tabla 23 proporciona los recuentos de etiquetas obtenidos a partir de la secuenciación de la biblioteca diana y la fracción fetal calculada derivada de los datos de secuenciación.
TABLA 23
Figure imgf000073_0001
[0272] Los resultados muestran que las secuencias de ácidos nucleicos polimórficos que comprenden cada uno al menos un SNP pueden amplificarse a partir de ADNcf derivado de una muestra de plasma materno para construir una biblioteca que puede secuenciarse de forma masiva paralela para determinar la fracción de ácidos nucleicos fetales en la muestra materna. Los métodos de secuenciación masivamente paralelos para determinar la fracción fetal se pueden usar en combinación con otros métodos para proporcionar el diagnóstico de la aneuploidía fetal y otras pruebas prenatales.
Ejemplo 14
Determinación de la fracción fetal por secuenciación masivamente paralela de una biblioteca de destino que comprende ácidos nucleicos polimórficos que comprenden STR o SNP en tándem
[0273] La fracción fetal puede determinarse independientemente de la determinación de aneuploidía utilizando una biblioteca de destino que comprende SNP o STR en tándem como se describe para la biblioteca de destino SNP del Ejemplo 13. Para preparar una biblioteca de destino SNP en tándem, una porción de biblioteca de ADNcf purificada que comprende los ácidos nucleicos maternos y fetales se utiliza para amplificar las secuencias diana utilizando una mezcla de cebadores, por ejemplo, las Tablas 10 y 11. Para preparar una biblioteca STR, se utiliza una porción de una biblioteca de ADNcp purificada que comprende los ácidos nucleicos maternos y fetales una mezcla de cebadores, por ejemplo, la Tabla 22. La biblioteca diana de SNP en tándem se secuencia como se describe en el Ejemplo 12.
[0274] Las bibliotecas diana se secuenciaron como se ha descrito, y la fracción fetal se determina a partir del número de etiquetas de secuencias asignadas al genoma de referencia STR o SNP en tándem que comprende respectivamente todos los posibles alelos STR o SNP en tándem abarcados por los cebadores. Los alelos informativos se identifican y la fracción fetal se determina utilizando el número de etiquetas mapeadas a los alelos de las secuencias polimórficas.
Ejemplo 15
Determinación de la fracción fetal por electroforesis capilar de secuencias polimórficas que comprenden STR
[0275] Para determinar la fracción fetal en muestras maternas comprenden ADNcf fetal y materna, se recogieron muestras de sangre periférica de mujeres embarazadas con fetos de voluntarios ya sea hombre o mujer. Las muestras de sangre periférica se obtuvieron y procesaron para proporcionar un ADNf purificado como se describe en el Ejemplo 1
[0276] Se analizaron diez microlitros de las muestras de ADNc utilizando el kit de amplificación por PCR AmpF1STR® MiniFiler™ (Applied Biosystems, Foster City, CA) de acuerdo con las instrucciones del fabricante. Brevemente, el ADNcf contenido en 10 pl se amplificó en un volumen de reacción de 25 pl que contiene 5 pL de cebadores marcados con fluorescencia (Conjunto de cebador AmpF/STR® MiniFiler™), y la mezcla maestra AmpF/STR® MiniFiler™, que incluye AmpliTaq Gold® ADN polimerasa y tampón asociado, sal (MgC12 1,5 mM), y 200 pM trifosfatos de desoxinucleótidos (dNTPs: dATP, dCTP, dGTP y dTTP). Los cebadores marcados con fluorescencia son cebadores directos que están marcados con tintes 6Fa Mtm, VICtm, NEDtm y PET™. El ciclo térmico se realizó con el Gene Amp9700 (Applied Biosystems) utilizando las siguientes condiciones de ciclo: incubación a 95°C durante 10 minutos, seguido de 30 ciclos a 94°C durante 20 segundos, 59°C durante 2 minutos y 72°C durante 1 minuto, seguido de una incubación final a 60°C durante 45 minutos. Se agregó una retención final a 4°C hasta que las muestras se retiraron para su análisis. El producto amplificado se preparó diluyendo 1 pl de producto amplificado en 8,7 pl de Hi-di™ formamida (Applied Biosystems) y 0,3 pl de GeneScanTM-500 LIZ_estandar de tamaño interno (Applied Biosystems) y se analizó con un analizador genético ABI PRISM3130x1 (Applied Biosystems) utilizando recopilación de datos HID_G5_POP4 (Applied Biosystems) y una matriz de capilares de 36 cm. Todo el genotipado se realizó con el software GeneMapper_ID v3.2 (Applied Biosystems) utilizando escaleras y cubetas y paneles alélicos provistos por el fabricante.
[0277] Todas las mediciones de genotipificación se realizaron en el Analizador genético Applied Biosystems 3130 xl, utilizando una "ventana" de 0,5-nt en torno al tamaño obtenido para cada alelo para permitir la detección y la correcta asignación de alelos. Se determinó que cualquier alelo de muestra cuyo tamaño estaba fuera de la ventana 0,5-nt es OL, es decir, "Off Ladder". Los alelos OL son alelos de un tamaño que no está representado en la escalera alélica AmpF/STR® MiniFiler™ o un alelo que no corresponde a una escalera alélica, pero cuyo tamaño está justo fuera de una ventana debido a un error de medición. El umbral de altura de pico mínimo de >50 RFU se estableció en base a los experimentos de validación realizados para evitar la tipificación cuando es probable que los efectos estocásticos interfieran con la interpretación precisa de las mezclas. El cálculo de la fracción fetal se basa en promediar todos los marcadores informativos. Los marcadores informativos se identifican por la presencia de picos en el electroferograma que se encuentran dentro de los parámetros de los contenedores preestablecidos para los STR que se analizan.
[0278] Los cálculos de la fracción fetal se realizaron utilizando la altura de pico promedio para alelos mayores y menores en cada locus STR determinado a partir de inyecciones por triplicado. Las reglas aplicadas al cálculo son: 1. los datos de alelos off-ladder (OL) para alelos no se incluyen en el cálculo; y
2. solo se incluyen en el cálculo las alturas de los picos derivadas de >50 RFU (unidades de fluorescencia relativa)
3. si solo está presente un contenedor, el marcador se considera no informativo; y
4. si se llama un segundo recipiente, pero los picos del primero y el segundo son dentro del 50-70% de sus unidades de fluorescencia relativa (RFU) en altura de pico, la fracción minoritaria no se mide y el marcador se considera no informativo.
[0279] La fracción del alelo menor para cualquier marcador informativo dado se calcula dividiendo la altura del pico del componente menor por la suma de la altura del pico para el componente principal, y se expresó como un porcentaje se calculó primero para cada locus informativo como
fracción fetal = (Zaltura de pico de alelo menor / Ealtura de pico de alelo mayor)) X 100, La fracción fetal para una muestra que comprende dos o más RTS informativos, se calcularía como el promedio de las fracciones fetales calculadas para los dos o más marcadores informativos.
[0280] La tabla 8 proporciona los datos obtenidos al analizar el ADNcf de una paciente embarazada de un feto masculino.
TABLA 24
Figure imgf000075_0001
[0281] Los resultados muestran que ADNcf se puede utilizar para determinar la presencia o ausencia de ADN fetal como se indica por la detección de un componente menor en uno o más alelos sTr , para determinar la fracción fetal por ciento, y para determinar el sexo del feto como se indica por la presencia o ausencia del alelo de Amelogenin. Ejemplo 16
Uso de la fracción fetal para establecer umbrales y estimar el tamaño de muestra mínimo en la detección de aneuploidía
[0282] Los recuentos de coincidencias de secuencia con diferentes cromosomas se manipulan para generar una puntuación que variará con el número de copias cromosómicas que se puede interpretar para identificar la amplificación o eliminación cromosómica. Por ejemplo, tal puntuación podría generarse comparando la cantidad relativa de una secuencia de etiquetas en un cromosoma que experimenta cambios en el número de copias a un cromosoma que se sabe que es un euploide. Los ejemplos de puntuaciones que se pueden usar para identificar la amplificación o la eliminación incluyen, entre otros, los siguientes: recuentos del cromosoma de interés dividido por recuentos de otro cromosoma de la misma serie experimental, los recuentos del cromosoma de interés divididos por el total número de recuentos de la prueba experimental, comparación de recuentos de la muestra de interés versus una muestra de control separada. Sin pérdida de generalidad, se puede suponer que las puntuaciones aumentarán a medida que aumente el número de copias. El conocimiento de la fracción fetal se puede usar para establecer umbrales de "corte" para llamar estados de "aneuploidía", "normal" o "marginal" (incierto). Luego, se realizan cálculos para estimar el número mínimo de secuencias requeridas para lograr una sensibilidad adecuada (es decir, la probabilidad de identificar correctamente un estado de aneuploidía).
[0283] La Figura 19 es una gráfica de dos poblaciones diferentes de puntuaciones. El eje x es la puntuación y el eje y es la frecuencia. Las puntuaciones en muestras de cromosomas sin aneuploidía pueden tener una distribución que se muestra en la Figura 19A. La Figura 19B ilustra una distribución hipotética de una población de puntuaciones en muestras con un cromosoma amplificado. Sin pérdida de generalidad, los gráficos y las ecuaciones muestran el caso de una puntuación univariada donde la condición de aneuploidía representa una amplificación del número de copias. Los casos multivariados y/o las anomalías de reducción/eliminación son simples extensiones o reordenamientos de las descripciones dadas y pretenden caer dentro del alcance de esta técnica.
[0284] La cantidad de "solapamiento" entre las poblaciones puede determinar lo bien que se pueden discriminar los casos normales y aneuploidía. En general, el aumento de la fracción fetal, ff, aumenta el poder de discriminación al separar los dos centros de población (moviendo "C2", el "centro de puntuaciones de aneuploidía", y aumentando "d", lo que hace que las poblaciones se superpongan menos. Además, un aumento en el valor absoluto de la magnitud, m, (por ejemplo, tener cuatro copias del cromosoma en lugar de una trisomía) de la amplificación también aumentará la separación de los centros de población que conducen a un mayor poder (es decir, una mayor probabilidad de identificar correctamente los estados de aneuploidía).
[0285] Al aumentar el número de secuencias generadas, N, reduce las desviaciones estándar "sdevA" y/o "sdevB", la extensión de las dos poblaciones de puntuaciones, lo que también hace que las poblaciones se superpongan menos.
Configuración de umbrales y estimación del tamaño de la muestra
[0286] El siguiente procedimiento se puede usar para establecer "c", el valor crítico para llamar a los estados "aneuploidía", "normal" o "marginal" (incierto). Sin pérdida de generalidad, las pruebas estadísticas unilaterales se utilizan a continuación.
[0287] Primero, se decide una tasa de falsos positivos aceptable, FP (a veces también llamado "error de tipo I" o "especificidad"), que es la probabilidad de un falso positivo o una falsa llamada de aneuploidía. Por ejemplo, FP puede ser al menos, o aproximadamente 0,001, 0,002, 0,003, 0,004, 0,005, 0,006, 0,007, 0,009, 0,001, 0,02, 0,03, 0,04, 0,05, 0,06, 0,07, 0,08, 0,09, o 0,1.
[0288] Segundo, el valor de "c" se puede determinar resolviendo la ecuación: FP = integral desde C hasta el infinito de (f1 (x) dx).
Figure imgf000076_0001
[0289] Una vez que se ha determinado un valor crítico, c, las secuencias de números mínimos requeridas para lograr un cierto TP = tasa positiva verdadera puede ser estimada. La verdadera tasa positiva puede ser, por ejemplo, aproximadamente 0,5, 0.6, 0,7, 0,8 o 0,9. En una realización, la tasa positiva verdadera puede ser 0,8. En otras palabras, N es el número mínimo de secuencias requeridas para identificar el 100*TP de aneuploidía del tiempo. N= número mínimo tal que TP = integral de Ca infinito de f2(x,ff)dx > 0,8. N se determina resolviendo
oc>
miniV sí, {TB > j / 2(x, N)dx\
c
(Ecuación 2)
[0290] En las pruebas estadísticas clásicas f1 y f2 son a menudo F, distribuciones F no centrales (un caso especial de t y distribuciones t no centrales) aunque esa no es una condición necesaria para esta aplicación.
Configuración de "niveles" de umbrales para dar más control de errores
[0291] Los umbrales también se pueden establecer en etapas utilizando los métodos anteriores. Por ejemplo, se puede establecer un umbral para la llamada de alta confianza de "aneuploidía", digamos ca, usando FP 0,001 y un umbral "marginal", digamos cb, usando FP 0,05. En este caso si Puntuación, S:
(S > ca) luego llamar "Trisomía"
(cb > S <= ca) luego llamar "Marginal"
(S < cb) luego llamar "Normal"
Algunas generalizaciones triviales que caen dentro del alcance de esta técnica
[0292] Diferentes valores para los umbrales tales como TP, FP, etc. pueden ser utilizados. Los procedimientos se pueden ejecutar en cualquier orden. Por ejemplo, uno puede comenzar con N y resolver para c, etc. Las distribuciones pueden depender de ff para que fl(x,N,ff), 12(x,N,ff) y/u otras variables. Las ecuaciones integrales anteriores se pueden resolver por referencia a tablas o por métodos computacionales iterativos. Se puede estimar un parámetro no central y se puede leer la potencia de las tablas estadísticas estándar. El poder estadístico y los tamaños de muestra pueden derivarse del cálculo o estimación de los cuadrados medios esperados. Se pueden usar distribuciones teóricas de forma cerrada como f, t, t no central, normal, etc. o estimaciones (kernel u otro) para modelar las distribuciones f l, f2. El ajuste de umbral empírico y la selección de parámetros utilizando curvas características del operador del receptor (ROC) se pueden usar y agrupar con la fracción fetal. Se pueden usar varias estimaciones de la distribución (varianza, desviación media absoluta, rango intercuartil, etc.). Se pueden utilizar varias estimaciones del centro de distribución (media, mediana, etc.). Se pueden utilizar pruebas estadísticas a dos caras en lugar de a un solo lado. La prueba de hipótesis simple se puede reformular como regresión lineal o no lineal. Los métodos combinatorios, la simulación (p. ej., monte carlo), la maximización (p. ej., la expectativa de maximización), los métodos iterativos u otros pueden usarse de forma independiente o junto con los anteriores para establecer la potencia estadística o los umbrales.
Ejemplo 17
Demostración de detección de aneuploidía
[0293] Los datos de secuenciación obtenidos para las muestras descritas en los Ejemplos 4 y 5, y mostrados en las figuras 9-13 se analizaron adicionalmente para ilustrar la sensibilidad del método para identificar con éxito aneuploidías en muestras maternas. Las dosis de cromosomas normalizados para los cromosomas 21, 18, 13, X e Y se analizaron como una distribución relativa a la desviación estándar de la media (eje Y) y se muestran en la Figura 20. El cromosoma de normalización utilizado se muestra como el denominador (eje X).
[0294] La Figura 20 (A) muestra la distribución de las dosis de cromosomas en relación con la desviación estándar de la media de la dosis del cromosoma 21 en las muestras (o) no afectadas (normal) y las muestras de trisomía 21 (T21; A) cuando se usa el cromosoma 14 como el cromosoma normalizador para el cromosoma 21. La Figura 20 (B) muestra la distribución de las dosis de cromosomas en relación con la desviación estándar de la media para la dosis del cromosoma 18 en las muestras no afectadas (o) y las muestras de trisomía 18 (T18; A) cuando usando el cromosoma 8 como el cromosoma normalizador para el cromosoma 18. La figura 20 (C) muestra la distribución de las dosis de cromosomas en relación con la desviación estándar de la media para la dosis del cromosoma 13 en las muestras no afectadas (o) y las muestras de trisomía 13 (T13; A), utilizando la densidad media de la etiqueta de secuencia del grupo de los cromosomas 3, 4, 5 y 6 como el cromosoma normalizador para determinar la dosis de cromosoma para el cromosoma 13. La Figura 20 (D) muestra la distribución de las dosis de cromosoma

Claims (13)

REIVINDICACIONES
1. Un método para preparar una biblioteca de secuenciación a partir de una muestra de prueba que comprende moléculas de ácido nucleico, en donde el método comprende los pasos consecutivos de la reparación de extremos, la cola de dA y el adaptador que ligan dichos ácidos nucleicos, y en el que dichos pasos consecutivos excluyen la purificación de los productos reparados de forma final antes de la etapa de la cola de dA y excluyen la purificación de los productos de cola de dA antes del paso de ligadura del adaptador.
2. El método de la Reivindicación 1, en el que dichos pasos consecutivos se realizan en ausencia de polietilenglicol.
3. El método de la Reivindicación 1 o la reivindicación 2, en el que dichos pasos consecutivos se realizan en menos de 1 hora.
4. El método de cualquier reivindicación precedente, en el que dichos ácidos nucleicos son moléculas de ADN.
5. El método de cualquier reivindicación precedente, en el que dichos ácidos nucleicos:
(i) son moléculas de ADN genómico; o
(ii) son moléculas de ADN genómico humano.
6. El método de la Reivindicación 5, en el que dicho ADN genómico se somete a fragmentación antes de los pasos consecutivos de reparación final, cola de dA y adaptador que liga dichos ácidos nucleicos.
7. El método de cualquiera de las Reivindicaciones 1-5, en el que dichos ácidos nucleicos son moléculas de ADN libres de células (ADNcf) y no se someten a fragmentación antes de los pasos consecutivos de reparación final, colas de dA y ligadura con adaptador de dichos ácidos nucleicos .
8. Uso de una biblioteca de secuenciación preparada según el método de cualquiera de las Reivindicaciones 1-7 en un método de secuenciación de ácido nucleico.
9. El uso de la Reivindicación 8, en el que dicho método de secuenciación es un método de secuenciación de próxima generación (NGS).
10. El uso de la Reivindicación 8, en el que dicho método de secuenciación es un método de secuenciación masivamente paralelo, y en el que
opcionalmente:
(i) dicha secuenciación es una secuenciación masivamente paralela que utiliza secuenciación por síntesis con terminadores de tinte reversibles; o
(ii) dicha secuenciación es una secuenciación masivamente paralela utilizando la secuenciación por ligadura.
11. El uso de la Reivindicación 8, en el que dicha secuencia comprende una amplificación.
12. El uso de la Reivindicación 8, en el que dicha secuenciación es una secuenciación de una sola molécula.
13. El método de cualquiera de las Reivindicaciones 1-7 o el uso de cualquiera de las reivindicaciones 8-12, en el que la muestra:
(a) es una muestra de plasma derivada de sangre periférica que comprende una mezcla de ADNcf derivado de células normales y cancerosas;
(b) se deriva de una mezcla de células cancerosas y no cancerosas de un fluido biológico seleccionado de suero, sudor, lágrimas, esputo, orina, flujo de oído, linfa, saliva, líquido cefalorraquídeo, lavados, suspensión de médula ósea, flujo vaginal, Lavado transcervical, líquido cerebral, ascitis, leche, secreciones de las vías respiratorias, intestinales y geniutinarias, y muestras de leucoforesis; o
(c) se selecciona de biopsias de tejido, o frotis.
ES17180803T 2010-01-19 2010-12-01 Nuevo protocolo de preparación de bibliotecas de secuenciación Active ES2704701T3 (es)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US29635810P 2010-01-19 2010-01-19
US36083710P 2010-07-01 2010-07-01
US45584910P 2010-10-26 2010-10-26
US40701710P 2010-10-26 2010-10-26

Publications (1)

Publication Number Publication Date
ES2704701T3 true ES2704701T3 (es) 2019-03-19

Family

ID=44307118

Family Applications (6)

Application Number Title Priority Date Filing Date
ES17180803T Active ES2704701T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo de preparación de bibliotecas de secuenciación
ES10830938.6T Active ES2534758T3 (es) 2010-01-19 2010-12-01 Métodos de secuenciación en diagnósticos prenatales
ES10830939.4T Active ES2534986T3 (es) 2010-01-19 2010-12-01 Determinación simultánea de aneuploidía y fracción fetal
ES10844163.5T Active ES2560929T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácido nucleico fetal en muestras maternas
ES18201917T Active ES2909841T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo para preparar bibliotecas de secuenciación
ES18160303T Active ES2870533T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácidos nucleicos fetales en muestras maternas

Family Applications After (5)

Application Number Title Priority Date Filing Date
ES10830938.6T Active ES2534758T3 (es) 2010-01-19 2010-12-01 Métodos de secuenciación en diagnósticos prenatales
ES10830939.4T Active ES2534986T3 (es) 2010-01-19 2010-12-01 Determinación simultánea de aneuploidía y fracción fetal
ES10844163.5T Active ES2560929T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácido nucleico fetal en muestras maternas
ES18201917T Active ES2909841T3 (es) 2010-01-19 2010-12-01 Nuevo protocolo para preparar bibliotecas de secuenciación
ES18160303T Active ES2870533T3 (es) 2010-01-19 2010-12-01 Métodos de determinación de la fracción de ácidos nucleicos fetales en muestras maternas

Country Status (11)

Country Link
US (12) US20110245085A1 (es)
EP (14) EP2848704B1 (es)
AU (4) AU2010343277B2 (es)
CA (4) CA2786357C (es)
CY (1) CY1124494T1 (es)
DK (6) DK3382037T3 (es)
ES (6) ES2704701T3 (es)
GB (5) GB2485645B (es)
PL (4) PL2376661T3 (es)
TR (1) TR201807917T4 (es)
WO (3) WO2011090557A1 (es)

Families Citing this family (247)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE406463T1 (de) 2005-04-06 2008-09-15 Maurice Stroun Methode zur krebsdiagnose mittels nachweis von dna und rna im kreislauf
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US8532930B2 (en) 2005-11-26 2013-09-10 Natera, Inc. Method for determining the number of copies of a chromosome in the genome of a target individual using genetic data from genetically related individuals
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
SI2351858T1 (sl) * 2006-02-28 2015-06-30 University Of Louisville Research Foundation Med Center Three, Zaznavanje fetalnih kromosomskih nenormalnosti z uporabo tandema polimorfizmov posameznih nukleotidov
US20110033862A1 (en) * 2008-02-19 2011-02-10 Gene Security Network, Inc. Methods for cell genotyping
WO2009114543A2 (en) * 2008-03-11 2009-09-17 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20110092763A1 (en) * 2008-05-27 2011-04-21 Gene Security Network, Inc. Methods for Embryo Characterization and Comparison
CA3116156C (en) * 2008-08-04 2023-08-08 Natera, Inc. Methods for allele calling and ploidy calling
US8962247B2 (en) 2008-09-16 2015-02-24 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non invasive prenatal diagnoses
US8476013B2 (en) 2008-09-16 2013-07-02 Sequenom, Inc. Processes and compositions for methylation-based acid enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
EP2854056A3 (en) 2009-09-30 2015-06-03 Natera, Inc. Methods for non-invasive pre-natal ploidy calling
EP2496713B1 (en) 2009-11-06 2018-07-18 The Chinese University of Hong Kong Size-based genomic analysis
US9315857B2 (en) 2009-12-15 2016-04-19 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse label-tags
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
WO2011087760A2 (en) 2009-12-22 2011-07-21 Sequenom, Inc. Processes and kits for identifying aneuploidy
CA2786564A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
EP2848704B1 (en) 2010-01-19 2018-08-29 Verinata Health, Inc Sequencing methods for prenatal diagnoses
WO2012135730A2 (en) 2011-03-30 2012-10-04 Verinata Health, Inc. Method for verifying bioassay samples
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
WO2011146514A2 (en) * 2010-05-17 2011-11-24 The Board Of Regents Of The University Of Texas System Rapid isolation of monoclonal antibodies from animals
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
WO2013052557A2 (en) * 2011-10-03 2013-04-11 Natera, Inc. Methods for preimplantation genetic diagnosis by sequencing
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US12221653B2 (en) 2010-05-18 2025-02-11 Natera, Inc. Methods for simultaneous amplification of target loci
AU2011255641A1 (en) 2010-05-18 2012-12-06 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US12152275B2 (en) 2010-05-18 2024-11-26 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US10167508B2 (en) 2010-08-06 2019-01-01 Ariosa Diagnostics, Inc. Detection of genetic abnormalities
US20130040375A1 (en) 2011-08-08 2013-02-14 Tandem Diagnotics, Inc. Assay systems for genetic analysis
US20140342940A1 (en) 2011-01-25 2014-11-20 Ariosa Diagnostics, Inc. Detection of Target Nucleic Acids using Hybridization
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
US8700338B2 (en) 2011-01-25 2014-04-15 Ariosa Diagnosis, Inc. Risk calculation for evaluation of fetal aneuploidy
US11203786B2 (en) 2010-08-06 2021-12-21 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
US20130261003A1 (en) 2010-08-06 2013-10-03 Ariosa Diagnostics, In. Ligation-based detection of genetic variants
US11031095B2 (en) 2010-08-06 2021-06-08 Ariosa Diagnostics, Inc. Assay systems for determination of fetal copy number variation
US10533223B2 (en) 2010-08-06 2020-01-14 Ariosa Diagnostics, Inc. Detection of target nucleic acids using hybridization
WO2012038839A2 (en) 2010-09-21 2012-03-29 Population Genetics Technologies Ltd. Increasing confidence of allele calls with molecular counting
BR112013013421A2 (pt) * 2010-11-30 2016-09-06 Univ Hong Kong Chinese método de análise de uma amostra biológica de um organismo, método de determinação de um progresso de aberrações cromossômicas em um organismo, meios de armazenamento de memória, e, sistema de computador
AU2011348100B2 (en) 2010-12-22 2016-08-25 Natera, Inc. Methods for non-invasive prenatal paternity testing
US8756020B2 (en) 2011-01-25 2014-06-17 Ariosa Diagnostics, Inc. Enhanced risk probabilities using biomolecule estimations
US10131947B2 (en) 2011-01-25 2018-11-20 Ariosa Diagnostics, Inc. Noninvasive detection of fetal aneuploidy in egg donor pregnancies
US11270781B2 (en) 2011-01-25 2022-03-08 Ariosa Diagnostics, Inc. Statistical analysis for non-invasive sex chromosome aneuploidy determination
US9994897B2 (en) 2013-03-08 2018-06-12 Ariosa Diagnostics, Inc. Non-invasive fetal sex determination
CN103608818B (zh) 2011-02-09 2017-12-08 纳特拉公司 非侵入性产前倍性识别装置
US9260753B2 (en) 2011-03-24 2016-02-16 President And Fellows Of Harvard College Single cell nucleic acid detection and analysis
SMT201800558T1 (it) 2011-04-12 2018-11-09 Verinata Health Inc Risoluzione di frazioni genomiche usando conte di polimorfismi
AU2011365507A1 (en) * 2011-04-14 2013-05-02 Verinata Health, Inc. Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
GB2484764B (en) 2011-04-14 2012-09-05 Verinata Health Inc Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
US9411937B2 (en) * 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
US20130059762A1 (en) 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
EP3495497B1 (en) 2011-04-28 2021-03-24 Life Technologies Corporation Methods and compositions for multiplex pcr
US20130059738A1 (en) * 2011-04-28 2013-03-07 Life Technologies Corporation Methods and compositions for multiplex pcr
US8450061B2 (en) 2011-04-29 2013-05-28 Sequenom, Inc. Quantification of a minority nucleic acid species
WO2012177792A2 (en) 2011-06-24 2012-12-27 Sequenom, Inc. Methods and processes for non-invasive assessment of a genetic variation
KR101974492B1 (ko) * 2011-07-26 2019-05-02 베리나타 헬스, 인코포레이티드 샘플 중 상이한 이수성의 존재 또는 부재를 결정하는 방법
US8712697B2 (en) 2011-09-07 2014-04-29 Ariosa Diagnostics, Inc. Determination of copy number variations using binomial probability calculations
HK1199745A1 (en) 2011-09-09 2015-07-17 The Board Of Trustees Of The Leland Stanford Junior University Methods for obtaining a sequence
WO2013040583A2 (en) * 2011-09-16 2013-03-21 Complete Genomics, Inc Determining variants in a genome of a heterogeneous sample
US10196681B2 (en) 2011-10-06 2019-02-05 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9367663B2 (en) 2011-10-06 2016-06-14 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140242588A1 (en) 2011-10-06 2014-08-28 Sequenom, Inc Methods and processes for non-invasive assessment of genetic variations
US9984198B2 (en) 2011-10-06 2018-05-29 Sequenom, Inc. Reducing sequence read count error in assessment of complex genetic variations
US10424394B2 (en) 2011-10-06 2019-09-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
JP6073902B2 (ja) * 2011-10-06 2017-02-01 セクエノム, インコーポレイテッド 遺伝的変異の非侵襲的評価のための方法およびプロセス
US8688388B2 (en) 2011-10-11 2014-04-01 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013055817A1 (en) 2011-10-11 2013-04-18 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
WO2013062856A1 (en) 2011-10-27 2013-05-02 Verinata Health, Inc. Set membership testers for aligning nucleic acid samples
ES2929923T3 (es) * 2012-01-20 2022-12-02 Sequenom Inc Procesos de diagnóstico que condicionan las condiciones experimentales
WO2013130512A2 (en) 2012-02-27 2013-09-06 The University Of North Carolina At Chapel Hill Methods and uses for molecular tags
WO2013130674A1 (en) 2012-02-27 2013-09-06 Cellular Research, Inc. Compositions and kits for molecular counting
EP3287531B1 (en) 2012-02-28 2019-06-19 Agilent Technologies, Inc. Method for attaching a counter sequence to a nucleic acid sample
WO2013131021A1 (en) 2012-03-02 2013-09-06 Sequenom Inc. Methods and processes for non-invasive assessment of genetic variations
US9892230B2 (en) * 2012-03-08 2018-02-13 The Chinese University Of Hong Kong Size-based analysis of fetal or tumor DNA fraction in plasma
CA2868836C (en) * 2012-03-26 2019-08-06 The Johns Hopkins University Rapid aneuploidy detection
CN108485940B (zh) * 2012-04-12 2022-01-28 维里纳塔健康公司 拷贝数变异的检测和分类
US10289800B2 (en) 2012-05-21 2019-05-14 Ariosa Diagnostics, Inc. Processes for calculating phased fetal genomic sequences
US9920361B2 (en) 2012-05-21 2018-03-20 Sequenom, Inc. Methods and compositions for analyzing nucleic acid
EP3978621B1 (en) 2012-05-21 2023-08-30 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10504613B2 (en) 2012-12-20 2019-12-10 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
RU2014152211A (ru) * 2012-05-23 2016-07-20 БГИ Диагносис Ко., Лтд. Способ и система идентификации типов близнецов
US11261494B2 (en) * 2012-06-21 2022-03-01 The Chinese University Of Hong Kong Method of measuring a fractional concentration of tumor DNA
US10497461B2 (en) 2012-06-22 2019-12-03 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US20140093873A1 (en) 2012-07-13 2014-04-03 Sequenom, Inc. Processes and compositions for methylation-based enrichment of fetal nucleic acid from a maternal sample useful for non-invasive prenatal diagnoses
EP2875156A4 (en) 2012-07-19 2016-02-24 Ariosa Diagnostics Inc DETECTION BASED ON MULTIPLEX SEQUENTIAL LIGATION OF GENETIC VARIANTS
EP2875149B1 (en) 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome
US20140100126A1 (en) 2012-08-17 2014-04-10 Natera, Inc. Method for Non-Invasive Prenatal Testing Using Parental Mosaicism Data
US10876152B2 (en) 2012-09-04 2020-12-29 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
EP3470533B2 (en) 2012-09-04 2023-01-18 Guardant Health, Inc. Systems and methods to detect copy number variation
US20160040229A1 (en) 2013-08-16 2016-02-11 Guardant Health, Inc. Systems and methods to detect rare mutations and copy number variation
US11913065B2 (en) 2012-09-04 2024-02-27 Guardent Health, Inc. Systems and methods to detect rare mutations and copy number variation
US10482994B2 (en) 2012-10-04 2019-11-19 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP4009329A1 (en) 2012-10-04 2022-06-08 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10347361B2 (en) 2012-10-24 2019-07-09 Nantomics, Llc Genome explorer system to process and present nucleotide variations in genome sequence data
US10643738B2 (en) 2013-01-10 2020-05-05 The Chinese University Of Hong Kong Noninvasive prenatal molecular karyotyping from maternal plasma
US20130309666A1 (en) 2013-01-25 2013-11-21 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP2961851B1 (en) 2013-02-28 2018-04-25 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
WO2014168711A1 (en) 2013-03-13 2014-10-16 Sequenom, Inc. Primers for dna methylation analysis
AU2014233373B2 (en) 2013-03-15 2019-10-24 Verinata Health, Inc. Generating cell-free DNA libraries directly from blood
US20140278127A1 (en) * 2013-03-15 2014-09-18 Battelle Memorial Institute Computer Files and Methods Supporting Forensic Analysis of Nucleotide Sequence Data
CN105358709B (zh) 2013-03-15 2018-12-07 雅培分子公司 用于检测基因组拷贝数变化的系统和方法
ES2939547T3 (es) 2013-04-03 2023-04-24 Sequenom Inc Métodos y procedimientos para la evaluación no invasiva de variaciones genéticas
KR102385062B1 (ko) 2013-05-24 2022-04-12 시쿼넘, 인코포레이티드 유전적 변이의 비침습 평가를 위한 방법 및 프로세스
CA2915626A1 (en) 2013-06-17 2014-12-24 Verinata Health, Inc. Method for determining copy number variations in sex chromosomes
EP3540076B1 (en) 2013-06-21 2025-05-07 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9567645B2 (en) 2013-08-28 2017-02-14 Cellular Research, Inc. Massively parallel single cell analysis
GB201318369D0 (en) * 2013-10-17 2013-12-04 Univ Leuven Kath Methods using BAF
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
WO2015048535A1 (en) 2013-09-27 2015-04-02 Natera, Inc. Prenatal diagnostic resting standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
FI3053071T3 (fi) 2013-10-04 2024-01-18 Sequenom Inc Menetelmiä ja prosesseja geneettisten variaatioiden ei-invasiiviseen arviointiin
US9582877B2 (en) 2013-10-07 2017-02-28 Cellular Research, Inc. Methods and systems for digitally counting features on arrays
AU2014332241B2 (en) 2013-10-07 2021-04-29 Sequenom, Inc. Methods and processes for non-invasive assessment of chromosome alterations
ES2784450T3 (es) 2013-12-28 2020-09-25 Guardant Health Inc Métodos y sistemas para detectar variantes genéticas
WO2015138774A1 (en) 2014-03-13 2015-09-17 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
EP3134541B1 (en) 2014-04-21 2020-08-19 Natera, Inc. Detecting copy number variations (cnv) of chromosomal segments in cancer
US20180173846A1 (en) 2014-06-05 2018-06-21 Natera, Inc. Systems and Methods for Detection of Aneuploidy
WO2016019042A1 (en) 2014-07-30 2016-02-04 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US10892035B2 (en) 2014-10-10 2021-01-12 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
US9857328B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Chemically-sensitive field effect transistors, systems and methods for manufacturing and using the same
EP3235010A4 (en) 2014-12-18 2018-08-29 Agilome, Inc. Chemically-sensitive field effect transistor
US9618474B2 (en) 2014-12-18 2017-04-11 Edico Genome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10006910B2 (en) 2014-12-18 2018-06-26 Agilome, Inc. Chemically-sensitive field effect transistors, systems, and methods for manufacturing and using the same
US9859394B2 (en) 2014-12-18 2018-01-02 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
US10020300B2 (en) 2014-12-18 2018-07-10 Agilome, Inc. Graphene FET devices, systems, and methods of using the same for sequencing nucleic acids
SG11201706529TA (en) 2015-02-10 2017-09-28 Univ Hong Kong Chinese Detecting mutations for cancer screening and fetal analysis
US10697010B2 (en) 2015-02-19 2020-06-30 Becton, Dickinson And Company High-throughput single-cell analysis combining proteomic and genomic information
KR101533792B1 (ko) * 2015-02-24 2015-07-06 대한민국 Ngs 기반 인간 객체의 상염색체 분석방법
EP3262192B1 (en) 2015-02-27 2020-09-16 Becton, Dickinson and Company Spatially addressable molecular barcoding
WO2016160844A2 (en) 2015-03-30 2016-10-06 Cellular Research, Inc. Methods and compositions for combinatorial barcoding
US11390914B2 (en) 2015-04-23 2022-07-19 Becton, Dickinson And Company Methods and compositions for whole transcriptome amplification
US10844428B2 (en) * 2015-04-28 2020-11-24 Illumina, Inc. Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS)
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
PT3666902T (pt) 2015-05-22 2024-09-19 Medicover Public Co Ltd Análise paralela multiplexada de regiões genómicas alvo para testes pré-natais não invasivos
WO2016196229A1 (en) 2015-06-01 2016-12-08 Cellular Research, Inc. Methods for rna quantification
EP3135770A1 (en) * 2015-08-28 2017-03-01 Latvian Biomedical Research and Study Centre Set of oligonucleotides and method for detection of fetal dna fraction in maternal plasma
US11302416B2 (en) 2015-09-02 2022-04-12 Guardant Health Machine learning for somatic single nucleotide variant detection in cell-free tumor nucleic acid sequencing applications
EP3347465B1 (en) 2015-09-11 2019-06-26 Cellular Research, Inc. Methods and compositions for nucleic acid library normalization
AU2016355155A1 (en) * 2015-11-16 2018-05-24 Sequenom, Inc. Methods and processes for non-invasive assessment of genetic variations
CA3008651A1 (en) 2015-12-17 2017-06-22 Guardant Health, Inc. Methods to determine tumor gene copy number by analysis of cell-free dna
US10982286B2 (en) 2016-01-22 2021-04-20 Mayo Foundation For Medical Education And Research Algorithmic approach for determining the plasma genome abnormality PGA and the urine genome abnormality UGA scores based on cell free cfDNA copy number variations in plasma and urine
JP7064665B2 (ja) 2016-03-07 2022-05-11 ファーザー フラナガンズ ボーイズ ホーム ドゥーイング ビジネス アズ ボーイズ タウン ナショナル リサーチ ホスピタル 非侵襲的分子対照
RU2760913C2 (ru) 2016-04-15 2021-12-01 Натера, Инк. Способы выявления рака легкого
ES2956757T3 (es) 2016-05-02 2023-12-27 Becton Dickinson Co Codificación con códigos de barras moleculares precisa
WO2017201081A1 (en) 2016-05-16 2017-11-23 Agilome, Inc. Graphene fet devices, systems, and methods of using the same for sequencing nucleic acids
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
JP7046007B2 (ja) 2016-05-26 2022-04-01 ベクトン・ディキンソン・アンド・カンパニー 分子標識カウントの調節方法
EP4043581A1 (en) 2016-05-27 2022-08-17 Sequenom, Inc. Method for generating a paralog assay system
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CA3030894A1 (en) 2016-07-27 2018-02-01 Sequenom, Inc. Methods for non-invasive assessment of genomic instability
US11200963B2 (en) 2016-07-27 2021-12-14 Sequenom, Inc. Genetic copy number alteration classifications
WO2018053362A1 (en) 2016-09-15 2018-03-22 ArcherDX, Inc. Methods of nucleic acid sample preparation
EP4353830A3 (en) 2016-09-15 2024-07-03 ArcherDX, LLC Methods of nucleic acid sample preparation for analysis of cell-free dna
ES2961743T3 (es) 2016-09-26 2024-03-13 Becton Dickinson Co Medición de la expresión de proteínas utilizando reactivos con secuencias de oligonucleótidos con código de barras
CA3037366A1 (en) * 2016-09-29 2018-04-05 Myriad Women's Health, Inc. Noninvasive prenatal screening using dynamic iterative depth optimization
CN118460676A (zh) 2016-09-30 2024-08-09 夸登特健康公司 用于无细胞核酸的多分辨率分析的方法
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
AU2017355460B2 (en) * 2016-11-02 2022-12-08 Archerdx, Llc Methods of nucleic acid sample preparation for immune repertoire sequencing
AU2017359048B2 (en) 2016-11-08 2022-07-21 Becton, Dickinson And Company Methods for expression profile classification
JP7228510B2 (ja) 2016-11-08 2023-02-24 ベクトン・ディキンソン・アンド・カンパニー 細胞標識分類の方法
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US10722880B2 (en) 2017-01-13 2020-07-28 Cellular Research, Inc. Hydrophilic coating of fluidic channels
KR20240135859A (ko) 2017-01-18 2024-09-12 일루미나, 인코포레이티드 이종 분자 길이를 가진 고유 분자 인덱스 세트의 생성 및 오류 수정 방법 및 시스템
CA3049682C (en) 2017-01-20 2023-06-27 Sequenom, Inc. Methods for non-invasive assessment of genetic alterations
CA3049455C (en) 2017-01-20 2023-06-13 Sequenom, Inc. Sequencing adapter manufacture and use
WO2018136882A1 (en) 2017-01-20 2018-07-26 Sequenom, Inc. Methods for non-invasive assessment of copy number alterations
IL319365A (en) 2017-01-24 2025-05-01 Sequenom Inc Methods and processes for assessing genetic variations
MY197535A (en) 2017-01-25 2023-06-21 Univ Hong Kong Chinese Diagnostic applications using nucleic acid fragments
CN110382708A (zh) 2017-02-01 2019-10-25 赛卢拉研究公司 使用阻断性寡核苷酸进行选择性扩增
US10894976B2 (en) 2017-02-21 2021-01-19 Natera, Inc. Compositions, methods, and kits for isolating nucleic acids
WO2018170511A1 (en) 2017-03-17 2018-09-20 Sequenom, Inc. Methods and processes for assessment of genetic mosaicism
EP3612644B1 (en) * 2017-04-18 2021-12-15 Agilent Technologies Belgium NV Use of off-target sequences for dna analysis
EP4345172A3 (en) 2017-06-05 2024-07-03 Becton, Dickinson and Company Sample indexing for single cells
DK3649258T3 (da) 2017-07-07 2022-08-01 Nipd Genetics Public Company Ltd Target-beriget multiplekset parallel analyse til vurdering af foster-dna-prøver
CA3068111A1 (en) 2017-07-07 2019-01-10 Nipd Genetics Public Company Limited Target-enriched multiplexed parallel analysis for assessment of risk for genetic conditions
US20220228219A1 (en) 2017-07-07 2022-07-21 Nipd Genetics Public Company Limited Target-enriched multiplexed parallel analysis for assessment of tumor biomarkers
PL3649257T3 (pl) 2017-07-07 2022-07-18 Nipd Genetics Public Company Limited Wzbogacanie docelowych regionów genomowych do multipleksowej analizy równoległej
EP4234723A3 (en) 2017-07-26 2023-09-20 The Chinese University Of Hong Kong Enhancement of cancer screening using cell-free viral nucleic acids
SI3658689T1 (sl) 2017-07-26 2021-08-31 Trisomytest, S.R.O. Metoda za neizvazivno predrojstno zaznavanje anevploidije plodovih kromosomov iz materine krvi na osnovi Bayesove mreže
IL272399B2 (en) 2017-08-04 2025-03-01 Billiontoone Inc Sequencing output determination and analysis with target-associated molecules in quantification associated with biological targets
CA3071855C (en) 2017-08-04 2021-09-14 Billiontoone, Inc. Target-associated molecules for characterization associated with biological targets
US11519024B2 (en) 2017-08-04 2022-12-06 Billiontoone, Inc. Homologous genomic regions for characterization associated with biological targets
WO2019025004A1 (en) 2017-08-04 2019-02-07 Trisomytest, S.R.O. METHOD FOR NON-INVASIVE PRENATAL DETECTION OF FETUS SEX CHROMOSOMAL ABNORMALITY AND FETUS SEX DETERMINATION FOR SINGLE PREGNANCY AND GEEMELLAR PREGNANCY
US11447818B2 (en) 2017-09-15 2022-09-20 Illumina, Inc. Universal short adapters with variable length non-random unique molecular identifiers
CN108733982B (zh) * 2017-09-26 2021-02-19 上海凡迪基因科技有限公司 孕妇nipt结果校正方法、装置及计算机可读存储介质、设备
CN111526793A (zh) 2017-10-27 2020-08-11 朱诺诊断学公司 用于超低体积液体活检的设备、系统和方法
WO2019118926A1 (en) 2017-12-14 2019-06-20 Tai Diagnostics, Inc. Assessing graft suitability for transplantation
US11946095B2 (en) 2017-12-19 2024-04-02 Becton, Dickinson And Company Particles associated with oligonucleotides
KR102031841B1 (ko) * 2017-12-22 2019-10-15 테라젠지놈케어 주식회사 모체 시료 중 태아 분획을 결정하는 방법
JP7164125B2 (ja) 2018-01-05 2022-11-01 ビリオントゥーワン,インコーポレイテッド シーケンシングベースのアッセイの妥当性を確保するための品質管理鋳型
CA3064622A1 (en) 2018-04-02 2019-10-10 Illumina, Inc. Compositions and methods for making controls for sequence-based genetic testing
JP7573443B2 (ja) 2018-04-14 2024-10-25 ナテラ, インコーポレイテッド 循環腫瘍dnaの個別化された検出を用いる癌検出およびモニタリングの方法
EP4234717A3 (en) 2018-05-03 2023-11-01 Becton, Dickinson and Company High throughput multiomics sample analysis
US11365409B2 (en) 2018-05-03 2022-06-21 Becton, Dickinson And Company Molecular barcoding on opposite transcript ends
IL271454B2 (en) * 2018-05-17 2025-04-01 Illumina Inc Rapid single-cell genetic sequencing with low Aggregation bias
KR102605749B1 (ko) 2018-05-25 2023-11-23 일루미나, 인코포레이티드 자간전증에 특이적인 순환 rna 시그니처
US12234509B2 (en) 2018-07-03 2025-02-25 Natera, Inc. Methods for detection of donor-derived cell-free DNA
US12071651B2 (en) 2018-08-06 2024-08-27 Billiontoone, Inc. Dilution tagging for quantification of biological targets
CN112805389B (zh) 2018-10-01 2024-08-06 贝克顿迪金森公司 确定5’转录物序列
JP7618548B2 (ja) 2018-11-08 2025-01-21 ベクトン・ディキンソン・アンド・カンパニー ランダムプライミングを使用した単一細胞の全トランスクリプトーム解析
CN112996926A (zh) * 2018-12-07 2021-06-18 深圳华大生命科学研究院 一种靶基因文库的构建方法、检测装置及其应用
CN113195717A (zh) 2018-12-13 2021-07-30 贝克顿迪金森公司 单细胞全转录组分析中的选择性延伸
US11371076B2 (en) 2019-01-16 2022-06-28 Becton, Dickinson And Company Polymerase chain reaction normalization through primer titration
ES2989967T3 (es) 2019-01-23 2024-11-28 Becton Dickinson Co Oligonucleótidos asociados con anticuerpos
ES3013495T3 (en) 2019-01-31 2025-04-14 Guardant Health Inc Method for isolating and sequencing cell-free dna
US12071617B2 (en) 2019-02-14 2024-08-27 Becton, Dickinson And Company Hybrid targeted and whole transcriptome amplification
WO2020214642A1 (en) 2019-04-19 2020-10-22 Becton, Dickinson And Company Methods of associating phenotypical data and single cell sequencing data
WO2020226528A1 (ru) * 2019-05-08 2020-11-12 Общество с ограниченной ответственностью "ГЕНОТЕК ИТ" Способ определения кариотипа плода беременной женщины
EP3980559A1 (en) 2019-06-06 2022-04-13 Natera, Inc. Methods for detecting immune cell dna and monitoring immune system
EP4004231A1 (en) 2019-07-22 2022-06-01 Becton, Dickinson and Company Single cell chromatin immunoprecipitation sequencing assay
WO2021037016A1 (en) * 2019-08-30 2021-03-04 The Chinese University Of Hong Kong Methods for detecting absence of heterozygosity by low-pass genome sequencing
JP2022553829A (ja) 2019-10-31 2022-12-26 セクエノム, インコーポレイテッド 多胎児妊娠およびパーソナライズされたリスク評価におけるモザイク現象比の適用
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
CA3131748A1 (en) 2019-11-22 2021-05-27 Sarah E. SHULTZABERGER Circulating rna signatures specific to preeclampsia
EP4090763B1 (en) 2020-01-13 2024-12-04 Becton Dickinson and Company Methods and compositions for quantitation of proteins and rna
US12188010B2 (en) 2020-01-29 2025-01-07 Becton, Dickinson And Company Barcoded wells for spatial mapping of single cells through sequencing
EP4111168A1 (en) 2020-02-25 2023-01-04 Becton Dickinson and Company Bi-specific probes to enable the use of single-cell samples as single color compensation control
WO2021217060A1 (en) 2020-04-24 2021-10-28 The Johns Hopkins University Quantitative ratiometric regression pcr
EP4150118A1 (en) 2020-05-14 2023-03-22 Becton Dickinson and Company Primers for immune repertoire profiling
CN111534604B (zh) * 2020-05-27 2024-01-23 广东华美众源生物科技有限公司 一种检测人常染色体dip-str遗传标记的荧光复合扩增试剂盒
EP4158055B1 (en) 2020-06-02 2024-03-27 Becton, Dickinson and Company Oligonucleotides and beads for 5 prime gene expression assay
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
LT4211260T (lt) 2020-09-11 2025-06-25 New England Biolabs, Inc. Imobilizuotų fermentų taikymas nanoporų bibliotekos konstravimui
US11739443B2 (en) 2020-11-20 2023-08-29 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
US20220170010A1 (en) 2020-12-02 2022-06-02 Illumina Software, Inc. System and method for detection of genetic alterations
KR20250019610A (ko) 2022-03-21 2025-02-10 빌리언투원, 인크. 치료 모니터링을 위한 메틸화된 세포 유리 dna의 분자 계수
WO2024186778A1 (en) 2023-03-03 2024-09-12 Laboratory Corporation Of America Holdings Methods and systems for positive cfdna screening on genetic variations using mosaicism ratio
WO2024238593A1 (en) 2023-05-15 2024-11-21 Laboratory Corporation Of America Holdings Machine-learning approaches to pan-cancer screening in whole genome sequencing
CN117965744B (zh) * 2023-12-12 2024-10-11 东莞博奥木华基因科技有限公司 一种基于多重pcr捕获技术检测胎儿样本倍性和母源细胞污染的试剂盒、引物和方法

Family Cites Families (105)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6270961B1 (en) 1987-04-01 2001-08-07 Hyseq, Inc. Methods and apparatus for DNA sequencing and DNA identification
US5856097A (en) * 1992-03-04 1999-01-05 The Regents Of The University Of California Comparative genomic hybridization (CGH)
WO1994003638A1 (en) * 1992-07-30 1994-02-17 Applied Biosystems, Inc. Method of detecting aneuploidy by amplified short tandem repeats
US5776737A (en) 1994-12-22 1998-07-07 Visible Genetics Inc. Method and composition for internal identification of samples
US6057103A (en) 1995-07-18 2000-05-02 Diversa Corporation Screening for novel bioactivities
EP0938381B1 (en) 1996-10-04 2012-12-26 Veri-Q Inc. Sample collection devices and methods using markers and the use of such markers as controls in sample validation, laboratory evaluation and/or accreditation
GB9704444D0 (en) 1997-03-04 1997-04-23 Isis Innovation Non-invasive prenatal diagnosis
US20010051341A1 (en) 1997-03-04 2001-12-13 Isis Innovation Limited Non-invasive prenatal diagnosis
ATE364718T1 (de) 1997-04-01 2007-07-15 Solexa Ltd Verfahren zur vervielfältigung von nukleinsäure
US5888740A (en) 1997-09-19 1999-03-30 Genaco Biomedical Products, Inc. Detection of aneuploidy and gene deletion by PCR-based gene- dose co-amplification of chromosome specific sequences with synthetic sequences with synthetic internal controls
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6440706B1 (en) * 1999-08-02 2002-08-27 Johns Hopkins University Digital amplification
WO2001090415A2 (en) 2000-05-20 2001-11-29 The Regents Of The University Of Michigan Method of producing a dna library using positional amplification
US7062418B2 (en) 2000-06-27 2006-06-13 Fluidigm Corporation Computer aided design method and system for developing a microfluidic system
EP1294883A2 (en) 2000-06-30 2003-03-26 Incyte Genomics, Inc. Human extracellular matrix (ecm)-related tumor marker
US20020142324A1 (en) * 2000-09-22 2002-10-03 Xun Wang Fungal target genes and methods to identify those genes
EP1345698A4 (en) 2000-11-16 2006-05-17 Fluidigm Corp MICROFLUID DEVICES FOR THE INTRODUCTION AND DISPOSAL OF FLUIDS FROM MICROFLUID SYSTEMS
US6691042B2 (en) 2001-07-02 2004-02-10 Rosetta Inpharmatics Llc Methods for generating differential profiles by combining data obtained in separate measurements
US7226732B2 (en) 2001-07-16 2007-06-05 Cepheid Methods, apparatus, and computer programs for verifying the integrity of a probe
US6927028B2 (en) 2001-08-31 2005-08-09 Chinese University Of Hong Kong Non-invasive methods for detecting non-host DNA in a host using epigenetic differences between the host and non-host DNA
US7893248B2 (en) 2002-02-20 2011-02-22 Sirna Therapeutics, Inc. RNA interference mediated inhibition of Myc and/or Myb gene expression using short interfering nucleic acid (siNA)
US6977162B2 (en) 2002-03-01 2005-12-20 Ravgen, Inc. Rapid analysis of variations in a genome
JP2006508632A (ja) 2002-03-01 2006-03-16 ラブジェン, インコーポレイテッド 遺伝子疾患の検出法
US20030194704A1 (en) * 2002-04-03 2003-10-16 Penn Sharron Gaynor Human genome-derived single exon nucleic acid probes useful for gene expression analysis two
US7727720B2 (en) 2002-05-08 2010-06-01 Ravgen, Inc. Methods for detection of genetic disorders
WO2004029221A2 (en) 2002-09-27 2004-04-08 The General Hospital Corporation Microfluidic device for cell separation and uses thereof
US10229244B2 (en) 2002-11-11 2019-03-12 Affymetrix, Inc. Methods for identifying DNA copy number changes using hidden markov model based estimations
US7700325B2 (en) * 2003-01-17 2010-04-20 Trustees Of Boston University Haplotype analysis
EP1583846B1 (en) 2003-01-17 2011-11-16 The Chinese University Of Hong Kong Circulating mrna as diagnostic markers for pregnancy-related disorders
US7244567B2 (en) 2003-01-29 2007-07-17 454 Life Sciences Corporation Double ended sequencing
WO2004078999A1 (en) 2003-03-05 2004-09-16 Genetic Technologies Limited Identification of fetal dna and fetal cell markers in maternal plasma or serum
EP1606417A2 (en) 2003-03-07 2005-12-21 Rubicon Genomics Inc. In vitro dna immortalization and whole genome amplification using libraries generated from randomly fragmented dna
EP1649040A4 (en) 2003-07-10 2007-07-18 Third Wave Tech Inc ANALYSIS FOR DIRECT MEASUREMENT OF A GENE ASSAY
EP1664077B1 (en) 2003-09-05 2016-04-13 Trustees of Boston University Method for non-invasive prenatal diagnosis
WO2005039389A2 (en) 2003-10-22 2005-05-06 454 Corporation Sequence-based karyotyping
US7252946B2 (en) * 2004-01-27 2007-08-07 Zoragen, Inc. Nucleic acid detection
US20100216151A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
US20060046258A1 (en) * 2004-02-27 2006-03-02 Lapidus Stanley N Applications of single molecule sequencing
US20100216153A1 (en) * 2004-02-27 2010-08-26 Helicos Biosciences Corporation Methods for detecting fetal nucleic acids and diagnosing fetal abnormalities
EP1765503A2 (en) 2004-03-03 2007-03-28 The General Hospital Corporation System for delivering a diluted solution
WO2005116257A2 (en) 2004-05-17 2005-12-08 The Ohio State University Research Foundation Unique short tandem repeats and methods of their use
DE102004036285A1 (de) 2004-07-27 2006-02-16 Advalytix Ag Verfahren zum Bestimmen der Häufigkeit von Sequenzen einer Probe
JP2007327743A (ja) 2004-09-07 2007-12-20 Univ Of Tokyo 遺伝子コピーの解析方法及び装置
TW200624106A (en) 2004-09-07 2006-07-16 Uni Charm Corp Warming article
US20060178835A1 (en) 2005-02-10 2006-08-10 Applera Corporation Normalization methods for genotyping analysis
ES2398233T3 (es) * 2005-03-18 2013-03-14 The Chinese University Of Hong Kong Un método para la detección de aneuploidías cromosómicas
WO2006131928A2 (en) 2005-06-08 2006-12-14 Compugen Ltd. Novel nucleotide and amino acid sequences, and assays and methods of use thereof for diagnosis
US20060286558A1 (en) * 2005-06-15 2006-12-21 Natalia Novoradovskaya Normalization of samples for amplification reactions
DE102005057988A1 (de) 2005-08-04 2007-02-08 Bosch Rexroth Ag Axialkolbenmaschine
WO2007092473A2 (en) 2006-02-02 2007-08-16 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive fetal genetic screening by digital analysis
US20100184043A1 (en) 2006-02-28 2010-07-22 University Of Louisville Research Foundation Detecting Genetic Abnormalities
SI2351858T1 (sl) * 2006-02-28 2015-06-30 University Of Louisville Research Foundation Med Center Three, Zaznavanje fetalnih kromosomskih nenormalnosti z uporabo tandema polimorfizmov posameznih nukleotidov
US20080064098A1 (en) * 2006-06-05 2008-03-13 Cryo-Cell International, Inc. Procurement, isolation and cryopreservation of maternal placental cells
EP2061801A4 (en) 2006-06-14 2009-11-11 Living Microsystems Inc DIAGNOSIS OF FETAL ANOMALIES BY COMPARATIVE GENOMIC HYBRIDIZATION ANALYSIS
EP2029779A4 (en) * 2006-06-14 2010-01-20 Living Microsystems Inc HIGHLY PARALLEL SNP GENOTYPING UTILIZATION FOR FETAL DIAGNOSIS
DK2029778T3 (en) 2006-06-14 2018-08-20 Verinata Health Inc DIAGNOSIS OF Fetal ABNORMITIES
EP2589668A1 (en) 2006-06-14 2013-05-08 Verinata Health, Inc Rare cell analysis using sample splitting and DNA tags
AU2007260676A1 (en) 2006-06-14 2007-12-21 Artemis Health, Inc. Rare cell analysis using sample splitting and DNA tags
US8137912B2 (en) 2006-06-14 2012-03-20 The General Hospital Corporation Methods for the diagnosis of fetal abnormalities
US20080050739A1 (en) 2006-06-14 2008-02-28 Roland Stoughton Diagnosis of fetal abnormalities using polymorphisms including short tandem repeats
US20080113358A1 (en) 2006-07-28 2008-05-15 Ravi Kapur Selection of cells using biomarkers
EP2049682A2 (en) * 2006-07-31 2009-04-22 Illumina Cambridge Limited Method of library preparation avoiding the formation of adaptor dimers
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
WO2008098142A2 (en) 2007-02-08 2008-08-14 Sequenom, Inc. Nucleic acid-based tests for rhd typing, gender determination and nucleic acid quantification
BRPI0814670B8 (pt) 2007-07-23 2021-07-27 Univ Hong Kong Chinese método para realizar diagnóstico pré-natal de uma aneuploidia cromossômica fetal
US12180549B2 (en) 2007-07-23 2024-12-31 The Chinese University Of Hong Kong Diagnosing fetal chromosomal aneuploidy using genomic sequencing
JP2010539991A (ja) 2007-10-04 2010-12-24 ハルシオン モレキュラー 電子顕微鏡を用いた核酸ポリマーの配列決定
SG190670A1 (en) * 2008-02-01 2013-06-28 Gen Hospital Corp Use of microvesicles in diagnosis, prognosis and treatment of medical diseases and conditions
WO2009114543A2 (en) 2008-03-11 2009-09-17 Sequenom, Inc. Nucleic acid-based tests for prenatal gender determination
US20090299645A1 (en) * 2008-03-19 2009-12-03 Brandon Colby Genetic analysis
AU2009228312B2 (en) * 2008-03-26 2015-05-21 Sequenom, Inc. Restriction endonuclease enhanced polymorphic sequence detection
US20090270601A1 (en) * 2008-04-21 2009-10-29 Steven Albert Benner Differential detection of single nucleotide polymorphisms
WO2010009398A1 (en) * 2008-07-18 2010-01-21 Xenomics, Inc. Methods for pcr-based detection of "ultra short" nucleic acid sequences
EP3378951B1 (en) 2008-09-20 2020-05-13 The Board of Trustees of the Leland Stanford Junior University Noninvasive diagnosis of aneuploidy by sequencing
WO2010115044A2 (en) 2009-04-02 2010-10-07 Fluidigm Corporation Selective tagging of short nucleic acid fragments and selective protection of target sequences from degradation
WO2011056094A2 (ru) * 2009-10-26 2011-05-12 Общество С Ограниченной Ответственностью "Апoгeй" Пожарный вентиль
CA2778926C (en) 2009-10-26 2018-03-27 Lifecodexx Ag Means and methods for non-invasive diagnosis of chromosomal aneuploidy
SI3241914T1 (sl) * 2009-11-05 2019-07-31 The Chinese University Of Hong Kong Fetalna genomska analiza materinskega biološkega vzorca
CN102597272A (zh) 2009-11-12 2012-07-18 艾索特里克斯遗传实验室有限责任公司 基因座的拷贝数分析
US10388403B2 (en) 2010-01-19 2019-08-20 Verinata Health, Inc. Analyzing copy number variation in the detection of cancer
US20120100548A1 (en) 2010-10-26 2012-04-26 Verinata Health, Inc. Method for determining copy number variations
CA2786564A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Identification of polymorphic sequences in mixtures of genomic dna by whole genome sequencing
WO2011090556A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Methods for determining fraction of fetal nucleic acid in maternal samples
US9323888B2 (en) 2010-01-19 2016-04-26 Verinata Health, Inc. Detecting and classifying copy number variation
US9260745B2 (en) 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
WO2011091063A1 (en) 2010-01-19 2011-07-28 Verinata Health, Inc. Partition defined detection methods
EP2848704B1 (en) * 2010-01-19 2018-08-29 Verinata Health, Inc Sequencing methods for prenatal diagnoses
US20120270739A1 (en) 2010-01-19 2012-10-25 Verinata Health, Inc. Method for sample analysis of aneuploidies in maternal samples
US20120237928A1 (en) 2010-10-26 2012-09-20 Verinata Health, Inc. Method for determining copy number variations
US20110312503A1 (en) 2010-01-23 2011-12-22 Artemis Health, Inc. Methods of fetal abnormality detection
PL2539450T3 (pl) 2010-02-25 2016-08-31 Advanced Liquid Logic Inc Sposób wytwarzania bibliotek kwasu nukleinowego
US20120238738A1 (en) * 2010-07-19 2012-09-20 New England Biolabs, Inc. Oligonucleotide Adapters: Compositions and Methods of Use
US20120034603A1 (en) 2010-08-06 2012-02-09 Tandem Diagnostics, Inc. Ligation-based detection of genetic variants
CN102409043B (zh) 2010-09-21 2013-12-04 深圳华大基因科技服务有限公司 高通量低成本Fosmid文库构建的方法及其所使用标签和标签接头
BR112013013421A2 (pt) 2010-11-30 2016-09-06 Univ Hong Kong Chinese método de análise de uma amostra biológica de um organismo, método de determinação de um progresso de aberrações cromossômicas em um organismo, meios de armazenamento de memória, e, sistema de computador
EP2649199A2 (en) 2010-12-07 2013-10-16 Stanford University Non-invasive determination of fetal inheritance of parental haplotypes at the genome-wide scale
CN102127818A (zh) 2010-12-15 2011-07-20 张康 利用孕妇外周血建立胎儿dna文库的方法
CN103384725A (zh) 2010-12-23 2013-11-06 塞昆纳姆股份有限公司 胎儿遗传变异的检测
US20120190021A1 (en) 2011-01-25 2012-07-26 Aria Diagnostics, Inc. Detection of genetic abnormalities
CN103608818B (zh) 2011-02-09 2017-12-08 纳特拉公司 非侵入性产前倍性识别装置
SMT201800558T1 (it) 2011-04-12 2018-11-09 Verinata Health Inc Risoluzione di frazioni genomiche usando conte di polimorfismi
GB2484764B (en) 2011-04-14 2012-09-05 Verinata Health Inc Normalizing chromosomes for the determination and verification of common and rare chromosomal aneuploidies
US9411937B2 (en) 2011-04-15 2016-08-09 Verinata Health, Inc. Detecting and classifying copy number variation
KR101974492B1 (ko) 2011-07-26 2019-05-02 베리나타 헬스, 인코포레이티드 샘플 중 상이한 이수성의 존재 또는 부재를 결정하는 방법
EP2875149B1 (en) 2012-07-20 2019-12-04 Verinata Health, Inc. Detecting and classifying copy number variation in a cancer genome

Also Published As

Publication number Publication date
PL3260555T3 (pl) 2019-05-31
US20170327884A1 (en) 2017-11-16
GB2485645B (en) 2012-11-21
GB201118396D0 (en) 2011-12-07
US11130995B2 (en) 2021-09-28
ES2870533T3 (es) 2021-10-27
GB2485644A (en) 2012-05-23
EP2376661A4 (en) 2012-03-21
US11884975B2 (en) 2024-01-30
DK2376661T3 (en) 2015-02-02
EP2513339A1 (en) 2012-10-24
EP3492601A1 (en) 2019-06-05
AU2010343279B2 (en) 2015-04-23
AU2010343277B2 (en) 2015-05-28
GB2485644B (en) 2012-11-21
US20220106639A1 (en) 2022-04-07
EP2883965A1 (en) 2015-06-17
US20220017958A1 (en) 2022-01-20
EP2376661A1 (en) 2011-10-19
EP2366031B1 (en) 2015-01-21
US20120165203A1 (en) 2012-06-28
HK1170270A1 (en) 2013-02-22
AU2010343277A1 (en) 2012-09-06
AU2010343278B2 (en) 2015-05-21
HK1170269A1 (en) 2013-02-22
US20110224087A1 (en) 2011-09-15
WO2011090559A1 (en) 2011-07-28
EP3878973B1 (en) 2024-07-10
EP2883965B8 (en) 2018-06-27
PL2366031T3 (pl) 2015-08-31
ES2560929T3 (es) 2016-02-23
AU2010343276A1 (en) 2012-09-06
ES2909841T3 (es) 2022-05-10
US20110201507A1 (en) 2011-08-18
DK3260555T3 (en) 2019-01-21
US20170327883A1 (en) 2017-11-16
EP2366031A4 (en) 2012-03-21
EP3382037B1 (en) 2021-02-17
EP2513339A4 (en) 2013-05-29
EP2366031A1 (en) 2011-09-21
EP2370599A4 (en) 2012-03-21
PL3492601T3 (pl) 2022-05-23
GB201108795D0 (en) 2011-07-06
EP3260555B1 (en) 2018-10-24
GB2479471A (en) 2011-10-12
CA2785718A1 (en) 2011-07-28
GB2479476B (en) 2012-06-13
EP3006573A1 (en) 2016-04-13
DK3382037T3 (da) 2021-05-25
GB201118398D0 (en) 2011-12-07
WO2011090558A1 (en) 2011-07-28
GB2479476A (en) 2011-10-12
HK1177232A1 (zh) 2013-08-16
EP2513339B1 (en) 2015-09-09
GB201107268D0 (en) 2011-06-15
EP2848704A1 (en) 2015-03-18
EP2370599A1 (en) 2011-10-05
EP2370599B1 (en) 2015-01-21
HK1160186A1 (en) 2012-08-10
GB201108794D0 (en) 2011-07-06
TR201807917T4 (tr) 2018-06-21
US11952623B2 (en) 2024-04-09
AU2010343279A1 (en) 2012-09-06
AU2010343276B2 (en) 2015-05-28
EP4074838A1 (en) 2022-10-19
EP4450645A2 (en) 2024-10-23
GB2485645A (en) 2012-05-23
GB2479080A (en) 2011-09-28
CA2785718C (en) 2017-04-04
CA2786544C (en) 2020-11-10
AU2010343278A1 (en) 2012-09-06
EP3492601B1 (en) 2022-01-05
HK1162197A1 (en) 2012-08-24
GB2479080B (en) 2012-01-18
EP3260555A1 (en) 2017-12-27
PL2376661T3 (pl) 2015-06-30
EP2848704B1 (en) 2018-08-29
US10941442B2 (en) 2021-03-09
EP2376661B1 (en) 2015-01-21
DK3492601T3 (da) 2022-04-04
US20210340613A1 (en) 2021-11-04
CA2786357C (en) 2018-08-21
US20170327881A1 (en) 2017-11-16
CA2786357A1 (en) 2011-07-28
CY1124494T1 (el) 2022-07-22
EP2883965B1 (en) 2018-05-09
EP4450645A3 (en) 2025-01-22
CA2786351C (en) 2022-01-25
HK1160185A1 (en) 2012-08-10
CA2786351A1 (en) 2011-07-28
US20120094849A1 (en) 2012-04-19
EP3382037A1 (en) 2018-10-03
US9657342B2 (en) 2017-05-23
ES2534986T3 (es) 2015-05-04
US20240150828A1 (en) 2024-05-09
GB2479471B (en) 2012-02-08
US20110245085A1 (en) 2011-10-06
DK2513339T3 (en) 2015-12-14
CA2786544A1 (en) 2011-07-28
EP3878973A1 (en) 2021-09-15
DK2366031T3 (en) 2015-02-23
ES2534758T3 (es) 2015-04-28
US11286520B2 (en) 2022-03-29
WO2011090557A1 (en) 2011-07-28
EP2848703A1 (en) 2015-03-18
EP3006573B1 (en) 2018-03-07

Similar Documents

Publication Publication Date Title
ES2704701T3 (es) Nuevo protocolo de preparación de bibliotecas de secuenciación
US20120270739A1 (en) Method for sample analysis of aneuploidies in maternal samples
AU2022283736A1 (en) Sequencing methods and compositions for prenatal diagnoses
HK40073897A (en) Novel protocol for preparing sequencing libraries
HK1248282A1 (en) Novel protocol for preparing sequencing libraries
HK1248282B (en) Novel protocol for preparing sequencing libraries
HK40008115B (en) Novel protocol for preparing sequencing libraries
HK40008115A (en) Novel protocol for preparing sequencing libraries