ES2670544T3 - Análisis de transcriptoma de plasma materno por secuenciación masiva en paralelo de ARN - Google Patents

Análisis de transcriptoma de plasma materno por secuenciación masiva en paralelo de ARN Download PDF

Info

Publication number
ES2670544T3
ES2670544T3 ES14757525.2T ES14757525T ES2670544T3 ES 2670544 T3 ES2670544 T3 ES 2670544T3 ES 14757525 T ES14757525 T ES 14757525T ES 2670544 T3 ES2670544 T3 ES 2670544T3
Authority
ES
Spain
Prior art keywords
allele
maternal
rna
locus
fetus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES14757525.2T
Other languages
English (en)
Inventor
Yuk Ming Dennis Lo
Rossa Wai Kwun Chiu
Kwan Chee Chan
Peiyong Jiang
Bo Yin Tsui
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Application granted granted Critical
Publication of ES2670544T3 publication Critical patent/ES2670544T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Abstract

Un método para diagnosticar un trastorno relacionado con el embarazo usando una muestra de una hembra embarazada con un feto, comprendiendo el método: recibir un gran número de lecturas de secuencias, en donde las lecturas de secuencias se obtienen de un análisis de moléculas de ARN obtenidos de la muestra, muestra que contiene una mezcla de moléculas de ARN maternos y fetales; identificar, mediante un sistema informático, las ubicaciones de las lecturas de secuencias en una secuencia de referencia; identificar uno o más locus informativos, cada uno de los cuales es homocigótico en una primera entidad para un primer alelo correspondiente y que es heterocigótico en una segunda entidad para el correspondiente primer alelo y un correspondiente segundo alelo, en donde la primera entidad es la hembra embarazada o el feto, y la segunda entidad es el otro de entre la hembra embarazada y el feto; filtrar uno o más locus informativos para identificar uno o más locus informativos filtrados: que se encuentran dentro de una región expresada de la secuencia de referencia, en la que se encuentran al menos un primer número predeterminado de lecturas de secuencias en el gran número de lecturas de secuencias que contienen el correspondiente primer alelo, y en el que se encuentra al menos un segundo número predeterminado de lecturas de secuencias en el gran número de lecturas de secuencias que contienen el segundo alelo correspondiente, para cada uno de los locus informativos filtrados: determinar un primer número de lecturas de secuencias situadas en el locus informativo filtrado y que contiene el primer alelo correspondiente, determinar un segundo número de lecturas de secuencias situadas en el locus informativo filtrado y que contiene el segundo alelo correspondiente, calcular una primera suma de los primeros números y la segunda suma de los segundos números; calcular una relación entre la primera suma y la segunda suma, y comparar la relación con un valor discriminatorio para determinar si el feto, la madre o el embarazo tiene un trastorno relacionado con el embarazo, determinándose el valor discriminatorio a partir de una o más muestras obtenidas de hembras embarazadas sin el trastorno relacionado con el embarazo.

Description

5
10
15
20
25
30
35
40
45
50
55
Análisis de transcriptoma de plasma materno por secuenciación masiva en paralelo de ARN
Se han descrito moléculas de ARN extracelular que son específicas del embarazo en el plasma materno1. Han proporcionado una herramienta de pruebas no invasivas para la evaluación fetal y seguimiento del embarazo utilizando simplemente una muestra de sangre periférica de la madre.
Hasta la fecha, se han desarrollado una serie de aplicaciones de diagnóstico prenatal prometedoras utilizando ARN de plasma materno2-8. Los investigadores han estado buscando activamente más marcadores de ARN con el fin de ampliar las aplicaciones en diferentes contextos de trastornos fetales y patologías del embarazo. Por ejemplo, el documento WO2004065629A1 proporciona métodos y equipos para diagnóstico, seguimiento o predicción de trastornos relacionados con el embarazo tales como preclamsia o embarazo en fase inicial, que comprende cuantificar los ARNm circulantes que codifican marcadores tales como hCG-beta.
En teoría, el método de identificación de ARN marcador más sencillo consiste en describir directamente moléculas de ARN extracelular en plasma materno. Este método sin embargo no ha sido fácil porque las tecnologías de selección de alto rendimiento convencionales, tales como el análisis de chips y análisis en serie de la expresión génica (SAGE), tienen una capacidad limitada para detectar los concentraciones normalmente bajas de ARN extracelular parcialmente degradado en el plasma materno9 . En cambio, la mayoría de las estrategias de detección del marcador de ARN descritas operan indirectamente comparando las características de la expresión de la placenta y las células sanguíneas maternas10. Sólo las transcripciones que se expresan mucho más altas en la placenta que en las células de sangre materna se estudian más en muestras de plasma materno por tecnologías de alta sensibilidad pero de bajo rendimiento, tal como la reacción en cadena de la polimerasa de la transcriptasa inversa en tiempo real (RT-PCR). Hasta ahora los marcadores de ARN del plasma identificados por este método indirecto son relativamente limitados. Esto es posiblemente debido a que la estrategia de extracción en base al tejido no ha tenido totalmente en cuenta todos los factores biológicos que influyen en las concentraciones de ARN de la placenta en el plasma materno. Además, las transcripciones que se expresan y liberan por tejidos no placentarios en respuesta al embarazo no pudieron identificarse por este método. Una metodología sensible y de alto rendimiento que permite la caracterización directa del transcriptoma del plasma materno sería por lo tanto muy deseable.
Asimismo, la caracterización directa del ARN del plasma puede ser útil en otros escenarios en los que hay una mezcla de moléculas de ARN de dos individuos, tales como para trasplante de órganos. La circulación de las receptoras de trasplante contiene moléculas de ácido nucleico tanto de la donante como de la receptora. Un cambio en las características relativas de las moléculas de ARN aportadas por la donante o la receptora puede revelar patologías en el órgano trasplantado o la receptora, tales como el rechazo del trasplante.
El documento US2010311046A1 describe métodos para el diagnóstico prenatal de trisomía 21, que comprende analizar SNP informativos o transcritos de ARN que proceden de locus en el cromosoma 21. La trisomía 21 fetal se determina a continuación comparando las relaciones entre los alelos de un sitio polimórfico en transcritos de ARN específicos de locus y de tejidos desde un feto aneuploide a un feto euploide. El estado aneuploide viene determinado por las relaciones anormales entre los SNP informativos en los transcritos de ARN. Se seleccionan SNP que se encuentran en el ARN con expresión de tejido placentario.
Según la presente invención, se proporciona un método de diagnóstico de un trastorno relacionado con el embarazo utilizando una muestra de una hembra embarazada con un feto, comprendiendo el método: recibir un gran número de lecturas de secuencias, en donde las lecturas de secuencias se obtienen a partir de un análisis de moléculas de ARN obtenidas de la muestra, muestra que contiene una mezcla de moléculas de ARN de la madre y del feto; identificar, mediante un sistema informático, ubicaciones de las lecturas de secuencias en una secuencia de referencia; identificar uno o más locus informativos, cada uno de los cuales es homocigótico en una primera entidad de un primer alelo correspondiente y un segundo alelo correspondiente, en donde la primera entidad es la mujer embarazada o el feto, y la segunda entidad es distinta de la mujer embarazada y del feto; filtrar uno o más locus informativos para identificar uno o más locus informativos filtrados: que están situados dentro de una región expresada de la secuencia de referencia, en la que está situado al menos un primer número determinado de lecturas de secuencias en el gran número de lecturas de secuencias que contienen el segundo alelo correspondiente, para cada uno de los locus informativos filtrados: determinar un primer número de lecturas de secuencias situadas en el locus informativo filtrado y que contienen el primer alelo correspondiente, determinar un segundo número de lecturas de secuencias situadas en el locus informativo filtrado y que contienen el segundo alelo correspondiente, calcular una primera suma de los primeros números y la segunda suma de los segundos números; calcular la relación de la primera suma y la segunda suma, y comparar la relación con un criterio de valoración para determinar si el feto, la madre o el embarazo tiene un trastorno relacionado con el embarazo, determinándose el valor discriminatorio a partir de una o más muestras obtenidas de las mujeres embarazadas sin el trastorno relacionado con el embarazo.
Los presentes métodos no están limitados a diagnósticos prenatales y pueden aplicarse a cualquier muestra biológica que contenga una mezcla de moléculas de ARN procedentes de dos individuos.
Por ejemplo, puede utilizarse una muestra de plasma sanguíneo obtenido de una receptora de trasplante de
5
10
15
20
25
30
35
40
45
50
órganos. Los transcritos expresados en el órgano trasplantado reflejan genotipo de la donante y se producen a niveles detectables en la sangre de la receptora. Mediante la lectura de estas transcripciones, pueden ser identificados locus informativos dentro de los genes expresados tanto por la donante como por la receptora, y se puede medir los niveles de expresión relativos de los alelos de cada individuo. Niveles de expresión anormales del alelo aportado únicamente por la donante o la receptora se pueden utilizar para diagnosticar trastornos relacionados con el trasplante.
Las muestras biológicas que pueden utilizarse en los presentes métodos incluyen muestras de sangre, plasma, suero, orina, saliva y de tejido.
Por ejemplo, se han detectado ácidos nucleicos fetales en la orina de mujeres embarazadas. Se ha demostrado que la orina de los receptores de trasplante renal contiene ácidos nucleicos sin células y células del órgano trasplantado. Se ha observado microhibridismo en muchas enfermedades. Microhibridismo se refiere a la presencia de una fuente de células o ácidos nucleicos de otra persona en el cuerpo, incluidos órganos y tejidos de un individuo en particular. Se ha observado microhibridismo en biopsias de la tiroides, hígado, bazo, piel, médula ósea y otros tejidos. El microhibridismo puede producirse como resultado de embarazos anteriores o transfusiones de sangre.
La Fig. 1 muestra una relación positiva entre la relación alélica B/A y los niveles relativos de expresión de los respectivos genes en la placenta y células sanguíneas maternas.
La Fig. 2 muestra una relación entre el nivel de la expresión génica total y los niveles relativos de expresión de los genes en la placenta y células sanguíneas maternas.
La Fig. 3 es un diagrama de flujo para métodos de diagnóstico de un trastorno relacionado con el embarazo,
Las Fig. 4 y 5 muestran resúmenes de resultados de la alineación de lecturas de secuencias de ARN.
La Fig. 6 muestra los datos de la secuenciación del ARN de plasma sanguíneo de dos individuos. La Fig. 6A muestra la distribución de GC% de lecturas secuenciadas de las bibliotecas de secuencias de ARN de M9356P (con pretratamiento Ribo-Zero Gold) y M9415P (sin pretratamiento Ribo-Zero Gold). La Fig. 6B muestra la correlación de las características de la expresión génica entre M9356P y M9415P.
La Fig. 7 muestra las relaciones alélicas ARN-SNP y las concentraciones plasmáticas totales de diferentes transcritos de ARN en el plasma materno representadas frente a los niveles de expresión del tejido relativos (células sanguíneas/placenta).
La Fig. 8 muestra relaciones alélicas ARN-SNP y los niveles plasmáticos totales de diferentes genes que contienen los SNP informativos representados frente al nivel de expresión relativo del tejido (células sanguíneas/placenta).
La Fig. 9 muestra relaciones alélicas ARN-SNP para alelos de SNP feto-específicos y los niveles de expresión de transcritos de ARN que contienen estos alelos en el plasma materno.
La Fig. 10 muestra relaciones alélicas ARN-SNP para alelos de SNP específicos de la madre y los niveles de expresión de transcritos de ARN que contienen estos alelos en el plasma materno.
La Fig. 11 muestra datos para alelos de SNP específicos de la madre en pacientes con preeclampsia y de referencia. La Fig. 11A muestra relaciones alélicas ARN-SNP del caso 5641 (preeclamsia de aparición tardía en el tercer trimestre) y del caso 7171 (referencia) para SNP informativos que comprenden alelos de SNP específicos de
la madre. La fig. 11B muestra el número de veces de diferencias de relaciones alélicas ARN-SNP y de los niveles
plasmáticos del caso 5641 respecto a las de 7171 (referencia) para SNP informativos que comprenden alelos de SNP específicos de la madre.
La Fig. 12 muestra datos para alelos de SNP específicos de la madre en pacientes preeclámpsicas y de referencia. La Fig. 12A muestra relaciones alélicas ARN-SNP del caso 5641 (preeclampsia de aparición tardía en el tercer trimestre) y del caso 9356 (referencia) para SNP informativos que comprenden alelos de SNP específicos de la madre. La Fig. 12B muestra el número veces de diferencias de relaciones alélicas ARN-SNP y de niveles plasmáticos de caso 5641 respecto a las de 9356 para SNP informativos que comprenden alelos de SNP específicos de la madre.
La Fig. 13 muestra los datos en la Fig. 11 en forma de tabla.
La Fig. 14 muestra los datos en la Fig. 12 en forma de tabla.
La Fig. 15 es un diagrama de flujo para procedimientos de determinación, en una muestra de una hembra embarazada con un feto, una parte de ARN que es de origen fetal.
La Fig. 16 muestra los resultados del análisis de SNP informativo del transcriptoma de plasma materno.
La Fig. 17 muestra contribuciones fetales y maternas relativas sin filtrar la expresión específica de alelo en las
5
10
15
20
25
30
35
40
45
50
muestras de plasma maternos de final del embarazo.
La Fig. 18 muestra contribuciones fetales y maternas en el transcriptoma de plasma materno. La Fig. 18A muestra proporciones de transcritos fetal y materno en el plasma materno de embarazos en las fases inicial y final. La Fig. 18B muestra los recuentos de alelos y proporciones fetal-alelo antes y después del parto.
La Fig. 19 compara contribuciones fetal y materna fraccionadas en un ARN-SNP para los casos de embarazo pre- eclámpsico y de referencia,
La Fig. 20 es un diagrama de flujo para los métodos de designación de un locus genómico como marcador materno o fetal.
La Fig. 21 es una lista de genes relacionados con el embarazo.
La Fig. 22 muestra niveles de expresión más bajos de genes relacionados con el embarazo en hembras después del parto en comparación con antes del parto.
La Fig. 23 muestra la agrupación jerárquica de las muestras de plasma que utilizan los 131 genes relacionados con el embarazo.
La Fig. 24 muestra los niveles de expresión de 131 genes relacionados con el embarazo en la placenta, células de sangre materna y el plasma materno. La Fig. 24A es un mapa de calor de la expresión génica (log2 (nivel de transcripción)) de la placenta y de las células sanguíneas maternas, así como del plasma materno antes y después del parto de los dos casos de embarazo en la fase final. Los 131 genes relacionados con el embarazo se expresaron preferentemente en la placenta. La fig. 24B demuestra que los niveles de expresión de los 131 genes en la placenta y en el plasma se correlacionaron positivamente (P <0,05, correlación de Spearman).
La Fig. 25 compara contribuciones fetales y maternas con ARN en el plasma para genes identificados con los métodos basados en el plasma y en tejidos.
La Fig. 26 lista 98 ARN relacionados con la preeclampsia en el plasma materno identificados por ARN-Seq. Se muestran los niveles de expresión en el plasma recogido de las mujeres embarazadas sin complicaciones y mujeres que han desarrollado preeclampsia.
La Fig. 27 muestra recuentos de lectura de secuenciación de ARN en puntos del polimorfismo de un solo nucleótido (SNP) en ARN con PAPPA para el caso de 9415. El alelo A es el alelo compartido y el alelo G es el alelo específico del feto.
La Fig. 28 muestra recuentos de lectura de la secuenciación de ARN en puntos del polimorfismo de un solo nucleótido (SNP) en ARN con H19 para el caso 9415.
La Fig. 29 muestra la detección de estado de metilación H19 materna por digestión de la enzima de restricción sensible a la metilación.
La Fig. 30 muestra un diagrama de bloques de un ejemplo de sistema de ordenador 3000 utilizable con el sistema y métodos según realizaciones de la presente invención.
I. Introducción
La presencia de ARN fetal sin células en el plasma materno se describió hace más de una década11. Después de este hallazgo, ya se han llevado a cabo muchos estudios para detectar ARN circulante de origen fetal y placentario en el plasma materno1,10,12. Curiosamente, se encontró que los niveles de expresión de los transcritos específicos de la placenta en el plasma se correlacionan positivamente con los de tejidos de la placenta10, lo que subraya la utilidad clínica de análisis de ARN del plasma como una herramienta no invasiva para controlar la salud y desarrollo de la placenta o el feto. De hecho, el examen de ARN materno circulante ha encontrado aplicaciones clínicas para los trastornos relacionados con el embarazo o la placenta como la preeclampsia2,13'15, retraso del crecimiento intrauterino4 y parto prematuro8 , así como para pruebas no invasivas de las aneuploidías cromosómicas fetales5,7,16. Dichos desarrollos destacan las posibles utilidades de biomarcadores de ARN para la evaluación molecular de trastornos prenatales.
A pesar de la prometedora perspectiva de análisis de ARN del plasma en las pruebas prenatales, sigue habiendo un número limitado de transcritos relacionadas con el embarazo o la placenta bien validados en el plasma materno hasta la fecha. En este sentido, el examen de los biomarcadores de ARN en el plasma había sido llevado a cabo
utilizando la transcriptasa inversa (RT)-PCR........... , un método sensible que normalmente se dirigiría a un
número relativamente pequeño de especies de ARN por análisis. A destacar que estos estudios se centraron principalmente en genes con niveles relativamente altos de expresión en la placenta, en comparación con las células de sangre materna, sobre la premisa de que los genes relacionados con el embarazo proceden en gran parte de la placenta. Dichos métodos han identificado dianas de ARN relacionadas con el embarazo que se expresan mucho en la placenta, pero podría haber perdido otras dianas importantes. Además, dadas las bajas concentraciones y la
5
10
15
20
25
30
35
40
45
escasa integridad de ARN del plasma9,15, métodos de alto rendimiento convencionales, tales como el análisis en serie de la expresión génica y el análisis de chips no serían robusto para el examen directo del transcriptoma del plasma.
Las limitaciones técnicas mencionadas de análisis de ARN del plasma posiblemente podrían resolverse empleando secuenciación masiva en paralelo (SMP) para el análisis de aRn, es decir, secuenciación de ARN (RNA-seq)17,18 Dada la sensibilidad mejorada y amplio intervalo dinámico, se ha empleado RNA-seq para examinar la expresión de genes en muchos tejidos humanos, incluida la placenta19. La superioridad de la SMP se ha demostrado además por su viabilidad en la caracterización directa de ARNmi en el plasma en individuos sanos20 y en mujeres embarazadas21,22. Sin embargo, el espectro completo de transcriptoma de plasma sigue siendo difícil de alcanzar, lo que podría deberse a la menor estabilidad de las especies de aRn largos en comparación con los ARNmi cortos en el plasma23.
En este estudio, se ha demostrado que los transcritos fetales y maternos pueden ser detectados en el plasma materno y que sus contribuciones relativas pueden estimarse usando RNA-seq, mediante el examen de polimorfismos de un solo nucleótido (SNP) específicos fetal y materno. Además, los patrones de expresión específicos de alelos de la placenta pueden controlarse en el plasma materno. También se ha demostrado que los transcritos relacionados con el embarazo podrían ser identificados por examen directo del plasma materno antes y después del parto.
II. Método de diagnóstico de un trastorno relacionado con el embarazo utilizando relaciones alélicas de SNP
El análisis de las características de la expresión génica es útil para la detección del estado de enfermedad de un individuo. Las realizaciones de la presente invención incluyen métodos para analizar las características de la expresión de un individuo mediante el análisis de una mezcla de moléculas de ARN de dos individuos diferentes. Los métodos hacen uso de las abundancias relativas de alelos que son específicos de un individuo y los alelos compartidos entre los dos individuos. En base a las abundancias relativas de los alelos compartidos e individuales específicos, pueden determinarse las características de expresión génica de los dos individuos. Una posible aplicación de los presentes métodos es el análisis de las características de la expresión génica de un feto mediante el análisis del ARN en una muestra de plasma materno que contiene ARN tanto del feto como de la mujer embarazada.
En una mezcla que contiene ARN de dos individuos, las características de la expresión de cada individuo no pueden determinarse en base al análisis de la cantidad total de los diferentes transcritos de ARN en la mezcla porque es difícil determinar las contribuciones relativas de cada individuo en todo el ARN. La abundancia relativa de los diferentes transcritos de ARN puede ser útil para el seguimiento del bienestar de un individuo o para detectar una enfermedad.
En este método, el genotipo de los dos individuos puede determinarse en primer lugar ya sea por genotipado directo de los individuos o por análisis familiar. Por ejemplo, si los padres tienen el genotipo de AA y TT, entonces el genotipo del feto sería AT.
El siguiente ejemplo hipotético ilustra el principio de este método. Para cada uno de los genes de interés, hay un SNP en la región de codificación de modo que el polimorfismo se puede observar en las transcripciones de ARN de los diferentes genes. Suponer que los genotipos del feto y de la mujer embarazada son AB y aA, respectivamente. Por lo tanto, el alelo B sería específico para el feto y el alelo A sería compartido entre el feto y la madre. Los niveles relativos de expresión de los diferentes genes en la placenta y las células de sangre materna son como se muestran en la Tabla 1.
En este ejemplo, se supone que la placenta y las células sanguíneas maternas contribuirían con una proporción relativa igual del 2% de cada uno de sus transcritos de ARN en el plasma materno. En otras palabras, si el nivel de expresión en la placenta de un gen es 10.000, 200 transcripciones de ARN de ese gen contribuirían en el plasma materno. Como se muestra en la Fig. 1, la relación alélica B/A muestra una buena relación positiva con los niveles relativos de expresión de los respectivos genes en la placenta y en las células sanguíneas maternas. Por el contrario, el nivel de expresión génica total se ve afectado por la fluctuación de la expresión de las células de la sangre materna y por lo tanto, se correlacionan peor con la expresión de la placenta (Fig. 2).
Tabla 1
Gen
Genotipo materno Genotipo del feto Nivel de expresión relativo Expresión relativa (placenta /células sanguíneas maternas Plasma materno
en células sanguíneas maternas
en la placenta Abundancia relativa de ARN materno a fetal Cono, de ARN total Cono, de ARN Relación B/A
con el alelo A
con el alelo B
1
AA AB 8.000 20.000 2,5 1:1 560 360 200 0,56
2
AA AB 6.000 10.000 1,67 1:1 320 220 100 0,45
3
AA AB 10.000 5.000 0,5 1:1 300 250 50 0,2
4
AA AB 14.000 1.000 0,071 1:1 300 290 10 0,03
5
10
15
20
25
30
35
40
45
50
55
60
Otra ventaja de utilizar el análisis de la relación alélica es que el nivel de expresión de un gen concreto en la placenta está normalizado al nivel de expresión de las células de la sangre materna. Ya que el nivel de expresión puede variar en gran medida a través de diferentes genes y diferentes muestras, esta normalización haría más robusta la comparación con diferentes genes y evitaría la necesidad de comparar con un gen de referencia, por ejemplo, un gen constitutivo. En otras palabras, en el análisis de la expresión génica convencional, el nivel de expresión de un gen en una muestra se mide con referencia a un gen constitutivo o como una cantidad para todo el ARN de la muestra. Para identificar la expresión génica aberrante, convencionalmente, se podría comparar entonces esos valores relativos de la muestra de ensayo con las muestras de referencia.
En la presente memoria se propone un nuevo método en el que se utilizan las cantidades relativas aportadas por el feto normalizadas a la contribución de la madre del mismo gen como medio para determinar las características de la expresión génica. En los estados patológicos, por ejemplo preeclampsia, parto prematuro, enfermedades maternas tales como lupus eritematoso diseminado, mediante los cuales se altera la expresión del gen en la placenta o los órganos maternos, la relación fetal a materna de ese gen se alteraría en comparación con embarazos sin dichas enfermedades. Este método puede ponerse en práctica también utilizando el alelo SNP específico del feto en relación con el alelo compartido entre los transcritos de ARN en el plasma materno.
El método también se puede poner en práctica utilizando el alelo del SNP específico para la madre con respecto al alelo compartido entre los transcritos de ARN en el plasma materno. Pueden identificarse enfermedades cuando uno o más de dichas relaciones alélicas para uno o más transcritos de genes de ARN están alterados en comparación con lo que cabe esperar para un estado no patológico. El patrón de dichas relaciones alélicas a través de un locus del gen o múltiples locus de genes podría utilizarse para identificar enfermedades. Los estados no patológicos podrían representarse mediante relaciones alélicas en embarazos normales, en muestras obtenidas antes o después de la prueba cuando el embarazo ya no está afectado por el estado patológico o a partir de datos existentes previamente obtenidos a partir de embarazos normales, es decir, un intervalo de referencia obtenido previamente.
Los trastornos relacionados con el embarazo que pueden diagnosticarse empleando los presentes métodos incluyen cualquiera de los trastornos caracterizados por niveles de expresión relativos anormales de genes en tejido materno y fetal. Estos trastornos incluyen, pero no se limitan a, preeclampsia, restricción del crecimiento intrauterino, placentación invasiva, nacimiento prematuro, la enfermedad hemolítica del recién nacido, insuficiencia placentaria, hidropesía fetal, malformación fetal, síndrome de HELLP, lupus eritematoso diseminado y otras enfermedades inmunológicas de la madre. Los métodos distinguen entre moléculas de ARN aportadas por la madre y el feto en una muestra que contiene una mezcla de dichas moléculas. Por lo tanto, los métodos pueden identificar cambios en la contribución de un individuo (es decir, la madre o el feto) a la mezcla en un locus determinado o para un gen determinado, incluso si la contribución del otro individuo no cambia o se mueve en la dirección opuesta. Dichos cambios no se pueden detectar fácilmente cuando se mide el nivel de expresión global del gen sin tener en cuenta el tejido o el individuo de origen. Los trastornos relacionados con el embarazo, como se expone en la presente memoria, no se caracterizan por anomalías cromosómicas en el feto, por ejemplo aneuploidía.
Los presentes métodos también se pueden realizar sin información previa de genotipado de la placenta. Por ejemplo, el genotipo de la mujer embarazada puede determinarse por genotipo directo de sus células sanguíneas. A continuación, los transcritos de ARN de las muestras de plasma pueden analizarse, por ejemplo, pero no limitarse a la secuenciación masiva en paralelo. Pueden identificarse transcritos de ARN que muestran dos alelos diferentes. En este conjunto de transcritos, si la madre es homocigótica, indicaría que el feto es heterocigótico para el alelo específico del feto y el alelo materno. En este escenario, el análisis de la relación alélica de ARN se puede realizar sin información previa del genotipo del feto (o la placenta). Además, los casos en que la madre es heterocigótica pero el feto es homocigótico pueden ser identificados por una desviación de una relación 1:1. En la patente de EE.UU. n° 8.467.976 se describen más detalles de dichas técnicas.
A. Método de diagnóstico
Un método 300 para el diagnóstico de un trastorno relacionado con el embarazo según algunas realizaciones se muestra en la Fig. 3. El método utiliza una muestra de una hembra embarazada con un feto. La muestra puede ser de plasma sanguíneo materno y contiene una mezcla de moléculas de ARN materno y fetal. La muestra puede obtenerse según se desee, de una hembra en cualquier fase del embarazo. Por ejemplo, mujeres embarazadas en el primer, segundo y tercer trimestre con embarazos de un solo feto pueden servir como pacientes. Las mujeres embarazadas del primer y segundo trimestres se pueden clasificar como "casos en la fase inicial del embarazo " y las mujeres embarazadas del tercer trimestre, se pueden clasificar como "casos en la fase final del embarazo". En algunas realizaciones, las muestras también se pueden recoger después del parto del feto, o de la misma persona antes y después del parto, y las muestras de las hembras no embarazadas pueden servir como referencias. Las muestras se pueden obtener en cualquier momento después del parto (por ejemplo, a las 24 horas).
La muestra puede obtenerse de la sangre periférica. Una muestra de sangre materna puede tratarse como se desee, por ejemplo, por centrifugación para separar las células sanguíneas del plasma. Pueden añadirse estabilizadores a la muestra de sangre o partes de la misma, y la muestra se puede almacenar antes de su uso. En algunas realizaciones, también se obtienen muestras de tejido fetal, por ejemplo vellosidades coriónicas, líquido
5
10
15
20
25
30
35
40
45
50
55
amniótico, o tejido placentario. El tejido fetal se puede utilizar para determinar genotipos fetales, como se expone más adelante. El tejido fetal se puede obtener antes o después del parto.
Una vez se obtiene una muestra, el ARN o el ADN puede entonces extraerse de las células de la sangre materna y el plasma, así como de cualquier tejido fetal tal como una muestra de la placenta. Pueden pretratarse muestras de ARN placentario y de células sanguíneas, tal como con el Ribo-Zero Gold Kit (Epicenter), para eliminar el ARN ribosómico (ARNr) antes de la preparación de la biblioteca de secuenciación.
En la etapa 301 del método, se recibe un gran número de lecturas. Las lecturas se obtienen de un análisis de moléculas de ARN obtenidas de la muestra. En diversas realizaciones, las lecturas pueden obtenerse por secuenciación, PCR digital, RT-PCR y espectrometría de masas. Aunque la exposición se centra en la secuenciación, los aspectos de la descripción son también aplicables a otras técnicas de obtención de las lecturas. Por ejemplo, la PCR digital (incluidas pCr microfluida y en gotas) puede proporcionar conocimiento de diferentes alelos en un locus determinado utilizando sondas (incluidos los cebadores) dirigidos a cada alelo. Las sondas pueden llevar marcadores para que sean distinguibles entre sí, por ejemplo presentando diferentes colores. En el mismo experimento o en un experimento diferente (por ejemplo, en un portaobjetos o chip separado), sondas con diferentes marcadores pueden dirigirse a diferentes locus. La detección de los marcadores refleja la presencia y/o cantidad de moléculas de ARN o de ADNc que están amplificándose y corresponde con las lecturas de las moléculas de ARN o ADNc, donde tales lecturas proporcionan información sobre una secuencia de las moléculas de ARN o ADNc en los locus correspondientes a las sondas. La descripción en relación con las "lecturas de secuencias" se aplica igualmente a lecturas obtenidas mediante cualquier técnica adecuada, incluidas las técnicas sin secuenciación.
La secuenciación se puede realizar como se desee, utilizando cualquier tecnología disponible. Ejemplos de tecnologías y métodos de secuenciación de ácidos nucleicos incluyen la secuenciación masiva en paralelo, la secuenciación de la siguiente generación, la secuenciación de todo el genoma, la secuenciación del exoma, secuenciación con o sin enriquecimiento de objetivo, la secuenciación por síntesis (p. ej., secuenciación por amplificación, amplificación clonal, amplificación puente, secuenciación con terminadores reversibles), la secuenciación por ligadura, la secuenciación por hibridación (p. ej., la secuenciación de chips), secuenciación de una sola molécula, de secuenciación en tiempo real, la secuenciación por nanoporos, pirosecuenciación, la secuenciación por semiconductores, la secuenciación por espectroscopia de masas, la secuenciación por perdigonada y la secuenciación de Sanger. En algunas realizaciones, la secuenciación se realiza utilizando técnicas masivas en paralelo sobre una biblioteca de ADNc preparada a partir de ARN en la muestra. Las bibliotecas de ADNc se pueden sintetizar como se desee, por ejemplo usando el mRNA-Seq Sample Preparation Kit (Illumina) siguiendo las instrucciones del fabricante o con ligeras modificaciones. En algunas realizaciones, la ADN de Klenow polimerasa diluida 5 veces se utiliza para la etapa de reparación en el extremo de ADNc del plasma. El equipo de purificación por PCR QIAquick y el equipo QIAquick MinElute (Qiagen) se pueden utilizar para purificar productos reparados en el extremo y adenilados, respectivamente. En algunas realizaciones, se utilizan adaptadores emparejado en el extremo diluidos 10 veces para la muestra de ADNc del plasma, o se llevan a cabo dos rondas de purificación para los productos ligados al adaptador utilizando las perlas AMPure XP (Ageticourt). Una biblioteca de ADNc puede secuenciarse para 75 pares de bases en un formato de extremos emparejados en un instrumento HiSeq 2000 (Illumina), o usar otros formatos o instrumentos.
En la etapa 302, se determinan ubicaciones de las lecturas en una secuencia de referencia. Por técnicas basadas en PCR, puede determinarse una ubicación, por ejemplo, haciendo coincidir el color de un marcador detectado en una sonda o cebador para la secuencia para la que la sonda o cebador es específico. Por técnicas de secuenciación, la ubicación puede determinarse alineando la secuencia de lectura con la secuencia de referencia. La alineación de secuencias puede realizarse mediante un sistema informático. Puede utilizarse cualquier tubería bioinformática para el preprocesamiento de datos en bruto (tal como la eliminación de lecturas muy duplicadas y lecturas de baja calidad), alineación de datos y/o normalización de datos. Los niveles de transcripción de ARN en las células de sangre materna, tejidos de la placenta y plasma materno pueden calcularse como fragmentos por kilobase por millonésima de lecturas exónicas (FPKM). Para la determinación de relaciones alélicas, el preprocesamiento de datos y la alineación se pueden realizar, pero no se requiere normalización de datos. Para la alineación puede utilizarse cualquier secuencia de referencia (por ejemplo, el genoma humano de referencia hg 19).
En un ejemplo de realización de las etapas 301 y 302, después de la eliminación de lecturas duplicadas y lecturas de ARNr, se obtuvieron un promedio de 3 millones de lecturas analizables para cada muestra de plasma de mujer no embarazada; un promedio de 12 millones de lecturas analizables se obtuvieron para cada muestra de plasma de mujeres embarazadas. Para RNA-seq en tejidos, se obtuvieron un promedio de 173 millones y 41 millones de lecturas analizables por muestra para la placenta y las células sanguíneas, respectivamente. Las estadísticas de alineación de RNA-seq se resumen en las Fig. 4 y 5. El contenido por GC de lecturas secuenciadas también se examinó en todas las muestras (Fig. 6A y tabla 2).
5
10
15
20
25
30
35
40
45
Tabla 2. Proporción de lecturas secuenciadas ricas en GC en bibliotecas de RNA-seq
Tipo de muestra
Muestra Tratamiento Lecturas ricas en GC (% de lecturas en bruto)
Plasma
M9356P Disminución de ARNr 49,28%
M9415P
Ninguno 0,00%
Placenta
N9356 Disminución de ARNr 0,15%
Células sanguíneas
M9356W Disminución de ARNr 0,30%
a. Las lecturas en bruto se alinearon frente a la secuencia rica en GC montada de nuevo por BLAST (NCBI).
En la etapa 303, se identifican uno o locus más informativos. Esta etapa puede determinar o hacer deducciones acerca de los genotipos de la hembra y el feto en el locus dentro del genoma, y comparar estos genotipos. Un locus se considera informativo si es homocigótico en una primera entidad para un primer alelo correspondiente (p. ej., AA), y es heterocigótico en una segunda entidad para el primer alelo correspondiente y un segundo alelo correspondiente (p. ej., AB). La primera entidad puede ser la hembra embarazada o el feto, y la segunda entidad es el otro de entre el la hembra embarazada y el feto. En otras palabras, un individuo (ya sea la madre o el feto) es homocigótico, y el otro individuo es heterocigótico, para cada locus informativo.
Los locus informativos pueden clasificarse además según qué individuo es heterocigótico y el único contribuyente de un alelo. Un locus se considera un locus materno informativa, o análogamente un locus materno específico, si el feto es homocigótico y la hembra embarazada es heterocigótica. Un locus se considera un locus fetal informativo, o análogamente un locus fetal específico, si la hembra embarazada es homocigótica y el feto es heterocigótico. En la etapa 303, todos los locus informativos identificados son materno específicos o fetal específicos, porque el mismo individuo sirve como segunda entidad para todos estos locus.
Un locus informativo puede representar un polimorfismo de un solo nucleótido o "SNP", en donde el primer alelo y el segundo alelo difieren en la identidad de un solo nucleótido. Un locus informativo también puede representar una corta inserción o eliminación, en donde uno o más nucleótidos se insertan o eliminan en un alelo en comparación con el otro alelo.
En algunas realizaciones, el genotipo de la hembra embarazada en uno o más locus informativos, o en cada locus informativo, se determina por secuenciación del ADN genómico obtenido del tejido materno. El tejido materno puede ser células de sangre materna o cualquier otro tipo de tejido. En algunas realizaciones, el genotipo del feto en uno o más locus informativos, o en cada locus informativo, se determina por secuenciación del ADN genómico obtenido del tejido fetal, tales como la placenta, vellosidades coriónicas, líquido amniótico. Si se prefiere un método menos invasivo, el ADN fetal puede obtenerse también para la secuenciación de una muestra de sangre materna. La misma muestra usada para obtener las moléculas de ARN para la secuenciación puede ser la fuente de dicho ADN fetal, o puede utilizarse una muestra diferente. Se valorará que los locus fetales informativos puedan ser identificados sin genotipar directamente el feto. Por ejemplo, si se determina que la hembra embarazada es homocigótica para un primer alelo en un locus, y la secuenciación de ARN indicar la presencia de un segundo alelo en la mezcla de RNA materno y fetal, entonces el feto se puede suponer que es heterocigótico en este locus.
En algunas realizaciones, tanto la madre como el feto se genotipan utilizando métodos masivamente paralelos para identificar locus informativos. La secuenciación se puede realizar en células de sangre materna enriquecidas con exoma y muestras de ADN genómico de placenta. El ADN genómico se puede extraer de los tejidos de la placenta y de células sanguíneas maternas utilizando el QIAamp DNA Kit y el QIAamp Blood Kit (ambos de Qiagen), respectivamente, siguiendo las instrucciones del fabricante. El enriquecimiento con exoma y la preparación de la biblioteca de secuenciación se pueden realizar utilizando el TruSeq Exoma Enrichment Kit (Illumina) siguiendo el protocolo del fabricante. Pueden secuenciarse las bibliotecas de 75 pb en un formato PE en un instrumento HiSeq 2000 (Illumina).
En la etapa 304, se filtran uno o más locus informativos. Como se emplea en la presente memoria, "filtrar" significa seleccionar determinados locus informativos, fuera de los identificados en la etapa 303, para su posterior análisis. Un locus informativo "filtrado" es un locus seleccionado de este modo. La selección puede hacerse sobre la base de uno o más criterios. Uno de dichos criterios es cuando los locus informativos se encuentran en el genoma o en una secuencia de referencia. En algunas realizaciones, solamente los locus situados dentro de un exón o la región expresada de la secuencia de referencia se analizan además.
Otro criterio para el filtrado es el número de lecturas de secuencias, fuera de todas las recibidas en la etapa 301 y alineadas con la secuencia de referencia en la etapa 302, que se alinean con el locus y contienen cada alelo. En algunas realizaciones, un locus informativo filtrado debe tener asociado a él al menos un primer número
5
10
15
20
25
30
35
40
45
50
55
60
predeterminado de lecturas de secuencias que contiene el primer alelo, y/o un segundo número predeterminado de lecturas de secuencias que contienen el segundo alelo. Los números predeterminados pueden ser 1, 2 o más, y pueden corresponder a una calidad de lectura o profundidad de secuenciación deseadas. Como resultado de la filtración, se identifican uno o más locus informativos filtrados.
En algunas realizaciones, solamente los locus informativos que representan SNP sone consideran para el filtrado. En un ejemplo del método, se examinaron aproximadamente un millón de SNP en la base de datos NCBI dbSNP Build 135, todos ellos situados en los exones, y se identificaron los SNP informativos de este millón utilizando genotipos maternos y fetales. Para ilustración de SNP informativos, Se asignó "A" como alelo compartido y "B" como alelo materno- o fetal-específico. Los SNP informativos incluían aquellos con un alelo de SNP específico de la madre, es decir, "AA" en el feto y "AB" en la madre en un locus dado, y aquellos con un alelo de SNP fetal- específico, es decir, "AA" en la madre y " AB" en el feto, en un locus dado. Los genotipos se designaron usando una tubería de bioinformática interna. Para realizar el filtrado, se incluyeron para análisis solamente los SNP informativos en los que tanto el alelo "A" como el alelo "B" presentaban al menos un recuento de lecturas, respectivamente.
En las etapas 305 y 306, las lecturas de secuencias que alinean a cada locus informativo filtrado se cuentan y clasifican dependiendo de qué alelo contienen. Para cada locus informativo filtrado, se determinan dos números: un primer número, que es el número de lecturas de secuencias que se alinean al locus y que contienen el correspondiente primer alelo (es decir, el alelo compartido); y un segundo número, que es el número de lecturas de secuencias que se alinean al locus y que contienen el segundo alelo correspondiente (es decir, el alelo materno- o fetal-específico). El primer número y el segundo número pueden calcularse como se desee. El primer número más el segundo número para cada locus proporciona un número total de lecturas de secuencias que se alinean al locus. Una relación del primer número y el segundo número para un determinado locus informativo filtrado puede denominarse una "relación alélica".
En las etapas 307 y 308, los números de los primeros alelos y los segundos alelos se suman en todos los locus informativos filtrados. En la etapa 307, se calcula una primera suma de los primeros números. La primera suma representa el número total de lecturas de secuencias que contiene los primeros alelos correspondientes (es decir, los alelos compartidos) para los locus informativos filtrados. En la etapa 308, se calcula una segunda suma de los segundos números. La segunda suma representa el número total de lecturas de secuencias que contiene los segundos alelos correspondientes (es decir, los alelos materno- o fetal-específicos) para los locus informativos filtrados. Las sumas se pueden calcular como se desee, utilizando todos los locus informativos filtrados identificados en la etapa 304 o uno de sus subconjuntos. En algunas realizaciones se ponderan las sumas. Por ejemplo, las contribuciones a las sumas de locus de un determinado cromosoma se pueden escalar hacia arriba o abajo multiplicando los primeros números y segundos números para esos locus por un escalar.
En la etapa 309, se calcula una relación de la primera suma y la segunda suma. Esta relación representa el número relativo de lecturas de secuencias para los primeros alelos y segundo alelos, agregados en todos los locus informativos filtrados. En algunas realizaciones, la relación se calcula simplemente como la primera suma dividida por la segunda suma. Dicho cálculo da el número de lecturas de secuencias para alelos compartidos como un múltiplo de las lecturas de secuencias para alelos materno- o fetal-específicos. Alternativamente, la relación se puede calcular como la segunda suma dividida por la suma de la primera suma y la segunda suma. Aquí la relación proporciona el número de lecturas de secuencias para los alelos específicos para la madre o el feto como una fracción de todas las lecturas de secuencias. Otros métodos de cálculo de la relación serán evidentes para el experto en la materia. La primera suma y la segunda suma, a partir de las cuales se calcula la relación, pueden servir como representantes de las cantidades de ARN (es decir, transcritos) presentes en la muestra que se originan a partir de los alelos compartidos y específicos, para los locus informativos filtrados.
En la etapa 310, la relación calculada en la etapa 309 se compara con un valor discriminatorio para determinar si el feto, la madre o el embarazo tienen un trastorno relacionado con el embarazo. En diversas realizaciones, un valor discriminatorio puede determinarse a partir de una o más muestras obtenidas de hembras embarazadas sin trastorno relacionado con el embarazo (es decir, pacientes de referencia) y/o determinarse a partir de una o más muestras obtenidas de hembras embarazadas con el trastorno relacionado con el embarazo. En algunas realizaciones, el valor discriminatorio se determina realizando el mismo método que se ha descrito anteriormente en muestras de pacientes de referencia, y examinando el mismo o un conjunto de la superposición de locus informativos filtrados. Un valor discriminatorio puede ajustarse a un valor entre los valores esperados para embarazos sin un trastorno y los valores esperados para embarazos con un trastorno. El valor discriminatorio puede basarse en una diferencia estadística a partir de un valor normal.
En algunas realizaciones, la relación calculada para la hembra embarazada (como en la etapa 309) usa locus informativos filtrados en un determinado conjunto de genes, y una relación (es decir, el valor discriminatorio) se calcula para los pacientes de referencia utilizando locus informativos filtrados en algunos o todos los genes iguales. Si la relación calculada para la hembra embarazada se basa en alelos específicos de la madre, entonces el valor discriminatorio calculado para las pacientes de referencia puede también basarse en alelos específicos de la madre. Del mismo modo, la relación y el valor discriminatorio pueden ambos estar basados en alelos fetal-específicos.
La comparación entre la relación y el valor discriminatorio puede realizarse como se desee. Por ejemplo, un
5
10
15
20
25
30
35
40
45
50
55
trastorno puede diagnosticarse si la relación excede el valor discriminatorio o cae por debajo del valor discriminatorio, en cualquier cantidad o en un determinado margen. La comparación puede implicar el cálculo de una diferencia o el cálculo de otra relación entre la relación para la hembra embarazada y el valor discriminatorio. En algunas realizaciones, la comparación implica evaluar si los niveles relativos de expresión de alelos compartidos y no compartidos para determinados genes difieren significativamente entre la hembra embarazada y las pacientes de referencia.
Si se desea, el método también se puede usar para estimar una parte de ARN en la muestra que es de origen materno o fetal. La estimación se hace multiplicando la relación calculada en la etapa 309 por un escalar. El escalar representa un nivel de expresión total en los locus informativos filtrados con respecto a la expresión de los segundos alelos en el individuo heterocigótico.
El ejemplo siguiente ilustra la aplicación del escalar. Si los segundos alelos contados en el método son fetal- específicos, entonces la relación calculada en la etapa 309 puede proporcionar el número de lecturas de secuencias para alelos fetal-específicos como una fracción de todas las lecturas de secuencias para los locus informativos filtrados. De las lecturas de secuencias que contienen el alelo compartido, algunos están aportados por la madre y algunos están aportados por el feto. Si se conocen los niveles relativos de expresión de los alelos específicos para el feto y compartidos en el feto, o pueden estimarse, entonces la relación se puede escalar para obtener una estimación de la contribución fetal fraccionada para todas las lecturas de secuencias para los locus informativos filtrados.
En algunas realizaciones, los alelos fetales y compartidos se expresan de forma simétrica en la mayoría de los locus y el escalar se supone que es aproximadamente dos. En otras realizaciones, el escalar se aparta de dos y tiene en cuenta la expresión génica asimétrica24. La contribución materna fraccionada a las lecturas de secuencias es entonces uno menos la contribución fetal fraccionada. Cálculos similares pueden hacerse cuando los segundos alelos en los locus informativos filtrados son específicos de la madre.
B. Ejemplos:
1. Correlación de relaciones alélicas y concentraciones plasmáticas
Se analizaron las características de la expresión de una muestra de plasma materno (edad de gestación 37 2/7) y se compararon con la placenta correspondiente y las células de sangre materna para una mujer embarazada. Se realizó la secuenciación masiva en paralelo de ARN para cada una de estas muestras utilizando el instrumento Illumina HiSeq 2000. La placenta y las células de sangre materna se genotiparon mediante secuenciación del exoma por secuenciación masiva en paralelo. Se examinaron aproximadamente un millón de SNP en la base de datos NCBI dbSNP Build 135 que se encuentran en los exones, y se clasificaron los SNP informativos cuando la madre es homocigótica (genotipo AA) y el feto es heterocigótico (genotipo AB). Por lo tanto, el alelo A sería el alelo compartido entre la madre y el feto y el alelo B es específico del feto.
Las relaciones alélicas ARN-SNP y las concentraciones plasmáticas totales de diferentes transcritos de ARN en el plasma materno se representan frente a los niveles relativos de expresión hística (placenta/células sanguíneas) (Fig. 7). Se puede observar que la relación alélica ARN-SNP en el plasma se correlaciona bien con el nivel relativo de expresión hística (R de Spearman = 0,9731679, P = 1,126e-09). Sin embargo, el nivel plasmático total no se correlacionó con la expresión tisular (R de Spearman = -0,7285714, P = 0,002927).
Además de los análisis de la expresión fetal, este método también puede utilizarse para la caracterización de la expresión materna. En este escenario, se pueden utilizar los SNP informativos que la madre es heterocigótica (genotipo AB) y el feto es homocigótico (genotipo AA). La relación alélica ARN-SNp se puede calcular entonces como el recuento alélico específico de la madre dividido por el recuento de los alelos compartidos. En la Fig. 8, las relaciones alélicas ARN-SNP y los niveles totales en el plasma de diferentes genes que contienen SNP informativos se representan frente al nivel de expresión hística relativo (células sanguíneas/placenta). Se puede observar una buena relación positiva entre el nivel de expresión hística con la relación alélica ARN-SNP en el plasma materno (R de Spearman = 0,9386, P <2,2e-16), pero no los niveles totales de transcripción en el plasma (R de Spearman = 0,0574, P = 0,7431).
Los transcritos de ARN, sus relaciones alélicas ARN-SNP y sus concentraciones en el plasma se tabulan en la fig. 9 y la fig. 10.
2. Comparación de la relación alélica-SNP ARN del plasma materno para los casos de preeclampsia y embarazo de referencia
Para los casos de dos hembras embarazadas, se obtuvieron un número medio de 117.901.334 fragmentos en bruto (TABLA 3A). La relación alélica ARN-SNP de un subconjunto de transcritos circulantes que llevan alelos SNP específicos de la madre se comparó entre un caso de preeclampsia de aparición tardía en el tercer trimestre (PET), 5641, y su caso de referencia de igual edad de gestación, 7171. Como se muestra en la Fig. 11A, las relaciones alélicas ARN-SNP de estos transcritos representaron unas características diferentes en PET y los casos de referencia. Es importante destacar que, las características de la relación alélica ARN-SNP son distintas de las
5
10
15
20
25
características del nivel de transcripción de plasma, como se muestra en la Fig. 11B. Esta sugiere que el análisis de la relación alélica ARN-SNP en el plasma de materna podría ser utilizado como otro indicador para distinguir mejor los casos PET de un casos de embarazo normal. El número de transcritos informativos podría aumentarse más con un mayor número de SNP informativos, ejemplificados por la comparación entre el caso de PET, 5641, y otro caso de referencia de embarazo normal, 9356 (Figs. 12A y 12b). Las relaciones alélicas ARN-SNP y el nivel en el plasma de los transcritos de ARN se muestran en la Fig. 11 y la Fig. 12 se tabulan en la Fig. 13 y Fig. 14, respectivamente.
Tabla 3A: Compendio de resultados de alineación de lecturas de ARN-seq
Tipo de muestra
Muestra Lecturas en bruto Lecturas preprocesadasa (%)b Lecturas cartografiablesc (%)d
Plasma materno
5641 (Preeclampsia) 119.902.178 30.106.800 25,11% 4.001.376 13,29%
Plasma materno
7171 (Referencia) 115.900.490 29.160.920 25,16% 1.397.345 4,79%
a. Lecturas conservadas tras la eliminación de lecturas muy repetitivas. b. % de lecturas en bruto. c. Para análisis detallado véanse Datos complementarios en tabla 2B. d. % de las lecturas preprocesadas.
Tabla 3B: Compendio de resultados de alineación de lecturas de ARN-seq
Tipo de muestra
Muestra Lecturas filtradasa Lecturas analizablesb Exón (%) Intrón (%) Región intergénica (%)c
Plasma materno
5641 (Preeclampsia) 2.579.163 1.422.213 44,87% 12,32% 42,80%
Plasma materno
7171 (Referencia) 790.735 606.610 37,69% 16,09 46,22%
a. La mayoría de las lecturas filtradas son los ARNr y los ARNt nucleares y mitocondriales. b. Lecturas analizables = lecturas cartografiables totales - lecturas filtradas. c. % de lecturas que se alinean a regiones fuera de exones e intrones de los genes de referencia.
III. Método de determinación de la contribución del ARN fetal o materno
A. Método
En la Fig. 15 se muestra un método 1500 para determinar, en una muestra de una hembra embarazada con un feto, una parte de ARN que es de origen fetal. La muestra se puede preparar y obtener como se expuso anteriormente para el método 300.
En la etapa 1501, se reciben un gran número de lecturas de secuencias. En la etapa 1502, las lecturas de secuencias, están alineados con una secuencia de referencia. Estas etapas se pueden realizar como se describió anteriormente para las etapas 301 y 302.
En la etapa 1503, se identifican una o más locus informativos maternos. Cada locus informativo materno es homocigótico en el feto para un primer alelo correspondiente y heterocigótico en la hembra embarazada para un primer alelo correspondiente y un segundo alelo correspondiente. El primer alelo es compartido por lo tanto entre la madre y el feto, y el segundo alelo es específico de la madre. Los locus maternos informativos pueden identificarse como se describió anteriormente para la etapa 303.
En la etapa 1504, los locus informativos maternos se filtran, como en la etapa 304, y se identifican uno o más locus informativos maternos filtrados. Las lecturas de secuencias se manipulan entonces en cada uno de los locus informativos maternos filtrados en las etapas 1505-1511. En las etapas 1505 y 1506, se determinan un primer número y un segundo número para cada locus materno informativo filtrado. El primer número se determina en la etapa 1505 como el número de lecturas de secuencias que se alinean al locus y que contienen el correspondiente
5
10
15
20
25
30
35
40
45
50
55
primer alelo. El segundo número se determina en la etapa 1506 como el número de lecturas de secuencias que se alinean al locus y que contienen el correspondiente segundo alelo. Las etapas 1505 y 1506 se pueden realizar de manera similar a las etapas 305 y 306, expuestas anteriormente.
En la etapa 1507, para cada locus informativo materno se calcula una suma del primer número y el segundo número. La suma puede ser equivalente al número total de lecturas de secuencias que se alinean al locus. En la etapa 1508, se calcula una relación materna dividiendo el segundo número por la suma. La relación materna proporciona la fracción de todas las lecturas de secuencias que se alinean a cada locus que contiene el segundo alelo (específico de la madre).
En la etapa 1509, se determina un escalar. El escalar representa un nivel de expresión total en el locus informativo materno filtrado con relación a la expresión del segundo alelo correspondiente en la hembra embarazada. En algunas realizaciones, donde la expresión de los dos alelos en la hembra embarazada se sabe o se supone que son simétricos, el escalar es de aproximadamente dos. En otras realizaciones, el escalar puede apartarse de dos y tener en cuenta la expresión génica asimétrica. Como la mayoría de locus expresan de forma simétrica, la suposición de simetría es válida.
En la etapa 1510, la relación materna se multiplica por el escalar para obtener una contribución materna. La contribución materna representa, en el locus informativo materno filtrado, la fracción de lecturas de secuencias (o, por extensión, la fracción de ARN en la muestra) que aporta la madre. Uno menos la contribución materna es la contribución fetal, o la fracción de lecturas de secuencias aportadas por el feto. En la etapa 1511, se calcula la contribución del feto para el locus informativo materno filtrado.
En la etapa 1512, se determina una parte de ARN en la muestra que es de origen fetal. La parte es la media de las contribuciones fetales para los locus informativos maternos filtrados. En algunas realizaciones, este promedio se pondera, por ejemplo, por las sumas calculadas para los locus informativos maternos filtrados. Mediante el cálculo de una media ponderada, la parte determinada en la etapa 1512 puede reflejar los niveles de expresión relativos de diferentes locus o genes en la muestra.
La parte de ARN en la muestra que es de origen fetal puede calcularse para un locus informativo materna filtrado, muchos de dichos locus, o todos los dichos locus para los cuales se obtienen datos de secuenciación. Se valorará que esta parte refleje el transcriptoma circulante en la hembra embarazada concreta en el momento de obtención de la muestra. Si las muestras se obtienen de la persona en diferentes momentos durante el curso de la gestación, el conjunto de locus informativos maternos filtrados identificados en el método 1500 puede variar de una muestra a la siguiente, ya que pueden determinarse las porciones de ARN de origen fetal en estos locus. La parte de ARN en una muestra que es de origen fetal también puede variar de una persona a otra, incluso cuando se controla la etapa gestacional u otros factores, y puede diferir entre una paciente que tiene un trastorno relacionado con el embarazo y una persona sana. Por consiguiente, la parte se puede comparar con un valor discriminatorio para diagnosticar un trastorno de este tipo.
En algunas realizaciones, el valor discriminatorio se determina realizando el método 1500 que utiliza muestras procedentes de una o más personas sanas. En algunas realizaciones, se hace un diagnóstico si la parte excede del valor discriminatorio o cae por debajo del mismo, en cualquier cantidad o por un determinado margen. La comparación puede implicar el cálculo de una diferencia o el cálculo de una relación entre la parte del ARN de origen fetal en la hembra embarazada y el valor discriminatorio. En algunas realizaciones, la comparación implica evaluar si la parte de ARN de origen fetal en la hembra embarazada difiere significativamente de lo que se ve en las mujeres embarazadas sanas en períodos gestacionales similares.
La parte de ARN en la muestra que es de origen fetal también puede determinarse examinando locus informativos fetales. En cada locus informativo fetal, esta parte se puede estimar calculando en primer lugar una relación fetal, que es el número de lecturas de secuencias que contiene el segundo alelo (específico del feto) dividido por el número total de lecturas de secuencias. La contribución fetal es entonces la relación fetal multiplicada por un escalar que representa los niveles de expresión relativos de los dos alelos en el feto. En consecuencia, una variación del método 1500 puede llevarse a cabo identificando locus informativos fetales, filtrando estos locus, calculando una contribución fetal para cada locus filtrado y promediando las contribuciones fetales para los locus informativos filtrados. Si se desea, la parte de origen fetal del ARN determinada por el método 1500 puede aumentarse promediando las contribuciones fetales calculadas para locus informativos maternos filtrados con contribuciones fetales calculadas para locus informativos fetales filtrados. Los promedios calculados en la presente memoria pueden ponderarse, para reflejar la variación en el número de lecturas de secuencias en diferentes locus, para dar más peso a los locus específicos de la madre o del feto, o de otra manera según se desee.
B. Ejemplos
1. Identificación y estimación del transcripto fetal y materno en plasma materno
Genes informativos, definidos como genes con al menos un SNP informativo, se identificaron en primer lugar en base a los datos de genotipado. En los dos casos de embarazo en la fase inicial, un número total de 6.714 y 6.753 genes informativos estaban disponibles para examinar las proporciones relativas de las contribuciones fetales y
5
10
15
20
25
30
35
40
45
50
55
maternas, respectivamente (Fig. 16 y 17). En los dos casos de embarazo en la fase final, un número total de 7.788 y 7.761 genes informativos estaban disponibles para examinar las proporciones relativas de las contribuciones fetal y materna, respectivamente. Para medir la proporción relativa de contribución fetal en el plasma materno, se clasificaron transcritos de ARN, donde los alelos específicos del feto fueron cubiertos por al menos una lectura de ARN-seq en las muestras de plasma materno. Las proporciones relativas de dichos transcritos del feto fueron 3,70% y 11,28% durante gestaciones prematuras y tardías, respectivamente. Utilizando un método similar, las proporciones relativas de contribución materna en la circulación, examinadas usando los alelos SNP específicos de la madre, se estimó que eran 76,90% y 78,32% durante las gestaciones prematura y tardía, respectivamente (Fig. 18A).
2. Comparación de la contribución fetal y materna fraccionaria de ARN-SNP para PET y los casos de embarazo de referencia
Se ha examinado la contribución fetal y materna fraccionaria para el transcrito GNAS, que se detectó tanto en el caso de PET, 5641, como en su caso de referencia de igual edad de gestación, 7171. En el transcrito GNAS, había un sitio de SNP informativo que comprende el alelo SNP específico del feto en el locus rs7121 en el caso 5641, en el mismo sitio SNP en el caso 7171, había un alelo SNP específico de la madre. Las contribuciones fetales y maternas fraccionarias para este sitio SNP en el caso 5641 se calculó que eran 0,09 y 0,91, respectivamente. Por otra parte, las contribuciones fetales y maternas fraccionarias para el mismo sitio de SNP en el caso de 7171 fueron 0,08 y 0,92, respectivamente (Fig. 19). En comparación con el caso de referencia 7171, hubo un aumento de 12,5% en la contribución fetal fraccionada y una disminución 1,09% en la contribución maternal fraccionaria en este transcrito. Curiosamente, se detectó un aumento del 21% en FPKM para este transcrito en el caso 5641 en comparación con el 7171.
IV. Método de designar un locus genómico como marcador o fetal
A. Método
Un método 2000 de designación de un locus genómico como marcador materno o fetal se muestra en la Fig. 20. El método implica el análisis de una muestra de una hembra embarazada con un feto. La muestra puede ser de plasma de la sangre materna y contiene una mezcla de moléculas de ARN de la madre y del feto. La muestra se puede obtener y preparar como se expuso anteriormente para el método 300.
En la etapa 2001, se reciben un gran número de lecturas de secuencias. En la etapa 2002, las lecturas de secuencias, están alineadas con una secuencia de referencia. Estas etapas se pueden realizar como se describió anteriormente para las etapas 301 y 302.
En la etapa 2003, se identifican uno o más locus informativos. Cada locus es homocigótico en una primera entidad para un primer alelo correspondiente y heterocigótico en una segunda entidad para el correspondiente primer alelo y un correspondiente segundo alelo. La primera entidad es la hembra embarazada o el feto, y la segunda entidad es el otro de entre la hembra embarazada y el feto. Los locus informativos pueden identificarse como se describió anteriormente para la etapa 303.
En la etapa 2004, los locus informativos se filtran, como en la etapa 304, y se identifican uno o más locus informativos filtrados. En algunas realizaciones, solamente los locus informativos que representan los SNP se consideran para el filtrado. En un ejemplo del método, los locus informativos filtrados incluían SNP informativos con al menos una lectura de secuencia para el alelo "A" y una lectura de secuencia para el alelo "B" en el plasma materno.
Las lecturas de secuencias, se manipulan a continuación en cada uno de los locus informativos filtrados en las etapas 2005-2008, En las etapas 2005 y 2006, para cada locus informativo filtrada se determinan un primer número y un segundo número. El primer número se determina en la etapa 2005 como el número de lecturas de secuencias que se alinean al locus y que contienen el correspondiente primer alelo. El segundo número se determina en la etapa 2006 como el número de lecturas de secuencias que se alinean al locus y que contienen el segundo alelo correspondiente. Las etapas 2005 y 2006 pueden realizarse de manera similar a las etapas 305 y 306, expuestas anteriormente.
En la etapa 2007, se calcula una relación del primer número y el segundo número para cada locus informativo filtrado. Esta relación representa las abundancias relativas de lecturas de secuencias (y, por extensión, los transcritos en la muestra) que contienen el primer alelo y el segundo alelo. En algunas realizaciones, la relación se calcula simplemente como el primer número dividido por el segundo número. Dicho cálculo da el número de lecturas de secuencias para el alelo compartido como un múltiplo de las lecturas de secuencias para el alelo específico materno o fetal. Esta relación, o su recíproca, puede considerarse una relación alélica, y para los locus de sNp, una relación alélica ARN-SNP.
En algunas realizaciones, para los SNP informativos que incluyen alelos de SNP específicos para la madre, la relación alélica ARN-SNP para cada SNP se calcula como alelo específico para la madre:alelo compartido. Por otra parte, para los SNP informativos que incluyen alelos de SNP específicos para el feto, la relación alélica ARN-SNP puede calcularse como alelo específico para el feto: alelo compartido. A diferencia de análisis de expresión génica,
5
10
15
20
25
30
35
40
45
50
55
en el que la normalización de datos es un prerrequisito, el análisis de la relación alélica ARN-SNP no requiere normalización de datos y se introduce menos sesgo. Para los transcritos que contienen más de un SNP informativo, se puede calcular una relación alélica ARN-SNP para cada sitio SNP informativo y se puede calcular una relación alélica ARN-SNP media por transcrito.
En la etapa 2007, la relación puede calcularse alternativamente como el segundo número dividido por la suma del primer número y el segundo número. En la presente memoria la relación proporciona el número de lecturas de secuencias para el alelo específico para la madre o el feto como una fracción de todas las lecturas de secuencias en el locus. En términos de alelos "A" y "B", la relación puede expresarse como
Relación de alelo B = recuento de alelos B / (recuento de alelos A + recuento de alelos B)
Teóricamente, para una transcrito plasmático que es aportado únicamente por el feto o por la madre, la relación de alelo B debe ser 0,5, suponiendo que no hay expresión específica del alelo. Otros métodos de cálculo de la relación serán evidentes para el experto en la materia.
En la etapa 2008, el locus informativo filtrado se designa como un marcador cuando la relación excede de un valor discriminatorio. En algunas realizaciones, el valor discriminatorio es de aproximadamente 0,2 a aproximadamente 0,5. En algunas realizaciones, el valor discriminatorio es de 0,4. En un ejemplo del método, el valor discriminatorio de la relación de alelo B se definió como > 0,4 para un transcrito de ARN con una alta contribución fetal o materna. Este valor discriminatorio tomó en consideración la distribución de Poisson y muestreo aleatorio de lecturas de RNA- seq. En algunas realizaciones, se dice que la contribución del alelo "B" es alta cuando la relación excede el valor discriminatorio.
Una alta relación alélica en un locus informativo concreto puede indicar que (i) el segundo o alelo "B" se expresa mucho más en el individuo heterocigótico que el alelo "A" (es decir, el alelo se expresa de forma asimétrica), (ii) una mayor participación de todo el ARN que se alinea al locus en el plasma materno es aportado por el individuo heterocigótico, o ambos (i) y (ii). Una alta relación alélica también puede indicar un trastorno relacionado con el embarazo si el gen relacionado con el locus informativo se está sobreexpresando patológicamente. Por consiguiente, algunas realizaciones del método también incluyen el diagnóstico de un trastorno relacionado con el embarazo en base a si un locus informativo filtrada se designa como marcador para la segunda entidad (es decir, el individuo heterocigótico). Al hacer dicho diagnóstico, el valor discriminatorio utilizado para la comparación con la relación alélica se puede basar en los niveles de transcripción en las muestras de plasma obtenidas de personas embarazadas sanas.
En algunas realizaciones, el método 2000 también se puede usar para estimar una parte de ARN en la muestra, en un locus informativo filtrado concreto, que es de origen materno o fetal. La estimación se realiza multiplicando la proporción calculada en la etapa 2007 por un escalar. El escalar representa un nivel de expresión total en el locus respecto a la expresión del segundo alelo en el individuo heterocigótico.
Para ilustrar, si el segundo alelo ("B") contado en el método es específico para el feto, entonces la relación B-alelo, calculada como anteriormente, representa el número de lecturas de secuencias para este alelo como una fracción de todas las lecturas de secuencias para el locus informativo filtrado. De las lecturas de secuencias que contiene el alelo ("A") compartido, algunas son aportadas por la madre y otras son aportados por el feto. Si se conocen o pueden estimarse los niveles relativos de expresión de los alelos específicos para el feto y compartidos en el feto, entonces la relación B-alelo se puede escalar para obtener una estimación de la contribución fetal fraccionada a todas las lecturas de secuencias para el locus. Si los alelos "A" y "B" se expresan igualmente en el feto, a continuación, el escalar es de aproximadamente dos. La contribución materna fraccionada a las lecturas de secuencias en el locus es entonces uno menos la contribución fetal fraccionada. Cálculos similares pueden realizarse cuando el alelo "B" en el locus informativa filtrada es específico de la madre.
B. Ejemplo: Grandes contribuciones fetal y materna
Utilizando un valor discriminatorio para el alelo B de 0,4 como se ha descrito anteriormente, se encontró que el 0,91% de los transcritos circulantes muestran gran contribución por el feto durante la gestación preliminar (es decir, el primer y segundo trimestres). Este porcentaje aumentó a 2,52% durante la gestación tardía (es decir, el tercer trimestre). Por otra parte, el 42,58% y el 50,98% presentaron una gran contribución de la madre durante las gestaciones preliminar y tardía, respectivamente (Fig. 16, 17 y 18A).
V. Uso de genes para el diagnóstico de trastornos relacionados con el embarazo
A. Genes relacionados con el embarazo
También se proporciona un método de identificación de genes relacionados con el embarazo. El método incluye recibir un gran número de primera lecturas de secuencias y gran número de segundas lecturas de secuencias. Las primeras lecturas de secuencias provienen de moléculas de ARN de secuenciación obtenidas a partir de una muestra de plasma de sangre de una mujer embarazada. Las segundas lecturas de secuencias provienen de la secuenciación de moléculas de ARN obtenidas a partir de una muestra de plasma de sangre de una mujer no
5
10
15
20
25
30
35
40
45
50
55
embarazada. Las primeras lecturas de secuencias y las segundas lecturas de secuencias se alinean con una secuencia de referencia, y se designa un conjunto de genes candidatos.
Según el método, las lecturas de secuencias se utilizan entonces para determinar los niveles de expresión para cada gen candidato en las muestras de la mujer embarazada y la mujer no embarazada. Específicamente, para cada gen candidato, se determina un primer número de transcritos correspondientes al gen candidato utilizando las primeras lecturas de secuencias; y se determina un segundo número de transcritos correspondientes al gen candidato usando las segundas lecturas de secuencias. El primer número de transcritos y el segundo número de transcritos pueden normalizarse. A continuación se calcula una relación de transcripción para el gen candidato, donde la relación de transcripción incluye el primer número de transcritos dividido por el segundo número de transcritos. La relación de transcripción se compara entonces con un valor discriminatorio. El gen candidato se identifica como un gen relacionado con el embarazo si la relación de transcripción excede del valor discriminatorio.
En algunas realizaciones del método, la normalización del primer número de transcripciones corresponde a ampliar el primer número de transcripciones por el número total de primera lecturas de secuencias. Del mismo modo, la normalización del segundo número de transcripciones puede corresponder a ampliar el segundo número de transcripciones por el número total de segundas lecturas de secuencias. En otras realizaciones, la normalización del primer número de transcripciones para cada gen candidato corresponde a la ampliación del primer número de transcripciones para el gen candidato por el número total de primeras transcripciones de todos los genes candidatos. La normalización de la segunda serie de transcripciones para cada gen candidato puede corresponder a ampliar el segundo número de transcripciones para el gen candidato por el número total de segundas transcripciones para todos los genes candidatos.
El método identifica generalmente genes como relacionados con el embarazo si se expresan a niveles más altos en una mujer embarazada, en comparación con una mujer no embarazada, siendo igual todo lo demás. Las mujeres embarazadas y no embarazadas pueden ser el mismo individuo; es decir, las muestras obtenidas de la persona antes y después de dar a luz pueden ser las fuentes de las primeras lecturas de secuencias y de las segundas lecturas de secuencias, respectivamente.
Se ha demostrado que un subconjunto de transcritos de ARN circulante que llevan alelos específicos para el feto desapareció completamente del plasma materno después del parto (Fig. 18B). Estos transcritos se consideraron específicos para el feto en el plasma materno. Por otro lado, una parte de los alelos específicos para la madre también eran indetectable después del parto. Por lo tanto, se han explorado genes que presentaban aumento durante el embarazo, denominados genes relacionados con el embarazo, comparando directamente su representación en el plasma materno antes y después del parto. Se definen genes relacionados con el embarazo los que se detectaron en el plasma antes del parto de mujeres embarazadas de tercer trimestre, en las que su nivel en el plasma después del parto se redujo en > 2 veces en ambos casos. Empleando un algoritmo bioinformático para la normalización de datos y análisis de la expresión génica diferencial, se compilaron una lista de 131 genes relacionados con el embarazo (Fig. 21). Entre estos genes, se publicó previamente que 15 eran específicos del embarazo en el plasma materno1,2, 5,9,1 ,12. Utilizando RT-PCR en tiempo real de una sola etapa, se ha validado aún más la relación con el embarazo de cinco transcritos recién identificados, que eran abundantes en el plasma materno antes del parto, es decir, STAT1, GBP1 y HSD17B1 en 10 muestras de plasma adicionales de mujeres embarazadas del tercer trimestre, así como KRT18 y GADD45G en 10 muestras de plasma de otra cohorte de mujeres embarazadas del tercer trimestre (Fig. 22).
Para evaluar la relación de estos 131 genes con el embarazo, se realizó la agrupación jerárquica para todas las muestras de plasma. Se observó una separación clara entre las muestras de plasma de mujeres embarazadas (es decir, en las fases inicial y final del embarazo) y los que no relacionados con el embarazo en curso (es decir, referencias de no embarazadas y después del parto) (Fig. 23).
Curiosamente, cuando los patrones de expresión de estos 131 genes se compararon entre las muestras de plasma de los dos casos de embarazo en fase final y sus correspondientes células de placenta y sanguíneas maternas, se observó una semejanza más estrecha entre las muestras de placenta y del plasma antes del parto, y entre las células sanguíneas maternas y las muestras de plasma después del parto (Fig. 24A). Esta observación apoya la tesis de que la mayoría de los genes relacionados con el embarazo se expresan preferentemente en la placenta más que en las células de la sangre materna. Además, los niveles de expresión de estos transcritos relacionados con el embarazo en las placentas y plasma materno se correlacionaron positivamente (P <0,05, correlación de Spearman) (Fig. 24B).
B. Expresión génica diferencial en la placenta y la sangre materna
Mientras que hemos sido capaces de catalogar un grupo de genes relacionados con el embarazo mediante el examen directo de las muestras de plasma maternas antes y después del parto, también se han extraído los datos de RNA-seq y células de la placenta y de sangre para comparación. Suponiendo que los genes relacionados con el embarazo debe ser los expresados a un alto nivel en la placenta y a un bajo nivel en las células sanguíneas maternas según lo publicado antes10,15, se fijó arbitrariamente una diferencia de 20 veces como un valor discriminatorio mínimo para el análisis basado en el tejido. Este análisis basado en el tejido produjo un total de 798
5
10
15
20
25
30
35
40
45
50
55
posibles genes candidatos, en el que se calcularon las proporciones de contribuciones fetales y maternas en el plasma materno. Se identificó una proporción relativamente alta de genes con contribución fetal predominante (Fig. 25) en comparación con la del transcriptoma completo (Fig. 18A). Sin embargo, la estrategia basada en plasma superó a la estrategia basada en el tejido en que es capaz de identificar una mayor proporción de genes con la contribución fetal predominante (Fig. 25).
C. Genes relacionados con la enfermedad o el trastorno
También se proporciona en la presente memoria un método de identificación de genes relacionado con un trastorno relacionado con el embarazo. El método incluye recibir un gran número de primeras lecturas de secuencias y gran número de segundas lecturas de secuencias. Las primeras lecturas de secuencias provienen de moléculas de ARN de secuenciación obtenidas de una muestra de plasma de sangre de una mujer embarazada sana. Las segundas lecturas de secuencias provienen de moléculas de ARN de secuenciación obtenidas de una muestra de plasma de sangre de una mujer embarazada que padece un trastorno relacionado con el embarazo, o que lleva un feto que padece un trastorno relacionado con el embarazo. Las primeras lecturas de secuencias y las segundas lecturas de secuencias están alineadas con una secuencia de referencia, y se designa un conjunto de genes candidatos.
Según el método, las lecturas de secuencias se utilizan entonces para determinar los niveles de expresión para cada gen candidato en las muestras para las dos mujeres embarazadas. Específicamente, para cada gen candidato, se determina un primer número de transcritos correspondientes al gen candidato usando las primeras lecturas de secuencias, y se determina un segundo número de transcritos correspondientes al gen candidato usando las segundas lecturas de secuencias. El primer número de transcritos y el segundo número de transcritos pueden normalizarse. A continuación, se calcula una relación de transcripción para el gen candidato, donde la relación de transcripción incluye el primer número de transcripciones dividido por el segundo número de transcripciones. La relación de transcripción se compara entonces con un valor de referencia. El gen candidato se identifica como relacionado con el trastorno si la relación de transcripción se desvía del valor de referencia.
En algunas realizaciones del método, la normalización de la primera serie de transcritos corresponde a la ampliación de la primera serie de transcritos por el número total de primeras lecturas de secuencias. Del mismo modo, la normalización de la segunda serie de transcritos puede corresponder a la ampliación del segundo número de transcritos por el número total de segundas lecturas de secuencias. En otras realizaciones, la normalización de la primera serie de transcritos para cada gen candidato corresponde a la ampliación de la primera serie de transcritos para el gen candidato por el número total de primeros transcritos de todos los genes candidatos. La normalización de la segunda serie de transcritos para cada gen candidato puede corresponder a la ampliación de la segunda serie de transcritos para el gen candidato por el número total de segundos transcritos para todos los genes candidatos.
Según el método de identificación de genes asociados a un trastorno relacionado con el embarazo, en algunas realizaciones, el valor de referencia es 1. En algunas realizaciones, la relación de transcripción se desvía del valor de referencia cuando la proporción de la relación transcripción y el valor de referencia excede o cae por debajo de un valor discriminatorio. En algunas realizaciones, la relación de transcripción se desvía del valor de referencia cuando la diferencia entre la relación de la transcripción y el valor de referencia excede un valor discriminatorio.
El método identifica generalmente un gen asociado a un trastorno relacionado con el embarazo si el nivel de expresión de ese gen difiere significativamente en los embarazos que demuestran y no demuestran el trastorno, siendo todo lo demás igual.
El diagnóstico y seguimiento de los trastornos fetales y patologías del embarazo se ha conseguido previamente utilizando ARN plasmáticos maternos que están relacionados con enfermedades. Por ejemplo, la concentración en el plasma materno de ARNm de la hormona liberadora de corticotropina (CRH) se ha demostrado que es útil para la detección no invasiva y la predicción de preeclampsia2,3. La detección de ARNm del receptor tipo 1 de interleucina 1 (IL1RL1) en el plasma materno se ha demostrado que es útil para identificar mujeres con parto prematuro espontáneo8. Un grupo de marcadores de ARN de plasma materno relacionados con el crecimiento también se ha investigado para la evaluación no invasiva de restricción del crecimiento fetal y del crecimiento intrauterino4. En este estudio, se considera que los nuevos marcadores de ARN circulantes relacionados con la enfermedad podrían ser identificados por los transcriptomas de plasma materno directamente comparados de mujeres embarazadas normales y mujeres con embarazos complicados, tales como la preeclampsia, restricción del crecimiento intrauterino, parto prematuro y aneuploidías fetales. Para demostrar la viabilidad de este método, se realizó RNA- Seq para muestras de plasma maternos obtenidas de tres mujeres embarazadas que desarrollaron preeclampsia y siete mujeres embarazadas sin complicaciones de gestaciones coincidentes. Se identificaron 98 transcritos que presentaban una elevación significativa en el plasma de mujeres embarazadas con preeclampsia (Fig, 26). Los transcritos relacionados con preeclampsia recién identificados son potencialmente útiles para la predicción, el pronóstico y el seguimiento de la enfermedad.
Esta tecnología también puede utilizarse para la predicción y seguimiento de parto prematuro. La tecnología también puede utilizarse para la predicción de muerte fetal inminente. La tecnología también puede usarse para la detección de enfermedades causadas por mutaciones génicas, siempre que el gen en cuestión se transcriba en tejidos fetales o placentarios y los transcritos sean detectables en el plasma materno.
5
10
15
20
25
30
35
40
45
50
55
La RNA-Seq del plasma se puede aplicar en otros escenarios clínicos. Por ejemplo, la metodología RNA-Seq del plasma desarrollada en este estudio sería posiblemente útil para el estudio de otros procesos patológicos, como el cáncer, en los que se han descrito13,14 las concentraciones anormales de ARN plasmático. Por ejemplo, comparando los transcriptomas en el plasma de un paciente de cáncer antes y después del tratamiento, pueden identificarse marcadores de ARN circulante relacionados con tumores para la aplicación de diagnóstico no invasivo.
VI. Patrones de expresión alélica de genes específicos
Se ha empleado secuenciación de ARN para examinar el patrón de expresión alélica25. Se supone que el patrón de expresión alélica de un gen dado se conservaría cuando los transcritos de ARN se liberen de los tejidos en la circulación, por lo tanto, podrían detectarse en el plasma. En este estudio, se han examinado los recuentos alélicos de dos transcritos de ARN, a saber, PAPPA, gen específico del embarazo, y H19, gen impreso expresado por vía materna26,27.
Para el gen PAPPA, se analizó un SNP, rs386088, que contiene un alelo SNP específico del feto (Fig. 27). La ausencia de lecturas de RNA-seq PAPPA en las muestras de plasma después del parto indicó que era de hecho específico del embarazo4. A destacar que no hubo diferencia estadísticamente significativa en las proporciones de recuentos de lecturas de alelos en el feto entre el plasma materno antes del parto y las muestras de ARN placentario (P = 0,320, prueba de la x2), lo que indica que los datos de plasma materno reflejaban el patrón de expresión bialélica de PAPPA en la placenta.
Recientemente se ha publicado de que el patrón de metilación del ADN del gen H19 impreso expresado por vía materna en la placenta y las células de sangre materna se pudo detectar por secuenciación de ADN con bisulfito del ADN del plasma materno28. En la presente memoria, se ha examinado además si el estado de la impronta genómica del gen Hl9 se podría explorar en el ARN. Se han centrado en primer lugar en un punto del SNP en el exón 1 del gen H19, rs2839698, que contiene un alelo específico materno, es decir, AA en el feto y AG en la madre. Como se muestra en la Fig. 28, sólo se detectó alelo G en el plasma materno en el puerperio (Fig. 28). Dicho patrón monoalélico estaba según su enlace al alelo G no metilado en el punto SNP rs4930098 en la región de control de impronta (Fig. 29). En el plasma materno antes del parto, mientras que el alelo G estaba presente, el alelo A, que fue aportado por la placenta, también fue detectado (Fig. 28). En otros tres puntos de SNP, es decir, rs2839701, rs2839702 y rs3741219, que llevan alelos específicos de la madre, se encontró un patrón alélico similar, es decir bialélico en el plasma materno antes del parto y monoalélico en el plasma materno en el puerperio (Fig. 28). Puede ser que los alelos específicos de la madre en estos puntos de SNP estuvieran en el mismo haplotipo materno, que estaba sin metilar y por lo tanto que estaban transcritos. Concretamente, H19 ARN no se expresó en las células de la sangre materna (Fig. 28), lo que sugiere que las moléculas de H19 ARN en el plasma procedían de tejidos/órganos maternos distintos de las células sanguíneas. Los tejidos no placentarios y no fetales que se han descrito que muestran la expresión H19 incluyen las glándulas suprarrenales, los músculos esqueléticos, el útero, adipocitos, el hígado y el páncreas 29.
VII. Exposición
En este trabajo, se pretendía desarrollar una tecnología para proporcionar una visión global de las actividades transcriptómicas en el plasma materno utilizando ARN-seq. Se ha demostrado previamente que el ADN fetal fraccionado en el plasma materno puede calcularse eligiendo como objetivo a uno o varios locus específicos del feto porque todo el genoma fetal está representado de manera uniforme en el plasma materno30. A diferencia de ADN circulante, la medición de la proporción de transcritos de ARN fetal en el plasma materno es menos sencilla ya que se complica por la expresión génica diferencial en los tejidos fetales y maternos y tal vez por su liberación en la circulación. Al realizar la RNA-seq en el plasma materno y examinar las diferencias polimórficas entre el feto y la madre, fuimos capaces de estimar la proporción de transcritos en el plasma aportados por el feto. Aunque los transcritos maternos dominaban el transcriptoma en el plasma, como era de prever, 3,70% y 11,28% de los transcritos circulantes en el plasma materno procedían del feto durante las fases inicial y final del embarazo, respectivamente. Estos transcritos fetales incluyen las moléculas de ARN aportadas por el feto y la madre, así como las aportadas únicamente por el feto. Se encontró que esta última constituye el 0,90% y el 2,52% de las transcritos circulantes maternos, durante las fases inicial y final del embarazo, respectivamente. La mayor representación de dichos genes específicos del feto durante la fase final del embarazo se correlaciona quizás con un aumento en el tamaño del feto y la placenta a medida que evoluciona el embarazo.
En este estudio, se ha demostrado que una expresión alélica equilibrada de ARN del gen PAPPA específico del embarazo en la placenta y la expresión monoalélica del gen H19 expresado por vía materna impreso se pudo observar en el plasma materno. Estos datos sugieren que el plasma materno podría utilizarse como una fuente de muestras no invasivas para el estudio de patrones de expresión alélica.
Por comparación cuantitativa de los transcritos de ARN en las muestras de plasma maternos antes y después del parto, se ha compilado una lista de 131 genes que habían aumentado durante el embarazo, como es evidente por su reducida representación en las muestras de plasma del puerperio. Como cabía esperar, las características de estos genes podrían utilizarse para diferenciar muestras de plasma de mujeres embarazadas de las no embarazadas. Dicha comparación directa de las muestras de plasma materno antes y después del parto nos ha permitido, en una
5
10
15
20
25
30
35
40
45
50
55
forma de alto rendimiento, clasificar los genes relacionados con el embarazo, que pueden no necesariamente expresarse a un nivel mucho más alto en la placenta que en las células sanguíneas maternas como se demuestra en el trabajo anterior10,15. En esencia, este método directo de examen del plasma presenta otra vía para el descubrimiento de transcritos circulantes de ARN relacionados con el embarazo, sin un conocimiento a priori de las características transcriptómicas de los tejidos de la placenta y las células sanguíneas.
Aunque se ha demostrado que la ARN-seq es un método viable para caracterizar el transcriptoma del plasma, se pueden mejorar más varias cuestiones técnicas. En primer lugar, el rendimiento de la información para la RNA-seq del plasma podría incrementarse por una mayor optimización del protocolo de secuenciación, en particular en la reducción del ARNr muy transcrito y de los genes de globina del plasma. En segundo lugar, se han centrado únicamente en las transcripciones de referencia y todavía no se han explorado isoformas individuales. Los estudios futuros podrían incluir la detección de nuevos transcritos y el análisis diferencial de las variantes de corte y empalme y sus isoformas31-33 aumentando la profundidad de lectura de la secuenciación. En tercer lugar, se ha omitido el filtrado ASE en el análisis de las proporciones de los transcritos fetal y maternos para las muestras de embarazo en fase inicial a medida que las vellosidades coriónicas y el líquido amniótico se había agotado para el análisis de genotipado. No obstante, se ha demostrado en la fase final del embarazo que el filtrado ASE no tuvo un impacto pronunciado en la identificación de genes con aportes fetales y maternos predominantes en el plasma materno (Fig. 16 y 17).
En conclusión, se ha demostrado que la tecnología RNA-seq se puede utilizar para medir la proporción de transcritos fetales y para identificar genes circulantes relacionados con el embarazo en el plasma materno. Este estudio ha allanado el camino hacia una mejor comprensión del panorama transcriptómico del plasma materno, facilitando por tanto la identificación de candidatos a biomarcadores implicados en las enfermedades relacionadas con el embarazo. Se idea prevé que esta tecnología podría conducir a nuevas vías para el diagnóstico molecular de enfermedades relacionadas con el embarazo o la placenta, y también para otras enfermedades como el cáncer34.
VIII. Trasplantes
Como se ha mencionado anteriormente, los métodos descritos en la presente memoria también pueden aplicarse a trasplantes. Los métodos para trasplantes pueden proceder de una manera similar al del análisis fetal. Por ejemplo, puede obtenerse un genotipo del tejido trasplantado. Las realizaciones pueden identificar locus donde el tejido trasplantado es heterocigótico, y donde el organismo anfitrión (p. ej., macho o hembra) es homocigótico. Y, las realizaciones pueden identificar locus donde el tejido trasplantado es homocigótico, y donde el organismo anfitrión (p. ej., macho o hembra) es heterocigótico. Las mismas relaciones pueden calcularse, y compararse con un valor discriminatorio para determinar si existe un trastorno.
IX. Sistemas informáticos
Cualquiera de los sistemas informáticos mencionados en la presente memoria puede utilizar cualquier número adecuado de subsistemas. Ejemplos de dichos subsistemas se muestran en la Fig. 30 en un ordenador 3000. En algunas realizaciones, un sistema informático incluye un único ordenador, donde los subsistemas pueden ser los componentes del ordenador. En otras realizaciones, un sistema informático puede incluir varios ordenadores, siendo cada uno un subsistema, con los componentes internos.
Los subsistemas mostrados en la fig. 30 están interconectados a través de un bus del sistema 3075. Se muestran subsistemas adicionales tales como una impresora 3074, el teclado 3078, dispositivo(s) de almacenamiento 3079, monitor 3076, que está acoplado al adaptador de pantalla 3082 y otros. Periféricos y dispositivos de entrada/salida (I/O), que se acoplan al controlador I/O 3071, se pueden conectar al sistema informático por cualquier número de medios conocidos en la técnica, tal como el puerto de serie 3077. Por ejemplo, el puerto de serie 3077 o la interfaz externa 3081 (p. ej., Ethernet, Wi-Fi, etc.) se puede utilizar para conectar el sistema informático 3000 a una red de área amplia tal como Internet, un dispositivo de entrada de ratón, o un escáner. La interconexión a través del bus del sistema 3075 permite al procesador central 3073 comunicarse con cada subsistema y controlar la ejecución de instrucciones desde la memoria del sistema 3072 o el/los dispositivo(s) de almacenamiento 3079 (p. ej., un disco fijo, tal como un disco duro o un disco óptico), así como el intercambio de información entre subsistemas. La memoria del sistema 3072 y/o el/los dispositivo(s) de almacenamiento 3079 pueden incorporar un medio legible por ordenador. Cualquiera de los datos mencionados en la presente memoria puede ser la salida de un componente a otro componente y puede ser salida para el usuario.
Un sistema informático puede incluir un gran número de los mismos componentes o subsistemas, p. ej., conectados entre sí por la interfaz externa 3081 o por una interfaz interna. En algunas realizaciones, los sistemas informáticos, el subsistema o aparatos pueden comunicarse a través de una red. En tales casos, un ordenador puede considerarse un cliente y otro ordenador un servidor, donde cada uno puede formar parte de un mismo sistema informático. Un cliente y un servidor pueden incluir cada uno múltiples sistemas, subsistemas o componentes.
Debe entenderse que cualquiera de las realizaciones de la presente invención se puede llevar a cabo en forma de lógica de control utilizando el equipo informático (hardware) (p. ej., un circuito integrado específico para aplicaciones o matriz de puertas programables en campo) y/o utilizando programas informáticos (software) con un procesador
5
10
15
20
25
30
35
40
45
50
55
generalmente programable de una manera modular o integrada. Como usuario en la presente memoria, un procesador incluye un procesador de varios núcleos en un mismo chip integrado, o múltiples unidades de procesamiento en una única placa de circuito o en red. Basándose en la descripción y las enseñanzas proporcionadas en la presente memoria, un experto en la técnica sabrá y valorar otras formas y/o métodos para poner en práctica realizaciones de la presente invención utilizando equipos informáticos y una combinación de equipos y programas informáticos.
[0137] Cualquiera de los componentes o funciones del programa informático descritas en esta aplicación de software pueden llevarse a cabo como código de programa informático a ejecutar por un procesador utilizando cualquier lenguaje de ordenador adecuado, tal como, por ejemplo, Java, C++ o Perl usando, por ejemplo, técnicas convencionales u orientadas al objeto. El código programa informático puede ser almacenado como una serie de instrucciones o comandos en un medio legible por ordenador para su almacenamiento y/o transmisión, medios adecuados incluyen memoria de acceso aleatorio (RAM), una memoria de sólo lectura (ROM), un medio magnético tal como un disco duro o un disquete, o un medio óptico, tal como un disco compacto (CD) o DVD (disco versátil digital), memoria flash y similares. El medio legible por ordenador puede ser cualquier combinación de dichos dispositivos de almacenamiento o transmisión.
Dichos programas también pueden codificarse y transmitirse utilizando señales portadoras adaptadas para la transmisión a través de redes cableadas, ópticas, y/o inalámbricas adecuadas a una variedad de protocolos, incluido el Internet. Como tal, puede crearse un medio legible por ordenador según una realización de la presente invención usando una señal de datos codificada con dichos programas. Medios legibles por ordenador codificados con el código del programa pueden empaquetarse con un dispositivo compatible o proporcionarse por separado de otros dispositivos (p. ej., mediante descarga por Internet). Cualquier medio legible por ordenador tal puede residir en o dentro de un único ordenador (p. ej., un disco duro, un Cd, o un sistema informático completo), y puede estar presente en o dentro de diferentes ordenadores dentro de un sistema o red. Un sistema informático puede incluir un monitor, impresora u otra pantalla adecuada para proporcionar cualquiera de los resultados mencionados en la presente memoria a un usuario.
Cualquiera de los métodos descritos en la presente memoria puede ser total o parcialmente realizado con un sistema informático incluidos uno o más procesadores, que pueden configurarse para realizar las etapas. Por lo tanto, las realizaciones pueden dirigirse a sistemas informáticos configurados para realizar las etapas de cualquiera de los métodos descritos en la presente memoria, potencialmente con diferentes componentes que realizan unas etapas respectivas etapas o un grupo respectivo de etapas. Aunque presentadas como etapas numeradas, las etapas de los métodos en la presente memoria se pueden realizar al mismo tiempo o en un orden diferente. Además, partes de estas etapas se pueden utilizar con partes de otras etapas de otros métodos. También, toda o partes de una etapa pueden ser opcionales. Además, cualquiera de las etapas de cualquiera de los métodos se pueden realizar con módulos, circuitos, u otros medios para realizar estas etapas.
Los detalles específicos de realizaciones particulares se pueden combinar de cualquier manera adecuada sin apartarse del espíritu y alcance de las realizaciones de la invención. Sin embargo, otras realizaciones de la invención pueden dirigirse a realizaciones específicas relativas a cada aspecto individual, o combinaciones específicas de cada uno de estos aspectos.
La descripción anterior de realizaciones ejemplares de la invención se ha presentado a efectos de ilustración y descripción. No se pretende que sea exhaustiva o que limite la invención a la forma precisa descrita, y son posibles muchas modificaciones y variaciones a la luz de las enseñanzas anteriores. Las realizaciones se eligieron y describieron con el fin de explicar mejor los principios de la invención y sus aplicaciones prácticas para permitir por ello a otros expertos en la técnica utilizar mejor la invención en varias realizaciones y con varias modificaciones que son adecuadas al uso particular contemplado.
A relación de "un", "una" o "el", "la", "los", "las" quiere decir "uno o más" a menos que se indique específicamente lo contrario.
X. Referencias
1. Ng EKO, Tsui NBY, Lau TK, Leung TN, Chiu RWK, Panesar NS, Lit LC, Chan KW, Lo YMD. mRNA of placental origin is readily detectable in maternal plasma. Proc. Natl. Acad. Sci. U S A 2003; 100: 4748-53.
2. Ng EKO, Leung TN, Tsui NBY, Lau TK, Panesar NS, Chiu RWK, Lo YMD. The concentration of circulating corticotropin-releasing hormone mRNA in maternal plasma is increased in preeclampsia. Clin. Chem. 2003;49: 72731.
3. Farina A, Sekizawa A, Sugito Y, Iwasaki M, Jimbo M, Saito H, Okai T. Fetal DNA in maternal plasma as a screening variable for preeclampsia. A preliminary nonparametric analysis of detection rate in low-risk nonsymptomatic patients. Prenat. Diagn. 2004;24: 83-6.
4. Pang WW, Tsui MH, Sahota D, Leung TY, Lau TK, Lo YM, Chiu RW. A strategy for identifying circulating placental RNA markers for fetal growth assessment, Prenat. Diagn. 2009:29: 495-504.
5
10
15
20
25
30
35
40
45
5. Lo YMD, Tsui NBY, Chiu RWK, Lau TK, Leung TN, Heung MM, Gerovassili A, Jin Y, Nicolaides KH, Cantor CR, Ding C. Plasma placental RNA allelic ratio permits noninvasive prenatal chromosomal aneuploidy detection. Nat. Med. 2007; 13: 218-23.
6. Tsui NBY, Akolekar R, Chiu RWK, Chow KCK, Leung TY, Lau TK, Nicolaides KH, Lo YMD. Synergy of total PLAC4 RN A concentration and measurement of the RNA single-nucieotide polymorphism allelic ratio for the noninvasive prenatal detection of trisomy 21. Clin. Chem. 2010;56: 73-81.
7. Tsui NBY, Wong BCK, Leung TY, Lau TK, Chiu RWK, Lo YMD. Non-invasive prenatal detection of fetal trisomy 18 by RNA-SNP allelic ratio analysis using maternal plasma SERP1NB2 mRNA: a feasibility study. Prenat. Diagn. 2009; 29: 1031-7.
8. Chim SS, Lee WS, Ting YH, Chan OK, Lee SW, Leung TY. Systematic identification of spontaneous preterm birth- associated RNA transcripts in maternal plasma. PLoS One 2012:7: e34328.
9. Wong BCK, Chiu RWK, Tsui NBY, Chan KCA, Chan LW, Lau TK, Leung TN, Lo YMD. Circulating placental RNA in maternal plasma is associated with a preponderance of 5' mRNA fragments: implications for noninvasive prenatal diagnosis and monitoring. Clin. Chem. 2005;51 : 1786-95.
10. Tsui NBY, Chim SSC, Chiu RWK, Lau TK, Ng EKO, Leung TN, Tong YK, Chan KCA, Lo YMD. Systematic micro- array based identification of placental mRNA in maternal plasma: towards non-invasive prenatal gene expression profiling. J. Med. Genet. 2004;41: 461-7.
11. Poon LL, Leung TN, Lau TK, Lo YMD. Presence of fetal RNA in maternal plasma. Clin. Chem. 2000;46: 1832-4.
12. Go AT, Visser A, Mulders MA, Blankenstein MA, Van Vugt JM, Oudejans CB. Detection of placental transcription factor mRNA in maternal plasma. Clin. Chem. 2004;50:1413-4.
13. Smets EM, Visser A, Go AT, van Vugt JM, Oudejans CB. Novel biomarkers in preeclampsia. Clin. Chim. Acta 2006;364:22-32.
14. Purwosunu Y, Sekizawa A, Koide K, Farina A, Wibowo N, Wiknjosastro GH, et al. Cell-free mRNA concentrations of plasminogen activator inhibitor-1 and tissue-type plasminogen activator are increased in the plasma of pregnant women with preeclampsia. Clin. Chem. 2007;53 :399-404.
15. Miura K, Miura S, Yamasaki K, Shimada T, Kinoshita A, Niikawa N, et al. The possibility of microarray -based analysis using cell-free placental mRNA in maternal plasma, Prenat. Diagn. 2010;30:849-61.
16. Ng EKO, El-Sheikhah A, Chiu RWK, Chan KC, Hogg M, Bindra R, et al. Evaluation of human chorionic gonadotropin beta-subunit mRNA concentrations in maternal serum in aneuploid pregnancies: a feasibility study. Clin. Chem. 2004;50: 1055-7.
17. Mortazavi A, Williams BA, McCue K, Schaeffer L, Wold B. Mapping and quantifying mammalian transcriptornes by RNA-Seq. Nat. Methods 2008;5:621-8.
18. Sultan M, Schulz MH, Richard H, Magen A, Klingenhoff A, Scherf M, et al. A global view of gene activity and alternative splicing by deep sequencing of the human transcriptome. Science 2008;321 :956-60.
19. Kim J, Zhao K, Jiang P, Lu ZX, Wang J, Murray JC, Xing Y. Transcriptome landscape of the human placenta. BMC Genomics 2012; 13 :115.
20. Wang K, Li H, Yuan Y, Etheridge A, Zhou Y, Huang D, et al. The complex exogenous RNA spectra in human plasma: an interface with human gut biota? PLoS One 2012;7:e51009.
21. Li H, Guo L, Wu Q, Lu J, Ge Q, Lu Z. A comprehensive survey of maternal plasma miRNAs expression profiles using high-throughput sequencing. Clin. Chim. Acta 2012;413 :568-76.
22. Williams Z, Ben-Dov IZ, Elias R, Mihailovic A, Brown M, Rosenwaks Z, Tuschl T. Comprehensive profiling of circulating microRNA via small RNA sequencing of cDNA libraries reveals biomarker potential and limitations. Proc. Natl. Acad. Sci. U S A 2013,110:4255-60,
23. Chim SSC, Shing TK, Hung EC, Leung TY, Lau TK, Chiu RWK, Lo YMD. Detection and characterization of placental microRNAs in maternal plasma. Clin. Chem. 2008;54:482-90.
24. Pickrell JK et al. Understanding mechanisms underlying human gene expression variation with RNA sequencing. Nature 2010;464:768-772.
25. Smith RM, Webb A, Papp AC, Newman LC, Handelman SK, Suhy A, et al. Whole transcriptome RNA-Seq allelic expression in human brain. BMC Genomics 2013; 14:571.
26. Frost JM, Monk D, Stojilkovic-Mikic T, Woodfine K, Chitty LS, Murrell A, et al. Evaluation of allelic expression of imprinted genes in adult human blood, PLoS One 2010:5:e13556.
27. Daelemans C, Ritchie ME, Smits G, Abu-Amero S, Sudbery IM, Forrest MS, et al. High-throughput analysis of candidate imprinted genes and allele-specific gene expression in the human term placenta. BMC Genet. 2010; 11:25.
5 28. Lun FMF, Chiu RWK, Sun K, Leung TY, Jiang P, Chan KCA, et al. Noninvasive prenatal methylomic analysis by
genomewide bisulfite sequencing of maternal plasma DNA. Clin. Chem. 2013;59: 1583-94.
29. Wu C, Orozco C, Boyer J, Leglise M, Goodale J, Batalov S, et al. BioGPS: an extensible and customizable portal for querying and organizing gene annotation resources. Genome Biol. 2009; 10:R130.
30. Lo YMD, Chan KCA, Sun H, Chen EZ, Jiang P, Lun FMF, et al. Maternal plasma DNA sequencing reveals the 10 genome-wide genetic and mutational profile of the fetus. Sci. Transl. Med. 2010;2:61 ra91.
31. Cabili MN, Trapnell C, Goff L, Koziol M, Tazon-Vega B, Regev A, Rinn JL. Integrative annotation of human large intergenic noncoding RNAs reveals global properties and specific subclasses. Genes Dev. 2011;25:1915-27.
32. St Laurent G, Shtokalo D, Tackett MR, Yang Z, Eremina T, Wahlestedt C, et al. Intronic RNAs constitute the major fraction of the non-coding RNA in mammalian cells. BMC Genomics 2012;13:504.
15 33. Anders S, Reyes A, Huber W. Detecting differential usage of exons from RNA-seq data. Genome Res. 2012;
22:2008-17.
34. Fleischhacker M, Schmidt B. Circulating nucleic acids (CNAs) and cancer— a survey. Biochim. Biophys. Acta 2007; 1775:181-232.

Claims (13)

  1. 5
    10
    15
    20
    25
    30
    35
    40
    45
    1. Un método para diagnosticar un trastorno relacionado con el embarazo usando una muestra de una hembra embarazada con un feto, comprendiendo el método:
    recibir un gran número de lecturas de secuencias, en donde las lecturas de secuencias se obtienen de un análisis de moléculas de ARN obtenidos de la muestra, muestra que contiene una mezcla de moléculas de ARN maternos y fetales;
    identificar, mediante un sistema informático, las ubicaciones de las lecturas de secuencias en una secuencia de referencia;
    identificar uno o más locus informativos, cada uno de los cuales es homocigótico en una primera entidad para un primer alelo correspondiente y que es heterocigótico en una segunda entidad para el correspondiente primer alelo y un correspondiente segundo alelo, en donde la primera entidad es la hembra embarazada o el feto, y la segunda entidad es el otro de entre la hembra embarazada y el feto;
    filtrar uno o más locus informativos para identificar uno o más locus informativos filtrados:
    que se encuentran dentro de una región expresada de la secuencia de referencia, en la que se encuentran al menos un primer número predeterminado de lecturas de secuencias en el gran número de lecturas de secuencias que contienen el correspondiente primer alelo, y
    en el que se encuentra al menos un segundo número predeterminado de lecturas de secuencias en el gran número de lecturas de secuencias que contienen el segundo alelo correspondiente,
    para cada uno de los locus informativos filtrados:
    determinar un primer número de lecturas de secuencias situadas en el locus informativo filtrado y que contiene el primer alelo correspondiente,
    determinar un segundo número de lecturas de secuencias situadas en el locus informativo filtrado y que contiene el segundo alelo correspondiente,
    calcular una primera suma de los primeros números y la segunda suma de los segundos números; calcular una relación entre la primera suma y la segunda suma, y
    comparar la relación con un valor discriminatorio para determinar si el feto, la madre o el embarazo tiene un trastorno relacionado con el embarazo, determinándose el valor discriminatorio a partir de una o más muestras obtenidas de hembras embarazadas sin el trastorno relacionado con el embarazo.
  2. 2. El método de la reivindicación 1, en donde la muestra de la mujer embarazada es una muestra de plasma sanguíneo.
  3. 3. El método de la reivindicación 1 o 2, en donde la segunda entidad es la hembra embarazada.
  4. 4. El método de la reivindicación 1, en donde la segunda entidad es el feto.
  5. 5. El método de una cualquiera de las reivindicaciones precedentes, en donde el cálculo de una relación de la primera suma y la segunda suma comprende dividir la segunda suma por una suma de la primera suma y la segunda suma.
  6. 6. El método de una cualquiera de las reivindicaciones precedentes, en donde el análisis de moléculas de ARN obtenidas de la muestra comprende la secuenciación de las moléculas de ARN o de una de las copias de ADNc.
  7. 7. El método de una cualquiera de las reivindicaciones 1 a 5, en donde el análisis de moléculas de ARN obtenidas de la muestra comprende realizar la PCR digital.
  8. 8. El método de una cualquiera de las reivindicaciones precedentes, en donde la identificación de las ubicaciones de las lecturas de secuencias en una secuencia de referencia comprende la alineación de las lecturas de secuencias con la secuencia de referencia.
  9. 9. El método de una cualquiera de las reivindicaciones precedentes, en donde el primer número predeterminado de lecturas de secuencias es 1, y en donde el segundo número predeterminado de lecturas de secuencias es 1.
  10. 10. El método de una cualquiera de las reivindicaciones precedentes, que comprende además ADN genómico de secuenciación obtenido de tejido materno para determinar un genotipo de la hembra embarazada en cada locus informativo.
  11. 11. El método de una cualquiera de las reivindicaciones precedentes, que comprende además ADN genómico de secuenciación obtenido de la placenta, de vellosidades coriónicas, del líquido amniótico o del plasma materno para determinar un genotipo del feto en cada locus informativo.
  12. 12. El método de una cualquiera de las reivindicaciones precedentes, que comprende además la estimación de una 5 parte de ARN en la muestra que es de origen materno o fetal, en donde la parte es la relación multiplicada por un
    escalar.
  13. 13. Un programa informático que comprende un gran número de instrucciones que pueden ser ejecutadas por un sistema informático, que cuando se ejecutan controlan el sistema informático para llevar a cabo el método de una cualquiera de las reivindicaciones precedentes.
    10 14. Un producto del programa informático que comprende un medio legible por ordenador que almacena un
    programa informático según la reivindicación 13.
ES14757525.2T 2013-02-28 2014-02-28 Análisis de transcriptoma de plasma materno por secuenciación masiva en paralelo de ARN Active ES2670544T3 (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361770985P 2013-02-28 2013-02-28
US201361770985P 2013-02-28
PCT/IB2014/059351 WO2014132244A1 (en) 2013-02-28 2014-02-28 Maternal plasma transcriptome analysis by massively parallel rna sequencing

Publications (1)

Publication Number Publication Date
ES2670544T3 true ES2670544T3 (es) 2018-05-30

Family

ID=51388739

Family Applications (1)

Application Number Title Priority Date Filing Date
ES14757525.2T Active ES2670544T3 (es) 2013-02-28 2014-02-28 Análisis de transcriptoma de plasma materno por secuenciación masiva en paralelo de ARN

Country Status (15)

Country Link
US (3) US10240199B2 (es)
EP (4) EP3910072A3 (es)
JP (5) JP6525894B2 (es)
KR (2) KR102082025B1 (es)
CN (2) CN105143466B (es)
AU (4) AU2014222312B2 (es)
CA (2) CA2897684C (es)
EA (2) EA037326B1 (es)
ES (1) ES2670544T3 (es)
HK (1) HK1253097A1 (es)
IL (4) IL289547B2 (es)
MX (3) MX391736B (es)
SG (2) SG10201609080WA (es)
TW (3) TWI762728B (es)
WO (1) WO2014132244A1 (es)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3910072A3 (en) * 2013-02-28 2022-02-16 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing
CN105441432B (zh) * 2014-09-05 2019-05-28 天津华大基因科技有限公司 组合物及其在序列测定和变异检测中的用途
CN104232778B (zh) * 2014-09-19 2016-08-17 天津华大基因科技有限公司 同时确定胎儿单体型及染色体非整倍性的方法及装置
CN104232777B (zh) * 2014-09-19 2016-08-24 天津华大基因科技有限公司 同时确定胎儿核酸含量和染色体非整倍性的方法及装置
WO2016205753A1 (en) * 2015-06-17 2016-12-22 The Translational Genomics Research Institute Systems and methods for obtaining biological molecules from a sample
NL2016967B1 (en) 2016-06-15 2017-12-21 Iq Products B V Markers and their ratio to determine the risk for early-onset preeclampsia.
IL296349A (en) * 2017-05-16 2022-11-01 Univ Hong Kong Chinese Integrative single-cell and cell-free plasma rna analysis
CN109280697B (zh) * 2017-07-20 2022-04-26 天昊生物医药科技(苏州)有限公司 利用孕妇血浆游离dna进行胎儿基因型鉴定的方法
CA3062226A1 (en) 2018-05-25 2019-11-25 Illumina, Inc. Circulating rna signatures specific to preeclampsia
AU2020387423A1 (en) 2019-11-22 2021-09-30 Illumina, Inc. Circulating RNA signatures specific to preeclampsia
KR102326813B1 (ko) * 2020-04-20 2021-11-16 강원대학교산학협력단 임신중독증의 예측 또는 진단을 위한 바이오마커로서의 miRNA-214-3p 및 miRNA-1290-3p
CA3186291A1 (en) 2020-06-10 2021-12-16 Board Of Regents, The University Of Texas System Method for determining risk of pre-term birth
KR102494583B1 (ko) * 2020-11-04 2023-02-07 강원대학교산학협력단 miR-31-5p 및 miR-1290-3p의 발현수준 비율을 이용한 임신중독증 진단 방법
KR102497167B1 (ko) * 2020-11-04 2023-02-08 강원대학교산학협력단 miR-155-5p 및 miR-1290-3p의 발현수준 비율을 이용한 임신중독증 진단 방법
WO2023235353A2 (en) 2022-06-03 2023-12-07 Illumina, Inc. Circulating rna biomarkers for preeclampsia

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6664056B2 (en) 2000-10-17 2003-12-16 The Chinese University Of Hong Kong Non-invasive prenatal monitoring
JP4624977B2 (ja) * 2003-01-17 2011-02-02 ザ チャイニーズ ユニバーシティ オブ ホンコン 妊娠障害診断マーカーとしての血中mRNA
AU2003263660A1 (en) 2003-08-29 2005-03-16 Pantarhei Bioscience B.V. Prenatal diagnosis of down syndrome by detection of fetal rna markers in maternal blood
CN101065667B (zh) * 2004-09-24 2013-09-04 貝丝以色列女执事医疗中心 诊断和治疗妊娠并发症的方法
CN101137760B (zh) * 2005-03-18 2011-01-26 香港中文大学 检测染色体非整倍性的方法
CN101137761B (zh) * 2005-03-18 2010-12-08 香港中文大学 产前诊断和监测的标记
DE102005013949A1 (de) 2005-03-26 2006-09-28 Carl Zeiss Meditec Ag Scanvorrichtung
US7790463B2 (en) * 2006-02-02 2010-09-07 Yale University Methods of determining whether a pregnant woman is at risk of developing preeclampsia
US7901884B2 (en) 2006-05-03 2011-03-08 The Chinese University Of Hong Kong Markers for prenatal diagnosis and monitoring
US20080233583A1 (en) * 2007-02-20 2008-09-25 Regents Of The University Of California Biomarkers for preeclampsia
AU2008278839B2 (en) * 2007-07-23 2013-04-04 The Chinese University Of Hong Kong Determining a nucleic acid sequence imbalance
US20100016173A1 (en) 2008-01-30 2010-01-21 Proteogenix, Inc. Maternal serum biomarkers for detection of pre-eclampsia
ES2936256T3 (es) 2008-02-01 2023-03-15 Massachusetts Gen Hospital Uso de microvesículas en el diagnóstico, y pronóstico de enfermedades y afecciones médicas
US20110171650A1 (en) * 2008-09-16 2011-07-14 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Gene expression related to preeclampsia
CN101871002B (zh) * 2009-04-22 2013-04-17 中山大学达安基因股份有限公司 一种无创性产前筛查21-三体综合征的试剂盒
BR112012010694B8 (pt) * 2009-11-05 2021-07-27 Sequenom Inc método para determinar pelo menos uma porção do genoma de um feto não nascido de uma fêmea grávida, e, meio legível por computador não transitório
US9260745B2 (en) * 2010-01-19 2016-02-16 Verinata Health, Inc. Detecting and classifying copy number variation
PL2376661T3 (pl) 2010-01-19 2015-06-30 Verinata Health Inc Jednoczesne oznaczenie aneuploidii i frakcji płodowej
US20130316351A1 (en) 2010-06-07 2013-11-28 Osnat Ashur-Fabian Methods and kits for diagnosing conditions related to hypoxia
US20120077185A1 (en) 2010-08-06 2012-03-29 Tandem Diagnostics, Inc. Detection of genetic abnormalities and infectious disease
EP2426217A1 (en) 2010-09-03 2012-03-07 Centre National de la Recherche Scientifique (CNRS) Analytical methods for cell free nucleic acids and applications
WO2012058316A1 (en) 2010-10-26 2012-05-03 Stanford University Non-invasive fetal genetic screening by sequencing analysis
WO2012088348A2 (en) 2010-12-23 2012-06-28 Sequenom, Inc. Fetal genetic variation detection
US8530228B2 (en) 2010-12-28 2013-09-10 Bexmart Integrated versatile and systems preparation of specimens
CN103459614B (zh) 2011-01-05 2015-12-02 香港中文大学 胎儿性染色体的非侵入性产前基因分型
EP2490027A1 (en) * 2011-02-15 2012-08-22 Roche Diagnostics GmbH Means and methods for diagnosing pregnancy complications based on GDF-15 and PlGF/sFlt1
EP2860265B1 (en) 2011-02-24 2016-10-26 The Chinese University of Hong Kong Determining fetal DNA percentage for twins
CN102286462A (zh) * 2011-06-27 2011-12-21 深圳市易瑞生物技术有限公司 一种游离rna提取方法及试剂盒
EP3910072A3 (en) * 2013-02-28 2022-02-16 The Chinese University Of Hong Kong Maternal plasma transcriptome analysis by massively parallel rna sequencing

Also Published As

Publication number Publication date
WO2014132244A9 (en) 2014-11-27
MX2021015876A (es) 2022-02-03
EA201591582A1 (ru) 2015-12-30
AU2022200046B2 (en) 2022-11-17
IL289547A (en) 2022-03-01
TW201441618A (zh) 2014-11-01
MX2015010784A (es) 2016-05-12
TWI762728B (zh) 2022-05-01
AU2014222312B2 (en) 2019-08-01
IL281429B (en) 2022-02-01
AU2023200786A1 (en) 2023-03-09
IL289547B2 (en) 2024-01-01
EP3587588B1 (en) 2021-06-30
US11970742B2 (en) 2024-04-30
KR102241051B1 (ko) 2021-04-16
IL289547B1 (en) 2023-09-01
EP3351643A1 (en) 2018-07-25
SG10201609080WA (en) 2016-12-29
KR102082025B1 (ko) 2020-02-26
JP2016511641A (ja) 2016-04-21
CA2897684C (en) 2021-06-29
WO2014132244A1 (en) 2014-09-04
CN105143466B (zh) 2018-10-23
AU2019246833A1 (en) 2019-10-31
JP7646239B2 (ja) 2025-03-17
JP6525894B2 (ja) 2019-06-05
KR20200020996A (ko) 2020-02-26
IL267845A (en) 2019-09-26
JP2024023390A (ja) 2024-02-21
JP2025081680A (ja) 2025-05-27
US20190218615A1 (en) 2019-07-18
CN109136364A (zh) 2019-01-04
US20140243212A1 (en) 2014-08-28
AU2022200046A1 (en) 2022-02-03
MX391736B (es) 2025-03-21
KR20150123807A (ko) 2015-11-04
JP2021164469A (ja) 2021-10-14
CA2897684A1 (en) 2014-09-04
SG11201506516TA (en) 2015-09-29
AU2014222312A1 (en) 2015-07-30
EP2961851B1 (en) 2018-04-25
EP2961851A4 (en) 2016-11-16
EA202190075A2 (ru) 2021-04-30
EA037326B1 (ru) 2021-03-12
IL281429A (en) 2021-04-29
IL239939B (en) 2019-07-31
JP7397498B2 (ja) 2023-12-13
TWI801188B (zh) 2023-05-01
TW202246521A (zh) 2022-12-01
EP3910072A3 (en) 2022-02-16
HK1253097A1 (zh) 2019-06-06
MX2019010844A (es) 2019-10-30
TWI641834B (zh) 2018-11-21
JP2019162121A (ja) 2019-09-26
CA3117788A1 (en) 2014-09-04
IL239939A0 (en) 2015-08-31
EP3351643B1 (en) 2019-09-18
EA202190075A3 (ru) 2021-07-30
EP3910072A2 (en) 2021-11-17
EP3587588A1 (en) 2020-01-01
IL267845B (en) 2021-04-29
TW201900882A (zh) 2019-01-01
MX368004B (es) 2019-09-13
EP2961851A1 (en) 2016-01-06
AU2023200786B2 (en) 2025-06-05
US20240271218A1 (en) 2024-08-15
US10240199B2 (en) 2019-03-26
AU2019246833B2 (en) 2021-10-07
CN105143466A (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
ES2670544T3 (es) Análisis de transcriptoma de plasma materno por secuenciación masiva en paralelo de ARN
JP2022185149A (ja) 癌スクリーニング及び胎児分析のための変異検出
TW201720932A (zh) 藉由母體血漿dna之淺深度測序以準確定量胎兒dna含量
EA046998B1 (ru) Анализ транскриптома материнской плазмы с применением массивного параллельного секвенирования рнк
EA049951B1 (ru) Анализ транскриптома материнской плазмы с применением массивного параллельного секвенирования рнк