ES3056147T3

ES3056147T3 - A system and method of generating a model to detect, or predict the risk of, an outcome

Info

Publication number: ES3056147T3
Application number: ES19708778T
Authority: ES
Inventors: Robin Tuytten; Gregoire Thomas; Charles Garvey
Original assignee: Metabolomic Diagnostics Ltd
Current assignee: Metabolomic Diagnostics Ltd
Priority date: 2018-02-09
Filing date: 2019-02-11
Publication date: 2026-02-18
Anticipated expiration: 2039-02-11
Also published as: US20250087362A1; EP3750168C0; EP3750168A1; EP3750168B1; WO2019155071A1; US20220005605A1

Abstract

Un sistema y un método para generar un modelo M que puede detectar o predecir la predisposición a un resultado, por ejemplo, la predisposición de una persona a desarrollar una condición de salud como la preeclampsia, con un valor predictivo positivo o negativo superior o igual a un valor predictivo objetivo predefinido. El método considera el impacto de la prevalencia en el rendimiento de la prueba. El sistema y el método emplean una metodología iterativa de segregación poblacional, que implica al menos dos pasos de segregación poblacional, cada uno de los cuales, de forma independiente, emplea un modelo de probabilidad definida. El primer paso de segregación se selecciona entre un modelo de probabilidad definida por la regla de entrada y un modelo de probabilidad definida por la regla de salida, y el segundo paso de segregación se selecciona entre el otro modelo de probabilidad definida por la regla de entrada y un modelo de probabilidad definida por la regla de salida. La presente invención supera las limitaciones técnicas de los modelos predictivos existentes y proporciona una solución para lograr un modelo predictivo superior que ofrece un resultado de predicción de riesgo preciso y con un menor consumo computacional. Al aislar y segmentar subconjuntos poblacionales particulares según la invención, se logra una forma mucho más sólida y precisa de detectar o predecir el riesgo de un resultado. (Traducción automática con Google Translate, sin valor legal)

Description

[0001] DESCRIPCIÓN

[0002] Un sistema y método de generación de un modelo para detectar o predecir el riesgo de un resultadoCampo de la invención

[0003] La presente invención se refiere a un sistema y método de generación de un modelo M para detectar, o predecir el riesgo de, un trastorno del embarazo. También se contemplan usos del modelo para detectar o predecir el resultado, y en particular predecir el riesgo de que un sujeto desarrolle un trastorno del embarazo.

[0004] Antecedentes de la invención

[0005] Clásicamente, para identificar a una población con alto riesgo de un resultado definido (como desarrollar un trastorno específico del embarazo), es habitual fijar la tasa de falsos positivos (FPR, 1-especificidad) en un valor objetivo y luego, para cualquier clasificador específico, observar en qué sensibilidad (tasa de detección de futuros casos) la curva ROC cruza el criterio de especificidad. Por el contrario, para identificar a una población de bajo riesgo, es habitual fijar la tasa de falsos negativos (FNR, 1-sensibilidad) en un valor objetivo y luego, para cualquier clasificador dado, observar en qué especificidad (detección de futuros no casos) la curva ROC cruza el criterio de FNR para identificar a una población de bajo riesgo. Normalmente, primero se desarrolla un modelo de pronóstico que maximice el AUROC y, a continuación, se establece su tasa de detección estimada con el criterio establecido. Sin embargo, los modelos pronósticos con un AUROC elevado no son necesariamente los mejores cuando la aplicación clínica prevista es de inclusión o exclusión [1]. Es más, los modelos pronósticos no suelen tener un AUROC elevado; por ejemplo, uno de los modelos pronósticos más utilizados es el modelo de riesgo de Framingham para la predicción del riesgo cardiovascular, discrimina únicamente de forma razonable en determinadas (sub)poblaciones, con un área bajo la curva de características operativas del receptor (ROC) de poco más de 0,70 [2][3].

[0006] Los estadígrafos AUROC, Sn y Sp se consideran estadígrafos independientes de la prevalencia, aunque la prevalencia (o incidencia; según la aplicación) es importante a la hora de evaluar la utilidad clínica de una prueba pronóstica. Cuando una prueba pronóstica se evalúa/aplica en su contexto clínico pertinente, resultan más apropiadas métricas como el valor predictivo positivo y negativo (PPV y NPV), que tienen en cuenta la prevalencia (o incidencia) de la enfermedad. En este caso, el p. ej., corresponde a la fracción de pacientes que realmente desarrollarán la enfermedad (TP, verdaderos positivos) dentro del grupo de todos los pacientes que tienen un resultado positivo en la prueba (verdaderos positivos falsos positivos (FP)); o en otras palabras, el p. ej., es la probabilidad de que la enfermedad esté presente cuando la prueba es positiva. El NPV corresponde a la fracción de pacientes que realmente no desarrollarán las afecciones (TN, verdaderos negativos) dentro del grupo de todos los pacientes que tienen un resultado negativo en la prueba (verdaderos negativos+ falsos negativos (FN)), o dicho de otro modo, el NPV es la probabilidad de que la enfermedad no esté presente cuando la prueba es negativa.

[0007] Típicamente, una prueba de pronóstico de inclusión debe 1) identificar una proporción mínima de los pacientes que realmente desarrollarán la enfermedad y 2) garantizar que este verdadero grupo positivo tiene una proporción suficientemente grande de los pacientes que dan positivo. En otras palabras, dichas pruebas pronósticas deben alcanzar una sensibilidad y un p. ej., mínimos. Del mismo modo, una prueba de pronóstico de exclusión debe 1) identificar una proporción mínima de pacientes que con toda seguridad no desarrollarán la enfermedad y 2) garantizar que de los pacientes que den negativo, un número suficientemente reducido desarrollará la enfermedad (falsos negativos). Por lo tanto, dicha prueba debe alcanzar una especificidad mínima y un valor predictivo negativo (NPV) mínimo.

[0008] Es fácil comprender que los valores predictivos son determinantes importantes del rendimiento de un clasificador, ya que permiten cuantificar el "coste" asociado a un cambio de vía clínica tras el resultado de una prueba pronóstica. A título ilustrativo, debe considerarse el siguiente escenario hipotético. Si el coste monetario total (y/o el coste sanitario derivado de efectos secundarios no deseados) de un tratamiento profiláctico disponible es elevado, un sistema sanitario podría determinar, basándose en un análisis de beneficios y costes, que puede apoyar el tratamiento de un grupo de alto riesgo con una probabilidad de 1:5 de desarrollar la enfermedad (es decir, en el que mínimamente 1 de cada 5 de los tratados desarrollará finalmente la enfermedad (y, por tanto, justifica el tratamiento) y máximamente 4 de cada 5 son falsos positivos y, por tanto, se les ofrecerá innecesariamente el tratamiento). Este criterio se traduce en una prueba pronóstica que debe seleccionar un grupo de alto riesgo con un p. ej., = 0,2.

[0009] En este escenario, una prueba que clasifica el 50 % de los futuros casos en un grupo de alto riesgo con un p. ej., = 0,2 se considera mejor (desde el punto de vista de la economía sanitaria) que una prueba que clasifica el 75 % de los futuros casos en un grupo de alto riesgo con un p. ej., = 0,1. Esto último equivaldría a un "coste" de tratamiento de 9 falsos positivos por cada verdadero positivo, lo que no sería considerado adecuado por el sistema sanitario, donde el coste del tratamiento profiláctico es elevado. En el ejemplo 1 se ilustran las limitaciones de definir pruebas de exclusión o inclusión utilizando un FPR fijo (inclusión) o un FNR fijo (exclusión). Esto también limita la utilidad del análisis AUROC, ampliamente aplicado para la evaluación de pruebas pronósticas.

[0010] La predicción, la prevención y la intervención precoz son piedras angulares de la asistencia sanitaria moderna. Para aplicar estos conceptos, los profesionales sanitarios deben, en primer lugar, identificar a las personas con riesgo de desarrollar una enfermedad o que ya padecen una enfermedad subclínica. Únicamente cuando estos grupos pueden identificarse precozmente, los pacientes pueden beneficiarse al máximo de los tratamientos adecuados.

[0011] Típicamente, los sistemas sanitarios utilizarán pruebas de pronóstico, predisposición o cribado para identificar estos grupos objetivo. Las estrategias de cribado pueden ser muy eficaces para las enfermedades que tienen una causa bien definida, como las infecciones víricas (p. ej., el diagnóstico precoz de la infección por VIH, descrito en Lucas A, Armbruster B. "The cost-effectiveness of expanded VIH screening in the United States" [4]), o los trastornos genéticos (p. ej., las pruebas prenatales no invasivas para detectar aneuploidías en el embarazo, descritas en Dondorp W, De Wert G, Bombard Y,et al."Non-invasive prenatal testing for aneuploidy and beyond: Challenges of responsible innovation in prenatal screening" [5]. En estos ejemplos, se puede prestar una asistencia sanitaria eficaz porque las pruebas para identificar a las poblaciones objetivo combinan - una sensibilidad muy alta de la prueba (Sn), siendo Sn una medida de la capacidad para identificar realmente a las personas que desarrollarán la enfermedad/tendrán la enfermedad subclínica en la población que realmente desarrollará la enfermedad/tendrá realmente la enfermedad subclínica, y

[0012] - una especificidad de la prueba (Sp) muy alta, siendo Sp una medida de la capacidad para identificar realmente a estas personas que no desarrollarán la enfermedad/no tendrán enfermedad subclínica en la población que realmente no desarrollará la enfermedad/no tendrá enfermedad subclínica.

[0013] Como resultado, estas pruebas también ofrecen:

[0014] - un buen valor predictivo positivo (PPV), siendo el PPV la fracción de personas que tienen o desarrollarán la enfermedad dentro de la población de personas que dieron positivo en la prueba, es decir, un resultado positivo en la prueba corresponde a desarrollar la enfermedad/tener la enfermedad, y

[0015] - un buen valor predictivo negativo (NPV), siendo el NPV la fracción de personas que no tienen ni desarrollarán la enfermedad dentro de la población de personas que dieron negativo en la prueba.

[0016] Sin embargo, en el caso de muchas enfermedades, un problema de las pruebas actuales para identificar a las personas que padecen o corren el riesgo de padecer una enfermedad se caracteriza por unas características de las pruebas (Sn, Sp, PPV y NPV) que no son óptimas. En estos casos, los sistemas sanitarios tienen que equilibrar los recursos sanitarios, los deseos de los médicos y las expectativas del público.

[0017] Hay una tendencia en los sistemas sanitarios a utilizar análisis de costes y beneficios para establecer un PPV económicamente viable para una prueba en lugar de basarse en la sensibilidad (Sn), como se destaca en una publicación titulada "Prevention of cardiovascular disease: guidelines for assessment and management of cardiovascular risk" de la Organización Mundial de la Salud[6]. Es más, en el caso de las soluciones de modelos técnicamente aplicadas, cuando la prevalencia (o probabilidad previa a la prueba) de una enfermedad es muy baja, incluso las pruebas con una "buena" sensibilidad y especificidad pueden tener una probabilidad posterior a la prueba (PPV) sorprendentemente baja, como se demuestra en esta tabla;

[0019]

[0021] 1 % 90 % 10 % 0,083

[0022] 10 % 90 % 10 % 0,500

[0023] Es deseable mitigar la disyuntiva entre la necesidad de limitar el número de falsos positivos por cada verdadero positivo (expresado como umbral de PPV) y la de identificar al mayor número posible de personas que padecen o corren el riesgo de padecer una enfermedad (aumentando la sensibilidad).

[0024] A la hora de desarrollar modelos de aplicación técnica para uso médico, también hay que tener en cuenta la finalidad del modelo. En los modelos de diagnóstico, el objetivo es la clasificación precisa de los individuos en sus verdaderos estados de enfermedad. Sin embargo, a la hora de desarrollar modelos de pronóstico, el objetivo es más complejo desde el punto de vista técnico. En este contexto, predecir correctamente si se producirá un acontecimiento futuro es más difícil debido a su naturaleza estocástica. Por lo tanto, es más apropiado intentar clasificar a las personas en estratos de riesgo para garantizar que las que corren riesgo puedan acogerse a tratamientos paliativos.

[0025] Para generar buenas pruebas de predicción, los desarrolladores de pruebas a menudo intentarán combinar múltiples predictores en un modelo de predicción, para mejorar el rendimiento de la prueba. Sin embargo, especialmente en el pronóstico, la adición de más predictores suele dar lugar a mejoras inútiles de las pruebas, sobre todo cuando se evalúan únicamente mediante la estimación del área bajo la curva ROC (o el estadígrafo C), que es la métrica más utilizada para evaluar las pruebas pronósticas y/o diagnósticas. Es más, Roystonet al.observaron que el AUROC de los modelos pronósticos suele estar entre 0,6 y 0,85[7], un intervalo de AUROC que suele ser insuficiente para lograr un buen PPV y un buen Sn al mismo tiempo. Por lo tanto, las técnicas actuales exigen que la mera consideración de un mayor número de predictores (o variables) en los algoritmos de pronóstico proporcione los incrementos que a menudo se buscan en el rendimiento pronóstico. De lo anterior se desprende que desarrollar "buenas" pruebas de pronóstico es una tarea no trivial y complicada. Además, es aún más difícil conseguir probabilidades posteriores a la prueba adecuadas para las pruebas de enfermedades de baja prevalencia.

[0026] Es un objeto de la invención superar al menos uno de los problemas arriba referenciados. Es un objeto adicional de la invención aprovechar conjuntos de predictores disponibles de manera diferente, con el fin de superar las limitadas ganancias de rendimiento pronóstico típicamente logradas mediante la combinación de predictores en modelos cada vez más complejos.

[0027] Compendio de la invención

[0028] La invención proporciona, como se expone en las reivindicaciones adjuntas, un sistema, un producto de programa informático y un método para generar un modelo que pueda emplearse para detectar, o predecir el riesgo de, un resultado, por ejemplo el riesgo de que un sujeto desarrolle un trastorno del embarazo en el contexto de una prueba diagnóstica o pronóstica.

[0029] En particular, la invención proporciona un método para generar un modelo que pueda detectar o predecir la predisposición a un resultado, con un valor predictivo positivo y/o negativo mejor o igual que un objetivo de valor predictivo predefinido, y por lo tanto el método factoriza el impacto de la prevalencia en el rendimiento de la prueba. Los métodos emplean una metodología iterativa de segregación de la población, que implica al menos dos etapas de segregación de la población en las que cada etapa, de forma independiente, emplea un modelo definido por probabilidades.

[0030] La primera etapa de segregación se selecciona de una de un modelo definido por la probabilidad de inclusión y un modelo definido por la probabilidad de exclusión, y la segunda etapa de segregación se selecciona del otro de un modelo definido por la probabilidad de inclusión y un modelo definido por la probabilidad de exclusión. El método emplea metodología iterativa de segregación de poblaciones, para obtener subpoblaciones enriquecidas de sujetos que tienen (una predisposición para) un resultado y/o subpoblaciones enriquecidas de sujetos que no tienen (una predisposición para) un resultado. El método comprende la generación de modelos definidos por el PPV con altas tasas de detección de sujetos con (predisposición a) el resultado, y/o modelos definidos por el NPV con altas tasas de detección de sujetos que no tienen (predisposición a) el resultado. La presente invención supera las limitaciones técnicas de los modelos predictivos existentes y proporciona una solución para lograr un modelo predictivo superior que ofrezca un resultado preciso de predicción del riesgo, y ello de una forma menos intensiva desde el punto de vista computacional. Al aislar y segmentar determinados subconjuntos de la población de la forma definida en la reivindicación 1, se consigue una forma mucho más sólida y precisa de detectar o predecir el riesgo de un resultado. Se consigue una mejora significativa en la precisión de los modelos de pronóstico cuando se comparan las cifras significativas de dos modelos de predicción establecidos con y sin la aplicación de la invención, por lo que ambos modelos utilizan las mismas cuatro variables:

[0032]

[0034] Está claro que, para un objetivo de PPV dado, aumentar la tasa de detección de futuros casos de enfermedad del 65 % al 91 % es excepcional en el contexto de un modelo de pronóstico.

[0035] La metodología iterativa de segregación de poblaciones incluye al menos dos etapas de segregación. La primera etapa de segregación emplea un primer modelo para segregar la población de prueba (o un subconjunto de la misma) para generar dos subpoblaciones A1 y B1 en las que la subpoblación A1 está enriquecida en sujetos que o bien tienen la (predisposición para la) condición o bien no tienen la (predisposición para la) condición (es decir, uno de los modelos de inclusión o exclusión). La segunda etapa de segregación emplea un segundo modelo para segregar la subpoblación B1 y generar dos subpoblaciones A2 y B2 en las que la subpoblación A2 está enriquecida en sujetos que o bien tienen la (predisposición para la) enfermedad o bien no tienen la (predisposición para la) enfermedad (es decir, el otro de los modelos de inclusión o exclusión). Cada modelo está configurado para generar una subpoblación cuyos sujetos tienen una de las dos probabilidades seleccionadas entre las probabilidades de corte de entrada y de corte de salida.

[0036] Por ejemplo, el primer modelo puede configurarse para generar una subpoblación A1 cuyos sujetos tienen una probabilidad de tener (/desarrollar) un trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida, y el segundo modelo puede configurarse para generar una subpoblación A2 cuyos sujetos tienen una probabilidad de tener (/desarrollar) un trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida. Como alternativa, el primer modelo puede configurarse para generar una subpoblación A1 cuyos sujetos tienen una probabilidad de tener(/desarrollar) el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida, y el segundo modelo puede configurarse para generar una subpoblación A2 cuyos sujetos tienen una probabilidad de tener(/desarrollar) el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida.

[0037] Tomando un ejemplo de "exclusión y luego inclusión", la primera etapa de segregación emplea un modelo de exclusión configurado para generar una subpoblación A1 cuyos sujetos tienen una probabilidad de tener (/desarrollar) el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida. La subpoblación A1, que está enriquecida en sujetos que no tienen (la predisposición para) el trastorno, se elimina y la siguiente etapa de segregación se realiza en los sujetos restantes, es decir, la subpoblación B1, que ahora tiene una mayor prevalencia de sujetos con (la predisposición para) el trastorno del embarazo que la población de partida. En otras palabras, la subpoblación B1 está enriquecida en sujetos que tienen (la predisposición a) la enfermedad. La segunda etapa de segregación emplea un modelo de inclusión en la subpoblación B1 que está configurado para generar una subpoblación A2 cuyos sujetos tienen una probabilidad de tener(/desarrollar) el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida. Estas dos etapas de segregación combinadas generan una subpoblación que se enriquece aún más en sujetos que tienen (la predisposición para) el trastorno del embarazo (es decir, tiene una prevalencia mucho mayor de (predisposición para) el trastorno del embarazo que la población de partida).

[0038] El método de la invención puede emplear tres o más etapas de segregación, en las que al menos dos etapas sucesivas se ajustan a las etapas de segregación dirigidas por inclusión/exclusión o exclusión/inclusión descritas anteriormente. Entre las posibles realizaciones de la invención se incluyen las etapas de segregación inclusión/exclusión/inclusión y exclusión/inclusión/exclusión. El método de la invención puede emplear etapas de segregación consecutivas hasta que se genere un subconjunto poblacional de n.<ésima>generación que no pueda segregarse más. Este evento de "parada" se producirá

[0039] 1) cuando no se pueda encontrar ningún modelo de segregación satisfactorio, basándose en las variables disponibles para los sujetos de la población de la n.<ésima>generación; o bien

[0040] 2) cuando la población de la n.<ésima>generación en su totalidad cumpla la probabilidad de corte de inclusión de PPV preestablecida o la probabilidad de corte de exclusión de NPV preestablecida;

[0041] o 3) cuando la población de la n.<ésima>generación en su totalidad se añade a la compuesta que constituye los subconjuntos combinados de reglas de inclusión de la población de generaciones anteriores, la población compuesta de inclusión resultante cumple la probabilidad de corte preestablecida de inclusión del PPV, o cuando la población de la n.<ésima>generación en su totalidad se añade a la compuesta que constituye los subconjuntos combinados de exclusión de la población de generaciones anteriores, la población compuesta de exclusión resultante cumple la probabilidad de corte de exclusión del NPV. Cuando los métodos se emplean con el objetivo de encontrar una prueba de diagnóstico/pronóstico con un PPV igual o mejor que un valor de corte preestablecido, la etapa final de segregación generalmente emplea un modelo definido por el PPV.

[0042] Cuando los métodos se emplean con el objetivo de encontrar una prueba de exclusión de diagnóstico/pronóstico con un NPV igual o mejor que un valor de corte preestablecido, la etapa final de segregación emplea generalmente un modelo definido por el NPV.

[0043] Cuando los métodos se emplean con el objetivo de encontrar una prueba diagnóstica/pronóstica combinada de inclusión y exclusión con un PPV igual o mejor que un valor de corte preestablecido, y un NPV igual o mejor que un valor de corte preestablecido, cualquiera de las etapas de segregación puede considerar un modelo definido por el PPV o el NPV, de tal manera que las poblaciones compuestas de inclusión, obtenidas en diferentes etapas de segregación, cumplan al menos el valor de corte de PPV preestablecido, y las poblaciones compuestas de exclusión, obtenidas en diferentes etapas de segregación, cumplan al menos el valor de corte de NPV preestablecido.

[0045] Cuando los métodos de la invención se refieren a detectar o predecir el riesgo de un trastorno del embarazo, el método emplea generalmente una población de sujetos de prueba, al menos algunos de los cuales tienen o desarrollarán el trastorno. Se obtienen datos de medición de una pluralidad de variables de diagnóstico o pronóstico de cada uno de los sujetos. Las variables pueden seleccionarse entre características biométricas, de estilo de vida y fisiológicas, y en una realización particular, las variables incluirán moléculas biológicas como proteínas, metabolitos o combinaciones de los mismos. Los datos de la medición pueden obtenerse de una población de prueba en la que algunos de los sujetos tienen el trastorno del embarazo en el momento de la medición, o de una población de prueba en la que ninguno de los sujetos tiene la afección (o síntomas de la afección) en el momento de la medición, pero posteriormente desarrolla la afección (es decir, un estudio anidado para su uso en la generación de un modelo para predecir el riesgo de desarrollar el trastorno del embarazo). Algunos ejemplos de esto último serían una población de prueba utilizada en la generación de un modelo para predecir el riesgo de desarrollar preeclampsia en una mujer en una fase temprana del embarazo, o un modelo para predecir el riesgo de desarrollar cánceres secundarios en pacientes con cáncer primario. En ambos casos, los sujetos de la población de prueba no presentan el trastorno objetivo del embarazo en el momento de la medición.

[0047] En un primer aspecto, la invención proporciona un método de generación de un modelo M para detectar, o predecir el riesgo de, un resultado, comprendiendo el método las etapas de proporcionar una población de muestras de prueba (es decir, sujetos, escenarios, productos) y datos de medición para una pluralidad (n) de variables para cada una de las muestras de prueba, y a partir de ello, generar un primer modelo M1, que comprende de 1 a n variables, configurado para predecir la presencia o el riesgo de desarrollo del resultado. El modelo M1 está configurado para segregar la población de muestras de prueba en subconjuntos poblacionales de primera generación A y B en los que las muestras del subconjunto poblacional de primera generación A tienen una probabilidad seleccionada entre una probabilidad de exclusión (es decir, una probabilidad del resultado inferior o igual a una probabilidad de corte de exclusión predefinida) y una probabilidad de inclusión (es decir, una probabilidad del resultado superior o igual a una probabilidad de corte de inclusión predefinida). A continuación, la población de muestras se segrega basándose en el primer modelo M1 en subconjuntos poblacionales de primera generación A y B.

[0049] Cuando el subconjunto poblacional de primera generación B comprende un número suficiente de muestras, se genera un segundo modelo M2 que comprende de 1 a n variables, que está configurado para predecir la presencia o el riesgo del resultado en el subconjunto poblacional de primera generación B. El modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que las muestras del subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre una probabilidad de exclusión (es decir, una probabilidad del resultado inferior o igual a una probabilidad de corte de exclusión predefinida) y una probabilidad de inclusión (es decir, una probabilidad del resultado superior o igual a una probabilidad de corte de inclusión predefinida). A continuación, el subconjunto poblacional de primera generación B se segrega basándose en el segundo modelo M2 en los subconjuntos poblacionales de segunda generación A y B. El modelo M comprende el primer modelo M1 y el segundo modelo M2 que se aplican generalmente a una muestra de forma secuencial. En la práctica, los dos modelos pueden combinarse en un único algoritmo, o emplearse dos algoritmos en secuencia. Se puede emitir un valor representativo o indicativo de una detección, o de una predicción de riesgo, del trastorno del embarazo en el sujeto basado en dicho modelo M.

[0051] El método de la invención puede aplicarse para generar modelos de predicción de distintos tipos de resultados, en una serie de campos diferentes, como la medicina, la radiología, la biometría, la predicción de riesgos naturales, la meteorología, el aprendizaje automático y la investigación en minería de datos. Un ámbito de aplicación particular es el de los diagnósticos y pronósticos médicos, especialmente la predicción del riesgo de que un sujeto padezca o desarrolle un trastorno particular del embarazo, particularmente afecciones sindrómicas como la preeclampsia.

[0053] En un aspecto, la invención proporciona un método de generación de un modelo M para detectar, o predecir el riesgo de, un trastorno del embarazo en un sujeto, comprendiendo el método las etapas de proporcionar una población de sujetos de prueba y datos de medida para una pluralidad (n) de variables para cada uno de los sujetos de prueba seleccionadas entre características biométricas, de estilo de vida y fisiológicas, y a partir de ello, generar un primer modelo M1, que comprende de 1 a n variables, configurado para predecir la presencia o predisposición a desarrollar un trastorno del embarazo en la población de sujetos de prueba. El modelo M1 está configurado para segregar la población de sujetos de ensayo en subconjuntos poblacionales de primera generación A y B en los que los sujetos del subconjunto poblacional de primera generación A tienen una probabilidad seleccionada entre una probabilidad de exclusión (es decir, una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida) y una probabilidad de inclusión (es decir, una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida). A continuación, la población de sujetos se segrega basándose en el primer modelo M1 en subconjuntos poblacionales de primera generación A y B.

[0054] Cuando el subconjunto poblacional de primera generación B comprende un número suficiente de sujetos, se genera un segundo modelo M2 que comprende de 1 a n variables, que está configurado para predecir la presencia o predisposición de desarrollar un trastorno del embarazo en el subconjunto poblacional de primera generación B. El modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre una probabilidad de exclusión (es decir, una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida) y una probabilidad de inclusión (es decir, una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida). A continuación, el subconjunto poblacional de primera generación B se segrega, basándose en el segundo modelo M2, en los subconjuntos poblacionales de segunda generación A y B. El modelo M comprende el primer modelo M1 y el segundo modelo M2 aplicados secuencialmente. En la práctica, los dos modelos pueden combinarse en un único algoritmo, o emplearse dos algoritmos en secuencia.

[0055] En una realización, los sujetos del subconjunto poblacional de primera generación A tienen una probabilidad de tener o desarrollar el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida, y los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad de tener o desarrollar el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida. Cuando el método se restringe a dos etapas, el modelo M2 se configura generalmente para segregar el primer subconjunto poblacional B de tal manera que los sujetos del subconjunto poblacional de segunda generación A tengan una probabilidad de tener o desarrollar el trastorno del embarazo mayor o igual que un valor de corte de PPV de inclusión predefinido.

[0056] En una realización, los sujetos del subconjunto poblacional de primera generación A tienen una probabilidad de tener o desarrollar el trastorno del embarazo mayor o igual que una probabilidad de corte de inclusión predefinida, y los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad de tener o desarrollar el trastorno del embarazo menor o igual que una probabilidad de corte de exclusión predefinida. Cuando el método se restringe a dos etapas, el modelo M2 se configura generalmente para segregar el primer subconjunto poblacional B de forma que los sujetos del subconjunto poblacional de segunda generación A tengan una probabilidad de tener o desarrollar el trastorno del embarazo inferior o igual a un valor de corte de PPV de inclusión predefinido.

[0057] En una realización, el método comprende una etapa de segregación adicional que comprende:

[0058] Cuando el subconjunto poblacional de segunda generación B comprende un número suficiente de sujetos, generar un tercer modelo M3 que comprende de 1 a n variables, configurado para predecir la presencia o el riesgo de desarrollar un trastorno del embarazo en el subconjunto poblacional de segunda generación B, en donde el modelo M3 está configurado para segregar el subconjunto poblacional de segunda generación B en subconjuntos poblacionales de tercera generación A y B en los que los sujetos del subconjunto poblacional de tercera generación A tienen una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a una probabilidad de exclusión predefinida (por ejemplo, un valor de corte de NPV predefinido); o una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a una probabilidad de inclusión predefinida (por ejemplo, un valor de corte de PPV predefinido); y

[0059] segmentar el otro de los subconjuntos poblacionales de segunda generación basándose en el tercer modelo M3 en subconjuntos poblacionales de tercera generación A y B.

[0060] En una realización, el primer modelo M1 está configurado para segmentar la población de sujetos de prueba de tal manera que los sujetos el subconjunto poblacional de primera generación A tienen una probabilidad de tener/desarrollar el trastorno del embarazo superior a una probabilidad de corte de inclusión predefinida; el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de tal manera que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad de tener/desarrollar el trastorno del embarazo inferior a una probabilidad de corte de exclusión predefinida; y el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de forma que los sujetos del subconjunto poblacional de tercera generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo superior a un valor de corte de PPV de inclusión predefinido.

[0061] [Inclusión > Exclusión > Inclusión]

[0062] En una realización, el primer modelo M1 está configurado para segmentar la población de sujetos de ensayo de manera que los sujetos el subconjunto poblacional de primera generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo inferior a una probabilidad de corte de exclusión predefinida; el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de manera que los sujetos del subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo superior a una probabilidad de corte de inclusión predefinida; y

[0063] el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de forma que los sujetos del subconjunto poblacional de tercera generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo inferior a un valor de corte de NPV de exclusión predefinido.

[0064] [Exclusión > Inclusión > Exclusión]

[0065] En una realización, el primer modelo M1 está configurado para segmentar la población de sujetos de prueba de forma que los sujetos del subconjunto A de la población de primera generación tengan una probabilidad de tener/desarrollar el trastorno del embarazo superior a un valor de corte de PPV de inclusión predefinido; el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de forma que los sujetos del subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo inferior a una probabilidad de corte de exclusión predefinida; y

[0066] el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de modo que los sujetos del subconjunto poblacional de tercera generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo de modo que la población compuesta de inclusión que constituye el subconjunto combinado de población de primera generación A y la población de tercera generación A tenga una probabilidad superior a un valor de corte PPV de inclusión predefinido. [Inclusión > Exclusión > Inclusión -compuesto]

[0067] En una realización, el primer modelo M1 está configurado para segmentar la población de sujetos de prueba de tal manera que los sujetos del subconjunto poblacional de primera generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo inferior a un valor de corte de NPV de exclusión predefinido; el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de manera que los sujetos del subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo superior a una probabilidad de corte de inclusión predefinida; y

[0068] el tercer modelo M3 está configurado para segmentar el subconjunto de población de segunda generación B de modo que los sujetos del subconjunto de población de tercera generación A tengan una probabilidad de tener/desarrollar el trastorno del embarazo de modo que la población compuesta de exclusión que constituye el subconjunto combinado de población de primera generación A y la población de tercera generación A tenga una probabilidad inferior a un valor de corte de NPV de exclusión predefinido. [Exclusión > Inclusión > Exclusión -compuesto]

[0069] En una realización, el método incluye etapas de segregación adicionales, por ejemplo 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 etapas adicionales. Cada etapa adicional de segmentación puede comprender las etapas de: cuando el subconjunto poblacional B de n.<ésima>generación comprende un número suficiente de sujetos, generar un (n+1).<ésimo>modelo M<n+1>que comprende de 1 a n variables, configurado para predecir la presencia o el riesgo de desarrollar un trastorno del embarazo en el subconjunto poblacional de n.<ésima>generación B, en donde el modelo M<n+1>está configurado para segregar el subconjunto poblacional de n.<ésima>generación B en el subconjunto poblacional de (n+1).<ésima>generación A y B tal que los sujetos del subconjunto poblacional de (n+1).<ésima>generación A tienen una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a un valor de corte de NPV de exclusión predefinido; o una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a un valor de corte de PPV de inclusión predefinido; y

[0070] segmentar el subconjunto poblacional de n.<ésima>generación B basándose en el (n+1).<ésimo>modelo multivariante en los subconjuntos poblacionales de (n+1).<ésima>generación A y B.

[0071] Generalmente, el modelo empleado en la etapa final de segregación en el método está configurado para segregar la población en subconjuntos en los que uno de los subconjuntos tiene una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a un valor de corte de NPV de exclusión predefinido; o una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a un valor de corte de PPV de inclusión predefinido.

[0072] En una realización, se repiten etapas sucesivas de segmentación hasta que se genera un subconjunto poblacional que no puede segmentarse más.

[0073] En una realización, el método incluye etapas de segregación adicionales, por ejemplo 1, 2, 3, 4, 5, 6, 7, 8, 9 o 10 etapas adicionales. Cada etapa adicional de segmentación puede comprender las etapas de: cuando el conjunto poblacional de n.<ésima>generación B comprende un número suficiente de sujetos, generar un (n+1).<ésimo>modelo M<n+1>que comprende de 1 a n variables, configurado para predecir la presencia o el riesgo de desarrollar un trastorno del embarazo en el conjunto poblacional de n.<ésima>generación B, en donde el modelo M<n+1>está configurado para segregar el subconjunto poblacional de n.<ésima>generación B en el subconjunto poblacional de (n+1).<ésima>generación A y B,

[0074] en donde cuando los sujetos del subconjunto poblacional de (n+1).<ésima>generación A se añaden a los subconjuntos combinados de población A de inclusión de generaciones anteriores, la población compuesta de inclusión tiene una probabilidad superior o igual a un valor de corte de PPV de inclusión predefinido de tener/desarrollar la afección; o bien

[0075] en donde cuando los sujetos del subconjunto poblacional de (n+1).<ésima>generación A se añaden a los subconjuntos A combinados de población descartada de generaciones anteriores, la población descartada compuesta tiene una probabilidad inferior o igual a un valor de corte de NPV de exclusión predefinido de tener/desarrollar la afección; y

[0076] segmentar el subconjunto poblacional de n.<ésima>generación B basándose en el (n+1).<ésimo>modelo multivariante en los subconjuntos poblacionales de (n+1).<ésima>generación A y B.

[0077] En una realización, se repiten etapas sucesivas de segmentación hasta que se genera un subconjunto poblacional que no puede segmentarse más.

[0078] En una realización, la probabilidad de corte de inclusión aplicada a un modelo de inclusión se refiere al umbral de corte para el parámetro de probabilidad seleccionado entre PPV (valor predictivo positivo), especificidad (tasa de 1-falso positivo; 1-FPR) o razón de probabilidad positiva (PLR), determinado por una persona experta en la técnica y teniendo en cuenta la prevalencia del trastorno del embarazo.

[0079] En una realización, la probabilidad de corte de exclusión aplicada a un modelo de exclusión se refiere al umbral de corte para el parámetro de probabilidad seleccionado entre NPV (valor predictivo negativo), sensibilidad (1-tasa de falsos negativos; 1-FNR) o relación de probabilidad negativa (PLR), determinado por una persona experta en la técnica y teniendo en cuenta la prevalencia del trastorno del embarazo.

[0080] En una realización, cuando uno de los subconjuntos poblacionales no comprende un número suficiente de sujetos, se repite la etapa de segregación anterior utilizando un modelo alternativo configurado para generar un subconjunto poblacional con un número suficiente de sujetos.

[0081] El modelo generado por el método de la invención comprende al menos dos modelos, a saber, al menos un modelo de inclusión y al menos un modelo de exclusión. Los modelos, generados según el método de la invención, pueden aplicarse a un sujeto para determinar la probabilidad de que el sujeto tenga o no un trastorno del embarazo (diagnóstico), o para determinar la probabilidad de que el sujeto desarrolle o no un trastorno del embarazo en el futuro (pronóstico). Por ejemplo, si los modelos son un primer modelo de exclusión y un segundo modelo de inclusión, si el sujeto no se ajusta al modelo de exclusión pero sí al modelo de inclusión, el sujeto tiene un alto riesgo de padecer (o desarrollar) un trastorno del embarazo, según el parámetro de probabilidad seleccionado. Del mismo modo, si los modelos son un primer modelo de inclusión y un segundo modelo de exclusión, si el sujeto no se ajusta al modelo de inclusión pero sí al modelo de exclusión, el sujeto tiene un riesgo bajo de tener (o desarrollar) un trastorno del embarazo según el parámetro de probabilidad seleccionado. En algunos aspectos, dependiendo de si el sujeto se ajusta al primer modelo, puede no ser necesario determinar si el sujeto se ajusta al segundo modelo.

[0082] En otro aspecto, la invención proporciona un método de detección del riesgo de que un sujeto tenga o desarrolle un trastorno del embarazo utilizando el modelo M generado según un método de la invención. El método comprende típicamente las etapas de:

[0083] utilizar el primer modelo M1 para determinar si el sujeto tiene una probabilidad de tener/desarrollar el trastorno del embarazo seleccionada entre una de: una probabilidad inferior o igual a una primera probabilidad de exclusión predefinida; y una probabilidad superior o igual a una primera probabilidad de inclusión predefinida; y

[0084] opcionalmente, utilizar el segundo modelo M2 para determinar si el sujeto tiene una probabilidad de tener/desarrollar el trastorno del embarazo seleccionado entre el otro de: una probabilidad inferior o igual a una segunda probabilidad de exclusión predefinida; o una probabilidad superior o igual a una segunda probabilidad de inclusión predefinida.

[0085] En una realización, cuando el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es superior a una primera probabilidad de corte de exclusión predefinida, el segundo modelo M2 se emplea para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es superior o igual a una segunda probabilidad de inclusión predefinida (por ejemplo, un corte de inclusión de PPV); en donde cuando el segundo modelo M2 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es mayor o igual que una segunda probabilidad de inclusión predefinida (por ejemplo, un corte de inclusión de PPV), se determina que el sujeto tiene una alta probabilidad de tener o desarrollar el trastorno del embarazo; [exclusión > inclusión] En una realización, cuando el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior a una primera probabilidad de corte de inclusión predefinida, el segundo modelo M2 se emplea para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior o igual a una segunda probabilidad de corte de exclusión predefinida (por ejemplo un corte de exclusión de NPV); en donde cuando el segundo modelo M2 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior o igual a una segunda probabilidad de exclusión predefinida (por ejemplo, un límite de exclusión de NPV), se determina que el sujeto tiene una baja probabilidad de tener o desarrollar el trastorno del embarazo. [Inclusión > Exclusión] En una realización, cuando el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior o igual a una primera probabilidad de corte de exclusión predefinida (por ejemplo, un corte de NPV de exclusión), se determina que el sujeto tiene una probabilidad baja de tener o desarrollar el trastorno del embarazo;

[0086] En una realización, cuando el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es superior o igual a una primera probabilidad de corte de inclusión predefinida (por ejemplo, corte de PPV de inclusión), se determina que el sujeto tiene una alta probabilidad de tener o desarrollar el trastorno del embarazo;

[0087] En una realización, el método comprende las etapas de:

[0088] utilizar el primer modelo M1 para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo seleccionada entre una de: una probabilidad inferior o igual a un valor de corte de NPV de exclusión predefinido; y una probabilidad superior o igual a un valor de corte de PPV de inclusión predefinido;

[0089] cuando el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es superior al primer valor de corte de NPV de exclusión predefinido O el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior al primer valor de corte de PPV de inclusión predefinido,

[0090] utilizar el segundo modelo M2 para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo seleccionado entre el otro de: una probabilidad inferior o igual al valor de corte de NPV de exclusión predefinido; o una probabilidad superior o igual al valor de corte de PPV de inclusión predefinido; y

[0091] cuando el segundo modelo M2 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es superior al primer valor de corte de NPV de exclusión predefinido O el segundo modelo M2 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior al primer valor de corte de PPV de inclusión predefinido, se utiliza el tercer modelo M3 para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo seleccionada entre una de: una probabilidad inferior o igual al valor de corte de NPV de exclusión predefinido; o una probabilidad superior o igual a la probabilidad de PPV de inclusión predefinida.

[0092] [Inclusión/Exclusión > Inclusión/Exclusión > Inclusión/Exclusión]

[0093] En una realización, el método comprende las etapas de:

[0094] utilizar el primer modelo M1 para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo superior o igual a un valor de corte de PPV de inclusión predefinido;

[0095] en donde cuando el primer modelo M1 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior al valor de corte de PPV de inclusión predefinido, el segundo modelo se emplea para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es inferior o igual a un valor de corte de NPV de exclusión predefinido;

[0096] en donde cuando el segundo modelo M2 determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es mayor que el valor de corte de NPV de exclusión predefinido, el tercer modelo M3 se emplea para determinar si el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es menor o igual que el valor de corte de NPV de exclusión predefinido; en donde cuando el tercer modelo determina que el sujeto tiene una probabilidad de tener o desarrollar el trastorno del embarazo que es mayor que el tercer valor de corte predefinido de NPV de exclusión predefinido, se determina que el sujeto tiene una alta probabilidad de tener/desarrollar el trastorno del embarazo.

[0097] En una realización, la pluralidad de variables incluye al menos dos variables seleccionadas entre un metabolito, una proteína y un factor de riesgo clínico.

[0098] En una realización, la pluralidad de variables incluye una pluralidad de metabolitos, opcionalmente en combinación con al menos una proteína o factor de riesgo clínico.

[0099] En una realización, el trastorno del embarazo es un trastorno relacionado con el embarazo. En una realización, el trastorno del embarazo se selecciona entre preeclampsia, y las variables incluyen metabolitos y/o proteínas. Se proporciona también un programa de ordenador que comprende instrucciones de programa para hacer que un programa de ordenador lleve a cabo un método de la invención que puede estar incorporado en un medio de registro, señal portadora o memoria de solo lectura.

[0100] También se proporciona un sistema implementado por ordenador para generar un modelo M para detectar o predecir el riesgo de un trastorno del embarazo en un sujeto. En una realización, el sistema implementado por ordenador comprende:

[0101] un módulo o medio para proporcionar una población de sujetos de prueba y datos de medición para una pluralidad (n) de variables para cada uno de los sujetos de prueba seleccionados entre características biométricas, de estilo de vida y/o fisiológicas;

[0102] un módulo o medio para proporcionar un primer modelo M1 configurado para predecir la presencia o el riesgo del trastorno del embarazo en la población de sujetos de ensayo que comprende de 1 a n variables, en donde el modelo M1 está configurado para segregar la población de sujetos de ensayo en subconjuntos poblacionales de primera generación A y B en los que los sujetos del subconjunto poblacional de primera generación A tienen una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida;

[0103] un módulo o medio para segmentar la población de sujetos basándose en el primer modelo M1 en subconjuntos poblacionales de primera generación A y B;

[0104] opcionalmente, un módulo o medio para determinar cuándo el subconjunto poblacional de primera generación B comprende un número suficiente de sujetos;

[0105] un módulo o medio para proporcionar un segundo modelo M2 configurado para predecir la presencia o el riesgo del trastorno del embarazo en el subconjunto poblacional de primera generación B, el modelo comprende de 1 a n variables, en donde el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre la otra de: una probabilidad de tener/desarrollar el trastorno del embarazo inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar el trastorno del embarazo superior o igual a una probabilidad de corte de inclusión predefinida; y

[0106] un módulo o medio para segmentar el subconjunto poblacional de primera generación B basado en el segundo modelo M2 en subconjuntos poblacionales de segunda generación A y B;

[0107] en donde el modelo M comprende el primer modelo M1 y el segundo modelo M2.

[0108] Las realizaciones de la invención descritas comprenden un aparato informático y/o procesos realizados en un aparato informático. Sin embargo, la invención también se extiende a los programas de ordenador, particularmente a los programas de ordenador almacenados en o sobre un soporte adaptado para poner en práctica la invención. El programa puede estar en forma de código fuente, código objeto o un código intermedio entre código fuente y código objeto, como por ejemplo en forma parcialmente compilada o en cualquier otra forma adecuada para su uso en la implementación del método según la invención. El soporte puede comprender un medio de almacenamiento como una ROM, p. ej. un CD ROM, o un medio de grabación magnética, p. ej. un disquete o un disco duro. El portador puede ser una señal eléctrica u óptica que puede transmitirse a través de un cable eléctrico u óptico o por radio u otros medios.

[0109] Otros aspectos y realizaciones preferidos de la invención se definen y describen en las demás reivindicaciones expuestas más adelante.

[0110] Breve descripción de los dibujos

[0111] La Fig. 1es una representación gráfica de una población hipotética de "caso base" (antes de la prueba) con una incidencia de resultados del 5 % (p= 0,05).

[0112] La Fig.2es una representación gráfica de un hipotético clasificador de resultados perfecto para la población hipotética del "caso base".

[0113] La Fig. 3es una representación gráfica de un clasificador de inclusión con una tasa de detección de resultados del 50 % con un umbral de FPR del 20 % para la población hipotética del "caso base".

[0114] La Fig.4es una representación gráfica de un clasificador hipotético de inclusión con una tasa de detección de resultados del 50 % a una FPR del 20 % para la población hipotética del "caso base" representada en el espacio ROC.

[0115] La Fig. 5es una representación gráfica de los clasificadores de inclusión con una tasa de detección del 50 % a una FPR del 20 %: Panel A: incidencia de resultados p= 0,025. Panel B: incidencia de resultados p= 0,1

[0116] La Fig.6es una representación gráfica de un clasificador de inclusión con una tasa de detección del 50 % con un PPV= 0,2 para la población hipotética del "caso base".

[0117] La Fig.7es una curva ROC de un clasificador hipotético de inclusión que proporciona una tasa de detección del 50 % con un PPV= 0,2 para la población hipotética del "caso base" representada en el espacio ROC.

[0118] La Fig.8es una representación gráfica de un clasificador de inclusión con una tasa de detección del 50 % con un umbral de PPV= 0,2. Panel A: incidencia de resultados p= 0,025. Panel B: incidencia de resultados p= 0,1.

[0119] Fig. 9:Clasificador hipotético de inclusión (Fig.7) representado en el espacio ROC con un umbral de PPV= 0,2. Panel A: Incidencia del resultado p= 0,025; el clasificador (apenas) detecta el 36 % de los futuros casos con el criterio aplicado. Panel B: Incidencia del resultado p= 0,1; el clasificador detecta el 83 % de los futuros casos con el criterio aplicado.

[0120] Fig.10:Panel A: Clasificador de exclusión con especificidad = 0,5 (tasa de detección del 50 % de futuros no casos) con un umbral de FNR del 10 % para la población hipotética del "caso base": Panel B: Clasificador hipotético de exclusión que proporciona una especificidad = 0,5 (o una tasa de detección del 50 % para futuros no casos) con una NPR del 10 % representada en el espacio ROC para la población hipotética del "caso base"

[0121] Fig. 11:Clasificadores de exclusión con especificidad = 0,5 con un umbral de FNR del 10 %; Panel A: Incidencia de resultados p =0,025; Panel B: Incidencia de resultados p = 0,1.

[0122] Fig. 12:Clasificador hipotético de exclusión que proporciona una especificidad = 0,5 con un NPV = 0,99 para la población hipotética del "caso base" representada en el espacio ROC.

[0123] Fig. 13:Clasificador hipotético de exclusión representado en el espacio ROC con un umbral de NPV = 0,99 (Fig. 12). Panel A: Incidencia del resultado p= 0,025; detecta el 80 % de los futuros no casos (verdaderos negativos) con el criterio aplicado. Panel B: Incidencia del resultado p= 0,1; el clasificador apenas detecta un 5 % de futuros no casos (verdaderos negativos) con el criterio aplicado.

[0124] Fig. 14:Ilustración de los requisitos mínimos, es decir, una tasa de detección del 70 % para un PPV = 0,2 para una prueba inclusión clínicamente significativa (hipotética) para una incidencia (o prevalencia) del resultado del 5 % (población hipotética del "caso base"). Panel A: El clasificador de inclusión proporciona una tasa de detección del 70 % con un PPV= 0,2 (o 4 falsos positivos / verdadero positivo). Panel B: Representación de los requisitos mínimos en el espacio ROC; punto de corte de la recta de PPV= 0,2 y de la recta de sensibilidad = 0,7. Cualquier clasificador con una curva ROC con puntos en el área "A" cumpliría el criterio mínimo.

[0125] Fig. 15:Establecimiento de la clasificación de inclusión mediante una estrategia secuencial; etapa 1. Aplicación de una clasificación de exclusión que da lugar a una Pob.-estudio 2 (transitoria) enriquecida en futuros casos. Panel A: Clasificador de exclusión con especificidad = 0,5 (tasa de detección del 50 % de futuros no casos) con un umbral de FNR del 10 %: Panel B Clasificador hipotético de exclusión que proporciona una especificidad = 0,5 (o una tasa de detección del 50 % para futuros no casos) con una NPR del 10 % representada en el espacio ROC.

[0127] Fig. 16:Establecimiento de la clasificación de inclusión mediante una estrategia secuencial; etapa 2. Aplicación de una clasificación de inclusión que da lugar al grupo final de alto riesgo (prueba positiva). Panel A: Clasificador de inclusión con sensibilidad = 0,77 (tasa de detección del 77 % de futuros casos) con un umbral de PPV= 0,2: Panel B: Clasificador hipotético de inclusión que proporciona sensibilidad = 0,77 con un PPV= 0,2 representado en el espacio ROC. Cualquier clasificador con una curva ROC con puntos en el área "A" cumpliría el criterio mínimo.

[0129] Fig. 17:Ilustración de los requisitos mínimos, es decir, especificidad=0,5 (es decir, tasa de detección del 50 % de futuros no casos) para NPV = 0,99 para una prueba de exclusión clínicamente significativa (hipotética) para una incidencia (o prevalencia) del resultado del 10 %. Panel A: Población "caso base 2" (antes de la prueba). Panel B: Clasificador de exclusión que proporciona especificidad = 0,5 con NPV= 0,99 (o 1 Falso negativo / 99 Verdaderos negativos). Panel C: Representación de los requisitos mínimos en el espacio ROC; punto de corte de la recta de NPV= 0,99 y de la recta de especificidad = 0,5 %. Cualquier clasificador con una curva ROC con puntos en el área "A" cumpliría el criterio mínimo.

[0131] Fig. 18:Establecimiento de la clasificación de exclusión mediante una estrategia secuencial; etapa 1. Aplicación de una clasificación de inclusión que da lugar a una pob. de estudio 2 (transitoria) enriquecida en futuros no casos. Panel A: Clasificador de inclusión con sensibilidad = 0,7 (tasa de detección del 70 % de futuros casos) con un umbral de FPR del 20 %: Panel B: Clasificador hipotético de inclusión que proporciona una sensibilidad = 0,7 (o una tasa de detección del 70 % para futuros no casos) con un 20 % de FPR representado en el espacio ROC.

[0133] Fig. 19:Establecimiento de la clasificación de exclusión mediante una estrategia secuencial; etapa 2. Aplicación de una clasificación de exclusión que da como resultado final el grupo de bajo riesgo (prueba positiva). Panel A: Clasificador de exclusión con especificidad = 0,625 (tasa de detección del 62,5 % de futuros no casos) en el umbral de NPV= 0,99: Panel B: Clasificador hipotético de exclusión que proporciona especificidad = 0,625 con NPV= 0,99 representado en el espacio ROC. Cualquier clasificador con una curva ROC con puntos en el área "A" cumpliría el criterio mínimo.

[0135] Fig. 20:Ilustración de los requisitos mínimos para una prueba pronóstica clínicamente significativa (hipotética) para una incidencia (o prevalencia) del resultado del 5 % (la población hipotética del "caso base"). Representación de los requisitos en el espacio ROC; para cualquier clasificador, las puntuaciones de riesgo que coincidan con un punto en el área "A" cumplirían el criterio mínimo de inclusión, las puntuaciones de riesgo que coincidan con un punto en el área "B" cumplirían el criterio mínimo de exclusión. Para que un clasificador cumpla los criterios de inclusión y exclusión al mismo tiempo, su curva ROC asociada tendrá puntos en el área de intersección (A ∩ B).

[0137] Fig. 21:Establecer una clasificación pronóstica extraordinaria (hipotética) que cumpla tanto un criterio preestablecido PPV>= 0,2 como un NPV>= 0,99, para una incidencia (o prevalencia) del resultado del 5 % (la población hipotética del "caso base"). La clasificación total sigue la aplicación de una estrategia de clasificación por etapas aumentada con un criterio de decisión [clasificación completa sí/no] en cada etapa. Panel A: Población del estudio antes de la prueba (Pob.-estudio 1). Panel B: 1.ª etapa: Clasificador de inclusión que da como resultado el grupo de alto riesgo PobHR1 (totalmente clasificado) y una nueva Pob. de estudio 2. Panel C: 2.ª etapa: Clasificador de exclusión aplicado a la Pob.-estudio 2 que da como resultado el grupo de bajo riesgo PopLR1 (totalmente clasificado) y una nueva Pob.-estudio 3. Panel D: 3.ª etapa: Clasificador de exclusión aplicado a la Pob.-estudio 3 que da como resultado el grupo de bajo riesgo PopLR2 (totalmente clasificado) y una nueva Pob.-estudio 4. Panel E: 4.ª etapa: Clasificador de inclusión que da como resultado el grupo de alto riesgo PobHR2 (totalmente clasificado) y una población residual, aún sin clasificar. Panel F: Resultado total de la clasificación presentado en "formato de cuadrícula" que representa el resultado si la población residual de la etapa 4 se considerara de bajo riesgo. Panel G: Representación del resultado total de clasificación presentado en el espacio ROC.

[0139] Fig. 22:Ilustración de la clasificación pronóstica total (hipotética) que cumple tanto un criterio de inclusión preestablecido PPV >= 0,2 como NPV >= 0,99, para una incidencia (o prevalencia) del resultado del 5 % (la población hipotética del "caso base"). La clasificación total sigue la aplicación de una estrategia de clasificación por etapas aumentada con un criterio de decisión [clasificación completa sí/no] en cada etapa. La clasificación total resultante produce 2 umbrales, es decir, pares específicos [sensibilidad - especificidad] en el espacio ROC, que corresponden a un umbral de clasificación de inclusión (rombo en el área "A"; grupo de alto riesgo) y a un umbral de clasificación de exclusión (punto en el área "B"; grupo de bajo riesgo). Los individuos que no se clasifican ni en el grupo de alto riesgo ni en el de bajo riesgo, se consideran no clasificados.

[0141] Fig. 23:Ejemplo 4A; Aplicación secuencial de un clasificador de exclusión seguido de un clasificador de inclusión para lograr un rendimiento pronóstico para predecir "Todas las PE" en función de un valor de corte de PPV preestablecido. Panel A: el valor de corte del PPV = 0,133 para una prevalencia antes de la prueba de futura PE de p = 0,05 trazada en el espacio ROC. Panel B: Etapa 1; curva ROC correspondiente a un clasificador de exclusión seleccionado (bp s-ENG 1-HD) con el modelo M1: 0,292700587596098log10[s-ENG (MoM)] 0,0103090246336299 [2.°_sbp] - 0,335817558146904 log10 [1-HD].La clasificación de toda la población de prueba (P1) se realiza con un umbral de FNR del 10 %. Esto corresponde a una puntuación umbral de exclusión del modelo M1 inferior a (<)0,66643052785405. El resultado es que el 38,3 % de los verdaderos negativos (futuros no casos) se clasifican como de bajo riesgo, junto con el 10 % de los futuros casos de PE (falsos negativos); estos individuos se eliminan de la población de prueba. Panel C: Paso2; Curva ROC correspondiente a un clasificador de inclusión ilustrativo (bp PIGF DC) con el modelo M2:-0,195394942337404 log10 [PIGF (MoM)] 0,00590836118884227 [map_1.o]0,143670336856774log10 [DC]y puntuación de umbral de inclusión del modelo M2 mayor que (>)0,581930006682247, tal y como se aplicó en el resto de la población de prueba (P2), un clasificador inclusión para predecir "Todas las PE" en función del corte de PPV preestablecido. Siguiendo la clasificación de exclusión de la etapa 1, la prevalencia de futura PE se enriquece hasta p=0,071, lo que da lugar a un criterio de PPV más relajado = 0,133.

[0143] Fig. 24:Ejemplo 4B; Aplicación secuencial de un clasificador de exclusión seguido de un clasificador de inclusión para lograr un rendimiento pronóstico en la predicción de "PE pretérmino" en función de un valor de corte de PPV preestablecido. Panel A: el valor de corte de PPV = 0,071 para una prevalencia pretest de futura PE pretérmino de p = 0,014, trazada en el espacio ROC. Panel B: Etapa 1; curva ROC correspondiente a un clasificador de exclusión seleccionado (s-ENG DLG) con el modelo M1: 0,22139876465602log10 [s-ENG] 0,0162829949120052 log10 [DLG];la clasificación de toda la población de prueba (P1) se realiza con un umbral de FNR del 10 %. Esto corresponde a una puntuación umbral de exclusión del modelo M1 inferior a (<)0,710765699780132. El resultado es que el 43,7 % de los verdaderos negativos (futuros no casos) se clasifican como de bajo riesgo, junto con el 10 % de los futuros casos de PE pretérmino (falsos negativos); estos individuos se eliminan de la población de prueba. Panel C: Paso 2; Curva ROC correspondiente a un clasificador inclusión ilustrativo (PIGF s-ENG DLG 2-HBA) con el modelo M2;0,20043337818718 log10 [s-ENG (MoM)] -0,212088369466248log10 [PIGF_(MoM)]0,112046727485729log10[2-HBA] 0,227265325783904 log10 [DLG]y puntuación de umbral de inclusión del modelo M2 superior a (>)0,668333882056883 según se aplicó en el resto de la población de prueba (P2), un clasificador de inclusión para predecir la "PE pretérmino" en función del valor de corte de PPV preestablecido. Siguiendo la clasificación de exclusión de la etapa 1, la prevalencia de futura PE pretérmino se enriquece hasta p=0,023, lo que da lugar a un criterio de PPV = 0,071 más relajado.

[0145] Fig. 25:Ejemplo 4C; Aplicación secuencial de un clasificador de exclusión seguido de un clasificador de inclusión para lograr un rendimiento pronóstico para predecir la "PE a término" en función de un valor de corte de PPV preestablecido. Panel A: el valor de corte de PPV = 0,154 para una prevalencia pretest de futura PE pretérmino de p = 0,037, trazada en el espacio ROC. Panel B: Etapa 1; curva ROC correspondiente a un clasificador de exclusión seleccionado (bp 1-HD) con el modelo M1:0,0115467461789923 [map_1.o] -0,324977743714534log10 [1-HD];la clasificación de toda la población de prueba (P1) se realiza con un umbral de FNR del 10 %. Esto corresponde a una puntuación umbral de exclusión del modelo M1 inferior a (<)0,680257687736226. El resultado es que el 38,2 % de los verdaderos negativos (futuros no casos) se clasifican como de bajo riesgo, junto con el 10 % de los futuros casos de PE a término (falsos negativos); estos individuos se eliminan de la población de prueba. Panel C: Paso2; Curva ROC correspondiente a un clasificador inclusión ilustrativo (bp 1-HD NGM) con el modelo M2;0,0093936118486756 [2.°_sbp] 0,560572544580583 log10 [NGM] - 0,302082838614281 log10 [1-HD]y puntuación umbral inclusión del modelo M2 mayor que (>)0,581599411310977.según se aplica en el resto de la población de prueba (P2), un clasificador de inclusión para predecir la "PE a término" en función del valor de corte de PPV preestablecido. Siguiendo la clasificación de exclusión de la etapa 1, la prevalencia de futura PE pretérmino se enriquece hasta p=0,053, lo que da lugar a un criterio de PPV = 0,154 más relajado.

[0147] Fig. 26Ejemplo 4D1; Determinación de los criterios pronósticos mínimos para predecir la PE pretérmino. Para cualquier clasificador, las puntuaciones de riesgo que coincidan con un punto del área "A" cumplirían el criterio de inclusión del criterio mínimo, y las puntuaciones de riesgo que coincidan con un punto del área "B" cumplirían el criterio de exclusión del criterio mínimo. Para que un clasificador cumpla los criterios de inclusión y exclusión al mismo tiempo, su curva ROC asociada (o valores emparejados de sensibilidadespecificidad) tendrá un punto en el área de intersección (A ∩ B).

[0149] Fig. 27:Ejemplo 4D2 Niveles de PIGF en el momento del muestreo frente al momento del parto. Símbolo "estrella": PE pretérmino. símbolo "barra": PE a término. símbolo "círculo": ausencia de PE. El área "A" contiene futuros casos de PE prematura que no se verán afectados por la aplicación de un umbral de PIGF único, como se ha indicado. El umbral de PIGF clasifica a la población en "alto riesgo" (por debajo del umbral), por lo que el PPV >= 0,071. Por encima del umbral se tendrá en cuenta para una clasificación posterior (véase el texto).

[0150] Fig. 28:Ejemplo 4D3: Diagrama de dispersión que muestra los valores sanguíneos en el momento de la toma de muestras de las variables PIGF y Dilinoleoil-glicerol para los sujetos del estudio. Muestras del estudio etiquetadas según el resultado (futuro) del embarazo; es decir, ausencia de PE o PE "pretérmino". El área "A" indica una amplia zona en el diagrama de dispersión sin (futura) PE prematura.

[0151] Fig. 29:Ejemplo 4D4: Segmentación de la Pob.-estudio 1 utilizando un nivel de PIGF como clasificador de inclusión, de forma que la población "incluida" resultante cumpla el criterio de PPV preestablecido.

[0152] Fig. 30:Ejemplo 4D5 "Clasificación total" lograda aplicando una clasificación basada en PIGF (inclusión) en 1 etapa.

[0153] Fig. 31:Ejemplo 4D6 Segmentación de la Pob.-estudio 2 utilizando un nivel de DLG como clasificador de exclusión, de modo que la población "descartada" resultante cumpla el criterio de PPV preestablecido.Fig. 32:Ejemplo 4D7 "Clasificación total" lograda aplicando una clasificación en 2 etapas que incluye PIGF (inclusión) y DLG (exclusión), en la que el clasificador de inclusión y el de exclusión se consideran por separado. También se representa la clasificación negativa (no inclusión, no exclusión).

[0154] Fig. 33:Ejemplo 4D8 Segmentación adicional de la Pob.-estudio 3 utilizando un nivel de L-ERG como clasificador de exclusión.

[0155] Fig. 34:Ejemplo 4D9 "Clasificación total" lograda aplicando una clasificación en 3 etapas que incluye PIGF (inclusión), DLG (exclusión) y L-ERG (exclusión), en la que los clasificadores de inclusión y de exclusión se consideran por separado. También se representa la clasificación negativa (no inclusión, no exclusión x 2).

[0156] Fig. 35:Ejemplo 4D10 Segmentación adicional de la Pob.-estudio 4 utilizando un s-ENG como clasificador de exclusión, creando una 3.ª población excluida (Pop-LR3), así como una población residual. Esta población se considera una 2.ª población de alto riesgo (Pop-HR2)

[0157] Fig. 36:Ejemplo 4D11: "Clasificación total" lograda aplicando una clasificación en 3 etapas que incluye PIGF (inclusión), DLG (exclusión), L-ERG (exclusión) y s-ENG (exclusión). A. Los clasificadores de inclusión y exclusión se consideran por separado. También se representa la clasificación negativa (no inclusión, no exclusión x 3). B. El clasificador total se da como un clasificador único que clasifica a cualquier población gestante o mujer embarazada en un grupo de alto riesgo de desarrollar una PE pretérmino (con un PPV >= 0,071) o en un grupo de bajo riesgo de desarrollar una PE pretérmino (con un NPV >= 0,9975)Descripción detallada de la invención

[0158] Definiciones y preferencias generales

[0159] Donde se emplean en la presente memoria y a menos que se indique específicamente lo contrario, los siguientes términos tienen los siguientes significados, además de cualquier significado más amplio (o más restringido) que los términos puedan tener en la técnica:

[0160] Salvo que el contexto exija lo contrario, el uso del singular debe entenderse que incluye el plural yviceversa. Los términos "una", "uno" o "un" utilizados en relación con una entidad deben entenderse referidos a una o varias de esas entidades. Como tales, los términos "un" (o "una"), "uno o más" y "al menos uno" se emplean indistintamente en la presente memoria.

[0161] Como se emplea en esta memoria, el término "comprende", o variaciones del mismo tales como "comprende" o "que comprende", deben entenderse para indicar la inclusión de cualquier número entero recitado (p. ej. un rasgo, elemento, característica, propiedad, etapa o limitación de un método/proceso) o grupo de enteros (p. ej. rasgos, elementos, características, propiedades, etapas o limitaciones de un método/proceso) pero no la exclusión de cualquier otro entero o grupo de enteros. Adicionalmente, como se emplea en esta memoria, la expresión "que comprende" es inclusiva o abierta y no excluye enteros adicionales no repetidos o etapas del método/proceso.

[0162] Como se emplea en esta memoria, el término "resultado" se refiere al resultado de un suceso en el que son posibles dos o más resultados. Por ejemplo, en los pronósticos médicos, el resultado puede ser que el sujeto desarrolle o no un trastorno específico del embarazo. Los métodos de la invención consisten en generar modelos a partir de una población de sujetos que pueden aplicarse a un sujeto de prueba para predecir la probabilidad de que el sujeto desarrolle el trastorno del embarazo. Otro ejemplo es la predicción meteorológica, donde el resultado puede ser un fenómeno meteorológico definido, donde el modelo se genera utilizando una población de escenarios meteorológicos, y el modelo puede aplicarse a un escenario meteorológico específico para predecir la probabilidad de que se produzca el fenómeno meteorológico definido. Los métodos de la invención pueden utilizarse para predecir otros tipos de resultados. El término "muestra", como se emplea en esta memoria, se refiere a la composición de la población de prueba utilizada para generar los modelos. En el ámbito del diagnóstico o pronóstico médico, las muestras serán generalmente sujetos. Sin embargo, para otras aplicaciones de los métodos de la invención, las muestras pueden ser acontecimientos (por ejemplo, fenómenos meteorológicos), observaciones, escenarios, fenómenos o productos.

[0164] Como se emplea en esta memoria, la expresión "trastorno del embarazo" o "enfermedad" se utiliza para definir cualquier condición anómala que altere la función fisiológica y esté asociada a síntomas específicos. La expresión se utiliza en sentido amplio para englobar cualquier trastorno, enfermedad, anomalía, patología, dolencia, afección o síndrome en el que la función fisiológica esté alterada, independientemente de la naturaleza de la etiología (o incluso de si se ha establecido la base etiológica de la enfermedad). Abarca, por tanto, las afecciones derivadas de infecciones, traumatismos, lesiones, intervenciones quirúrgicas, ablaciones radiológicas, intoxicaciones o deficiencias nutricionales. Algunos ejemplos de trastornos del embarazo incluyen enfermedades inflamatorias, enfermedades metabólicas, enfermedades cardiovasculares, enfermedades autoinmunitarias, enfermedades neurológicas, enfermedades degenerativas, enfermedades hepáticas y enfermedades pulmonares. En una realización, el trastorno del embarazo es un trastorno sindrómico. En una realización, el trastorno del embarazo es un trastorno del embarazo, por ejemplo un trastorno hipertensivo del embarazo o una enfermedad metabólica asociada al embarazo. En una realización, el trastorno hipertensivo del embarazo es la preeclampsia, o un subtipo de preeclampsia seleccionado entre, p. ej., pero no limitado a, la preeclampsia pretérmino, la preeclampsia a término, la preeclampsia de aparición temprana y el síndrome HELLP. Como se emplea en esta memoria, el término "PE" se refiere a la preeclampsia.

[0166] Como se emplea en esta memoria, el término "trastorno hipertensivo del embarazo" se refiere a una complicación del embarazo caracterizada por hipertensión e incluye la hipertensión crónica (incluyendo la leve y la grave), la hipertensión gestacional, la preeclampsia y los subtipos de preeclampsia.

[0168] El término "preeclampsia" incluye la preeclampsia pretérmino, la preeclampsia a término y la preeclampsia de aparición temprana. La preeclampsia se define como tensión arterial elevada después de 20 semanas de gestación (≥140 mmHg sistólica o ≥90 mmHg diastólica) más proteinuria (>0,3 g/24 horas). El término "preeclampsia pretérmino" hace referencia a la aparición de preeclampsia que da lugar al alumbramiento del bebé antes de las 37 semanas de gestación.

[0170] Como se emplea en esta memoria, el término "tratamiento" o "tratar" se refiere a una intervención (p. ej., la administración de un agente a un sujeto, o la modificación de la dieta o el ejercicio, etc.) que cura, mejora o disminuye los síntomas de una enfermedad o elimina (o disminuye el impacto de) su(s) causa(s) (por ejemplo, la reducción de la acumulación de niveles patológicos de enzimas lisosomales). En este caso, el término se utiliza como sinónimo de "terapia".

[0172] Adicionalmente, los términos "tratamiento" o "tratar" se refieren a una intervención (p. ej., la administración de un agente a un sujeto) que previene o retrasa la aparición o progresión de una enfermedad o reduce (o erradica) su incidencia dentro de una población tratada. En este caso, el término tratamiento se utiliza como sinónimo del término "profilaxis".

[0174] Como se emplea en esta memoria, unacantidad eficazo unacantidad terapéuticamente eficazde un agente define una cantidad que puede administrarse a un sujeto sin toxicidad excesiva, irritación, respuesta alérgica u otro problema o complicación, acorde con una relación beneficio/riesgo razonable, pero que es suficiente para proporcionar el efecto deseado, p. ej., el tratamiento o profilaxis manifestado por una mejora permanente o temporal de la afección del sujeto. La cantidad variará de un sujeto a otro, en función de la edad y el estado general del individuo, el modo de administración y otros factores. Así pues, aunque no es posible especificar una cantidad eficaz exacta, los expertos en la técnica podrán determinar una cantidad "eficaz" adecuada en cualquier caso individual utilizando la experimentación rutinaria y los conocimientos generales previos. Un resultado terapéutico en este contexto incluye la erradicación o disminución de los síntomas, la reducción del dolor o las molestias, la prolongación de la supervivencia, la mejora de la movilidad y otros marcadores de mejoría clínica. Un resultado terapéutico no tiene por qué ser una curación completa.

[0176] En el contexto del tratamiento y de las cantidades eficaces como se definió anteriormente, el términosujeto(que debe entenderse que incluye "individuo", "animal", "paciente" o "mamífero" cuando el contexto lo permite) define a cualquier sujeto, particularmente un sujeto mamífero, para el que está indicado el tratamiento. Los sujetos mamíferos incluyen, pero no se limitan a, humanos, animales domésticos, animales de granja, animales de zoológico, animales de deporte, animales de compañía como perros, gatos, cobayas, conejos, ratas, ratones, caballos, ganado vacuno, vacas; primates como simios, monos, orangutanes y chimpancés; cánidos como perros y lobos; félidos como gatos, leones y tigres; équidos como caballos, burros y cebras; animales de abasto como vacas, cerdos y ovejas; ungulados como ciervos y jirafas; y roedores como ratones, ratas, hámsteres y cobayas. En realizaciones preferidas, el sujeto es un ser humano.

[0177] Como se emplea en esta memoria, la expresión "trastorno de la gestación" se refiere a una enfermedad o afección de los mamíferos, por ejemplo un trastorno hipertensivo, una enfermedad cardiovascular, un trastorno proliferativo, una enfermedad inflamatoria, una enfermedad autoinmunitaria, un trastorno metabólico, una enfermedad neurológica o un trastorno hepático. En una realización, el trastorno del embarazo es un trastorno sindrómico. En una realización, el trastorno del embarazo es un trastorno del embarazo, por ejemplo un trastorno hipertensivo del embarazo, o un trastorno metabólico del embarazo. En una realización, el trastorno hipertensivo del embarazo es la preeclampsia, o un subtipo de preeclampsia seleccionado entre preeclampsia pretérmino, preeclampsia a término, preeclampsia de aparición temprana y síndrome HELLP, preeclampsia que conduce a resultados maternos adversos. Como se emplea en esta memoria, el término "PE" se refiere a la preeclampsia.

[0178] Como se emplea en esta memoria, la expresión "presencia de un trastorno del embarazo" se refiere al riesgo de que el sujeto padezca el trastorno del embarazo (es decir, al diagnóstico). Cuando los métodos de la invención están dirigidos a generar modelos de diagnóstico, la población de sujetos de prueba generalmente incluirá sujetos que son positivos para el trastorno del embarazo y sujetos que son negativos para el trastorno del embarazo cuando se obtienen datos de medición de los sujetos.

[0179] Como se emplea en esta memoria, la notación de fórmula [variable] se refiere típicamente a la concentración (relativa) en sangre de esta variable determinada con el ensayo como se ilustra en esta memoria descriptiva. Como se emplea en esta memoria, la notación de fórmula log10[variable] se refiere al logaritmo en base 10 de la concentración (típicamente relativa) en sangre de esta variable, determinándose la variable con el ensayo como se ilustra en esta memoria descriptiva.

[0180] Como se emplea en esta memoria, la fórmula [variable (MoM)] se refiere a la concentración normalizada múltiple de la mediana (MoM) de la variable; Cuando la variable muestra una dependencia significativa (prueba U de Mann-Whitney, correlación de Spearman, Benjamini, Hochberg y Yekutieli, p<0,01); los métodos aplicados en esta memoria descriptiva permiten considerar la normalización MoM de la variable. La variable se determina con el ensayo ilustrado en esta memoria descriptiva.

[0181] Como se emplea en esta memoria, la expresión "predecir el riesgo de un trastorno del embarazo" debe entenderse como predecir el aumento del riesgo o la disminución del riesgo del trastorno del embarazo. En el caso de detectar un aumento del riesgo, la probabilidad posterior a la prueba suele ser mayor que la probabilidad anterior a la prueba, por ejemplo 1,5, 2, 2,5, 3, 3,5, 4, 4,55, 5,5, 6, 6,57, 7,58, 8,59, 9,5 o 10 veces la probabilidad anterior a la prueba. En una realización, el método de la invención está configurado para detectar el 40-60 % de los casos de trastorno del embarazo (es decir, el 40 %-50 % o el 50-60 %) con una tasa de falsos positivos (FPR) del 5-25 %, y preferiblemente de aproximadamente el 10-20 % de FPR. En el caso de detectar una disminución del riesgo, la probabilidad posterior a la prueba es generalmente inferior a la probabilidad anterior a la prueba, por ejemplo 1,5, 2, 2,5, 3, 3,5, 4, 4,55, 5,5, 6, 6,57, 7,58, 8,59, 9,5 o 10 veces inferior a la probabilidad anterior a la prueba. En una realización, el método de la invención está configurado para detectar el 40-60 % de los no casos del trastorno del embarazo (es decir, el 40 %-50 % o el 50-60 %) con una tasa de falsos negativos (FNR) del 5-25 %, y preferiblemente de aproximadamente el 10-20 % de FNR.

[0182] Como se emplea en esta memoria, la expresión "datos de medición" aplicado a un sujeto o población de sujetos de ensayo se refiere a una pluralidad de variables seleccionadas entre características biométricas, de estilo de vida y fisiológicas. Algunos ejemplos de características biométricas son la edad, el origen étnico, la tensión arterial (diastólica, sistólica), el índice de masa corporal, el peso, la medida de la cintura, los antecedentes familiares de preeclampsia (madre o hermana), nulíparas o multíparas y la frecuencia cardiaca. Algunos ejemplos de características del estilo de vida son el hábito de fumar y el consumo de alcohol. Algunos ejemplos de características fisiológicas son la presencia/ausencia o los niveles de moléculas biológicas, por ejemplo proteínas, ácidos nucleicos, azúcares, anticuerpos y metabolitos. Por tanto, por ejemplo, los datos de medición de una mujer embarazada pueden incluir los niveles de una serie de metabolitos y proteínas, la tensión arterial, el peso, el IMC, el hábito de fumar y el número de embarazos. Los datos de medición pueden obtenerse en uno o más puntos temporales. Por ejemplo, cuando el trastorno del embarazo es preeclampsia, los datos de medición pueden obtenerse en una fase temprana del embarazo (es decir, de 10 a 20 semanas) y en el momento del parto.

[0183] Como se emplea en esta memoria, la expresión "1 a n variables" se refiere a las variables empleadas en los modelos. Por ejemplo, el primer modelo puede emplear dos variables (una proteína y una variable biométrica) y el segundo modelo puede emplear una única variable (una variable metabólica). Como alternativa, el primer modelo puede emplear una variable (una proteína) y el segundo modelo puede emplear una variable (una variable metabólica). Por ejemplo, en un método que emplea tres o más etapas de segregación, el primer modelo puede emplear una variable (una proteína) el segundo modelo puede emplear una variable (una primera variable metabólica), y el tercer modelo puede emplear dos variables (una segunda proteína y una segunda variable metabólica), y los modelos posteriores pueden implicar otras combinaciones de una o más variables.

[0184] Como se emplea en esta memoria, la expresión "modelo M" se refiere a un modelo generado por los métodos de la invención que puede emplearse con un sujeto de prueba para determinar el riesgo de que el sujeto tenga, o desarrolle posteriormente, el trastorno del embarazo. El modelo M comprende al menos dos modelos, un primer modelo M1 que es uno de los modelos de inclusión o exclusión y un segundo modelo M2 que es el otro modelo de inclusión o de exclusión. Como se ha descrito anteriormente, los modelos primero o segundo (y, en algunos casos, subsiguientes) pueden emplear cada uno independientemente una o más variables. Los dos (o más) modelos se aplicarán normalmente a un sujeto en secuencia, donde dependiendo del resultado de aplicar el primer modelo al sujeto, el segundo modelo puede o no aplicarse al paciente. Como alternativa, pueden aplicarse dos modelos al sujeto al mismo tiempo, o combinarse en un único modelo o algoritmo.

[0185] Un ejemplo de modelo teórico M en el que cada etapa requiere solo 1 variable, se ilustra en la tabla 1:

[0186] Tabla 1 - Modelo M

[0188]

[0190] Los modelos empleados en las etapas de segregación (M1, M2, etc.) suelen estar configurados para segregar la población (o subpoblación) con el fin de generar un subconjunto poblacional que esté enriquecido en sujetos que tengan o desarrollen posteriormente el trastorno del embarazo, es decir un subconjunto poblacional que presenta una mayor prevalencia del (futuro) trastorno del embarazo (modelo de inclusión), o que está enriquecido en sujetos que no tienen o no desarrollan posteriormente el trastorno del embarazo, es decir, un subconjunto poblacional que presenta una menor prevalencia del trastorno del embarazo (modelo de exclusión). Los modelos están configurados para segregar la población (o subpoblación) según un umbral preestablecido o una probabilidad de corte, es decir, una probabilidad de corte de inclusión o una probabilidad de corte de exclusión. Algunos ejemplos de parámetros de probabilidad que pueden emplearse son los valores predictivos (es decir, NPV o PPV), la sensibilidad/especificidad (tasa de falsos negativos o tasa de falsos positivos), o el límite de la razón de verosimilitud (es decir, límite de la razón de verosimilitud negativa o límite de la razón de verosimilitud positiva). Por tanto, por ejemplo, el primer modelo puede configurarse para generar un subconjunto poblacional que contenga el 50 % de todos los casos positivos con una tasa de falsos positivos del 20 %.

[0191] Generalmente, la etapa de segregación final de los métodos de la invención emplea un modelo definido por valor predictivo preestablecido, por ejemplo una PPV o una NPV. Las etapas de segregación precedentes pueden emplear diferentes parámetros de probabilidad, por ejemplo la tasa de falsos negativos y la tasa de falsos positivos.

[0192] Como se emplea en esta memoria, la expresión "probabilidad de corte de exclusión" aplicada a un modelo de exclusión se refiere al umbral de corte de la puntuación calculada por el modelo, que garantiza el cumplimiento del parámetro de probabilidad empleado. El parámetro de probabilidad puede seleccionarse entre

[0193] NPV (valor predictivo negativo), sensibilidad (1-tasa de falsos negativos) o razón de probabilidad negativa (NLR). Los parámetros empleados en los modelos dependerán de las circunstancias del caso, por ejemplo del tipo y la prevalencia del trastorno del embarazo, y podrán ser determinados por un experto en la técnica. Típicamente, el valor NPV (o equivalente) se selecciona para proporcionar una probabilidad posterior a la prueba que sea al menos 1,5, 2, 3, 4 o 5 veces menor que la probabilidad previa a la prueba de (futura) enfermedad. En una realización, el valor NPV (o equivalente) se selecciona para proporcionar una probabilidad posterior a la prueba que sea al menos 5-10 veces menor que la probabilidad previa a la prueba de (futura) enfermedad. En una realización, el valor NPV (o equivalente) se selecciona para proporcionar una probabilidad posterior a la prueba que sea al menos 10 veces menor que la probabilidad previa a la prueba de (futura) enfermedad. Algunos ejemplos de probabilidades de exclusión se explican con más detalle en las figuras 10 y 11 y en el texto que las acompaña.

[0194] Como se emplea en esta memoria, la expresión "probabilidad de corte de inclusión" aplicada a un modelo de inclusión se refiere al umbral de corte de la puntuación calculada por el modelo, que garantiza el cumplimiento del parámetro de probabilidad empleado. El parámetro de probabilidad puede seleccionarse entre el PPV (valor predictivo positivo), la especificidad (1-tasa de falsos positivos) o la razón de probabilidad positiva (RPL). Los parámetros empleados en los modelos dependerán de las circunstancias del caso, por ejemplo del tipo y la prevalencia del trastorno del embarazo, y podrán ser determinados por un experto en la técnica.

[0195] Típicamente, el valor de PPV (o equivalente) se selecciona para proporcionar una probabilidad posterior a la prueba que sea al menos 1,5, 2, 3, 4 o 5 veces la probabilidad anterior a la prueba de (futura) enfermedad. En una realización, el valor PPV (o equivalente) se selecciona para proporcionar una probabilidad posterior a la prueba que sea al menos 5-10 veces la probabilidad anterior a la prueba de (futura) enfermedad. En una realización, el valor PPV (o equivalente) se selecciona para proporcionar una probabilidad posterior a la prueba que sea al menos 10 veces la probabilidad anterior a la prueba de (futura) enfermedad. Algunos ejemplos de probabilidades de corte de la inclusión se presentan y explican con más detalle en las figuras 1 a 9 y en el texto que las acompaña.

[0196] Como se emplea en esta memoria, el término "NPV" o "Valor Predictivo Negativo" se refiere a la probabilidad de que un sujeto no tenga o desarrolle una afección si ha sido categorizado por la prueba como que no tiene o tiene bajo riesgo de desarrollar esa afección. Por ejemplo, si una de cada 100 personas identificadas como de bajo riesgo de padecer una enfermedad resulta tenerla o desarrollarla, la prueba predice correctamente el resultado para las otras 99, lo que arroja un NPV de 0,99. El NPV se define como Verdaderos Negativos / (Verdaderos Negativos Falsos Negativos). El NPV únicamente puede emplearse cuando se conoce (o puede estimarse) la prevalencia (o incidencia) de la (predisposición a la) afección y se tiene en cuenta a la hora de establecer el criterio del NPV.

[0197] Como se emplea en esta memoria, el término "PPV" o "Valor Predictivo Positivo" se refiere a la probabilidad de que un sujeto tenga o desarrolle una afección si ha sido categorizado por la prueba como poseedor o de alto riesgo de desarrollar dicha afección. Por ejemplo, si diez de cada cien personas identificadas como de alto riesgo de padecer una enfermedad resultan posteriormente no padecerla o no desarrollarla, la prueba predice correctamente el resultado para las otras 90, lo que da un PPV de 0,90. El PPV se define como Verdaderos positivos / (Verdaderos positivos Falsos positivos). El PPV únicamente puede emplearse cuando se conoce (o puede estimarse) la prevalencia (o incidencia) de la (predisposición a la) afección y se tiene en cuenta a la hora de establecer el criterio del PPV.

[0198] Como se emplea en esta memoria, el término"Sensibilidad"(Sn, Sens) se refiere a la probabilidad de que el resultado de una prueba sea positivo cuando(la predisposición para)la afección está presente (tasa de verdaderos positivos). La sensibilidad es independiente de la prevalencia (o incidencia) de la enfermedad (predisposición a la enfermedad).

[0199] Como se emplea en esta memoria, el término"Especificidad"(Sp, Spec) probabilidad de que el resultado de una prueba sea negativo cuando(la predisposición para)la afección no está presente (tasa de verdaderos negativos). La especificidad es independiente de la prevalencia (o incidencia) de la (predisposición a la) enfermedad

[0200] Como se emplea en esta memoria, el término "Tasa de Falsos Negativos" o "FNR" se refiere a la porción de sujetos que tienen o desarrollarán una enfermedad, que son incorrectamente categorizados como que no tienen o están en riesgo de desarrollar la enfermedad; también se denomina (1-Sensibilidad). Por ejemplo, si 10 de cada 100 personas que padecen una enfermedad o corren el riesgo de padecerla se clasifican incorrectamente como que no la padecen o corren el riesgo de padecerla, la prueba habrá clasificado incorrectamente a esas 10 personas, lo que arroja una FNR de 0,10. La FNR se define como Falsos Negativos / (Falsos Negativos Verdaderos Positivos). La FNR es independiente de la prevalencia (o incidencia) de la (predisposición a la) enfermedad; un criterio FNR no requiere que se conozca la prevalencia (o incidencia) de la (predisposición a la) enfermedad.

[0201] Como se emplea en esta memoria, el término "Tasa de Falsos Positivos" o "FPR" se refiere a la porción de sujetos que no tienen ni desarrollarán una enfermedad, que son incorrectamente categorizados como que tienen o están en riesgo de desarrollar la enfermedad; también se denomina (1-Especificidad). Por ejemplo, si 10 de cada 100 personas que no padecen o no desarrollarán una enfermedad se clasifican incorrectamente como personas que padecen o corren el riesgo de padecer la enfermedad, la prueba habrá clasificado incorrectamente a esas 10 personas, lo que equivale a una FPR de 0,10. La FPR se define como Falsos Positivos / (Falsos Positivos Verdaderos Negativos). La FPR es independiente de la prevalencia (o incidencia) de la (predisposición a la) afección; un criterio de FPR no requiere que se conozca la prevalencia (o incidencia) de la (predisposición a la) afección.

[0202] Como se emplea en esta memoria, la expresión "cociente de probabilidad negativo" se refiere a un cociente diseñado para evaluar el rendimiento de exclusión de una prueba, es el cociente entre la probabilidad de un resultado negativo de la prueba dada lapresenciade(la predisposición para)la afección y la probabilidad de un resultado negativo de la prueba dada laausenciade(la predisposición para)la afección. Se calcula dividiendo la Tasa de Falsos Negativos (o 1- Sensibilidad) por la Especificidad, (la tasa de detección de "(futuros) no casos").

[0203] Como se emplea en esta memoria, la expresión "cociente de probabilidad positiva" se refiere a un cociente diseñado para evaluar el rendimiento de una prueba, cociente entre la probabilidad de un resultado positivo de la prueba dada lapresenciade(la predisposición para)y la probabilidad de un resultado positivo de la prueba dada la de(la predisposición para)la afección. Se calcula dividiendo la Sensibilidad (o Tasa de Verdaderos Positivos o tasa de detección de "(futuros) casos") por la Tasa de Falsos Positivos (1-Especificidad).

[0204] Como se emplea en esta memoria la expresión "(futuro) caso" se refiere a un sujeto que tiene (la predisposición para) un resultado.

[0205] Como se emplea en esta memoria la expresión "(futuro) no caso" se refiere a un sujeto que no tiene (la predisposición para) un resultado.

[0206] En una realización, los métodos de la invención se aplican a resultados de baja prevalencia, en particular trastorno de baja prevalencia de los embarazos. En otra realización, los métodos de la invención se aplican a resultados de prevalencia moderada a alta, en particular a trastornos de embarazos de prevalencia moderada a alta. Como se emplea en esta memoria, la expresión "baja prevalencia" aplicado a un trastorno del embarazo significa un trastorno del embarazo con una prevalencia (incidencia) típicamente igual o inferior al 7 %, o igual o inferior al 5 %, o igual o inferior al 3 %, o igual o inferior al 1 %. Como se emplea en esta memoria, la expresión "afección de prevalencia moderada a alta" significa un trastorno del embarazo que un trastorno del embarazo con una prevalencia (incidencia) típicamente superior al 7 %, o igual o superior al 10 %, o igual o superior al 20 %, o igual o superior al 30 %.

[0207] Los métodos de la invención son especialmente aplicables a trastornos de baja prevalencia de los embarazos. En este contexto, la expresión "baja prevalencia" se refiere a un trastorno del embarazo que tiene una frecuencia inferior al 10 % de la población pertinente. Un ejemplo es la preeclampsia, que tiene una prevalencia de aproximadamente el 2-8 % (es decir, entre 20 y 80 de cada 1000 mujeres embarazadas desarrollarán preeclampsia durante el embarazo).

[0208] Como se emplea en esta memoria, la expresión "número suficiente de sujetos" aplicado a un subconjunto poblacional generado utilizando uno de los modelos (M1, M2, M3,…, M.<ésimo)>se refiere a una cohorte lo suficientemente grande como para permitir la identificación de un modelo capaz de dividir la cohorte en dos subgrupos, uno de los cuales cumple con un umbral de corte de inclusión o exclusión.

[0209] Como se emplea en esta memoria, la expresión "núcleo de diagnóstico/pronóstico" se refiere a una combinación recurrente específica de variables con un rendimiento pronóstico excepcional, tal como se encuentra dentro de una colección exhaustiva de modelos de diagnóstico/pronóstico disponibles.

[0210] Como se describe en los Antecedentes, los estadígrafos AUROC, Sn y Sp son estadígrafos independientes de la prevalencia, aunque la prevalencia (o la incidencia; dependiendo de la solicitud) es importante a la hora de evaluar la utilidad clínica de una prueba diagnóstica/pronóstica. Por lo tanto, cuando una prueba diagnóstica/pronóstica se evalúa/aplica en su contexto clínico pertinente, métricas como el valor predictivo positivo y negativo (PPV y NPV), que tienen en cuenta la prevalencia (o incidencia) de la enfermedad, son mucho más apropiadas. EN este caso, el PPV corresponde a la fracción de pacientes que realmente tendrán/desarrollarán la enfermedad (TP, Verdaderos Positivos) dentro del grupo de todos los pacientes que tienen un resultado positivo en la prueba (Verdaderos Positivos Falsos Positivos (FP)). El NPV corresponde a la fracción de pacientes que no tendrán/desarrollarán las afecciones (TN, Verdaderos Negativos) dentro del grupo de todos los pacientes que tienen un resultado negativo en la prueba (Verdaderos Negativos Falsos Negativos (FN)).

[0211] Para vincular el uso de estadísticas independientes de la prevalencia con estadísticas dependientes de la prevalencia, los solicitantes han desarrollado una metodología para vincular perfectamente estas dos visiones del rendimiento de las pruebas de pronóstico, trazando los criterios PPV o NPV, que tienen en cuenta la prevalencia, en el espacio de la Característica Operativa del Receptor (ROC) [1].

[0212] Integrando la metodología descrita en la presente memoria, los métodos esbozados en la presente solicitud son específicamente adecuados para la identificación de modelos de diagnóstico/pronóstico y/o núcleos de diagnóstico/pronóstico con utilidad clínica. El método y el sistema de la invención permiten la identificación de modelos de diagnóstico/pronóstico y/o núcleos de diagnóstico/pronóstico con tasas excepcionales de detección de casos (futuros) con un criterio de PPV preestablecido, cuando la aplicación clínica requiere una prueba de pronóstico de inclusión que controle la proporción de falsos positivos.

[0213] Del mismo modo, los métodos permiten identificar modelos de diagnóstico/pronóstico y/o núcleos de diagnóstico/pronóstico con tasas de detección excepcionales para (futuros) no casos con un criterio de NPV preestablecido cuando la solicitud clínica requiere para una prueba de pronóstico de exclusión que controle la proporción de falsos positivos. Significativamente, esto también apoya la noción, realizada por los solicitantes, de que una combinación específica de variables que constituye una prueba de pronóstico optimizada para un criterio PPV dado, no es necesariamente la misma combinación de variables que constituye una prueba de pronóstico optimizada para un criterio NPV dado.

[0214] Por extensión, los modelos de pronóstico y/o los núcleos de pronóstico que están optimizados para un criterio de PPV dado para una prueba de inclusión no constituyen necesariamente las mismas variables que los modelos de pronóstico y/o los núcleos de pronóstico para una prueba de inclusión que está optimizada para un criterio de FPR dado. Lo mismo ocurre con las pruebas de exclusión (criterio NPV frente a criterio FNR). Por lo tanto, también se puede utilizar la metodología elaborada en la presente memoria para ayudar en el desarrollo/selección de modelos de diagnóstico/pronóstico adecuados que cumplan con unos criterios preestablecidos de inclusión o exclusión.

[0215] Como ejemplo no limitativo, los solicitantes aplicaron métodos que capitalizan la creación de todos los modelos de pronóstico exhaustivos con 1 a 2, 1 a 3, 1 a 4, o 1 a n variables, utilizando una o más técnicas de modelización multivariable, para obtener un denominado "espacio de modelo exhaustivo". A continuación, este amplio espacio de modelos se examina mediante la aplicación de criterios de éxito específicos para identificar los modelos o "núcleos de pronóstico" que ofrecen un buen rendimiento diagnóstico/pronóstico con respecto a los criterios de éxito preestablecidos de inclusión o exclusión. Por ejemplo, dentro del espacio del modelo se identificarán los modelos de diagnóstico/pronóstico y/o los núcleos de diagnóstico/pronóstico que maximicen la tasa de detección con el criterio de valor predictivo preestablecido, en lugar de centrarse únicamente en el AUROC. Pueden emplearse otros métodos para desarrollar/seleccionar modelos o núcleos adecuados (véase el ejemplo 4D). En el ejemplo 4 se expone el proceso que constituye 1) la tecnología analítica (para determinar los niveles de metabolitos y proteínas en la sangre; es decir, variables fisiológicas), 2) la metodología, 3) la metodología de extracción de datos y 4) la aplicación de los métodos como invención para establecer nuevos modelos de pronóstico para predecir el riesgo de preeclampsia en las primeras etapas del embarazo. Algunos ejemplos de modelos de pronóstico reales y novedosos para la predicción del riesgo de preeclampsia también figuran en el ejemplo 4.

[0216] En el ejemplo 1, se ofrecen ilustraciones típicas pero no limitativas de las diferencias y eventuales ventajas del uso de los criterios PPV y NPV en comparación con los criterios FPR o FNR en la identificación y evaluación de clasificadores pronósticos clínicamente relevantes.

[0217] Cuando la metodología anterior para el descubrimiento de modelos de diagnóstico/pronóstico y/o núcleos de pronóstico específicos de inclusión (o exclusión) implica el estudio de poblaciones de muchos individuos y múltiples características de los mismos (es decir, variables), la prueba de pronóstico resultante tiene aplicabilidad a nivel del individuo individual. En cualquier individuo que sea como los individuos de la población de estudio, se pueden determinar los niveles/valores de variables específicas según el modelo/núcleo de pronóstico identificado, y calcular la puntuación de riesgo de los individuos utilizando el modelo/núcleo de pronóstico identificado. A continuación, se evaluará si esta puntuación de riesgo es superior o inferior a un umbral preestablecido, mediante el cual este umbral delimita la clasificación en "prueba positiva" o "prueba negativa", según la clasificación inclusión (o exclusión) establecida utilizando el conjunto de métodos elaborados en esta solicitud. Como resultado, se podrá determinar si una persona tiene un riesgo mayor (alto riesgo) de que el resultado se produzca o se produzca en un marco temporal futuro específico (inclusión), o si tiene un riesgo menor (bajo riesgo) de que el resultado se produzca o se produzca en un marco temporal futuro específico (exclusión).

[0218] El escenario hipotético presentado en los "antecedentes de la invención", junto con los párrafos anteriores y el ejemplo 1, muestran claramente que los métodos que integran el uso de criterios de PPV y/o NPV para encontrar modelos pronósticos, y/o núcleos pronósticos, son particularmente adecuados para identificar pruebas pronósticas con un rendimiento pronóstico clínicamente significativo. Sin embargo, las ilustraciones del ejemplo 1 ponen de manifiesto algunos retos pertinentes para desarrollar con éxito este tipo de clasificadores.

[0219] Cuando el requisito clínico de una prueba pronóstica exige una prueba con un PPV específico, los requisitos de [Sensibilidad y Especificidad] emparejados para que dicha prueba cumpla con dicho objetivo específico de PPV, se vuelven progresivamente más estrictos con la disminución de la prevalencia (o incidencia) del resultado; hasta el punto de que la existencia de dicho clasificador se vuelve improbable. Al mismo tiempo, se puede apreciar que, en la práctica clínica, las pruebas de pronóstico de inclusión tienen la mayor utilidad para los resultados de salud con baja prevalencia (incidencia) en la población de interés. Por el contrario, cuando el requisito clínico de una prueba pronóstica exige una prueba de exclusión con un NPV específico, los requisitos de [Sensibilidad y Especificidad] emparejados para que dicha prueba cumpla dicho objetivo de NPV específico se vuelven progresivamente más estrictos a medida que aumenta la prevalencia (o incidencia) del resultado. Al mismo tiempo, se puede apreciar que, en la práctica clínica, las pruebas de exclusión pronóstico tienen la mayor utilidad para los resultados que son bastante comunes en la población de interés.

[0220] Confrontados con este problema, que esencialmente impide el desarrollo de pruebas de pronóstico clínicamente significativas para muchos resultados de salud, los métodos de la invención proporcionan una solución a este problema.

[0221] Proceso aplicable a las pruebas de pronóstico de inclusión

[0222] Dada la necesidad clínica de una prueba de pronóstico por exclusión que ofrezca una tasa mínima de detección de futuros casos (Sn<prueba><>= Sn<objetivo>), para un umbral de PPV preestablecido (PPV<prueba><>= PPV<umbral>) para un resultado sanitario con baja incidencia (o prevalencia), el proceso implica las siguientes etapas discretas para permitir el establecimiento de dicho rendimiento pronóstico:

[0223] 1) Crear un primer espacio de modelos exhaustivo (Modelo-S1) de posibles modelos de pronóstico para una población de estudio determinada (Pob.-estudio 1) utilizando los métodos descritos anteriormente. 2) Definir una tasa "admisible" (FNR<admisible>) o proporción (NPV<admisible>) de futuros casos que pueden clasificarse erróneamente como de bajo riesgo.

[0224] 3) Identificar de modelos de exclusión pronóstico y/o núcleos pronósticos, en el Modelo-S1 que maximicen la especificidad Sp (o tasa de detección de futuros no casos) conforme al criterio de exclusión ((FNR<admisible>) o (NPV<admisible>)) definido en la etapa anterior.

[0225] 4) Seleccionar un modelo de exclusión adecuado (clasificador<Exclusión)>como el identificado en la etapa anterior y aplicarlo a la población de estudio (Pob.-estudio 1). El resultado será la creación de una población definida de bajo riesgo (PopLR), que cumpla un número (FNR<admisible)>o proporción (NPV<admisible)>preespecificados de falsos negativos y una fracción significativa de los verdaderos negativos, es decir, futuros no casos.

[0226] 5) Purgar esta población de la población de estudio inicial para generar una nueva población de estudio (Pob.-estudio 2), donde (Pob.-estudio 1) - (PopLR) = (Pob.-estudio 2). Cabe destacar que, en comparación con la Pob.-estudio 1 inicial, la nueva Pob.-estudio 2 de estudio tendrá una incidencia (o prevalencia) mayor de futuros casos.

[0227] 6) Crear un segundo espacio de modelos exhaustivo (Modelo-S2) de posibles modelos de pronóstico para la nueva población de estudio (Pob.-estudio 2) utilizando los métodos descritos anteriormente.

[0228] 7) Identificar los modelos de pronóstico de inclusión y/o núcleos de pronóstico, en el Modelo-S2 que maximizan la sensibilidad Sn (o tasa de detección de futuros casos) conforme al criterio del umbral de PPV (PPV<umbral>). Como la incidencia (o prevalencia) en la Pob.-estudio 2 está enriquecida en futuros casos en comparación con la Pob.-estudio 1, es mucho más fácil encontrar un clasificador que cumpla los requisitos pareados de [Sensibilidad y Especificidad] requeridos para cumplir con dicho PPV<umbral>específico.

[0229] 8) Seleccionar un modelo de inclusión adecuado (clasificador<Inclusión>) como el identificado en la etapa anterior que ofrezca una tasa de detección de futuros casos que, tras la corrección de los errores de clasificación admisibles (véanse las etapas 2 y 3), cumpla el objetivo de sensibilidad, es decir, Sn<prueba><>= Sn<objetivo>. El resultado de este proceso es un par específico de modelos de pronóstico (o núcleos de pronóstico), es decir, un modelo específico de exclusión y un modelo específico de inclusión que, cuando se aplican conjunta y secuencialmente ofrecerán un rendimiento de pronóstico de inclusión significativamente mejor que un modelo de inclusión no precedido por una etapa de exclusión.

[0230] El proceso esbozado para lograr un rendimiento de pronóstico de inclusión clínicamente relevante forma parte integral de los métodos relativos a la identificación de combinaciones de pronóstico no evidentes, tal como se elabora en la presente solicitud. Las combinaciones preferidas de núcleos de exclusión / inclusión para la preeclampsia se proporcionan en el ejemplo 4.

[0231] Proceso aplicable para descartar pruebas de pronóstico

[0232] Dada la necesidad clínica de una prueba de exclusión pronóstico que ofrezca una tasa máxima de detección de futuros no casos (Sp<prueba>= Sp<objetivo>), para un umbral de NPV preestablecido (NPV<prueba><>= NPV<umbral>) para un resultado sanitario con incidencia (o prevalencia) de moderada a alta, el proceso incluye las siguientes etapas discretas para permitir el establecimiento de dicho rendimiento pronóstico:

[0233] 1) Crear un primer espacio de modelos exhaustivo (Modelo-S1) de posibles modelos de pronóstico para una población de estudio determinada (Pob.-estudio 1) utilizando los métodos descritos anteriormente. 2) Definir una tasa "admisible" (FPR<admisible>) o proporción (PPV<admisible>) de futuros no casos que pueden clasificarse erróneamente como de alto riesgo.

[0234] 3) Identificar modelos de pronóstico de inclusión y/o núcleos de pronóstico, en el Modelo-S1 que maximicen la especificidad Sn (o tasa de detección de futuros casos) conforme al criterio de pronóstico de inclusión ((FPR<admisible>) o (PPV<admisible>)) definido en la etapa anterior.

[0235] 4) Seleccionar un modelo inclusión adecuado (clasificador<Inclusión)>como el identificado en la etapa anterior y aplicarlo a la población de estudio (Study-Pop1); esto dará lugar a la creación de una población de alto riesgo definida (PopHR), constituida por un número preespecificado (FPR<admisible)>o proporción (PPV<admisible)>de falsos positivos y una fracción significativa de los verdaderos positivos, i.e., futuros casos.

[0236] 5) Purgar esta población de la población de estudio inicial para generar una nueva población de estudio (Pob.-estudio 2), donde (Pob.-estudio 1) - (PopHR) = (Pob.-estudio 2). Cabe destacar que, en comparación con la Pob.-estudio 1 inicial, la nueva Pob.-estudio 2 tendrá una mayor incidencia (o prevalencia) de futuros no casos.

[0237] 6) Crear un segundo espacio de modelos exhaustivo (Modelo-S2) de posibles modelos de pronóstico para la nueva población de estudio (Pob.-estudio 2) utilizando los métodos descritos anteriormente.

[0238] 7) Identificar modelos de exclusión pronóstico y/o núcleos pronósticos, en el Modelo-S2 que maximicen la especificidad Sp (o tasa de detección de futuros no casos) conforme al criterio de umbral NPV (NPV<umbral)>. Como la incidencia (o prevalencia) en la Pob.-estudio 2 está enriquecida en futuros no casos en comparación con la Pob.-estudio 1, es mucho más fácil encontrar un clasificador que cumpla los requisitos pareados de [Sensibilidad y Especificidad] requeridos para cumplir con dicho NPV<umbral>específico.

[0239] 8) Seleccionar un modelo de exclusión adecuado (clasificador<Exclusión)>, identificado en la etapa anterior, que ofrezca una tasa de detección de futuros no casos que, una vez corregidos los errores de clasificación admisibles (véanse las etapas 2 y 3), cumpla el objetivo de especificidad, es decir, Sp<prueba>= Sp<objetivo>. El resultado de este proceso es un par específico de modelos de pronóstico (o núcleos de pronóstico), es decir, un modelo de inclusión específico y un modelo de exclusión específico que, cuando se aplican conjunta y secuencialmente, ofrecerán un rendimiento de pronóstico de exclusión significativamente mejor que un modelo de exclusión no precedido por una etapa de inclusión.

[0240] De manera significativa, estos elaborados procesos por etapas capitalizan la noción, realizada por los inventores, de que una combinación específica de variables que constituye una prueba de pronóstico con méritos excepcionales de exclusión, no es necesariamente la misma combinación de variables que constituye una prueba de pronóstico con méritos excepcionales de exclusión. Además, las características de una población transitoria (Pob.-estudio 2), tras la eliminación de conjuntos específicos de individuos, serán diferentes en comparación con la población inicial de prueba (Pob.-estudio 1). Como resultado, los modelos de pronóstico dentro de los respectivos espacios de modelos integrales, es decir, modelo-S1 y modelo-S2) pueden ser diferentes.

[0241] En el ejemplo 2 se elaboran ilustraciones típicas pero no limitativas de este proceso secuencial y sus méritos específicos en comparación con los métodos de una sola etapa en la identificación y evaluación de clasificadores pronósticos clínicamente relevantes.

[0242] Como la anterior colección de métodos para el descubrimiento de la combinación específica de 1) un modelo de pronóstico de inclusión y/o núcleo de pronóstico y 2) un modelo de pronóstico de exclusión y/o núcleo de pronóstico (o viceversa), implica el estudio de poblaciones de muchos individuos y múltiples características de los mismos (es decir, variables), la prueba de pronóstico resultante tiene aplicabilidad a nivel del individuo individual. En cualquier individuo que sea como los individuos de la población de estudio, se pueden determinar los niveles/valores de variables específicas según el primer modelo/núcleo de pronóstico identificado, y calcular la puntuación de riesgo de los individuos utilizando el modelo/núcleo de pronóstico de exclusión (o de inclusión) identificado. A continuación, se evaluará si esta puntuación de riesgo es superior o inferior a un umbral preestablecido, mediante el cual este umbral delimita la clasificación en "prueba positiva" o "prueba negativa", según la clasificación inclusión (o exclusión) establecida utilizando el conjunto de métodos elaborados en esta solicitud. En caso de que el individuo se clasifique como "prueba negativa", se pueden determinar los niveles/valores de variables específicas según el segundo modelo/núcleo de pronóstico identificado, y calcular la puntuación de riesgo del individuo utilizando el modelo/núcleo de pronóstico identificado. Ejecutando estas dos etapas consecutivas, se puede determinar, para cualquier individuo, si tendrá un riesgo mayor (riesgo alto) de que se produzca el resultado en un plazo futuro específico (inclusión), o si tendrá un riesgo menor (riesgo bajo) de que se produzca el resultado en un plazo futuro específico (exclusión).

[0243] Del mismo modo, el cálculo de las puntuaciones de riesgo consecutivas, las delimitaciones "prueba positiva" / "prueba negativa" y la clasificación de riesgo final, es decir, estar en alto riesgo (inclusión) o estar en bajo riesgo (exclusión) pueden ejecutarse en un único proceso de cálculo.

[0244] Rendimiento pronóstico: maximización del rendimiento mediante el proceso de clasificadores secuenciales.En algunos casos, y a la vista de la consecución de objetivos tan pertinentes para cumplir los requisitos de utilidad clínica, los inventores descubrieron que una ampliación del concepto anterior puede ofrecer un rendimiento pronóstico excepcional.

[0245] Dada la necesidad clínica de una prueba de pronóstico que proporcione una tasa máxima de detección de futuros casos (Sn,prueba_máxima), para un umbral de PPV preestablecido (PPV<prueba>= PPV<umbral>) o (/y), una prueba de pronóstico que proporcione una tasa máxima de detección de futuros no casos (Sp,prueba_máxima), para un umbral de NPV preestablecido (NPV<prueba><>= NPV<umbral>). El proceso implica las siguientes etapas individuales para permitir el establecimiento de dicho rendimiento pronóstico:

[0246] 1) Crear un primer espacio de modelos completo (Modelo-S1) de posibles modelos de pronóstico para una población de estudio determinada (Pob.-estudio 1) utilizando los métodos descritos anteriormente.

[0247] 2)

[0248] a. Identificar un clasificador dentro de la Pob.-estudio 1 que identifique una subpoblación de alto riesgo (PopHR1) que cumpla el umbral de PPV (pasar a 3.a)), o bien

[0249] b. Identificar un clasificador dentro de la Pob.-estudio 1 que identifique una subpoblación de bajo riesgo (PopLR1) que cumpla con el umbral de NPV (pasar a 3.b))

[0250] 3)

[0251] a. Purgar esta población de la población de estudio inicial para generar una nueva población de estudio Pob.-estudio 2, donde (Pob.-estudio 1) - (PopHR1) = (Pob.-estudio 2). Cabe destacar que, en comparación con la Pob.-estudio 1 inicial, la nueva Pob.-estudio 2 está efectivamente enriquecida en futuros no casos. En caso de que esta última población de la Pob.-estudio 2 cumpla también el criterio de NPV preestablecido, el proceso de clasificación se detiene al cumplirse los objetivos preestablecidos. En caso contrario, pasar a la etapa 4.

[0252] b. Purgar esta población de la población de estudio inicial para generar una nueva población de estudio (Pob.-estudio 2), donde (Pob.-estudio 1) - (PopLR1) = (Pob.-estudio 2). Cabe destacar que, en comparación con la Pob.-estudio 1 inicial, la nueva Pob.-estudio 2 se enriquece efectivamente en futuros casos. En caso de que esta última población de la Pob.-estudio 2 cumpla también el criterio de PPV preestablecido, el proceso de clasificación se detiene al cumplirse los objetivos preestablecidos. En caso contrario, pasar a la etapa 4.

[0253] c. En caso de que no se encuentren modelos de pronóstico útiles en 3a) o 3b), deberá calcularse y notificarse el riesgo restante en la Pob.-estudio 2 y darse por finalizado el proceso.

[0254] 4) Crear un segundo espacio de modelos exhaustivo (Modelo-S2) de posibles modelos de pronóstico para la nueva población de estudio (Pob.-estudio 2) utilizando los métodos descritos anteriormente.

[0255] 5) Identificar un clasificador dentro de la Pob.-estudio 2 que o bien;

[0256] a. Identifica una subpoblación de alto riesgo (PopHR2) que cumpla el umbral de PPV y se añade esta nueva subpoblación a PopHR1 (si existe), para crear una PopHR_total (pasar a 6.a), o bien b. Identifica una subpoblación de bajo riesgo (PopLR2) que cumpla el umbral NPV y se añade esta nueva subpoblación a PopLR1 (si existe), para crear un PopLR_total (pasar a 6.b)

[0257] c. En caso de que no se encuentren modelos de pronóstico útiles en 5a) o 5b), deberá calcularse y notificarse el riesgo restante en la Pob.-estudio 2 y darse por finalizado el proceso.

[0258] 6)

[0259] a. Purgar la PopHR2 de la población (Pob.-estudio 2) para generar una nueva población de estudio (Pob.-estudio 3), donde (Pob.-estudio 2) - (PopHR2) = (Pob.-estudio 3). Cabe destacar que, en comparación con la Pob.-estudio 2, la nueva Pob.-estudio 3 está efectivamente enriquecida en futuros no casos. En caso de que esta última población de la Pob.-estudio 3 cumpla también el criterio de NPV preestablecido, el proceso de clasificación se detiene al cumplirse los objetivos preestablecidos. En caso contrario, pasar a la etapa 7.

[0260] b. Purgar la PopLR2 de la población de estudio inicial para generar una nueva población de estudio (Pob.-estudio 3), donde (Pob.-estudio 2) - (PopLR2) = (Pob.-estudio 3). Cabe destacar que, en comparación con la Pob.-estudio 2, la nueva Pob.-estudio 3 está efectivamente enriquecida en futuros casos. En caso de que esta última población de la Pob.-estudio 3 cumpla también el criterio de PPV preestablecido, el proceso de clasificación se detiene al cumplirse los objetivos preestablecidos. En caso contrario, pasar a la etapa 7.

[0261] c. En caso de que no se encuentren modelos de pronóstico útiles en 5a) o 5b), deberá calcularse y notificarse el riesgo restante en la Pob.-estudio 2 y darse por finalizado el proceso.

[0262] 7) Repetir las etapas 4 a 6, hasta la tasa máxima de detección de futuros casos (Sn,prueba_máxima), para un umbral de PPV preestablecido (PPV<prueba>>= PPV<umbral>) o (/y), tasa máxima de detección de futuros no casos (Sp,prueba_máxima), para un umbral de NPV preestablecido (NPV<prueba>>= NPV<umbral>) como alcanzable utilizando las variables disponibles para los individuos objeto de estudio.

[0263] El resultado de este proceso es un clasificador total específico, que está formado por un conjunto de modelos pronósticos (o núcleos pronósticos) que, cuando se aplica secuencialmente, proporcionará un rendimiento pronóstico de inclusión y/o exclusión excepcional, según los requisitos clínicos preestablecidos de clasificación de riesgos.

[0264] Cabe destacar que, al aplicar este proceso, se puede optar por un clasificador de inclusión o de exclusión en cualquier punto. En otras palabras, para lograr el rendimiento deseado en la clasificación pronóstica, siempre se aplicará el mejor clasificador y, por tanto, posiblemente, pero no necesariamente, se alternará entre clasificadores de inclusión y exclusión.

[0265] Además, para cumplir los requisitos preestablecidos de PPV y/o NPV, basta con que la respectiva PopHR_total final = PopHR1 PopHR2+… PopHRn y/o PopLR_total = PopLR1 PopLR2+… PopLRn cumpla los criterios preestablecidos. Por tanto, las clasificaciones provisionales pueden desviarse de los umbrales establecidos.

[0266] El proceso indicado para lograr un rendimiento pronóstico de inclusión clínicamente relevante forma una parte integral de los métodos relativos a la identificación de combinaciones pronósticas no evidentes elaboradas en la presente solicitud.

[0267] Las combinaciones preferidas de clasificadores pronósticos múltiples para la preeclampsia pretérmino se describen en el ejemplo 4D.

[0268] En el ejemplo 3, se elaboran ilustraciones típicas pero no limitativas de este proceso secuencial iterativo y sus méritos específicos en comparación con los métodos de una sola etapa en la identificación y evaluación de clasificadores pronósticos clínicamente relevantes.

[0269] Como la colección de métodos anterior para el descubrimiento de una combinación específica de modelos de pronóstico implica el estudio de poblaciones de muchos individuos y múltiples características de los mismos (es decir, variables), la prueba de pronóstico total resultante tiene aplicabilidad a nivel del individuo único. En cualquier individuo que sea como los individuos de la población de estudio, se pueden determinar los niveles/valores de variables específicas según el primer modelo/núcleo pronóstico identificado, y calcular la puntuación de riesgo de los individuos utilizando el modelo/núcleo pronóstico identificado. A continuación, se evaluará si esta puntuación de riesgo es superior o inferior a un umbral preestablecido, mediante el cual este umbral delimita la clasificación en "prueba positiva" o "prueba negativa", según la clasificación (inclusión o exclusión) establecida utilizando el conjunto de métodos elaborados en esta solicitud. Cuando el individuo se clasifique como "prueba positiva", se comunicará el resultado correspondiente (el individuo se clasificará como de alto riesgo o de bajo riesgo, en función del clasificador aplicado). En caso de que el individuo se clasifique como "prueba negativa", se pueden determinar los niveles/valores de variables específicas según el segundo modelo/núcleo de pronóstico identificado, y calcular la puntuación de riesgo del individuo utilizando el modelo/núcleo de pronóstico identificado. A continuación, se evaluará si esta puntuación de riesgo es superior o inferior a un umbral preestablecido, mediante el cual este umbral delimita la clasificación en "prueba positiva" o "prueba negativa", según la clasificación (inclusión o exclusión) establecida utilizando el conjunto de métodos elaborados en esta solicitud. Cuando el individuo se clasifica como "prueba positiva" en esta 2.ª etapa, se comunicará el resultado correspondiente (el individuo se clasifica como de alto riesgo o de bajo riesgo, en función del clasificador aplicado). En el caso de que el individuo se clasifique como "prueba negativa", se pueden determinar los niveles/valores de variables específicas según el tercer modelo/núcleo de pronóstico identificado, y calcular la puntuación de riesgo del individuo utilizando el modelo/núcleo de pronóstico identificado (o descartado), etc. Esto se repetirá hasta que el individuo se clasifique en un grupo "prueba positiva" o hasta que se haya calculado para el individuo una puntuación de riesgo para cada uno de los clasificadores que constituyen el "clasificador total". En ese momento, el individuo será clasificado como de alto o bajo riesgo, o permanecerá sin clasificar con respecto a los criterios preestablecidos de PPV o NPV.

[0270] En el caso de que los requisitos clínicos estipulen que una prueba pronóstica debe considerar los criterios PPV y NPV al mismo tiempo (véase el ejemplo 3), los individuos que permanezcan sin clasificar con respecto a los criterios PPV y NPV preestablecidos, se considerarán no clasificados.

[0271] El cálculo de las puntuaciones de riesgo consecutivas, las delineaciones "prueba positiva" / "prueba negativa" y la clasificación final del riesgo, es decir, estar en alto riesgo (inclusión), estar en bajo riesgo (exclusión) o, sin clasificar (en caso de un criterio combinado [inclusión - exclusión]) pueden ejecutarse en un único proceso de cálculo.

[0272] Ejemplificación

[0273] A continuación se describirá la invención con referencia a Ejemplos específicos. Estos son únicamente ejemplos con una finalidad ilustrativa: no pretenden limitar en modo alguno el alcance del monopolio reivindicado ni de la invención descrita. Estos ejemplos constituyen el mejor modo actualmente contemplado para poner en práctica la invención.

[0274] EJEMPLO 1

[0275] Se elabora un conjunto no limitativo de ejemplos numéricos para ilustrar los conceptos de pruebas de inclusión y exclusión, y sus variaciones, tal como se aplican dentro de los métodos descritos.

[0276] Con una finalidad meramente ilustrativa, se construye la siguiente población de "caso base":

[0277] - Población n= 400

[0278] - Incidencia / prevalencia<p= 0,05 (la afección se desarrollará en el 5 % de la población en un>tiempo posterior a la aplicación de la prueba de pronóstico), o bien

o Casos futuros: n = 20

[0279] o Futuros no casos: n =380

[0280] En la figura 1 se muestra una representación gráfica de esta población de "caso base" (antes de la prueba). En medicina, el pronóstico se refiere comúnmente a la probabilidad o riesgo de que un individuo desarrolle un determinado estado de salud (un resultado) a lo largo de un tiempo específico, en función de su perfil clínico y no clínico, es decir, de un conjunto de variables.

[0281] Como los modelos de pronóstico añaden el elemento del tiempo, el pronóstico incluye un elemento estocástico, uno que es un sujeto al azar. El pronóstico y la predicción implican la estimación del riesgo, o la probabilidad de un acontecimiento o estado futuro. El resultado no solo es desconocido, sino que aún no existe, lo que distingue esta tarea del diagnóstico. En otras palabras, en el pronóstico, un clasificador, por definición, no será perfecto, mientras que, teóricamente, un clasificador de diagnóstico puede serlo.

[0282] En consecuencia, el ejemplo de clasificador perfecto presentado en la figura 2 Ejemplo es esencialmente imposible de encontrar en la investigación pronóstica.

[0283] Clasificadores de inclusión

[0284] Una prueba de pronóstico de inclusión está orientada a identificar a aquellos individuos que presentan un mayor riesgo de desarrollar un futuro trastorno del embarazo. Para ello, se tratará de desarrollar clasificadores que identifiquen un grupo de "alto riesgo", es decir, individuos con mayor riesgo de desarrollar el futuro trastorno del embarazo, en comparación con la población no estratificada. Con una finalidad meramente ilustrativa, se considera el siguiente "caso base" de inclusión:

[0285] - una prueba de inclusión que ofrezca una tasa de detección de "futuros casos" en el "grupo de alto riesgo" del 50 %, es decir, Sn= 0,5

[0286] Clásicamente, se aplicará un umbral de tasa de falsos positivos (1-especificidad), es decir, un porcentaje fijo de individuos que no desarrollarán la afección serán falsamente clasificados como de riesgo.

[0287] Con una finalidad meramente ilustrativa, se considera el siguiente "caso base" de inclusión de FPR:

[0288] - una prueba de inclusión que ofrezca una tasa de detección de "futuros casos" en el "grupo de alto riesgo" del 50 %, es decir, Sn= 0,5, para un FPR= 20 % (o [1-especificidad] = 0,2). Esto se ilustra en la figura 3. Como se explica en otra parte de esta solicitud, normalmente se expresaría el rendimiento pronóstico de un clasificador mediante una curva ROC. Para el ejemplo dado, el umbral del 20 % de FPR corresponde a la línea vertical en el espacio ROC; en la figura 4 también se muestra un hipotético clasificador conforme (que presenta una tasa de detección del 50 % al 20 % de FPR).

[0289] El clasificador representado en la figura 4 no tiene en cuenta la incidencia (prevalencia) de los resultados. A modo de ejemplo, considere la posibilidad de variar la incidencia del 5 % al 2,5 % (Figura 5 - Panel A) o al 10 % (Figura 5 - Panel B), manteniendo la tasa de detección del 50 % y la FPR del 20 % (según el "caso base" de inclusión de FPR). Se puede observar que la proporción de "Falsos positivos" está inversamente asociada a la incidencia del resultado. Sin embargo, el clasificador representado en la figura 4 se ajustaría a los tres escenarios de incidencia (prevalencia), es decir, p= 0,025, p= 0,05 y p= 0,1.

[0290] Como se explica en otra parte de esta solicitud, la utilidad clínica de una prueba de pronóstico, y por tanto su relevancia para la práctica clínica, a menudo viene determinada por el coste (monetario y/o sanitario) asociado a la clasificación. En este contexto, se suele sopesar, aunque sin limitarse a ello, el impacto de la clasificación "inclusión" en los futuros casos correctamente clasificados (verdaderos positivos), así como en los futuros casos incorrectamente clasificados (falsos positivos). Se puede apreciar que dicha evaluación de la utilidad clínica depende en gran medida de la relación verdaderos positivos/falsos positivos. Como se ilustra en las ilustraciones anteriores de inclusión fija de FPR, el uso de un criterio fijo de FPR es invariable a la incidencia (prevalencia) de la enfermedad y, por lo tanto, no es apropiado para evaluar la utilidad clínica de una prueba de pronóstico y, por lo tanto, su relevancia para la práctica clínica. Para superar esta limitación, los solicitantes desarrollaron una metodología que permite descubrir modelos pronósticos / núcleos pronósticos que cumplen un valor predictivo positivo preestablecido. El PPV es la fracción de pacientes que realmente desarrollarán la afección (TP) dentro del grupo de todas las pacientes que tienen un resultado positivo en la prueba (TP+FP); el PPV da cuenta de la incidencia (o prevalencia) del trastorno del embarazo. De ahí que los criterios de PPV resulten más relevantes en el desarrollo (y evaluación) de nuevos clasificadores pronósticos.

[0291] Con una finalidad meramente ilustrativa, se considera el siguiente "caso base" de inclusión de PPV:

[0292] - una prueba de inclusión que ofrezca una tasa de detección de "futuros casos" en el "grupo de alto riesgo" del 50 %, es decir, Sn= 0,5, para un PPV dado= 0,2. Esto se ilustra en la figura 6.

[0293] Según la metodología de los inventores [1], también se puede proyectar este criterio de PPV en el espacio ROC. Para el ejemplo dado, el umbral de PPV=0,2 calculado para una incidencia (o prevalencia) del 5 %, corresponde a la línea recta en el espacio ROC de la figura 7. También se muestra un hipotético clasificador conforme (que presenta una tasa de detección del 50 % con un PPV= 0,2).

[0294] Con vistas al desarrollo de clasificadores pronósticos de "inclusión" con relevancia clínica, el uso de un criterio de PPV fijo permite una evaluación más significativa del rendimiento de los clasificadores pronósticos. Al mismo tiempo, como los criterios de PPV tienen en cuenta la incidencia (o prevalencia) del resultado, la conformidad de un clasificador con un criterio de PPV depende de dicha incidencia (o prevalencia).

[0295] Para ilustrar esto, se considera la posibilidad de variar la incidencia del 5 % del ejemplo anterior al 2,5 % (figura 8 - panel A) o al 10 % (figura 8 - panel B) manteniendo el mismo criterio de PPV= 0,2. Se puede observar que la proporción de "Verdaderos positivos" frente a "Falsos positivos" es constante independientemente de la incidencia del resultado.

[0296] Sin embargo, en el espacio ROC, el criterio PPV variará con la incidencia (prevalencia) del resultado. A modo de ejemplo, el clasificador hipotético presentado en la figura 7, que ofrecía una tasa de detección del 50 % con un PPV= 0,2 para una incidencia de resultados del 5 %, se reproduce en la figura 9 para los escenarios con una incidencia de resultados del 2,5 % (figura 9, panel A) y del 10 % (figura 9, panel B).

[0297] A partir de estas ilustraciones, es obvio que los requisitos pronósticos para un determinado criterio de inclusión de PPV (en términos de sensibilidad y especificidad) son más estrictos cuanto menor es la incidencia (prevalencia) de la enfermedad. A la vista de los métodos elaborados en esta solicitud, el lector puede apreciar que es más difícil encontrar modelos pronósticos / núcleos pronósticos adecuados dado un criterio de PPV objetivo clínicamente relevante con una incidencia (prevalencia) de resultados decreciente.

[0298] Clasificadores de exclusión

[0299] Una prueba pronóstica de exclusión suele estar orientada a identificar a estos individuos con menor riesgo de desarrollar un futuro trastorno del embarazo. Para ello, se intentará desarrollar clasificadores que identifiquen un grupo de "bajo riesgo", es decir, individuos con un riesgo menor de desarrollar el futuro trastorno del embarazo, en comparación con la población no estratificada.

[0300] Con una finalidad meramente ilustrativa, se considera el siguiente "caso base" de exclusión:

[0301] - una prueba de exclusión que ofrezca una tasa de detección de "futuros no casos" en el "grupo de bajo riesgo" del 50 %, es decir, Especificidad Sp= 0,5

[0302] Clásicamente, se aplicará un umbral de tasa de falsos negativos (1-sensibilidad), es decir, un porcentaje fijo de individuos que desarrollarán la afección se clasificarán falsamente como de bajo riesgo.

[0303] Con una finalidad meramente ilustrativa, se considera el siguiente 2"caso base" de exclusión de FNR:

[0304] - una prueba de exclusión que ofrezca una tasa de detección de "futuros no casos" en el "grupo de bajo riesgo" del 50 %, es decir, Sp= 0,5, para una FNR= 10 % dada (o [1-sensibilidad] = 0,1). Esto se ilustra en la figura 10.

[0305] En el panel A, el ejemplo se presenta en una cuadrícula. En el panel B se ejemplifica el rendimiento pronóstico de dicho clasificador de exclusión mediante una curva ROC; también se ofrece un clasificador hipotético conforme, que presenta una especificidad Sp= 0,5 con una FNR del 10 %.

[0306] De nuevo, el uso de un criterio fijo de FNR para evaluar el rendimiento de un clasificador de exclusión pronóstico no tiene en cuenta la incidencia (prevalencia) del resultado. A modo de ejemplo, considere la posibilidad de variar la incidencia del 5 % de la población del "caso base" al 2,5 % (Figura 11 - Panel A) o al 10 % (Figura 11 - Panel B), manteniendo la especificidad =0,5 y el FNR del 10 % (según el "caso base 2" de inclusión de FNR). Se puede observar que la proporción de "falsos negativos" está directamente asociada a la incidencia del resultado.

[0307] Además, dado que la utilidad clínica de una prueba pronóstica suele estar determinada por el coste (monetario y/o sanitario) asociado a la clasificación, el uso de un umbral NPV, que tenga en cuenta la incidencia (o prevalencia) del resultado, podría ser más apropiado para evaluar el rendimiento pronóstico de una prueba de exclusión. El NPV es la fracción de pacientes que no desarrollarán la enfermedad (TN) dentro del grupo de todos los pacientes que tienen una prueba negativa (TN+FN).

[0308] Con una finalidad meramente ilustrativa, se considera el siguiente "caso base" de exclusión de NPV fijo: - una prueba de exclusión que ofrezca una especificidad = 0,5, es decir, una tasa de detección del 50 % de los "futuros no casos", en el "grupo de bajo riesgo" para un NPV establecido = 0,99. Esto último corresponde a 1 falso negativo (es decir, un futuro caso clasificado falsamente como de bajo riesgo) por cada 99 verdaderos negativos. (Esto se corresponde con la anterior figura 10 - panel A).

[0309] Según la metodología de los solicitantes [1], también se puede proyectar este criterio de NPV sobre el espacio ROC. Para el ejemplo dado, el umbral NPV=0,99 calculado para una incidencia (o prevalencia) del 5 %, corresponde a la recta en el espacio ROC; también se muestra un hipotético clasificador conforme (que presenta una especificidad = 0,5 con un NPV =0,99) (figura 12).

[0310] Al igual que en el caso anterior del PPV, el criterio de NPV conservará una proporción constante de verdaderos negativos sobre falsos negativos [no mostrado]. En el espacio ROC, el criterio de NPV variará con la incidencia (o prevalencia) del resultado. A modo de ejemplo, el clasificador hipotético presentado en la figura 12 se reproduce a continuación para los escenarios con una incidencia de resultados del 2,5 % (figura 13, panel A) y del 10 % (figura 13, panel B).

[0311] A partir de estas ilustraciones, es obvio que los requisitos pronósticos para un determinado criterio de exclusión de NPV (en términos de sensibilidad y especificidad) son más estrictos cuanto mayor es la incidencia (prevalencia) de la enfermedad. A la vista de los métodos elaborados en esta solicitud, el lector puede apreciar que es más difícil encontrar modelos pronósticos / núcleos pronósticos adecuados dado un criterio de NPV objetivo clínicamente relevante con una incidencia/prevalencia de resultados creciente.

[0312] EJEMPLO 2

[0313] Se elabora un conjunto no limitante de ejemplos numéricos para ilustrar los conceptos de la aplicación secuencial de [pruebas de inclusión y exclusión], para proporcionar una clasificación de inclusión excepcional, o la aplicación secuencial de [pruebas de inclusión y exclusión], para proporcionar una clasificación de exclusión excepcional.

[0314] Con una finalidad meramente ilustrativa, se considera la misma población de "caso base" del ejemplo 16. - Población n= 400

[0315] - Incidencia / prevalencia<p= 0,05 (la afección se desarrollará en el 5 % de la población en un>tiempo posterior a la aplicación de la prueba de pronóstico), o bien

o Casos futuros: n = 20

[0316] o Futuros no casos: n =380

[0317] Objetivo: Clasificación de inclusión de relevancia clínica

[0318] Una prueba de pronóstico de inclusión está orientada a identificar a aquellos individuos que presentan un mayor riesgo de desarrollar un futuro trastorno del embarazo. Para ello, se intentará desarrollar clasificadores que identifiquen un grupo de "alto riesgo", es decir, individuos con mayor riesgo de desarrollar el futuro trastorno del embarazo, en comparación con la población no estratificada. Con una finalidad meramente ilustrativa, se considera el siguiente objetivo de clasificación de inclusión:

[0319] - Para ser clínicamente significativa, una prueba de detección precoz debe proporcionar una tasa de detección de "futuros casos" en el "grupo de alto riesgo" de >= 70 %, es decir, Sn >= 0,7, para un Valor Predictivo Positivo =>0,2.

[0320] En la figura 14, estos objetivos pronósticos se ejemplifican en formato de "cuadrícula" (Panel A), así como en el espacio ROC (Panel B). A partir del último panel B, se puede apreciar que un clasificador conforme necesita tener una curva ROC con puntos en el área designada A en el espacio ROC. Como mínimo, el clasificador debe cumplir el par [Sensibilidad = 0,7, 1-Especificidad = 0,15]. También se puede apreciar que los clasificadores pronósticos con estos pares mínimos [Sensibilidad - Especificidad] serán difíciles de establecer o posiblemente no existirán.

[0321] Para aquellos casos en los que no se pueden establecer clasificadores, constituidos por combinaciones de variables y/o núcleos de pronóstico, que ofrezcan el rendimiento de pronóstico de inclusión según lo exige el contexto clínico, los solicitantes establecieron un proceso novedoso.

[0322] Con una finalidad meramente ilustrativa, considere el siguiente proceso gradual:

[0323] 1) Establecer una fracción "admisible" de futuros casos que se clasificarán erróneamente con toda seguridad; el establecimiento de esta fracción vendrá determinado normalmente, aunque no de forma limitativa, por el contexto sanitario y puede variar según corresponda. Para este ejemplo, se asume que es aceptable que el 10 % de los futuros casos se clasifiquen erróneamente; esto corresponde a un umbral FNR del 10 % (FNR<admisible>) para una prueba de exclusión, como se ejemplifica en el ejemplo 1.

[0324] 2) Aplicando los métodos elaborados anteriormente, se pueden establecer combinaciones de variables y/o núcleos pronósticos que pueden clasificar una población de prueba (en este ejemplo: Pob.-estudio 1; n= 400) según este criterio. A modo de ejemplo, supongamos que se puede desarrollar un clasificador de exclusión que clasifique correctamente el 50 % de los no futuros casos, junto con el 10 % de los futuros casos (es decir, falsos negativos). Los requisitos emparejados [Sensibilidad-Especificidad] de este tipo de clasificadores son mucho más modestos y, por tanto, la probabilidad de identificar este tipo de clasificadores es mayor.

[0325] 3) Aplicar este clasificador al Pob.-estudio 1 y crear una población de "bajo riesgo" PopLR, y una nueva Pob.-estudio 2. Los individuos del PopLR se consideran "totalmente clasificados" y no se les da más importancia. En la figura 15 se muestra un ejemplo. Los individuos de la Pob.-estudio 2 siguen en el proceso y serán considerados para otra etapa de clasificación.

[0326] La composición de la Pob.-estudio 2 es ahora la siguiente

[0328] - Población<n=>

[0329] <208>o Casos futuros:<n =>

[0330] <18>o Futuros no casos:<n>

[0331] =190 En la población de la Pob.-estudio 2, la incidencia / prevalencia del resultado ha - aumentado de p=0,05 a p= 0,0865 (la afección se desarrollará en el 8,65 % de la población

[0332] de la Pob.-estudio 2).

[0333] 4) La segunda etapa del proceso consiste en aplicar de nuevo los métodos elaborados anteriormente para generar un nuevo espacio-modelo (modelo-S2) e identificar en él todos los modelos de pronóstico robustos. A continuación, se buscarán modelos de pronóstico y/o núcleos de pronóstico que cumplan el criterio inicial de inclusión, es decir, PPV= 0,2 y maximicen la tasa de detección. Para cumplir la tasa de detección global del 70 % estipulada anteriormente, esta etapa debe detectar el 70 % de los 20 casos de la Pob.-estudio 1, a pesar de que 2 de estos futuros casos se clasificaron erróneamente en la primera etapa de este proceso. Por lo tanto, es necesario detectar 14 de los 18 casos de la Pob.-estudio 2. Por lo tanto, la tasa de detección para el clasificador de inclusión de la segunda etapa deberá ser de 14/18 (Sn= TP/(TP+FN)), es decir, Sn >= 0,77. Con una finalidad meramente ilustrativa, en la figura 16 se ilustra un clasificador de inclusión que clasifica correctamente el 77 % de los futuros casos, dado el criterio de PPV= 0,2 preestablecido.

[0334] Si bien la tasa de detección (es decir, la sensibilidad) de la segunda etapa debe ser mayor para cumplir el objetivo de tasa de detección global, el enriquecimiento de futuros casos en la Pob.-estudio 2 transitorio reduce los requisitos para que los valores emparejados [Sensibilidad - Especificidad] de la curva ROC de un clasificador cumplan el criterio de PPV preestablecido. Esta última "relajación" del criterio del PPV compensa los mayores requisitos de la tasa de detección. Esto también resulta evidente al comparar el tamaño de las Áreas "A" conformes en el espacio ROC (p. ej., el área "A" de la figura 16 es significativamente mayor que el área "A" de la figura 14).

[0335] Basándose en esta ilustración, el lector puede apreciar que la probabilidad de identificar un clasificador de inclusión que cumpla con el criterio de PPV como relevante para la segunda etapa en este proceso novedoso es significativamente mayor en comparación con la probabilidad de identificar un clasificador de inclusión de una sola etapa que lo cumpla. También puede apreciarse que el grado de "relajación" del criterio de PPV en la segunda etapa dependerá del rendimiento pronóstico alcanzado en la etapa de exclusión precedente. Cuanto mejor sea la clasificación de exclusión de la 1.ª etapa, menores serán los requisitos para que los valores emparejados [Sensibilidad - Especificidad] cumplan el criterio PPV en la 2.ª etapa de clasificación, y viceversa. Resumiendo, los métodos ilustrados en las 4 etapas anteriores, apoyan el descubrimiento de clasificadores de pronóstico de inclusión con un rendimiento de pronóstico excepcional por medio de la identificación de pares específicos de modelos de pronóstico y/o núcleos de pronóstico, que implican un clasificador de exclusión específico y un clasificador de inclusión específico, aplicados conjunta y consecutivamente. En el ejemplo dado se consideró la aplicación de un criterio FNR<admisible>(exclusión) y un criterio PPV<umbral>(inclusión). Los métodos alternativos pueden consistir, por ejemplo pero sin limitarse a ello, en NPV<admisible>(exclusión) y PPV<umbral>(inclusión); o RNL<admisible>(exclusión).

[0336] Objetivo: Clasificación de exclusión clínicamente relevante.

[0337] Una prueba pronóstica de exclusión suele estar orientada a identificar a aquellos individuos que tienen un riesgo menor de desarrollar un futuro trastorno del embarazo. Para ello, se intentará desarrollar clasificadores que identifiquen un grupo de "bajo riesgo", es decir, individuos con un riesgo menor de desarrollar el futuro trastorno del embarazo, en comparación con la población no estratificada. Como se destaca en el ejemplo 1, lograr un alto rendimiento pronóstico de exclusión suele tener más utilidad clínica cuando la incidencia (o prevalencia) del resultado de salud es más común. Por esta razón, se considera una población "caso base 2" diferente a la del ejemplo 16 con una finalidad meramente ilustrativa.

[0338] - Población n= 400

[0339] - Incidencia / prevalencia<p= 0,10 (la afección se desarrollará en el 10 % de la población en un>tiempo posterior a la aplicación de la prueba de pronóstico), o bien

o Casos futuros: n = 40

[0340] o Futuros no casos: n =360

[0341] Con una finalidad meramente ilustrativa, se considera el siguiente objetivo de clasificación de exclusión: - Para ser clínicamente significativa, una prueba de inclusión debe proporcionar una tasa de detección de "futuros no casos" en el "grupo de bajo riesgo" de >= 50 %, es decir, Sp>= 0,50, para un valor predictivo negativo=> 0,99.

[0342] En la figura 17, la población de "caso base" previa a la prueba (Panel A) se ilustra en formato de cuadrícula, junto con los objetivos pronósticos que se ejemplifican en formato de "cuadrícula" (Panel B), así como en el espacio ROC (Panel C). A partir del último panel C, se puede apreciar que un clasificador conforme necesita tener una curva ROC con puntos en el área designada A en el espacio ROC. Como mínimo, el clasificador debe cumplir el par [Sensibilidad = 0,955, 1-Especificidad = 0,5]. También se puede apreciar que los clasificadores pronósticos con estos pares mínimos [Sensibilidad - Especificidad] serán difíciles de establecer o posiblemente no existirán.

[0343] Para aquellos casos en los que no se puedan establecer clasificadores, constituidos por combinaciones de variables y/o núcleos pronósticos, que proporcionen el rendimiento de exclusión pronóstico exigido por el contexto clínico, los inventores establecen un proceso gradual similar al elaborado en la sección anterior [consulte Clasificación de exclusión clínicamente relevante].

[0344] Con una finalidad meramente ilustrativa, considere el siguiente proceso gradual:

[0345] 1) Establecer una fracción "admisible" de futuros no casos que con toda seguridad se clasificarán erróneamente como de riesgo. Para este ejemplo, se supone que es aceptable que el 20 % de los futuros casos no clasificados se clasifiquen erróneamente, lo que corresponde a un umbral de FPR del 20 % (FPR<admisible>) para una prueba de inclusión según el ejemplo 1.

[0346] 2) Aplicando los métodos elaborados anteriormente, se pueden establecer combinaciones de variables y/o núcleos pronósticos que pueden clasificar una población de prueba (en este ejemplo: Pob.-estudio 1; n= 400) según este criterio. Con una finalidad meramente ilustrativa, supongamos que se puede desarrollar un clasificador de inclusión que clasifique correctamente el 70 % de los futuros casos, junto con el 20 % de los no futuros casos (es decir, los falsos positivos). Los requisitos emparejados [Sensibilidad-Especificidad] de este tipo de clasificadores son mucho más modestos y, por tanto, la probabilidad de identificar este tipo de clasificadores es mayor.

[0347] 3) Aplicar este clasificador a la Pob.-estudio 1 y crear una población de "alto riesgo" PopHR, y una nueva Pob.-estudio 2. Las personas incluidas en la PopHR se consideran "totalmente clasificadas" y no se les da más importancia. En la figura 18 se muestra un ejemplo. Los individuos de la Pob.-estudio 2 siguen en el proceso y serán considerados para otra etapa de clasificación.

[0348] La composición de la Pob.-estudio 2 es ahora la siguiente

[0349] - Población n= 300 o Casos futuros: n = 12 o Futuros no casos: n =288 - En la población de la Pob.-estudio 2, la incidencia / prevalencia del resultado

[0350] disminuye ahora de p=0,1 a p= 0,04 (la enfermedad se desarrollará en el 4 % de la

[0351] población de la Pob.-estudio 2).

[0352] 4) La segunda etapa del proceso consiste en aplicar de nuevo los métodos elaborados anteriormente para generar un nuevo espacio-modelo (modelo-S2) e identificar en él todos los modelos de pronóstico robustos. A continuación, se buscarán modelos de pronóstico y/o núcleos de pronóstico que cumplan el criterio de exclusión inicial, es decir, NPV =0,99 y maximicen la especificidad (es decir, la tasa de detección de futuros no casos). Para cumplir la tasa global de detección de no casos estipulada anteriormente del 50 % (Sp=0,5), esta etapa debe detectar el 50 % de los 360 no casos de la Pob.-estudio 1, aunque 72 de ellos se clasificaran erróneamente en la primera etapa de este proceso. Por lo tanto, es necesario detectar los 180 no casos de los 288 no casos de la Pob.-estudio 2. Por lo tanto, la especificidad para el clasificador de exclusión de la segunda etapa deberá ser de 180/288 (Sp= TN/(TN+FP)), es decir, Sp >= 0,625. A modo de ejemplo, en la figura 19 se ilustra un clasificador de exclusión que clasifica correctamente el 62,5 % de los futuros no casos, dado el criterio preestablecido de NPV =0,99.

[0353] Mientras que la especificidad de la segunda etapa debe ser mayor para cumplir el objetivo de tasa global de detección de no casos, el agotamiento de futuros casos (equivalente a un enriquecimiento de futuros no casos) en la Pob.-estudio 2 transitoria reduce los requisitos para que los valores emparejados [Sensibilidad -Especificidad] de la curva ROC de un clasificador cumplan el criterio de NPV preestablecido. Esta última "relajación" del criterio del NPV compensa los mayores requisitos de especificidad. Esto también resulta evidente al comparar el tamaño de las Áreas "A" conformes en el espacio ROC (p. ej., el área "A" de la figura 19 es significativamente mayor que el área "A" de la figura 17.

[0354] Basándose en esta ejemplificación, el lector puede apreciar que la probabilidad de identificar un clasificador de exclusión que cumpla con el criterio NPV como relevante para la segunda etapa en este proceso novedoso es significativamente mayor en comparación con la probabilidad de identificar un clasificador de exclusión de una sola etapa que cumpla. También puede apreciarse que el grado de "relajación" del criterio de NPV en la segunda etapa dependerá de los resultados de pronóstico obtenidos en la etapa anterior de inclusión. Cuanto mejor sea la clasificación de inclusión en la 1.ª etapa, menores serán los requisitos para que los valores emparejados [Sensibilidad - Especificidad] cumplan el criterio de NPV en la 2.ª etapa de clasificación y viceversa.

[0355] En Compendio, los métodos ejemplificados en las 4 etapas anteriores, apoyan el funcionamiento de clasificadores pronósticos de exclusión con un rendimiento pronóstico excepcional mediante la identificación de pares específicos de modelos pronósticos y/o núcleos pronósticos, que implican un clasificador específico de inclusión y un clasificador específico de exclusión, aplicados conjunta y consecutivamente. En el ejemplo dado se consideró la aplicación de un criterio<admisible>(inclusión) y un criterio<umbral>(exclusión). Algunos métodos alternativos pueden implicar, por ejemplo pero sin limitarse a ello, PPV<admisible>(inclusión) y NPV<umbral>(exclusión); o PLR<admisible>(inclusión) y NPV<umbral>(exclusión).

[0356] EJEMPLO 3

[0357] Se elabora un ejemplo numérico no limitativo para ilustrar los conceptos de la aplicación secuencial de múltiples clasificadores en conjunción con un criterio de decisión [clasificado completamente sí/no] en cada etapa de clasificación, para entregar una clasificación excepcional de inclusión, y/o para entregar una clasificación excepcional de exclusión, tal como se aplica dentro de los métodos.

[0358] Con una finalidad meramente ilustrativa, se considera la misma población de "caso base" del ejemplo 1. - Población n= 400

[0359] - Incidencia / prevalencia<p= 0,05 (la afección se desarrollará en el 5 % de la población en un>tiempo posterior a la aplicación de la prueba de pronóstico), o bien

o Casos futuros: n = 20

[0360] o Futuros no casos: n =380

[0361] Con una finalidad meramente ilustrativa, se considera el siguiente objetivo de clasificación:

[0362] Para ser clínicamente significativa, una prueba pronóstica debe maximizar la tasa de detección de futuros casos en un grupo de alto riesgo con un PPV >= 0,2 y, al mismo tiempo, maximizar la tasa de detección de futuros no casos en un grupo de bajo riesgo, por lo que el Valor Predictivo Negativo >= 0,99.

[0363] En la figura 20, se ilustran los objetivos de clasificación de esta prueba de pronóstico ilustrativa. A partir de la figura 20, se puede apreciar que los clasificadores que cumplan con el criterio de alto riesgo PPV >=0,2 necesitarán pares [Sensibilidad-Especificidad] dentro del área designada "A", mientras que los clasificadores que cumplan con el criterio de alto riesgo NPV >=0,99 necesitarán pares [Sensibilidad-Especificidad] dentro del área designada "B".

[0364] Para que una prueba pronóstica cumpla el criterio de inclusión y el de exclusión al mismo tiempo, necesita tener pares [Sensibilidad-Especificidad] dentro de la intersección de las áreas "A" y "B". Se puede apreciar que un clasificador pronóstico de una etapa con pares [Sensibilidad - Especificidad] en la intersección de las áreas "A" y "B" será difícil de establecer.

[0365] Para una prueba pronóstica que proporcione pares [Sensibilidad-Especificidad] dentro del área "A" o "B", pero no en el área de intersección "A" ∩ "B", un individuo puede clasificarse en cualquiera de las 3 clases de riesgo siguientes: Alto riesgo, Bajo riesgo o indeterminado. La clasificación "indeterminado" se produce cuando la puntuación de riesgo pronóstico calculada de un individuo no lo clasifica ni en el grupo de alto riesgo ni en el de bajo riesgo. Su probabilidad posterior a la prueba de desarrollar el resultado de interés no está de acuerdo con los criterios clínicos preestablecidos de PPV y/o NPV.

[0366] De acuerdo con los requisitos de la prueba clínica hipotética, el componente "inclusión" del clasificador debe maximizar la Sensibilidad (es decir, la tasa de detección de futuros casos) para el criterio de PPV dado; mientras que el componente de "exclusión" del clasificador debe maximizar la Especificidad (es decir, la tasa de detección de no futuros casos).

[0367] Con una finalidad meramente ilustrativa, considere el siguiente proceso hipotético por etapas:

[0368] 1) Aplicando los métodos elaborados anteriormente, se pueden establecer combinaciones de variables y/o núcleos pronósticos que pueden clasificar una población de prueba (en este ejemplo: Pob.-estudio 1; n= 400; véase la figura 21 - panel A).

[0369] 2) Supongamos que se puede desarrollar un clasificador de inclusión que clasifique correctamente el 50 % de los futuros casos con un PPV = 0,2 (véase la figura 21 - panel B).

[0370] 3) Aplicar este clasificador al Pob.-estudio 1 y crear una población de "alto riesgo" PopHR1, y una nueva Pob.-estudio 2. Los individuos de la PopHR1 se consideran "totalmente clasificados" y no se les da más importancia. Los individuos de la Pob.-estudio 2 siguen en el proceso y serán considerados para otra etapa de clasificación. La composición de la Pob.-estudio 2 es ahora la siguiente

[0371] - Población n= 350

[0372] o Casos futuros: n = 10

[0373] o Futuros no casos: n = 340

[0374] 4) Aplicando los métodos elaborados anteriormente, se pueden establecer combinaciones de variables y/o núcleos pronósticos que pueden clasificar a la población de la Pob.-estudio 2.

[0375] 5) Supongamos que se puede desarrollar un clasificador de exclusión que clasifique correctamente el ~40 % de los futuros no casos de la Pob.-estudio 2 con un NPV >= 0,99 (véase la figura 21 - panel C).

[0376] 6) Aplicar este clasificador al Pob.-estudio 2 y crear una población de "bajo riesgo" PopLR1, y una nueva Pob.-estudio 3. Los individuos de la PopLR1 se consideran "totalmente clasificados" y no se les da más importancia. Los individuos de la Pob.-estudio 3 siguen en el proceso y se tendrán en cuenta para otra etapa de clasificación. La composición de la Pob.-estudio 3 es ahora la siguiente

[0377] - Población n= 213

[0378] o Casos futuros: n = 9

[0379] o Futuros no casos: n = 204

[0380] 7) Aplicando los métodos elaborados anteriormente, se pueden establecer combinaciones de variables y/o núcleos pronósticos que pueden clasificar a la población de la Pob.-estudio 3.

[0381] 8) Supongamos que se puede desarrollar otro clasificador de exclusión que clasifique correctamente el 50 % de los futuros no casos de la Pob.-estudio 2 con un NPV >= 0,99 (véase la figura 21 - panel D).

[0382] 9) Aplicar este clasificador al Pob.-estudio 3 y crear una población de "bajo riesgo" PopLR2, y una nueva Pob.-estudio 4. Los individuos de la PopLR2 se consideran "totalmente clasificados" y se añaden al grupo total de bajo riesgo (PopLR<total>= popLR1 PopLR2). A los individuos de la PopLR2 no se les da más consideración. Los individuos de la Pob.-estudio 4 siguen en el proceso y serán considerados para otra etapa de clasificación. La composición de la Pob.-estudio 4 es ahora la siguiente

[0383] - Población n= 111

[0384] o Casos futuros: n = 9

[0385] o Futuros no casos: n = 102

[0386] 10) Supongamos que se puede desarrollar un clasificador de inclusión que clasifique correctamente el 89 % de los futuros casos con un PPV = 0,2 (véase la figura 21 - panel E).

[0387] 11) Aplicar este clasificador a la Pob.-estudio 4 y crear una población de "alto riesgo" PopHR2. Estas últimas se añaden al grupo total de alto riesgo (PopHR<total>= popHR1 PopHR2). El examen de la población restante muestra que su composición no alcanza el criterio NPV >=0,99, es decir, NPV<resto>= 70/(70+1) = 0,986.

[0388] Dado que el criterio de decisión para seguir clasificando a la población restante se rige por si se cumplen los criterios de PPV y/o NPV dentro de los respectivos "grupo total de alto riesgo" y "grupo total de bajo riesgo", se evalúa el impacto de clasificar a la población restante en el "grupo total de bajo riesgo". Puede observarse en la figura Ejemplo18/2 - Panel F, que la adición de la población restante al "grupo total de bajo riesgo" hace que este último siga cumpliendo el criterio de NPV preestablecido. Por consiguiente, la población restante también se considera totalmente clasificada, y se etiqueta en consecuencia como PopLR3. Sin necesidad de clasificación adicional, la clasificación total resultante conseguida sigue la "suma" de los diferentes grupos intermedios de alto riesgo en el grupo total de alto riesgo, es decir, PopHR<total>= PopHR1 PopHR2, y la "suma" de los distintos grupos intermedios de bajo riesgo en el grupo total de bajo-alto riesgo, es decir, PopLR<total>= PopLR1 PopLR2 PopLR3 (véase la figura 21 - panel F). Es importante señalar que tanto el grupo total de alto riesgo como el grupo total de bajo riesgo cumplen sus respectivos criterios preestablecidos; es decir, un PPV >= 0,2 para el grupo total de alto riesgo y un NPV >= 0,99 para el grupo total de bajo riesgo.

[0389] Además, para la ilustración dada, el "clasificador total", que constituye el conjunto específico de 4 clasificadores aplicados en un orden específico, da como resultado la clasificación de todos los individuos de la población de estudio inicial en un grupo de alto riesgo o en un grupo de bajo riesgo según los requisitos clínicos preestablecidos. En este caso no hay individuos clasificados como indeterminados.

[0390] Para el ejemplo hipotético dado, el método aquí elaborado da como resultado un "clasificador total" muy específico, y se asocia a un único par [sensibilidad-especificidad] en el espacio ROC. En la figura 21 - panel G se puede observar que el "clasificador total", que constituye el conjunto específico de 4 clasificadores aplicados en un orden específico, cumple simultáneamente tanto el criterio PPV de entrada como el criterio NPV de salida y, por lo tanto, se encuentra en la intercepción de las áreas "A" y "B".

[0391] En otros casos, cuando las variables disponibles y los clasificadores derivados de las mismas (con diferentes clasificadores desarrollados para cada población de estudio intermedia) no permiten el descubrimiento de un conjunto de clasificadores que logre la clasificación total de la población de estudio para satisfacer simultáneamente los criterios preestablecidos de PPV y NPV, aún se podría encontrar un clasificador que constituya un conjunto de dos pares [Sensibilidad - Especificidad], uno en el área "A" y otro en el área "B", aunque ninguno de los puntos se encuentre en la intersección de las áreas "A" y "B".

[0392] Para ilustrar esto, considere el proceso paso a paso ejemplificado anteriormente, pero suponiendo que no se puede descubrir un clasificador apropiado para estratificar aún más la Pob.-estudio 4. De este modo, la clasificación máxima se alcanzó en la etapa 3 (véase la figura 21 - panel D). Dentro del "clasificador total", que constituye el conjunto específico de 3 clasificadores aplicados en un orden concreto, la clasificación inclusión es el resultado únicamente de la primera etapa de clasificación (etapa 1, Inclusión; véase la figura 21 - panel B), mientras que la clasificación exclusión sigue a la ejecución de 3 etapas de clasificación consecutivas (etapa 1 a etapa 3, véase la figura 21 - panel B-D). La clasificación "total" coincide con las zonas "cruzadas" de la figura 21 - panel E. Esto se traduce en el espacio ROC de la siguiente manera (véase la figura 22):

[0393] - Par [Sensibilidad - Especificidad] de inclusión:

[0394] - Sn = 0,50, véase la PopHR1, o la fracción de futuros casos que están en la PopHR1, es decir, 10/20 = 0,5

[0395] - Sp = 0,895, que corresponde a la fracción de futuros no casos que no están en la PopHR1, es decir, 340/380 = 0,895

[0396] - Par de [sensibilidad - especificidad] de exclusión:

[0397] - Sn = 0,95, (o FNR 1-Sn = 0,05) que corresponde a la fracción de futuros casos que no están en la PopLR1 PopLR2, es decir, 19/20 = 0,95

[0398] - Sp = 0,895, es decir, la fracción de futuros no casos que se encuentran en la PopLR1 PopLR2, es decir, (136+102)/380 =0,626

[0399] Los individuos de la Pob.-estudio 1 inicial que no están clasificados ni en la PopHR1 de alto riesgo ni en la PopLR1 PopLR2 de bajo riesgo, es decir, los individuos de la Pob.-estudio 4 residual, permanecen sin clasificar.

[0400] Resumiendo, los métodos tal como se ejemplifican en el presente ejemplo, apoyan el descubrimiento de clasificadores pronósticos con un rendimiento pronóstico excepcional mediante la identificación de conjuntos específicos de modelos pronósticos y/o núcleos pronósticos, que luego se aplicarán conjunta y consecutivamente. El número de etapas consecutivas y el orden de los clasificadores de entrada y salida aplicados en los ejemplos no son limitativos. Cualquier otra permutación del número de etapas o del orden de aplicación de los clasificadores de inclusión y de exclusión también está cubierta por esta solicitud.

[0401] Se apreciará que mientras que los ejemplos proporcionados anteriormente se dirigen a la predicción de un trastorno del embarazo en un sujeto, los métodos de la invención también pueden aplicarse al diagnóstico de trastornos de embarazos, en particular trastornos de embarazos para los que los síntomas se manifiestan en una etapa tardía de la patología del trastorno del embarazo. Los métodos de la invención también pueden aplicarse a otros trastornos del embarazo, por ejemplo determinar si un sujeto desarrollará una enfermedad neurodegenerativa, un trastorno proliferativo o una enfermedad cardiovascular. Los métodos de la invención también pueden aplicarse para predecir resultados relacionados con la salud, por ejemplo, si un cáncer primario en un sujeto hará metástasis, predecir si un paciente desarrollará septicemia en respuesta a una cirugía mayor y predecir si un paciente rechazará un trasplante. Adicionalmente, los métodos de la invención también pueden aplicarse para predecir otros resultados en un sujeto, por ejemplo predecir la eficacia de un fármaco o terapia en un sujeto, predecir el resultado de un sujeto que tiene un trastorno del embarazo, y predecir si un trastorno del embarazo volverá a ocurrir en el sujeto. Los métodos de la invención también son aplicables a la generación de modelos para predecir resultados no médicos, por ejemplo en el campo de la predicción meteorológica, la predicción de fallos de componentes eléctricos o mecánicos, el aprendizaje automático y la investigación de minería de datos.

[0403] EJEMPLO 4: Modelos de pronóstico de la preeclampsia

[0405] Los métodos de análisis de datos aquí elaborados se centran en identificar combinaciones pronósticas no evidentes de metabolitos, y/o combinaciones de variables fisiológicas, como metabolitos, proteínas y otras variables, para un futuro trastorno del embarazo. Adicionalmente, los métodos descritos se interpretan de tal forma que las combinaciones pronósticas no obvias de metabolitos, y/o combinaciones de metabolitos y otras variables, proporcionarán resultados pronósticos clínicamente significativos.

[0407] Para ejemplificar estos métodos, los inventores aplicaron los métodos para identificar combinaciones específicas no evidentes de metabolitos transmitidos por la sangre, y/o combinaciones de metabolitos transmitidos por la sangre y otras variables, para predecir el riesgo de preeclampsia en una mujer embarazada antes de la aparición de síntomas clínicos de preeclampsia en la mujer.

[0409] La preeclampsia (PE) es un trastorno específico del embarazo que se produce en el 2-8 % de todos los embarazos. La PE se origina en la placenta y se manifiesta como hipertensión de nueva aparición y proteinuria después de las 20 semanas de gestación. La PE sigue siendo una de las principales causas de morbilidad y mortalidad materna y perinatal. Cada año mueren 70.000 madres y 500.000 lactantes por las consecuencias directas de la PE. Las complicaciones maternas de la PE incluyen accidentes cerebrovasculares, rotura hepática, edema pulmonar o insuficiencia renal aguda. Para el feto, la insuficiencia placentaria provoca una restricción del crecimiento fetal, que se asocia a una mayor morbilidad y mortalidad neonatal. Hasta la fecha, la única cura para la PE es la expulsión de la placenta y, por tanto, el nacimiento del bebé. En consecuencia, la prematuridad iatrogénica aumenta la carga de morbilidad y mortalidad neonatal. El impacto de la PE en la salud de los pacientes no se limita al periodo perinatal: Las madres afectadas tienen un mayor riesgo de por vida de padecer enfermedades cardiovasculares, accidentes cerebrovasculares y diabetes mellitus de tipo 2. Los niños nacidos prematuramente como consecuencia de una PE pueden presentar problemas de desarrollo neurocognitivo que van desde dificultades leves de aprendizaje hasta discapacidades graves. A más largo plazo, los niños y adolescentes de embarazos complicados por PE presentan un aumento de la tensión arterial y del IMC en comparación con sus pares, con mayor incidencia de diabetes, obesidad, hipertensión y enfermedades cardiacas.

[0411] Aunque en la actualidad no existen tratamientos listos para curar la preeclampsia cuando se manifiesta, hay algunos tratamientos farmacológicos, es decir, ácido acetilsalicílico y metformina (y otros), que tienen el potencial de prevenir el desarrollo de algunos de los casos de preeclampsia. Sin embargo, para que estas intervenciones profilácticas con agentes terapéuticos repercutan en la incidencia de la preeclampsia a nivel de la población y sean eficaces, los proveedores de atención sanitaria deben disponer de una herramienta o prueba de estratificación del riesgo que combine los dos atributos siguientes: identificación de estos embarazos con mayor riesgo de contraer la enfermedad en una fase temprana de la gestación y selección de los embarazos para el tratamiento adecuado. Estos requisitos siguen el principio de precaución según el cual no se debe dañar a la mujer embarazada ni al feto. Una administración generalizada de fármacos a todos los embarazos con el fin de prevenir la preeclampsia en algunos, podría incurrir en riesgos innecesarios para la salud (p. ej., debido a los efectos secundarios del tratamiento) en estos que no están en riesgo en primer lugar.

[0412] Las hipótesis contemporáneas sobre las causas etiológicas de la preeclampsia sugieren que la PE es de naturaleza sindrómica, y que la preeclampsia es posiblemente más de una enfermedad. En el marco de esta hipótesis, la capacidad de evaluar con precisión en las primeras etapas del embarazo (varios meses antes de la manifestación de cualquier síntoma clínico) qué mujeres embarazadas tienen un riesgo mayor (o alto) de desarrollar preeclampsia, y qué mujeres tienen un riesgo menor (o bajo) de desarrollar preeclampsia, dependerá de esta suposición de que la preeclampsia es una enfermedad múltiple. Sin embargo, actualmente no existen medios para delimitar de forma inequívoca los diferentes subtipos de preeclampsia y/o para delimitar subpoblaciones específicas con riesgo de padecer preeclampsia (o cualquiera de sus subtipos).

[0414] Para superar esto, los solicitantes, y otros, utilizan características maternas fácilmente disponibles y/o datos de resultados del embarazo para crear subgrupos "por aproximación" de mujeres embarazadas o subtipos "por aproximación" de preeclampsia, que se supone que están enriquecidos en perfiles de riesgo de pacientes verdaderamente diferentes o subtipos de preeclampsia verdaderamente diferentes. Asimismo, y como se elabora en la presente memoria, junto a la consideración de la preeclampsia como una única entidad patológica, los solicitantes delimitaron la preeclampsia en 2 subtipos utilizando un diagnóstico de preeclampsia junto con la edad gestacional del parto, es decir, preeclampsia pretérmino y preeclampsia a término. Por pretérmino se entiende un parto anterior a la semana 37 de gestación, y por a término un parto a las 37 semanas de gestación o después.

[0415] Cuando estas "aproximaciones" artificiales enriquezcan realmente un perfil de riesgo de subpoblación real y/o un subtipo real de enfermedad, esto debería reflejarse en las variables, y/o los modelos pronósticos que constituyen combinaciones de variables, relevantes para predecir la preeclampsia en estos grupos por aproximación. Cabría esperar que diferentes combinaciones de variables fueran pronósticas para diferentes grupos de riesgo de la población y/o subtipos de preeclampsia. Al mismo tiempo, los solicitantes razonaron que, al aplicar cada modelo de pronóstico "específico por aproximación" para determinar únicamente el "riesgo específico por aproximación", su rendimiento pronóstico será mayor al disminuir el ruido de fondo derivado de la variabilidad biológica de la población objetivo. Por ejemplo, un modelo de pronóstico de preeclampsia pretérmino debería utilizarse únicamente para estratificar a las embarazadas según su riesgo de preeclampsia pretérmino y no para su riesgo de "preeclampsia total", ya que el rendimiento pronóstico del modelo de pronóstico de preeclampsia pretérmino no predecirá adecuadamente el riesgo de PE a término y, por lo tanto, también ofrecerá una predicción deficiente de la "preeclampsia total". Aunque este concepto parece trivial, a menudo se pasa por alto.

[0416] Además, los solicitantes también ampliaron este concepto al considerar que la cuestión pronóstica de encontrar mujeres embarazadas con bajo riesgo de desarrollar preeclampsia es diferente de la cuestión pronóstica de encontrar mujeres embarazadas con alto riesgo de desarrollar preeclampsia. Mientras que los modelos de pronóstico para la primera pregunta pueden constituir variables indicativas de "buena" salud materna y fetal, los modelos de pronóstico para la preeclampsia pueden constituir variables indicativas de "mala" salud materna y fetal, por lo que las combinaciones de variables para "buena" salud y "mala salud" no son necesariamente las mismas.

[0417] Además, los solicitantes reconocieron que la predicción de la preeclampsia, y sus subtipos, corresponde al desarrollo de pronósticos y, por lo tanto, se requerirá la necesidad de combinaciones no triviales de variables para lograr un rendimiento pronóstico clínicamente relevante para la preeclampsia y sus subtipos, tal como se considera en esta solicitud.

[0418] Es evidente que la aplicación de los métodos requiere la disponibilidad de una colección adecuada de muestras de sangre (u otras muestras biológicas), como obtenidas de mujeres embarazadas en un punto de tiempo temprano en su embarazo, más específicamente un punto de tiempo cuando ninguna de las mujeres muestra síntomas de preeclampsia. Adicionalmente, también es evidente que, además de las muestras, se dispone de información sobre los resultados del embarazo, es decir, si la mujer embarazada desarrolló preeclampsia durante su embarazo o si no la desarrolló. Adicionalmente, pero no como condición inexcusable, es necesario disponer de variables adicionales, como factores de riesgo (clínicos) relevantes recogidos en el momento de la toma de muestras o disponibles en los historiales (médicos), o los resultados de pruebas clínicas relevantes y bien establecidas (p. ej., mediciones de glucosa) o datos de cuantificación de otros tipos de moléculas biomarcadoras putativas relevantes, disponibles para la misma muestra / individuo de origen. Para evitar dudas, el diagnóstico de preeclampsia (o su ausencia) se produce en un momento del embarazo que es claramente posterior (normalmente, pero no de forma restrictiva, 20 o más semanas después) en comparación con el momento en que se toma la muestra biológica que se utiliza para establecer el riesgo futuro de que se produzca preeclampsia.

[0419] Los detalles sobre los participantes en el estudio y las muestras utilizadas para encontrar combinaciones pronósticas de variables, seleccionadas a partir de metabolitos, proteínas y factores de riesgos clínicos de interés, se describen en la sección"Participantes y muestras", y "Conjunto de muestras utilizado";

[0420] Los detalles sobre las variables de interés, es decir, metabolitos, proteínas y factores de riesgo clínico de interés se describen en la sección"Participantes y muestras";

[0421] Con el objetivo de la colección de métodos como se describe en la presente memoria para desarrollar pruebas clínicamente significativas para el pronóstico de la preeclampsia, también se presenta un ejemplo no limitativo de objetivos de rendimiento de pruebas clínicamente significativas como se adoptan en esta solicitud en la sección"Objetivos de pronóstico ilustrativos para pruebas de estratificación del riesgo de preeclampsia":Las variables de interés y los métodos a determinar se reseñan en el apartado "Recopilación de los métodos analíticos"

[0422] Para el ejemplo de preeclampsia elaborado en la presente memoria, los métodos y etapas de análisis de datos llevados a cabo se presentan en la sección"Recopilacióndedatos y métodos de análisis de datos utilizados".En la sección"resultados"se ofrecen ejemplos reales de modelos pronósticos de predicción de bajo riesgo y/o riesgo de preeclampsia en mujeres embarazadas, al principio del embarazo, antes del desarrollo de síntomas clínicos de preeclampsia.

[0423] Participantes y muestras:

[0424] Se recogieron muestras clínicas prospectivas de mujeres embarazadas con un embarazo único a las 15+/-1 y 20 /-1 semanas de gestación y a las que se diagnosticó preeclampsia (casos) o no se diagnosticó preeclampsia (controles) en el curso posterior de su embarazo. Todas las muestras se obtuvieron de participantes en el estudio prospectivo de cribado SCOPE (Screening for Pregnancy Endpoints) de mujeres nulíparas [8,9].

[0425] Se obtuvo el consentimiento por escrito de cada participante. Los criterios de inclusión aplicados para el estudio fueron nuliparidad, embarazo único, edad gestacional entre 14 semanas 0 días y 16 semanas 6 días de gestación y consentimiento informado para participar. Los criterios de exclusión aplicados fueron: No está segura de la última menstruación (FUM) y no está dispuesta a someterse a una ecografía en la semana <= 20, >=3 abortos espontáneos, >=3 interrupciones, anomalía fetal importante/cariotipo anormal, hipertensión esencial tratada antes del embarazo, hipertensión moderada-grave en el momento de la reserva >=160/100 mmHg, diabetes, enfermedad renal, lupus eritematoso sistémico, síndrome antifosfolípido, anemia de células falciformes, VIH positivo, anomalía uterina importante, sutura cervical, biopsia de cono con bisturí, rotura de membranas en la actualidad, esteroides a largo plazo, tratamiento con aspirina a dosis bajas, tratamiento con calcio (>1 g/24 h), tratamiento con ácido eicosopentanoico (aceite de pescado), tratamiento con vitamina C >=1000 mg y vitamina E >=400 ui, tratamiento con heparina/heparina de bajo peso molecular.

[0426] Preeclampsia definida como hipertensión gestacional (tensión arterial sistólica >= 140 mmHg y/o tensión arterial diastólica >= 90 mmHg (Korotkoff V) en al menos 2 ocasiones con 4 horas de intervalo después de la 20 semanas de gestación pero antes del inicio del parto) o PA sistólica postparto >= 140 mmHg y/o PA diastólica >= 90mmHg postparto en al menos 2 ocasiones separadas por 4 horas con proteinuria >= 300 mg/24 h o proteinuria puntual: cociente de creatinina >=30 mg/mmol creatinina o proteinuria >= 2 o cualquier complicación multisistémica de la preeclampsia. Las complicaciones multisistémicas incluyen cualquiera de las siguientes: 1) Insuficiencia renal aguda definida como un nuevo aumento de la creatinina sérica >=100 umol/l anteparto o >130 umol/l postparto; 2) Enfermedad hepática definida como elevación de la aspartato transaminasa y/o alanina transaminasa >45 UI/l y/o dolor intenso en el cuadrante superior derecho o epigástrico o rotura hepática; 3) Problemas neurológicos definidos como eclampsia o eclampsia inminente (cefalea intensa con hiperreflexia y alteración visual persistente) o hemorragia cerebral; 4) Hematológicos, incluida trombocitopenia (plaquetas <100 x 109/l), coagulación intravascular diseminada o hemólisis, diagnosticada por las características de la placa de sangre (p. ej., células fragmentadas, células en casco) y haptoglobina reducida. La preeclampsia podría diagnosticarse en cualquier fase del embarazo después de la inclusión hasta el parto o en las 2 primeras semanas después del parto.

[0427] Los datos clínicos sobre los factores de riesgo conocidos de preeclampsia [4, 5] se recopilaron a las 15+/-1 y 20 /-1 semanas de gestación mediante entrevista y exploración de las mujeres. A las 20 semanas se obtuvieron datos ecográficos sobre medidas fetales, anatomía, Doppler uterino y de la arteria umbilical y longitud cervical. El crecimiento fetal y los Dopplers uterino y umbilical se miden a las 24 semanas. Se realizó un seguimiento del resultado del embarazo y se visitó a la mujer en las 48 horas siguientes al parto. Las medidas del bebé se obtienen en las 48 horas siguientes al parto.

[0428] Conjunto de muestras utilizado:

[0429] Se realizó un estudio anidado de casos y controles dentro de la rama europea de SCOPE, utilizando muestras de sangre tomadas a las 15 /-1 semanas de gestación; la cohorte constituyó una proporción de casos:controles de ~1:3,5. Los casos se definen como aquellas mujeres embarazadas que desarrollan preeclampsia (tal y como se ha definido anteriormente) en el transcurso de su embarazo: en el estudio se consideraron 97 casos, lo que corresponde a todos los casos de la rama europea de SCOPE de los que se disponía de muestras. Los controles se seleccionaron aleatoriamente entre todos los demás embarazos. Para evitar artefactos debidos al sesgo de selección, se compararon las características demográficas y clínicas de la población de control seleccionada para el estudio y se verificó la ausencia de sesgo mediante las pruebas adecuadas; se utilizaron las pruebas de Chi-cuadrado, correlación de Spearman, U de Mann Whitney y Kruskal-Wallis, según procediera. Se seleccionaron para el estudio muestras de 335 embarazos de control.

[0430] En latabla 2,se presentan las características basales de esta cohorte del estudio.

[0431] Tabla 2:Características de la oblación de estudio

[0433]

[0436] Objetivos pronósticos ilustrativos para las pruebas de estratificación del riesgo de preeclampsia:

[0438] Como se explica en otra parte de esta solicitud, los métodos descritos en la presente memoria permiten el descubrimiento de combinaciones de variables para la preeclampsia total, pero también para subtipos clínicamente relevantes de preeclampsia y/o para diferentes poblaciones de pacientes con diferentes perfiles de riesgo. Dentro de esta solicitud, la atención se centra en establecer combinaciones pronósticas para diferentes subtipos de preeclampsia dentro de una población específica de pacientes, es decir, mujeres en su 1.<er>embarazo sin factores de riesgo clínicos manifiestos.

[0439] Los subtipos de preeclampsia objetivo de este estudio son los siguientes

[0440] - preeclampsia total ("todas las PE")

[0441] - preeclampsia pretérmino (PE-PT): se define como la preeclampsia que da lugar a un parto (iatrogénico) antes de las 37 semanas de gestación, o prematura.

[0442] - preeclampsia a término (PE-T): se define como la preeclampsia que se asocia a un parto a las 37 semanas de gestación o más tarde, o a término.

[0443] Objetivos de inclusión, basándose en un umbral de tasa de falsos positivos (especificidad):

[0444] Dentro de esta solicitud, también se considera el descubrimiento de modelos de pronóstico / núcleos que maximicen la tasa de detección (Sensibilidad) de futuros casos de preeclampsia, para una determinada Tasa de Falsos Positivos (FPR o (1-Especificidad)) de futuros no casos. Estos modelos de pronóstico se centran en identificar a los individuos que desarrollarán preeclampsia. Se consideran los siguientes FPR: 20 % FPR (Especificidad =0,8) y 10 % FPR (Especificidad =0,9). Con el fin de ofrecer una prueba de detección clínica significativa, se establecen las siguientes tasas mínimas de detección:

[0445] - 20 % FPR: >= 50 % de detección de futuros casos de PE (Sensibilidad >= 0,5)

[0446] - 10 % FPR: >= 40 % de detección de futuros casos de PE (Sensibilidad >= 0,4)

[0447] Objetivos de exclusión, basándose en un umbral de Tasa de Falsos Negativos (Sensibilidad):

[0448] Dentro de esta solicitud, también se considera el descubrimiento de modelos de pronóstico / núcleos que maximicen la tasa de detección (Especificidad) de futuros no casos de preeclampsia, para una determinada Tasa de Falsos Negativos (FNR o (1-Sensibilidad)) de futuros casos. Estos modelos de pronóstico se centran en identificar a los individuos que no desarrollarán preeclampsia. Se consideran los siguientes FNR: 20 % FNR (Sensibilidad =0,8) y 10 % FNR (Sensibilidad =0,9). Con vistas a ofrecer una prueba de exclusión clínicamente significativa, se ponen las siguientes tasas mínimas de detección:

[0449] - 20 % FNR: >= 40 % de tasa de detección de futuros no casos de PE (Especificidad >= 0,40)

[0450] - 10 % FPR: >= 30 % de tasa de detección de futuros no casos de PE (Especificidad >= 0,30) Umbrales de valor predictivo positivo y negativo

[0451] Todas las PE: Las mujeres en su primer embarazo tienen un riesgo de ~1/20 de desarrollar preeclampsia, o un riesgo relativo de aproximadamente 2, en comparación con las no nulíparas.

[0452] En un esfuerzo por desarrollar una prueba de cribado clínicamente significativa, los inventores publicaron recientemente los siguientes fundamentos.[1] El tratamiento prenatal de una mujer multípara con respecto a la preeclampsia está guiado en gran medida por su historial de embarazos previos. Los estudios epidemiológicos han demostrado que la preeclampsia previa se asocia a un mayor riesgo de recurrencia. Para un segundo embarazo, se han notificado riesgos de recurrencia de aproximadamente 1 de cada 8,6 a 1 de cada 6,8 (o PPV de 0,116 a 0,147), mientras que una mujer sin preeclampsia previa, tendrá un riesgo menor de 1 de cada 77 a 1 de cada 100 (o NPV de 0,987 a 0,99). En consonancia con esto, si una mujer ha padecido preeclampsia en un embarazo anterior, será tratada con mayor vigilancia en la mayoría de los sistemas sanitarios en entornos de altos recursos, con más visitas prenatales en comparación con una mujer que no desarrolló preeclampsia en ningún embarazo anterior.

[0453] Basándose en lo anterior, los presentes inventores propusieron que una prueba de estratificación del riesgo de preeclampsia para nulíparas debería idealmente imitar la información de riesgo de preeclampsia disponible para una mujer embarazada por segunda vez. Por lo tanto, la prueba debe estratificar a las mujeres nulíparas en un grupo de alto riesgo con una probabilidad de preeclampsia posterior a la prueba de al menos 1 en 7,5 (equivalente a un PPV = 0,133; inclusión) o estratificarlas en un grupo de bajo riesgo con una probabilidad posterior a la prueba de máximo 1 en 90 (equivalente a un NPV = 0,988; exclusión) e idealmente ambas. Basándose en este razonamiento, y teniendo en cuenta la prevalencia de la PE notificada en la cohorte de SCOPE, se establecieron los umbrales para "todas las PE" de PPV y NPV; véase la tabla 3.

[0454] PE pretérmino: Para la PE pretérmino, los umbrales de PPV y NPV se adoptaron a partir de una prueba de PE pretérmino de referencia, que ya se ha desarrollado. [6, 7] véase la tabla 3.

[0455] PE a término: Para la PE a término, los umbrales se determinaron en asociación con médicos, y corresponden aproximadamente a un enriquecimiento de 5 veces en comparación con la prevalencia previa a la prueba en cualquier dirección; es decir, el umbral de alto riesgo corresponde a una probabilidad previa a la prueba de ~5x de ser un futuro caso de PE; el umbral de bajo riesgo corresponde a una probabilidad previa a la prueba de ~5x de ser un futuro no caso de PE. En esta solicitud se elaboran únicamente modelos de pronóstico para la PE a término. Véase la tabla 3.

[0456] Mientras que en los párrafos anteriores se establece el PPV mínimo (inclusión) para cada subtipo de PE y/o subpoblación de pacientes, se persigue la siguiente tasa mínima (futura) de detección de casos de PE para cualquiera de los umbrales de PPV dados, es decir, la tasa (futura) de detección de casos de al menos el 40 % (Sensibilidad >=0,4). Del mismo modo, para cualquiera de los criterios de NPV (exclusión) preestablecidos, se persigue la siguiente tasa mínima de detección de futuros no casos de PE (o "controles") para cualquiera de los umbrales de NPV dados, es decir, la tasa de detección de futuros no casos de PE de al menos el 30 % (Especificidad >=0,3).

[0457] Los métodos específicos como relevantes para lograr rendimientos pronósticos excepcionales de inclusión y/o exclusión se elaboran en otra parte de esta solicitud, así como en los ejemplos 16-18.

[0458] Tabla 3Objetivos de rendimiento basados en el PPV y el NPV de las pruebas pronósticas para predecir el ri r l m i n m r m r z n l ri i n ín m líni PE.

[0460]

[0462] Para evitar dudas, aunque los objetivos de rendimiento anteriores se basan en la relevancia clínica, no son limitativos; diferentes entornos sanitarios pueden requerir objetivos diferentes. Además, cuando se disponga de nuevas opciones de tratamiento profiláctico, puede ser necesario establecer distintos objetivos en función, p. ej., del coste del tratamiento o de los efectos secundarios.

[0463] Para evitar dudas, las combinaciones pronósticas de variables, tal como se describen en la presente solicitud, también serán relevantes para el pronóstico de la preeclampsia en mujeres en su 2.<o>embarazo o posterior. Dado que estas mujeres multíparas tendrán un "historial de embarazo" que influirá en su riesgo de preeclampsia, es fácil comprender que esta información, combinada con los hallazgos descritos en esta solicitud, mejorará las prestaciones pronósticas para predecir el riesgo de que se produzca preeclampsia en sus embarazos.

[0464] Variables de interés:

[0465] Tabla 4.presenta en una tabla una lista no limitativa de variables de interés que se tienen en cuenta en esta solicitud. Los metabolitos, proteínas y factores de riesgo clínicos, son considerados relevantes por los solicitantes con vistas a identificar combinaciones pronósticas no evidentes de variables, para predecir el riesgo de preeclampsia en una mujer embarazada antes de la aparición de los síntomas clínicos de preeclampsia en mujeres con preeclampsia. En la medida de lo posible, los metabolitos de interés se identifican por su número CAS y/o su identificador HMDB; también se indican los pesos moleculares (n.d.: no disponible); Las proteínas se identifican por su identificador génico.

[0466] T l E m l 4.V ri l in r

[0468]

[0469]

[0470]

[0471]

[0473] "Recopilación de los métodos analíticos"

[0474] Para analizar las proteínas, se empleó ELISA; estos biomarcadores proteicos se analizaron como parte de una evaluación a gran escala de supuestos biomarcadores proteicos dentro del estudio SCOPE utilizando ensayos ELISA.[9]

[0475] Para analizar los metabolitos se empleó un ensayo LC-MSMS; que se resume aquí:

[0476] 1. El uso de un disolvente de extracción / disolvente de precipitación de proteínas que permita la extracción de los diferentes tipos (clases) de metabolitos. Esta composición de disolvente de extracción, siendo una mezcla de metanol, isopropanol y acetato de amonio (acuoso) 200 mM en una proporción 10:9:1, que a su vez se enriquece con 0,05 % de 3,5-di-terc-4-butil-hidroxitolueno; en el resto de este ejemplo este disolvente se denomina "crash".

[0477] 2. El uso de un sistema de cromatografía de líquidos (LC) dual (de alta resolución) para permitir la identificación y cuantificación de las diferentes clases de metabolitos en una tanda analítica corta. Los sistemas cromatográficos se desarrollaron de forma que pudieran unirse directamente a un sistema de detección por espectrometría de masas. Este sistema de cromatografía dual permite separar diferentes tipos/clases de metabolitos y, al mismo tiempo, generar una señal detectable a nivel del espectrómetro de masas; un sistema cromatográfico único, con un tiempo de respuesta corto, no es eficaz para generar de forma robusta una señal detectable en todas las clases. La capacidad de 1) analizar de forma exhaustiva metabolitos de diferentes clases, en función de su relevancia para una cuestión pronóstica, en 2) poco tiempo es importante para generar datos sobre conjuntos de muestras suficientemente grandes (necesarios para permitir modelos multivariables sólidos) en plazos y costes económicamente viables.

[0478] A continuación se detallan ejemplos típicos, aunque no limitativos, de métodos de LC:

[0479] Materiales y reactivos utilizados en las separaciones duales.

[0480] Instrumento: La plataforma de LC-MS/EM utilizada consistía en un sistema LC 1260 Infinity (Agilent Technologies, Waldbronn, Alemania). Este último se acopló a un espectrómetro de masas Agilent Triple Quadrupole 6460 (QqQ-MS) equipado con una fuente de electronebulización JetStream Electrospray (Agilent Technologies, Santa Clara, CA, EE. UU.) (véase el ejemplo 6).

[0481] RPLC:

[0482] El método RPLC se define mediante los siguientes ajustes/parámetros:

[0483] - Volumen de inyección: 7 µl

[0484] - Temperatura de la estufa de la columna: 60 °C

[0485] - Se realizó una RPLC en gradiente para resolver los metabolitos hidrófobos utilizando un sistema de disolvente binario:

[0486] ∘ fase móvil A: Tampón de agua:MeOH:NH<4>OAc 200 mM a pH 4,5, (92:3:5)

[0487] ∘ fase móvil B: MeOH:Acetonitrilo:IPA: NH<4>OAc 200 mM a pH 4,5 (35:35:25:5).

[0488] Se aplicó un programa de gradiente lineal: del 10 % de fase móvil B al 100 % de fase móvil B en 10 minutos. utilizando el siguiente programa de gradiente - caudal:

[0489] Tabla 5

[0491]

[0493] El eflujo de la columna de RPLC se condujo directamente al QqQ-MS para la determinación por espectrometría de masas de los compuestos hidrófobos de interés (véase más adelante).

[0494] HILIC:

[0495] El método HILIC se define mediante los siguientes ajustes/parámetros:

[0496] - Volumen de inyección: 3 µl, por lo que el tapón de inyección estaba encuadrado por tapones de disolvente ACN de 3 µl; para ello se ideó un programa de inyector específico.

[0497] - Temperatura de la estufa de la columna: 30 °C

[0498] - Se realizó una HILIC en gradiente para resolver los metabolitos hidrófobos utilizando un sistema de disolvente binario:

[0499] ∘ fase móvil A: Formiato de amonio (acuoso) 50 mM

[0500] ∘ fase móvil B: ACN

[0501] - Se aplicó un programa de gradiente lineal por etapas: del 10 % de fase móvil B al 100 % de fase móvil B en 10 minutos. utilizando el siguiente programa de gradiente - caudal:

[0502] -Tabla 6

[0504]

[0506] El eflujo de la columna de RPLC se condujo directamente al QqQ-MS para la determinación por espectrometría de masas de los compuestos hidrófobos de interés (véase más adelante).

[0507] 3. El uso de una forma de espectrometría de masas cuantitativa, es decir, un sistema de espectrometría de masas en tándem (MS/MS) operado en el modo de monitorización de reacciones múltiples para permitir un análisis sensible y específico de los metabolitos. Para ello, las muestras se someten a ionización en condiciones que producen formas ionizadas de los metabolitos de interés. A continuación, los metabolitos ionizados se fragmentan en iones fragmento derivados del metabolito. Las cantidades de dos fragmentos específicos por metabolito se determinan para identificar y cuantificar las cantidades de los metabolitos originadores en la muestra (para más detalles, véase más adelante). La espectroscopia de masas en tándem se llevó a cabo con ionización por electronebulización positiva y negativa y en modo de monitorización de reacciones múltiples (MRM). Para cada metabolito de interés, relevante para la preeclampsia, se establecieron y optimizaron específicamente los siguientes parámetros para todos y cada uno de los metabolitos de interés y cada SIL-IS disponible:

[0508] - m/z del ion precursor adecuado, incluido su modo de ionización preferido (positivo o negativo),

[0509] - Espectros de iones producto en distintas condiciones de tensión de colisión (véase la inducción de colisiones ion-molécula en distintos regímenes de energía, que dan lugar a iones producto específicos) y selección de los iones producto cuantificadores y cualificadores más adecuados que se utilizarán para la identificación y las cuantificaciones por espectrometría de masas.

[0510] - Establecimiento de las relaciones ion cuantificador / ion cualificador de referencia que servirán para evaluar la especificidad.

[0511] - Adicionalmente, se optimizaron una serie de parámetros instrumentales específicos para cada compuesto de interés: resoluciones cuadrupolares, tiempo de permanencia, tensión del fragmentador, energía de colisión y tensión del acelerador celular.

[0512] Al mismo tiempo, se optimizaron parámetros específicos del instrumento para mantener al máximo la integridad del compuesto en la fuente de electronebulización y lograr un análisis de metabolitos sensible y específico; temperatura de la fuente, flujo de gas de vaina, flujo de gas de secado y tensión del capilar. El espectrómetro de masas utilizado fue un Agilent Triple Quadrupole 6460 mass spectrometer (QqQ-MS) equipado con una fuente de electronebulización JetStream Electrospray lonisation source (Agilent Technologies, Santa Clara, CA, USA).

[0513] RPLC-ESI-MS/MS

[0514] Para el método de espectrometría de masas utilizado para analizar los metabolitos hidrófobos de interés, los parámetros optimizados de la fuente de ionización por electronebulización fueron los siguientes:

[0515] Tabla 7

[0517]

[0520] HILIC-MS/MS:

[0522] Para el método de espectrometría de masas utilizado para analizar los metabolitos hidrófilos de interés, los parámetros optimizados de la fuente de ionización por electronebulización fueron los siguientes:

[0524] Tabla 8

[0526]

[0529] 4. Para cada metabolito se desarrolló un ensayo específico de LC-MS/MS para cada uno de los objetivos de interés, así como para cada uno de los SIL-IS; un ensayo particular de LC-MS/MS implica una combinación de los puntos 2 y 3 anteriores.

[0531] 5. El uso de patrones internos marcados con isótopos estables (SIL-IS) para permitir la espectrometría de masas por dilución de isótopos estables, para lograr cuantificaciones de compuestos basadas en la espectrometría de masas precisas y exactas [11][12]. Resumiendo, la espectrometría de masas por dilución de isótopos estables se basa en el principio de enriquecer todas las muestras de estudio con el mismo volumen de una mezcla bien definida de patrones internos marcados con isótopos estables al inicio del proceso analítico. Estos SIL-IS son típicamente idénticos a los compuestos endógenos de interés, en este caso metabolitos, pero tienen un número de átomos específicos (típicamente Hidrógeno 1H, Nitrógeno 14N o Carbono 12C) dentro de su estructura molecular reemplazados por un isótopo estable y pesado del mismo elemento (típicamente Deuterio 2H, Nitrógeno 15N, Carbono 13C). Por tanto, los SIL-IS son químicamente idénticos, pero tienen una masa "más pesada" diferente a la de sus homólogos endógenos. Al ser químicamente idénticos, "experimentarán" toda la variabilidad experimental por igual los metabolitos endógenos de interés. Por ejemplo, cualquier rendimiento de extracción diferencial entre las muestras de estudio durante la preparación de la muestra afectará igualmente al metabolito de interés y a su SIL-IS correspondiente. Del mismo modo, el metabolito de interés y su correspondiente SIL-IS se someterán a la misma cromatografía y suelen ser igualmente sensibles a la variabilidad durante el análisis por espectrometría de masas. Por consiguiente, la relación entre la señal de cualquier metabolito diana y la señal SIL-IS correspondiente es en gran medida invariable con respecto a la variabilidad experimental, por lo que la relación "señal de metabolito / señal SIL-IS correspondiente" está directamente relacionada con la concentración original del objetivo en la muestra de sangre. Por tanto, en los métodos aquí descritos, la forma preferida de cuantificar con precisión la cantidad de un metabolito de interés en una muestra es mediante el establecimiento de la relación de "la cantidad del ion cuantificador del metabolito objetivo / la cantidad del ion cuantificador del SIL-IS correspondiente". Los métodos aquí descritos permiten cuantificar una multitud de diferentes metabolitos objetivo en un único análisis de la muestra. Además, como todas las muestras del estudio se enriquecen con el mismo volumen de una mezcla bien definida de SIL-IS, se pueden comparar fácilmente los niveles de los metabolitos de interés en todas las muestras del estudio. Los SIL-IS son compuestos exógenos y, por tanto, no se encuentran en las muestras biológicas nativas, por lo que sus niveles añadidos actúan como referencia común para todas las muestras del estudio.

[0532] 6. El uso de protocolos específicos de procesamiento de muestras para el procesamiento simultáneo de grandes lotes de muestras biológicas con alta reproducibilidad y baja variabilidad técnica. A continuación se detalla un ejemplo no limitativo de protocolo de procesamiento adecuado.

[0533] Como parte de los métodos, se ha establecido una metodología dedicada de preparación de muestras biológicas, que implica la fortificación de las muestras con una mezcla SIL-IS relevante, y el uso del "crash", para extraer los metabolitos de interés. En cuanto a la manipulación de las muestras, minimizar cualquier fuente potencial de error es fundamental para garantizar unos resultados fiables y precisos. La fuente crítica de error en esta metodología está relacionada con el control de los volúmenes; los volúmenes más críticos son el volumen real de la muestra disponible para el análisis y el volumen del SIL-IS añadido. Mientras que los analistas de laboratorio experimentados podrán preparar las muestras con precisión, se prefiere el uso de manipuladores de líquidos robotizados cuando el procesamiento de un gran número de muestras biológicas esté garantizado para eliminar la variabilidad técnica inducida por el ser humano.

[0534] En este caso, como ejemplo no limitativo, se elabora un proceso de procesamiento de sangre dedicado, como relevante para los métodos de la presente solicitud, utilizando un robot de manipulación de líquidos.

[0535] El robot se configuró para permitir 96 muestras de sangre en paralelo, utilizando el formato bien establecido de 96 pocillos; este es también el formato de lote analítico adoptado para la recopilación de métodos en la presente memoria.

[0536] Instrumento:

[0537] Plataforma de manipulación de líquidos automatizada Bravo de Agilent (BRAVO, Modelo 16050-102, Agilent Technologies, Santa Clara, CA, EE. UU.), equipada con un cabezal de puntas desechable de 96 LT, una estación de agitación orbital y una estación térmica Peltier (Agilent Technologies). La plataforma del robot dispone de 9 estaciones predefinidas, que pueden utilizarse para placas de 96 pocillos (muestras, reactivos, cajas de puntas de pipeta) o estaciones funcionales (p. ej., Estación Peltier, etc.)

[0538] Protocolo experimental:

[0539] Brevemente, se realizaron las siguientes etapas para cada lote de 96 alícuotas de 40 µl; los lotes parciales (n<96) se procesan de forma idéntica:

[0540] a) Una placa de 96 posiciones, que constituye un lote analítico, se recupera del almacenamiento a -80 °C, se coloca en la cubierta BRAVO (agitador orbital) y se agita en vórtex durante 20 minutos para facilitar la descongelación. Una vez descongelados, los viales se destapan.

[0541] b) Mientras tanto,

[0542] a. se extrae una alícuota de SIL-IS previamente preparada de un almacén a -20 °C para su acondicionamiento térmico, se agita en vórtex (1 minuto) y se trata con ultrasonidos (5 minutos), y a continuación se colocan los volúmenes adecuados en una columna (8 pocillos) de una placa de 96 pocillos de polipropileno (PP). A continuación, la placa SIL-IS se coloca en la plataforma BRAVO (Peltier a 4 °C).

[0543] b. La formulación patentada previamente preparada [precipitación de proteínas-extracción de metabolitos] "crash" se extrajo del almacén a -20 °C, se agitó y se llenó una placa de 96 pocillos de PP con los volúmenes adecuados; a continuación, la placa "crash" se colocó en la plataforma del robot. c) A continuación se inicia el protocolo Bravo; las etapas críticas de este proceso son:

[0544] d) Extraer 140 µl de SIL-IS de la columna llena de la placa SIL-IS y dispensar secuencialmente 10 µl en cada uno de los viales de muestras.

[0545] e) Las muestras fortificadas se someterán a vórtex en la cubierta durante 5 minutos a 1200 rpm.

[0546] f) Adición de la solución "crash"; esta parte de la preparación de la muestra se realiza en dos etapas separadas

[0547] a. Primera etapa: adición de 200 µl de solución "crash", seguida de agitación en vórtex en la plataforma durante 1 minuto a 1200 rpm,

[0548] b. Segunda etapa: adición de 140 µl de solución "crash" seguida de agitación en vórtex durante 4 minutos a 1000 rpm

[0549] g) A continuación, se retira la placa de muestras del robot BRAVO y se somete a vórtex a 4 °C durante 10 minutos, seguido de 2 minutos de tratamiento con ultrasonidos.

[0550] h) Transferir la placa de muestras al congelador, donde se mantienen a -20 °C durante 20 minutos para maximizar la precipitación de proteínas.

[0551] i) Tras la precipitación, los viales de muestras se centrifugan a 4 °C durante 20 min a una velocidad de 8000 rpm, después se devuelven al robot BRAVO; la placa de muestras se coloca en la estación Peltier a 4 °C. j) División del sobrenadante (es decir, el extracto de metabolitos) en dos alícuotas diferentes para permitir el análisis por separado de los compuestos hidrófobos e hidrófilos. Para ello, se aspiran 240 µl de sobrenadante y se dispensan 120 µl, dos veces, en placas PP de 96 pocillos separadas (placas duplicadas de "extracto de muestra").

[0552] k) A continuación, las placas de extracto de muestras se secan mediante evaporación al vacío a 40 °C durante 60 minutos. Típicamente, 1 placa de extracto de muestra seca se transfiere a -80 °C hasta su posterior análisis, la otra placa de extracto de muestra se devuelve al robot BRAVO para su reconstitución, preparando los muestras extraídas para el análisis por LC-MS/MS.

[0553] Mientras que el método ilustrado anteriormente se aplicó en el análisis de metabolitos de interés relevantes para la preeclampsia; también se emplean variaciones de los métodos anteriores según sea adecuado para el resultado de salud en consideración, y los metabolitos de interés asociados. Entre las variantes no limitativas se incluyen

[0554] - Pretratamiento de la muestra y posterior extracción de metabolitos mediante extracción en fase sólida en lugar del método de precipitación; existen protocolos robotizados.

[0555] 7. El uso de procedimientos específicos de Garantía de Calidad para evitar la introducción de sesgos experimentales y asegurar la calidad de la cuantificación de los metabolitos de interés. Estos procedimientos definen, por ejemplo: Tamaño y composición de los lotes analíticos, número y tipo de muestras de control de calidad, criterios de aceptación de las lecturas de datos, ocultación para el operario, diseño de estudios con potencia suficiente, selección de las muestras de estudio adecuadas. Para evitar el sesgo experimental, se utilizan métodos específicos para aleatorizar las muestras del estudio; a continuación, se confirma la ausencia de sesgo en el orden de las muestras mediante las pruebas adecuadas. Tras el procesamiento de la señal de los datos de espectrometría de masas, se aplican métodos específicos de calidad posteriores al análisis para evaluar por metabolito de interés, la tasa de datos perdidos a lo largo de un estudio clínico, la presencia de cualquier sesgo experimental (injustificado), la eventual deriva de la señal, y la idoneidad de la lectura cuantitativa elegida (es decir, "ion cuantificador de metabolito / relación de ion cuantificador SIL-IS seleccionado"). En caso necesario, pueden seleccionarse lecturas cuantitativas alternativas. La revisión de la cuantificación del analito se realiza de forma rutinaria para cuantificar la estabilidad y robustez. En caso de que se observen desviaciones interdiarias de los lotes, puede aplicarse una corrección adecuada. Se establece la métrica de cuantificación adecuada para cada metabolito de interés. Tras el control de calidad y la selección de la métrica de cuantificación más robusta, se medirá la imprecisión de la cuantificación de cada metabolito, mediante el cálculo de los coeficientes de variación (% CV), utilizando las muestras de control de calidad disponibles y/o mediciones replicadas.

[0556] 8. La aplicación de un conjunto de criterios de selección ("Criterios de calidad por etapas") para determinar qué metabolitos de interés pueden pasar al análisis de rendimiento de biomarcadores. Típicamente, pero sin limitarse a ellos, se tienen en cuenta los criterios de precisión, especificidad y ausencia; como alternativa, también se puede considerar la imputación de los valores que faltan [13]. Algunos ejemplos de límites de precisión típicos son, p. ej., % de CV <=15 %, o <=20 %CV o <=25 %. Los criterios adecuados de la Quality Stage-Gate se establecen específicamente para cada estudio de muestras biológicas, y pueden variar según el metabolito de interés. Esta etapa definirá qué metabolitos de interés pueden avanzar a las etapas siguientes y utilizarse en el descubrimiento de pruebas de diagnóstico/pronóstico multicomponente; y variará según el estudio de muestras biológicas.

[0557] 9. El uso de métodos para preprocesar los datos de cuantificación de los metabolitos de interés con vistas a realizar análisis de biomarcadores. Normalmente, estos métodos implican la comprobación de la necesidad y, cuando se justifica, la solicitud de transformaciones de los datos (p. ej., transformación logarítmica para obtener una distribución normal). Adicionalmente, los métodos probarán la necesidad, y cuando esté justificado, la aplicación de correcciones de los resultados de los biomarcadores de metabolitos para, p. ej., las características del paciente o del muestreo que modulan los resultados de los metabolitos independientemente de la cuestión pronóstica o diagnóstica que se esté investigando. Típicamente, pero sin limitarse a ello, los métodos implican la comprobación y, cuando se justifique, el establecimiento de múltiplos de la mediana de las cuantificaciones de metabolitos. La corrección de estos factores pretende reducir la varianza entre muestras/pacientes. En algunos casos, puede ser pertinente dicotomizar o categorizar las cuantificaciones de metabolitos. Las transformaciones de datos adecuadas y las correcciones adecuadas se establecen específicamente para cada estudio de muestras biológicas, y pueden variar por metabolito de interés.

[0558] a)Transformaciones logarítmicas:

[0559] Para los metabolitos de interés seleccionados (ejemplo 10), las lecturas de cuantificación se transformaron logarítmicamente antes de la modelización; con excepción de los datos tal como se presentan en los resultados 4D.

[0560] b) Múltiplo de las medianas - Transformaciones:

[0561] Las dependencias de la cuantificación de cada analito de las características comunes de los pacientes, como el centro clínico, el sobrepeso o la edad gestacional en el momento de la toma de muestras. Los analitos que muestran una dependencia significativa (prueba U de Mann-Whitney, correlación de Spearman, Benjamini, Hochberg y Yekutieli, p<0,01) de estos factores se normalizan mediante una metodología de múltiplos de la mediana (MoM). Se aplicaron correcciones múltiples de la mediana para los siguientes metabolitos de interés:

[0562] Tabla 9

[0565]

[0567] Todos los metabolitos de interés seleccionados cuantificados con la plataforma de espectrometría de masas se utilizaron como predictores para el cálculo de modelos predictivos de la enfermedad; en el caso de las variables normalizadas con MoM, tanto las no normalizadas como las normalizadas se consideraron predictores para el cálculo de modelos predictivos de la enfermedad.

[0568] c) Dicotomización de los datos: cotinina

[0569] Los analitos que son exógenos, como la cotinina, no son cuantificables en muchos pacientes. Esta falta de cuantificación suele estar asociada a la falta de exposición. Por lo tanto, la detectabilidad de la molécula puede ser un biomarcador mejor que la concentración real de la molécula en sangre. Este es el caso de la cotinina, cuya presencia en la sangre indica la inhalación de humo de cigarrillo. Por lo tanto, la cuantificación (relativa) de la cotinina se binarizó, las muestras sin cotinina cuantificable y las muestras con un valor bajo de cotinina recibieron una puntuación de 0. Las muestras con una concentración elevada de cotinina recibieron una puntuación de 1. La precisión para predecir si un paciente declara fumar se utilizó para definir un valor de corte óptimo de concentración relativa de cotinina. Este valor de corte corresponde a una baja densidad en la distribución de la cotinina, lo que indica una robustez en la puntuación.

[0570] 10. La selección de un conjunto específico de mediciones que se considerarán variables de entrada (o supuestos predictores) en el descubrimiento de pruebas de diagnóstico/pronóstico multicomponente. Este conjunto de variables constituirá los datos de cuantificación de metabolitos preprocesados generados en la etapa anterior, y se puede aumentar con variables relevantes no metabólicas disponibles para los muestras biológicas en estudio. Por ejemplo, cuando se pretende crear una prueba de estratificación del riesgo multicomponente (o prueba de pronóstico) para establecer la probabilidad de que un individuo padezca (o no) una enfermedad, estas variables no metabólicas podrían constituir, por ejemplo, pero sin limitarse a ello, factores de riesgo (clínicos) pertinentes recogidos en el momento del muestreo o disponibles en los historiales (médicos), o los resultados de pruebas clínicas pertinentes y bien establecidas (p. ej., mediciones de glucosa) o datos de cuantificación de otros tipos de moléculas de biomarcadores putativos pertinentes, p. ej., proteínas, ADN, ARN, etc., disponibles para la misma muestra/individuo de origen. La selección del conjunto adecuado de variables no metabólicas se establece específicamente por estudio y por objetivo específico del descubrimiento de la prueba de diagnóstico/pronóstico multicomponente. Dado que los solicitantes se propusieron específicamente encontrar pruebas de pronóstico para la preeclampsia que pudieran ser administradas fácilmente por los proveedores de atención primaria y/o en sistemas sanitarios con recursos limitados y que fueran sólidas, se seleccionaron únicamente estos factores de riesgo clínicos que están bien establecidos y son fáciles de obtener. Por la misma razón, se excluyeron explícita y deliberadamente los siguientes tipos de variables: datos de pacientes propensos a errores, por ejemplo, aunque no exclusivamente, variables detalladas del estilo de vida o datos detallados del historial médico, así como variables cuya recogida requiere personal especializado, por ejemplo, aunque no exclusivamente: Evaluación del flujo sanguíneo uteroplacentario mediante ecografía Doppler (doppler de la arteria uterina) y sus parámetros derivados, como el índice de pulsatilidad o el índice de resistencia. Aunque estas métricas del flujo sanguíneo uteroplacentario se asocian con el riesgo de preeclampsia, requieren disponer de un ecografista experto y de aparatos de ecografía avanzados. Dado que los metabolitos de interés se determinarán típicamente en un laboratorio clínico, también se consideraron variables ilustrativas que también pueden evaluarse en un laboratorio clínico y que se ha informado ampliamente que se asocian con el riesgo de preeclampsia: se seleccionaron mediciones de 3 proteínas específicas como variables de entrada adicionales; véase la sección anterior "Variables de interés".

[0572] Recogida de datos y métodos de análisis de datos utilizados

[0574] 1. Desarrollo de modelos multivariante:

[0576] Los solicitantes se dieron cuenta de que la relevancia de los clasificadores de pronóstico para predecir el riesgo (o probabilidad) de que un individuo desarrolle un futuro trastorno del embarazo viene determinada en gran medida por la medida en que los méritos pronósticos de dichos clasificadores satisfacen los requisitos clínicos identificados por los proveedores de asistencia sanitaria y/o los sistemas sanitarios.

[0578] Sin embargo, diferentes contextos clínicos podrían exigir diferentes requisitos para un clasificador. Por ejemplo, algunos contextos clínicos se centrarán principalmente en la búsqueda de individuos con mayor riesgo de padecer un resultado sanitario futuro. Para estas personas con mayor riesgo, se podría intensificar la atención y/o prescribir un tratamiento profiláctico. En otros contextos, resulta más adecuado identificar a los individuos con menor riesgo de sufrir el resultado futuro, p. ej., para racionalizar el uso de determinadas vías asistenciales. En algunos casos, ambas preguntas de clasificación serán de interés.

[0580] Adicionalmente, o como alternativa, podrían existir diferentes subtipos (o grados) del futuro trastorno del embarazo, por ejemplo en términos de gravedad del resultado. Los requisitos de los clasificadores pueden variar en función del subtipo de resultado. Adicionalmente, o como alternativa, pueden existir subgrupos de individuos que presenten un perfil de riesgo a priori diferente, y/o que sean más propensos al resultado o a cualquiera de sus subtipos. Una vez más, los requisitos clínicos de los clasificadores pueden variar según los subgrupos de individuos. Por este motivo, los solicitantes adoptaron, como parte de los métodos, el mejor método de regresión de subconjuntos para crear el espacio de todos los posibles modelos de predicción multivariable utilizando una o más técnicas de modelización multivariable según fuera pertinente para el conjunto de entrada de variables y resultados (p. ej., continuos o categóricos) objeto de estudio. De este modo, existe la posibilidad de abordar al mismo tiempo múltiples cuestiones relativas a los clasificadores y/o a los requisitos de los clasificadores, siempre que el estudio sea lo suficientemente amplio y representativo de las poblaciones de interés y que la información pronóstica aportada por las variables de entrada y sus combinaciones respalde el descubrimiento de dichos clasificadores. Por ejemplo, para un clasificador binario de riesgo, podrían aplicarse PLS-DA, regresión logística o polinomios fraccionales. Dependiendo de la cuestión que se trate y del tamaño del estudio disponible, el número de variables por modelo permitido puede variar; normalmente, pero sin limitarse a ello, el espacio del modelo se construye con todas las combinaciones de, p. ej., 1 a 3, 1 a 4, 1 a 5 o 1 a 6 variables. Adicionalmente, se aplican métodos para garantizar que únicamente se tienen en cuenta clasificadores multivariantes robustos, por ejemplo, aplicando la validación cruzada. A continuación se describen los métodos utilizados para crear el espacio del modelo integral para el estudio de la preeclampsia.

[0582] Ejemplo no limitante con descripción de la creación de un espacio de modelo de pronóstico integral tal como se aplica para identificar pruebas de estratificación de riesgo multicomponente (o pruebas de pronóstico) parapredecir el riesgo de preeclampsia (todas/pretérmino/a término) en una mujer embarazada antes de la aparición de síntomas clínicos de preeclampsia en la mujer.

[0584] Para cada posible combinación de una a cuatro variables predictoras, se entrena un modelo en casos completos utilizando regresión logística o análisis discriminante de mínimos cuadrados parciales (PLS-DA) para predecir el resultado. Para cada uno de ellos se calcularon tres modelos de resultados: preeclampsia, preeclampsia a término y preeclampsia pretérmino. Para los resultados preeclampsia a término, los modelos se entrenaron y probaron en pacientes que no desarrollaron preeclampsia (controles) frente a las pacientes que desarrollaron preeclampsia y dieron a luz con una edad gestacional de 37 semanas o superior. Para los resultados preeclampsia pretérmino, los modelos se entrenaron y probaron en pacientes que no desarrollaron preeclampsia (controles) frente a las pacientes que desarrollaron preeclampsia y dieron a luz con una edad gestacional inferior a 37 semanas. Esta selección de pacientes se realizó para tener en cuenta la baja prevalencia de la preeclampsia y la fuerte sobrerrepresentación de pacientes con preeclampsia en el conjunto de datos estudiado.

[0585] Para cada modelo, se deriva un intervalo de estadígrafos para estimar su rendimiento discriminativo y su relevancia clínica. Estos estadígrafos son:

[0586] ABC e (IC del 95 %)

[0587] sensibilidad al PPV (IC del 95 %)

[0588] especificidad al NPV (IC del 95 %)

[0589] sensibilidad al 80 % de especificidad (IC del 95 %)

[0590] sensibilidad al 90 % de especificidad (IC del 95 %)

[0591] especificidad al 80 % de sensibilidad (IC del 95 %)

[0592] especificidad al 90 % de sensibilidad (IC del 95 %)

[0593] número de controles (casos completos)

[0594] número de casos (casos completos)

[0595] donde IC significa intervalo de confianza.

[0596] 2. Selección de combinaciones pronósticas robustas de variables / núcleos pronósticos:

[0597] Estos estadígrafos se calculan para el conjunto de prueba en tres iteraciones de una validación cruzada triple. Se generó la media de cada estadígrafo en las tres iteraciones y se utilizó para la selección del modelo mediante una mejora.

[0598] Adicionalmente, también se generan todos los estadígrafos anteriores, así como para los conjuntos de muestras completos. En este último caso, los modelos se entrenaron y evaluaron en todos los controles y casos. Para controlar el sobreajuste, únicamente se mantienen dentro del espacio de modelos los modelos en los que la diferencia de las respectivas métricas ABC para la "Media" (véase validación cruzada triple) y la "completa" son <=0,1.

[0599] Además, también se purgaron los modelos con un límite inferior del 95 % de confianza (ICI) para el estadígrafo ABC inferior a <=0,495 tanto en la "media" como en la "completa".

[0600] Para lograr resultados sólidos, la selección de modelos de pronóstico/núcleos de pronóstico suele basarse en una evaluación del límite inferior del 95 % de confianza (ICI) calculado mediante el estadígrafo "media" derivado de la validación cruzada triple. Además, para garantizar que se seleccionan modelos dispersos, también se utiliza como criterio de selección la mejora calculada mediante el estadígrafo "media" derivado de la validación cruzada triple.

[0601] A efectos de notificación, se utilizan los estadígrafos calculados para los conjuntos de datos completos. De hecho, gracias a los métodos conservadores de modelización y selección utilizados, apenas se observa sobreajuste.

[0602] Notas:

[0603] - Mientras que el espacio de modelos exhaustivo se estableció con regresión logística o análisis discriminante de mínimos cuadrados parciales (PLS-DA), para esta solicitud se consideraron únicamente los modelos / núcleos pronósticos que seguían el PLS-DA (para simplificar la presentación de informes). Mientras que los estadígrafos de los modelos pronósticos individuales para la regresión logística y PLS-DA pueden diferir, ambos métodos conducen aproximadamente a la selección de combinaciones de predictores similares y se encuentra que los núcleos pronósticos subyacentes son en gran medida los mismos.

[0604] - Para el estudio de preeclampsia considerado en esta solicitud, la limitación a 4 variables / modelo se debe a 1) el deseo de identificar núcleos pronósticos dispersos 2) el poder restringido para la PE pretérmino, 3) la observación de que dentro del conjunto de datos de preeclampsia ejemplificado en la presente memoria, se logra poca "mejora" adicional al considerar más de 4 variables.

[0605] Para identificar núcleos de pronóstico relevantes dentro del amplio espacio de modelos de pronóstico creado, los inventores establecieron una regla lógica para estimar la relevancia de un modelo. Es importante evaluar si cada una de las variables de entrada que lo componen contribuye al rendimiento discriminativo del modelo. Para estimarlo, se calcula la diferencia mínima de rendimiento entre el modelo en cuestión y sus modelos de referencia para cada estadística considerada. Los modelos precursores son todos los modelos 1) con menos variables que el modelo en cuestión y 2) cuyas variables son todas las variables del modelo en cuestión. Las diferencias calculadas se denominan "mejora". A efectos de selección del núcleo pronóstico, únicamente se consideran relevantes los modelos con una "mejora" por encima de un determinado umbral positivo.

[0606] 3. Espacio modelo:

[0607] Para el estudio de la preeclampsia considerado en esta solicitud, se calcularon modelos para cada posible combinación de una a cuatro variables predictoras, para cada uno de los 3 resultados investigados (véase más arriba). Dentro del espacio de modelos PLS-DA generado, >256.000 modelos cumplían los requisitos básicos de rendimiento antes mencionados.

[0608] A continuación, los inventores se propusieron descubrir las combinaciones principales no triviales de variables, con méritos predictivos para cada uno de los objetivos de rendimiento, como se indica enObjetivos de diagnóstico para las pruebas de estratificación del riesgo de preeclampsia.Para ello, el espacio del modelo se filtró utilizando los límites inferiores de los intervalos de confianza del 95 % (ICI) calculados mediante la "media" derivada de la validación cruzada triple de la estadística pertinente y la mejora calculada mediante la "media" derivada de la validación cruzada triple de la misma estadística, para cada objetivo de rendimiento (ABC, Inclusión, Exclusión) para cada uno de los subtipos de PE (todas las PE, PE pretérmino y PE a término). Los umbrales de filtrado se ajustaron manualmente para obtener un conjunto limitado (normalmente entre 20 y 60) de combinaciones básicas de 2 a 4 variables (modelos). Ello bastó para identificar las variables que contribuyen sistemáticamente al rendimiento de los modelos. Estas variables y/o combinaciones específicas de los mismos, constituyen núcleos pronósticos con relevancia para la predicción del riesgo de preeclampsia. Como se explica en otra parte de esta solicitud, los núcleos pronósticos de las variables pueden diferir en función del subtipo de PE considerado y/o de si se considera el rendimiento pronóstico genérico (ABC), la predicción de alto riesgo ("Inclusión"; sensibilidad en los umbrales FPR o PPV) o la predicción de bajo riesgo ("Exclusión"; especificidad en los umbrales FNR o NPV). Para la elaboración de informes, los datos del estadígrafo correspondiente se obtienen dentro del "conjunto completo de datos", que a partir de ahora se abreviará como "completo" al considerar los umbrales de filtrado.

[0609] 4. Modelos pronósticos finales

[0610] Una vez identificados los núcleos pronósticos como relevantes para una cuestión pronóstica específica, p. ej., núcleo pronóstico relevante para "Excluir" la "PE pretérmino", se utilizaron (subconjuntos de) la variable de núcleo pronóstico para crear los modelos pronósticos "finales".

[0611] Resultados

[0612] 1. Introducción

[0613] Como se explica en esta memoria descriptiva, los solicitantes conceptualizaron un proceso que tiene el potencial de mejorar la tasa de detección (sensibilidad) con un valor de corte de PPV preestablecido de inclusión, por medio de, en primer lugar, el establecimiento de un modelo de exclusión (utilizando la totalidad de los métodos como se explica en otra parte de esta solicitud), en segundo lugar, aplicando este modelo para identificar a estas personas con una probabilidad baja (definida) de desarrollar preeclampsia y, en tercer lugar, estableciendo un modelo de inclusión (utilizando la totalidad de los métodos elaborados en otra parte de esta solicitud) que maximice la tasa de detección de futuros casos con un umbral de PPV preestablecido.

[0614] Aquí demostramos la validez de este concepto utilizando las siguientes entradas:

[0615] - valores de prevalencia de preeclampsia antes de la prueba según la sección"Objetivos de diagnóstico para las pruebas de estratificación del riesgo de preeclampsia",es decir.

[0616] - prevalencia de todas las PE = 0,05

[0617] - prevalencia de PE pretérmino = 0,014

[0618] - prevalencia de PE a término = 0,037

[0619] - Valores de corte de PPV tras la prueba según la tabla 3

[0620] - PPV<Todas las PE>= 0,133

[0621] - PPV<PE pretérmino>= 0,071

[0622] - PPV<PE a término>= 0,154

[0623] - Aplicación de un modelo (disperso) de exclusión (desarrollado por el), en el que la especificidad (tasa de detección de futuros no casos) con un límite FNR del 10 % (el 10 % de los futuros casos verdaderos se perderán para la clasificación de exclusión) se utiliza para descartar una fracción de la población de prueba.

[0624] 2. Ejemplo 4A: Todas las PE

[0625] De acuerdo con el ejemplo 1, el criterio de PPV puede trazarse en el espacio ROC, por lo que el criterio depende de la prevalencia de preeclampsia antes de la prueba. Esto se ilustra en el panel A de la figura 23. Dentro del marco ilustrativo anterior para encontrar núcleos pronósticos, el modelo multivariante de inclusión de mayor rendimiento (en una sola etapa) (pb HVD3 CR ADMA) ofrece una tasa de detección del 48 %.

[0626] Con vistas a aplicar una secuencia de un modelo de exclusión seguida de un modelo de inclusión, se consideró un modelo ilustrativo (disperso) de exclusión, que se ilustra en la figura 23 panel B.

[0627] - Modelo de exclusión de todas las PE: bp sENG 1-HD

[0628] Siguiendo la aplicación de este modelo de exclusión, el 38,3 % de los futuros no casos así como el 10 % de los futuros casos (véase 10 % de FNR) se eliminan de la población de prueba. Como resultado, la prevalencia de la preeclampsia en la población de prueba restante (P2) ha pasado a 0,071 (desde 0,05). Esto tiene el efecto de cambiar el valor de corte del PPV, como se observa en el panel C de la figura 23. Dentro de la población residual (P2), se generó un nuevo conjunto de modelos predictivos y se evaluó su rendimiento en función del criterio del PPV. La curva ROC obtenida con un modelo ilustrativo (disperso) se representa en la figura D1 panel3.

[0629] - Modelo de inclusión de todas las PE: bp PIGF DC

[0630] Dentro de la población de prueba P2, este último modelo ofrecerá una sensibilidad de 0,56 (tasa de detección del 56 %). Si se corrige el 10 % de futuros casos descartados en la etapa de exclusión, la tasa de detección global es del 51 % (56 % x 0,9).

[0631] Esta tasa de detección global, tras la aplicación secuencial de un modelo de exclusión y un modelo de inclusión, es mejor que el 48 % obtenido con la aplicación de un único modelo de inclusión según el ejemplo B1.

[0632] Por lo tanto, como se analiza en el ejemplo 2, las combinaciones de núcleos pronósticos de exclusión y de núcleos pronósticos de inclusión que presentan combinaciones multivariante de conjuntos específicos de las variables tomadas en consideración en esta solicitud proporcionarán un rendimiento pronóstico de inclusión excepcional para todas las preeclampsias.

[0633] 3. Ejemplo 4B: PE pretérmino

[0634] De acuerdo con el ejemplo 1, el criterio de PPV puede trazarse en el espacio ROC, por lo que el criterio depende de la prevalencia de preeclampsia antes de la prueba. Esto se ilustra en el panel A de la figura 24. Dentro del marco ilustrativo anterior para encontrar núcleos pronósticos, el modelo multivariante de inclusión de mayor rendimiento (en una sola etapa) (PIGF sENG DLG L-ERG) ofrece una tasa de detección del 65 %. Con vistas a aplicar una secuencia de un modelo de exclusión seguida de un modelo de inclusión, se consideró un modelo ilustrativo (disperso) de exclusión, que se ilustra en la figura 24 panel B.

[0635] - Modelo de exclusión de PE pretérmino: sENG DLG

[0636] Siguiendo la aplicación de este modelo de exclusión, el 43,7 % de los futuros no casos así como el 10 % de los futuros casos (véase 10 % de FNR) se eliminan de la población de prueba. Como resultado, la prevalencia de la preeclampsia pretérmino en la población de prueba restante (P2) ha pasado a 0,023 (desde 0,014). Esto tiene el efecto de cambiar la línea de corte del PPV, como se observa en el panel C de la figura 24. Dentro de la población (P2), se generó un conjunto de modelos predictivos y se evaluó su rendimiento en función del criterio del PPV. La curva ROC obtenida con un modelo ilustrativo se representa en la figura 24, panel C.

[0637] - Modelo de inclusión de PE pretérmino: PIGF sENG DLG 2-HBA

[0638] Dentro de la población de prueba P2, este último modelo ofrecerá una sensibilidad de 0,81 (tasa de detección del 81 %). Si se corrige el 10 % de futuros casos descartados en la etapa de exclusión, la tasa de detección global es del 73 % (81 % x 0,9).

[0639] Esta tasa de detección global, tras la aplicación secuencial de un modelo de exclusión y un modelo de inclusión, es mejor que el 65 % obtenido con la aplicación de un único modelo de inclusión según el ejemplo B2.

[0640] Por lo tanto, como se analiza en el ejemplo 2, las combinaciones de núcleos pronósticos de exclusión y de núcleos pronósticos de inclusión que presentan combinaciones multivariante de conjuntos específicos de las variables tomadas en consideración en esta solicitud proporcionarán un rendimiento pronóstico de inclusión excepcional para la preeclampsia pretérmino.

[0641] 4. Ejemplo 4C: PE a término

[0642] De acuerdo con el ejemplo 1, el criterio de PPV puede trazarse en el espacio ROC, por lo que el criterio depende de la prevalencia de preeclampsia antes de la prueba. Esto se ilustra en la figura 25, panel A. Dentro del marco ilustrativo anterior para encontrar núcleos de pronóstico, el modelo multivariante de inclusión de mayor rendimiento (en una sola etapa) (pb HVD3 TR) ofrece una tasa de detección del 35 %, que no cumple la tasa de detección mínima preestablecida en la tabla 3.

[0643] Con vistas a aplicar una secuencia de un modelo de exclusión seguida de un modelo de inclusión, se consideró un modelo ilustrativo (disperso) de exclusión, según el ejemplo C3, que se ilustra en la figura 25 panel B. - Modelo de exclusión de PE a término: bp 1-HD

[0644] Siguiendo la aplicación de este modelo de exclusión, el 38,2 % de los futuros no casos así como el 10 % de los futuros casos (véase 10 % de FNR) se eliminan de la población de prueba. Como resultado, la prevalencia de la preeclampsia a término en la población de prueba restante (P2) ha subido a 0,053 (desde 0,037). Esto tiene el efecto de cambiar la línea de corte del PPV, como se observa en el panel C de la figura 25. Dentro de la población (P2), se generó un nuevo conjunto de modelos predictivos y se evaluó su rendimiento en función del criterio del PPV. La curva ROC obtenida con un modelo ilustrativo se representa en la figura 25, panel C. - Modelo de inclusión de PE a término: bp 1-HD NGM

[0645] Dentro de la población de prueba P2, este último modelo ofrecerá una sensibilidad de 0,465 (tasa de detección del 46,5 %). Si se corrige el 10 % de futuros casos descartados en la etapa de exclusión, la tasa de detección global es del 42 % (46,5 % x 0,9).

[0646] Esta tasa de detección global, tras la aplicación secuencial de un modelo de exclusión (exclusión) y un modelo de inclusión (inclusión), es mejor que el 35 % obtenido con la aplicación de un único modelo de inclusión (inclusión), según el ejemplo B3, y cumple la tasa de detección mínima preestablecida, tal y como se expone en la tabla 3. Por lo tanto, como se analiza en el ejemplo 2, las combinaciones de núcleos pronósticos de exclusión y de núcleos pronósticos de inclusión que presentan combinaciones multivariante de conjuntos específicos de las variables tomadas en consideración en esta solicitud proporcionarán un rendimiento pronóstico de inclusión excepcional para la preeclampsia a término.

[0647] 5. Ejemplo 4D: Maximización del rendimiento pronóstico mediante un proceso de clasificadores secuenciales Introducción

[0648] En los ejemplos 4A, 4B, 4C el objetivo principal para la prueba de pronóstico, siendo la prueba fue la consecución de un rendimiento excepcional de inclusión.

[0649] Con combinaciones específicas de variables, como las consideradas a lo largo de esta solicitud, que muestran sistemáticamente una relevancia pronóstica excepcional para la PE pretérmino, los inventores exploraron si es concebible desarrollar una prueba pronóstica que ofrezca simultáneamente un rendimiento excepcional de inclusión y exclusión expresado por las métricas clínicamente relevantes PPV (inclusión) y NPV (exclusión). Según la tabla 3, se consideraron los siguientes valores de corte clínicamente relevantes:

[0650] - Inclusión: la prueba clasificará a una población en un grupo de alto riesgo, en donde la probabilidad de desarrollar preeclampsia pretérmino es >=1/14 o PPV >= 0,071

[0651] - Exclusión: la prueba clasificará a una población en un grupo de bajo riesgo, en donde la probabilidad de desarrollar preeclampsia pretérmino es =< 1/400 o NPV >= 0,9975.

[0652] Teniendo en cuenta la prevalencia de (futura) preeclampsia, es decir, p = 0,014 (véase la tabla 3), los requisitos pronósticos para dicha prueba pueden representarse en el espacio ROC; los umbrales clínicamente relevantes de PPV- y NPV- como relevantes para la PE pretérmino se ilustran en la figura 26.

[0653] PE pretérmino: clasificadores secuenciales

[0654] Los solicitantes descubrieron que mediante la aplicación de secuencias específicas de clasificaciones de "inclusión" y "exclusión", como se elabora teóricamente en el ejemplo 3, utilizando las variables de interés consideradas dentro de esta solicitud, se pueden establecer pruebas de pronóstico con métricas de rendimiento excepcionales de "inclusión" Y "exclusión".

[0655] En una primera etapa, los inventores utilizaron los conocidos méritos predictivos del PIGF para predecir la preeclampsia pretérmino, como se publicó para el estudio SCOPE en Kenny et al [9]. En la figura 27 se muestran los niveles de PIGF determinados en muestras de sangre materna aproximadamente a las 15 semanas de embarazo frente a la edad gestacional en el momento del parto para todos los sujetos del estudio considerados en esta solicitud. Téngase en cuenta que, en el momento de la extracción de sangre, todas las mujeres se consideraban sanas y no presentabansíntomas clínicos de preeclampsia ni factores clínicos de riesgo de preeclampsia.Las mujeres que dieron a luz prematuramente, es decir, antes de las 37 semanas de gestación, debido a preeclampsia ("preeclampsia pretérmino") se representan con símbolos de "estrella", las mujeres que sufrieron preeclampsia, pero dieron a luz a término, es decir, en o después de las 37 semanas de gestación, se representan con símbolos de "barra", las mujeres que dieron a luz sin sufrir preeclampsia se representan con símbolos de "círculo".

[0656] Como puede verse en la figura 27, el uso de los niveles de PIGF en el momento del muestreo permitirá clasificar la población de prueba en 2 grupos. Las mujeres con PIGF por debajo del umbral mostrado tendrán un PPV > 0,071 para desarrollar PE pretérmino, y se consideran de alto riesgo. También está claro que el grupo con niveles de PIGF superiores (o iguales) al umbral constituye >50 % de los futuros casos de PE pretérmino (Área "A").

[0657] Para el resto de esta ejemplificación, los (futuros) casos de PE a término no recibirán más consideración. Esto da como resultado la siguiente población de estudio Pob.-estudio 1, constituida por

[0658] - (Futura) PE pretérmino; n =23

[0659] - (Futura) ausencia de PE; n = 335

[0660] Para apreciar el rendimiento pronóstico de los clasificadores tal y como se establece dentro de este ejemplo E, es necesario corregir los datos del estudio, ya que éste se basa en un diseño de estudio de casos y controles y, por tanto, tiene una sobrerrepresentación de casos (futuros) de PE pretérmino en comparación con la prevalencia natural de la enfermedad p=0,014. A continuación se recalcula cualquier dato de clasificación para una población hipotética de 10.000 embarazos, que constituyen

[0662]

[0664] Aplicando los siguientes factores de escala

[0665] - (futura) PE pretérmino: 140/23 =6,087

[0666] - (Futura) ausencia de PE; 9860 / 335 =29,43

[0667] Los resultados del estudio pueden interpretarse para una población de 10.000 embarazos, teniendo en cuenta la prevalencia natural de la enfermedad.

[0668] Los inventores descubrieron que PIGF y DLG presentan un potencial de clasificación complementario, que se hace evidente al trazar ambos, como se ilustra en la figura 28.

[0669] En vista de los objetivos de clasificación de relevancia clínica de inclusión / exclusión considerados, esta complementariedad pronóstica puede utilizarse de la siguiente manera:

[0670] Etapa 1

[0671] Aplicación de un clasificador de inclusión que utiliza el valor de corte de PIGF, como se ejemplifica en la figura 27. Este clasificador segmentará la Pob.-estudio 1 en una población "incluida" o de alto riesgo (Pop-HR1), según la figura 29, y una nueva población de estudio, Pob.-estudio 2.

[0672] Usando la regla PIGF < 0,005445, se obtiene la siguiente clasificación:

[0673] Tabla 10A

[0675]

[0677] Tabla 10B

[0679]

[0681] Cuando se expresa como parte de un clasificador total, esta 1.<a>etapa da como resultado lo siguiente:

[0682] Tabla 10C

[0684]

[0686] El PPV dentro del grupo establecido como Inclusión, Pop-HR1, cumple el criterio de PPV preestablecido (PPV >= 0,071). La tasa de detección global de este clasificador de una sola etapa es del 43 % (Sn = 0,43), es decir, se encontrará el 43 % de todos los futuros casos de PE pretérmino cuando se aplique únicamente este valor de corte basado en PIGF. Cabe destacar que el grupo que no se sometió a la prueba (Pob.-estudio 2) no cumple ni el criterio de PPV ni el de NPV. Este clasificador de una etapa también puede representarse en el espacio ROC, como se ilustra en la figura 30, lo que confirma el cumplimiento del criterio de PPV (véase la figura 27)

[0687] Dado que la población Pop-HR1 cumple totalmente con el criterio de PPV preestablecido, se considera que la Pop-HR1 está totalmente clasificada y no se le da más importancia (se elimina del estudio). Esto significa que en la siguiente etapa de la clasificación únicamente se tendrá en cuenta la Pob.-estudio 2.

[0688] Etapa 2

[0689] Tras la eliminación de la Pop-HR1 de la Pob.-estudio 1, el valor pronóstico aditivo de DLG se hace muy evidente. En la figura 31 se ejemplifica un clasificador de exclusión que utiliza el valor de corte de DLG. Este clasificador segmentará la Pob.-estudio 2 en una población "excluida" o de bajo riesgo (Pop-LR1) y una nueva población de estudio Pob.-estudio 3.

[0690] Usando la regla DLG < 0,1454243, se obtiene la siguiente clasificación:

[0691] Tabla 11A

[0693]

[0695] Tabla 11B

[0697]

[0699] Cuando se añade al clasificador total, esta 2.<a>etapa da como resultado lo siguiente:

[0700] Tabla 11C

[0702]

[0704] Por lo que el NPV dentro del grupo de exclusión establecido, Pop-LR1, cumple el criterio de NPV preestablecido (NPV >= 0,9975).

[0705] La tasa de detección global de este clasificador de doble etapa es del 43 % (Sn = 0,43), es decir, se encontrará el 43 % de todos los futuros casos de PE pretérmino al aplicar el valor de corte basado en PIGF (etapa 1; menor que). Para cualquier sujeto que tenga un PIGF superior (o igual) al valor de corte de PIGF, se determinará si el sujeto tiene un valor inferior (exclusión) al valor de corte basado en la DLG, o superior al valor de corte de la DLG (pasando a formar parte de la Pob.-estudio 3). El 58 % (Sp = 0,58) de los (futuros) casos de ausencia de PE se estratificarán en la Pop-LR1 y se considerarán de bajo riesgo. Cabe señalar que la composición de la Pob.-estudio 3 no cumple el criterio de PPV ni el de NPV.

[0706] Este clasificador en dos etapas también puede representarse gráficamente en el espacio ROC, como se ilustra en la figura 32. Como el clasificador total tiene en cuenta la clasificación de inclusión y la clasificación de exclusión por separado, el clasificador de prueba total corresponde a 2 pares separados (Sn-Sp). Se puede observar que las clasificaciones de Inclusión y Exclusión resultantes se ajustan a los valores de corte de PPV o NPV preestablecidos. Estos sujetos, que no están clasificados ni como de alto riesgo ni como de bajo riesgo, constituyen la Pob.-estudio 3. También se pueden trazar las métricas de la Pob.-estudio 3 en el espacio ROC; está claro que este grupo (residual) no es conforme.

[0707] Dado que la población Pop-LR1 cumple totalmente con el criterio de NPV preestablecido, la Pop-LR1 también se considera totalmente clasificada y no se le da más importancia (se elimina del estudio). Esto significa que en la siguiente etapa de la clasificación únicamente se tendrá en cuenta la Pob.-estudio 3.

[0708] Etapa 3

[0709] Tras la eliminación de la Pop-LR1 de la Pob.-estudio 2, los inventores descubrieron que L-ERG puede utilizarse para estratificar la Pob.-estudio 3 una vez más, para descartar un grupo adicional de sujetos y clasificarlos también como de bajo riesgo. En la figura 33 se ejemplifica la aplicación de un clasificador de exclusión que utiliza un valor de corte de L-ERG. Este clasificador segmentará la Pob.-estudio 3 en una población "Excluida" o de bajo riesgo (Pop-LR2), y una nueva población de estudio Pob.-estudio 4.

[0710] Utilizando la regla L-ERG< 0,266432, se obtiene la siguiente clasificación:

[0711] Tabla 12A

[0713]

[0715] Tabla 12B

[0717]

[0719] Dentro del nuevo grupo excluido, es decir, Pop-LR2, apenas se cumple el criterio de NPV preestablecido (NPV= 0,996), pero cuando se considera la 3.<ª>etapa en combinación con la Pop-LR1, se cumple el criterio de exclusión acumulativo.

[0720] En combinación con las etapas anteriores, la 3.<ª>etapa da lugar a la siguiente clasificación combinada de inclusión y exclusión:

[0721] Tabla 12C

[0723]

[0725] La tasa de detección global de este clasificador de doble etapa es del 43 % (Sn = 0,43), es decir, se encontrará el 43 % de todos los futuros casos de PE pretérmino cuando se aplique el valor de corte basado en PIGF (etapa 1; menor que; Pop-HR1).

[0726] Para cualquier sujeto que tenga un PIGF superior (o igual) al valor de corte de PIGF, se determina entonces si el sujeto tiene un valor inferior al valor de corte basado en DLG; en caso afirmativo, estos sujetos se consideran de bajo riesgo (etapa 2; Pop-LR1).

[0727] Para cualquier sujeto que tenga un valor en sangre de PIGF >= valor de corte de PIGF Y un valor en sangre de DLG >= valor de corte de Met_021_062, se determinará si el sujeto tiene un valor inferior al valor de corte basado en L-ERG (exclusión; PopLR2), o superior al valor de corte de L-ERG (pasando a formar parte de la Pob.-estudio 4). Al combinar estas dos etapas consecutivas de segmentación por exclusión, el 75 % (Sp = 0,75) de los (futuros) casos de PE no pretérmino se estratificarán en el grupo de bajo riesgo total. Cabe destacar que la composición de la Pob.-estudio 4 no cumple ni el criterio de PPV ni el de NPV.

[0728] Este clasificador en tres etapas también puede representarse gráficamente en el espacio ROC, como se ilustra en la figura 34. Como el clasificador total tiene en cuenta la clasificación de inclusión y la clasificación de exclusión por separado, el clasificador de prueba total corresponde a dos pares separados (Sn-Sp). Se puede observar que las clasificaciones de Inclusión y Exclusión resultantes se ajustan a los valores de corte de PPV o NPV preestablecidos. Estos sujetos, que no están clasificados ni como de alto riesgo ni como de bajo riesgo, constituyen la Pob.-estudio 4. También se pueden trazar las métricas de esta prueba "negativa", correspondiente a la Pob.-estudio 4 en el espacio ROC. Está claro que este grupo (residual) no es acorde. Etapa 4

[0729] Los inventores descubrieron que sENG puede utilizarse para estratificar la Pob.-estudio 4 una vez más, para descartar un grupo adicional de sujetos y clasificarlos también como de bajo riesgo. En la figura 35 se ilustra la aplicación de un clasificador de exclusión que utiliza un valor de corte de sENG. Este clasificador segmentará la Pob.-estudio 4 en una población "Rechazada" o de Bajo Riesgo (Pop-LR2), y una población residual del estudio.

[0730] Usando la regla sENG< 14,8293, se obtiene la siguiente clasificación de la Pob.-estudio 4:

[0731] Tabla 13A

[0733]

[0735] Tabla 13B

[0737]

[0739] Dentro del nuevo grupo excluido, es decir, Pop-LR3, se cumple una vez más el criterio NPV preestablecido (NPV=1), lo que garantizará que cuando se considere la 4.<ª>etapa como parte del clasificador total, se cumpla el criterio de exclusión acumulativo.

[0740] Cuando se añade al clasificador total, la 4.<ª>etapa da lugar a la siguiente clasificación combinada de inclusión y exclusión:

[0741] Tabla 13C

[0743]

[0745] Es interesante observar que, en la población residual, el riesgo de sufrir una PE pretérmino más adelante en el embarazo se ajusta prácticamente al umbral de PPV. Esto también es evidente cuando se traza el clasificador total en el espacio ROC como se ilustra en la figura 36 panel A.

[0746] A partir de la figura 36-panel A, se puede apreciar que, tras la aplicación de la última clasificación de "Exclusión", la totalidad de las clasificaciones de "Exclusión" cumplen con el criterio de NPV de exclusión (como se pretendía), pero también cumple con el criterio de PPV de "Inclusión" preestablecido. En otras palabras, como resultado de esta aplicación secuencial específica de clasificadores individuales, cualquier sujeto que no esté clasificado como de bajo riesgo (según los clasificadores de exclusión anteriores), es de alto riesgo. Esto también queda claro en la población "residual", que también cumple el criterio de PPV (similar al primer grupo de Pop-HR1 de Inclusión). La eliminación iterativa (o "exclusión") de los sujetos de "bajo riesgo" da lugar a una población residual muy enriquecida en (futuros) casos de PE pretérmino. Por lo tanto, se puede considerar un grupo de alto riesgo total que constituye: Pop-HR1 Residual (o Pop-HR2).

[0747] Al hacerlo, este "clasificador total", como se ilustra en la figura 36-panel B, segmentará la población del estudio Pob.-estudio 1 original en 2 grupos; es decir

[0748] - un grupo de alto riesgo que contiene el 91 % de los (futuros) casos de PE pretérmino, y en donde cualquier sujeto tiene un riesgo >=1/14 (es decir, PPV >= 0,071) de desarrollar efectivamente la enfermedad más adelante en el embarazo

[0749] - un grupo de bajo riesgo que contiene el 83 % de los (futuros) casos de ausencia de PE, y en donde cualquier sujeto tiene un riesgo =<1/400 o (NPV >= 0,9975) de desarrollar efectivamente preeclampsia.

[0750] Además del clasificador total completamente ejemplificado (clasificador A; en la tabla 14), también se encontraron clasificadores totales adicionales que constituyen la solicitud ordenada de un conjunto de 4 variables. En la tabla 14 se presentan sus principales estadígrafos de rendimiento pronóstico.

[0751] Tabla 14:Modelos de diagnóstico de la PE pretérmino: Variables, en orden de aplicación en el clasificador secuencial, y métricas de rendimiento pronóstico ilustrativas para el ejemplo de PE pretérmino elaborado en esta solicitud.

[0753]

[0755] Será evidente para el lector que los siguientes clasificadores totales que constituyen la aplicación ordenada de cualesquiera 2, 3 o 4 clasificadores variables proporcionarán una estratificación altamente pronóstica para la PE pretérmino en mujeres embarazadas al principio del embarazo antes de mostrar cualquier síntoma clínico de preeclampsia:

[0756] - PIGF, DLG, L-ERG y sENG

[0757] - PIGF, DLG, sENG, 1-HD

[0758] - PIGF, DLG, L-LEU, sENG

[0759] - PIGF, DLG, sENG, L-LEU

[0760] - PIGF, DLG, L-ISO, sENG

[0761] - PIGF, DLG, (L-LEU L-ISO), sENG

[0762] - PIGF, DLG, L-ERG, L-LEU

[0763] - PIGF, DLG, L-ERG, L-ISO

[0764] - PIGF, DLG, L-ERG, (L-LEU L-ISO)

[0765] Por lo tanto, como se explica en los ejemplos 3 y 4, las combinaciones secuenciales de núcleos de pronóstico de exclusión (exclusión) y núcleos de pronóstico de inclusión (inclusión) que presentan combinaciones (multivariables) de conjuntos específicos de las variables consideradas en esta solicitud ofrecerán un rendimiento de pronóstico total (Inclusión Exclusión) excepcional para la preeclampsia pretérmino.

[0766] Implementación de hardware

[0767] Se apreciará que en el contexto de la presente invención pueden construirse igualmente implementaciones de hardware informático dedicadas que incluyen, pero no se limitan a, circuitos integrados específicos de la aplicación, matrices lógicas programables y otros dispositivos de hardware para implementar los métodos descritos en la presente memoria. Las aplicaciones que pueden incluir los aparatos y sistemas de diversas realizaciones incluyen ampliamente una variedad de sistemas electrónicos e informáticos. En algunas realizaciones, las funciones se implementan en dos o más módulos o dispositivos de hardware específicos interconectados, con señales de control y datos relacionadas comunicadas entre los módulos y a través de ellos, o como partes de un circuito integrado específico de la aplicación. Pueden proporcionarse diversos módulos para poner en práctica la invención tal como se define en las reivindicaciones. Por tanto, el sistema de ejemplo es aplicable a implementaciones de software, firmware y hardware.

[0768] Según diversas realizaciones de la presente divulgación, los métodos descritos en la presente memoria están destinados a funcionar como programas de software que se ejecutan en un procesador de ordenador. Además, las implementaciones de software pueden incluir, pero no se limitan a, procesamiento distribuido o procesamiento distribuido de componentes/objetos, procesamiento paralelo o procesamiento de máquinas virtuales también se pueden construir para implementar los métodos descritos en la presente memoria. La presente divulgación contempla un medio legible por máquina que contiene instrucciones para que un dispositivo conectado a la red de comunicaciones, a otra red, o a ambas, pueda enviar o recibir voz, vídeo o datos, y para comunicarse a través de la red de comunicaciones, de otra red, o de ambas, utilizando las instrucciones. Las instrucciones pueden además transmitirse o recibirse a través de la red de comunicaciones, de otra red, o de ambas, mediante el dispositivo de interfaz de red.

[0769] Por ejemplo, los datos obtenidos en los diversos ejemplos descritos anteriormente relativos a un sujeto concreto pueden cargarse en un aparato informático "in situ" y procesarse la información por un procesador. A continuación, el procesador puede enviar un valor a una pantalla que indique la detección, o la predicción de riesgo, del trastorno del embarazo en el sujeto basándose en dicho modelo M. Se prevé que esto pueda implementarse en forma de ordenador personal autónomo o dispositivo portátil o teléfono inteligente/dispositivo de comunicación. Por consiguiente, los datos pueden cargarse en una nube o en un servidor virtual donde se procesen según la invención. A continuación, los datos procesados pueden enviarse o utilizarse de cualquier forma adecuada.

[0770] La descripción anterior detalla realizaciones actualmente preferidas de la presente invención. Los expertos en la técnica podrán realizar numerosas modificaciones y variaciones en la práctica de los mismos tras considerar estas descripciones. Dichas modificaciones y variaciones están comprendidas en las reivindicaciones adjuntas.

[0771] REFERENCIAS

[0772] 1 Thomas G, Kenny LC, Baker PN,et al.A novel method for interrogating receiver operating characteristic curves for assessing prognostic tests. Diagnostic Progn Res 2017;1:17. doi:10.1186/s41512-017-0017-y 2 Moons KGM, Altman DG, Vergouwe Y,et al.Prognosis and prognostic research: application and impact of prognostic models in clinical practice. BMJ 2009;338:b606-b606. doi:10.1136/bmj.b606

[0773] 3 Liao Y, McGee DL, Cooper RS,et al.How generalizable are coronary risk prediction models? Comparison of Framingham and two national cohorts. Am Heart J 1999;137:837-45. doi:10.1016/S0002-8703(99)70407-2

[0774] 4 Lucas A, Armbruster B. The cost-effectiveness of expanded HIV screening in the United States. Aids 2013;27:795-801. doi:10.1097/QAD.Ob013e32835c54f9

[0775] 5 Dondorp W, De Wert G, Bombard Y,et al.Non-invasive prenatal testing for aneuploidy and beyond: Challenges of responsible innovation in prenatal screening. Eur J Hum Genet 2015;23:1438-50. doi:10.1038/ejhg.2015.57

[0776] 6 World Health Organisation. Prevention of cardiovascular disease: guidelines for assessment and management of cardiovascular risk. Ginebra, Suiza: : World Health Organisation 2007.

[0777] 7 Royston P, Moons KGM, Altman DG,et al.Prognosis and prognostic research: Developing a prognostic model. BMJ 2009;338:b604. doi:10.1136/bmj.b604

[0778] 8 North RA, Mccowan LME, Dekker GA,et al.Clinical risk prediction for pre-eclampsia in nulliparous women: development of model in international prospective cohort. BMJ 2011;342:d1875. doi:10.1136/bmj.d1875\rbmj.d1875 [pii]

[0779] 9 Kenny LC, Black MA, Poston L,et al.Early Pregnancy Prediction of Preeclampsia in Nulliparous Women, Combining Clinical Risk and Biomarkers: The Screening for Pregnancy Endpoints (SCOPE) International Cohort Study. Hypertension 2014;64:644-52. doi:10.1161/HYPERTENSIONAHA.114.03578

[0780] 10 Rolnik DL, Wright D, Poon LC,et al.ASPRE trial: performance of screening for preterm pre-eclampsia. Ultrasound Obstet Gynecol Fecha de primera publicación en línea: 25 de julio de 2017. doi:10.1002/uog.18816

[0781] 11 Pitt JJ. Principles and Applications of Liquid Chromatography- Mass Spectrometry in Clinical Biochemistry. Clin Biochem Rev 2009;30:19-34.

[0783] 12 CLSI. Liquid Chromatography - Mass Spectromtry Methods; Approved Guideline CLSI document 62-A.

[0784] 20 de octubre. Wayne, PA: : Clinical and Laboratory Standards Institute 2014.

[0786] 13 Hrydziuszko O, Viant MR. Missing values in mass spectrometry based metabolomics: an undervalued step in the data processing pipeline. Metabolomics 2012;8:161-74. doi:10.1007/s11306-011-0366-4

Claims

1. REIVINDICACIONES

1. Un método implementado por ordenador para generar un modelo M para detectar o predecir el riesgo de una afección en un sujeto, comprendiendo el método las etapas de:

proporcionar una población de sujetos de prueba y datos de medición para una pluralidad (n) de variables para cada uno de los sujetos de prueba seleccionadas entre características biométricas, de estilo de vida y/o fisiológicas;

proporcionar un primer modelo M1 configurado para predecir la presencia o riesgo de la afección en la población de sujetos de prueba que comprende de 1 a n variables, en donde el modelo M1 está configurado para segregar la población de sujetos de prueba en subconjuntos poblacionales de primera generación A y B en donde los sujetos en el subconjunto poblacional de primera generación A tienen una probabilidad seleccionada de una de: una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar la afección superior o igual a una probabilidad de corte de inclusión predefinida; caracterizado por las etapas de:

segmentar la población de sujetos basándose en el primer modelo M1 en subconjuntos poblacionales de primera generación A y B; cuando el subconjunto poblacional de primera generación B comprende un número suficiente de sujetos,

proporcionar un segundo modelo M2 configurado para predecir la presencia o el riesgo de la afección en el subconjunto poblacional de primera generación B, comprendiendo el modelo de 1 a n variables, en donde el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre las otras de: una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar la afección superior o igual a una probabilidad de corte de inclusión predefinida; en donde, cuando uno de los subconjuntos poblacionales no comprende un número suficiente de sujetos, se repite la etapa de segregación anterior utilizando un modelo alternativo configurado para generar un subconjunto poblacional con un número suficiente de sujetos, segmentar el subconjunto poblacional de primera generación B basado en el segundo modelo M2 en subconjuntos poblacionales de segunda generación A y B; y

en donde el modelo M comprende el primer modelo M1 y el segundo modelo M2; y emitir un valor indicativo de una detección, o una predicción de riesgo, de la afección en el sujeto basado en dicho modelo M y en donde la afección es un trastorno del embarazo.

2. Un método implementado por ordenador según la reivindicación 1 en el que el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en el que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre la otra de: una probabilidad de tener/desarrollar la afección inferior o igual a un valor de corte de NPV predefinido; o una probabilidad de tener/desarrollar la afección superior o igual a un valor de corte de PPV predefinido.

3. Un método implementado por ordenador según la reivindicación 1 en el que el modelo M1 está configurado para segregar la población de sujetos de prueba en subconjuntos poblacionales de primera generación A y B en los que los sujetos del subconjunto poblacional de primera generación A tienen una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; en donde el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad de tener/desarrollar la afección mayor o igual que una probabilidad de corte de inclusión predefinida que es opcionalmente un valor de corte de PPV.

4. Un método implementado por ordenador según la reivindicación 1 en el que el modelo M1 está configurado para segregar la población de sujetos de prueba en subconjuntos poblacionales de primera generación A y B en los que los sujetos del subconjunto poblacional de primera generación A tienen una probabilidad de tener/desarrollar afección mayor o igual que una probabilidad de corte de inclusión predefinida; en donde el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que los sujetos el subconjunto poblacional de segunda generación A tienen una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de exclusión predefinida que es opcionalmente un valor de corte de NPV.

5. Un método implementado por ordenador según cualquier reivindicación precedente, que incluye una etapa de segmentación adicional que comprende:

cuando el subconjunto poblacional de segunda generación B comprende un número suficiente de sujetos, proporcionar un tercer modelo M3 configurado para predecir la presencia o el riesgo de la afección en el subconjunto poblacional de segunda generación B, comprendiendo el modelo de 1 a n variables, en donde el modelo M3 está configurado para segregar el subconjunto poblacional de segunda generación B en subconjuntos poblacionales de tercera generación A y B de tal manera que los sujetos en el subconjunto poblacional de tercera generación A tienen una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar la afección inferior o igual a un valor de corte de NPV de exclusión predefinido; o una probabilidad de tener/desarrollar la afección superior o igual a un valor de corte de PPV de inclusión predefinido; y segmentar el otro de los subconjuntos poblacionales de segunda generación basándose en el tercer modelo M3 en subconjuntos poblacionales de tercera generación A y B.

6. Un método implementado por ordenador según la reivindicación 5 en el que:

el primer modelo M1 está configurado para segmentar la población de sujetos de prueba de tal manera que los sujetos el subconjunto poblacional de primera generación A tengan una probabilidad de tener/desarrollar la afección mayor que una probabilidad de corte predefinida por inclusión; el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de tal manera que los sujetos en el subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar la condición (de salud) menor que una probabilidad de corte predefinida por exclusión; y el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de modo que los sujetos de al menos uno de los subconjuntos poblacionales de tercera generación tengan una probabilidad de tener/desarrollar el problema de salud superior a un valor de corte de PPV de inclusión predefinido.

7. Un método implementado por ordenador según la reivindicación 5 en el que:

el primer modelo M1 está configurado para segmentar la población de sujetos de prueba de tal manera que los sujetos el subconjunto poblacional de primera generación A tengan una probabilidad de tener/desarrollar la afección inferior a una probabilidad de corte de exclusión predefinida; el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de tal manera que los sujetos en el subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar la afección superior a una probabilidad de corte de inclusión predefinida; y el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de tal manera que los sujetos de al menos uno de los subconjuntos poblacionales de tercera generación tengan una probabilidad de tener/desarrollar la afección inferior a un valor de corte de NPV de exclusión predefinido.

8. Un método implementado por ordenador según la reivindicación 6 en el que:

el primer modelo M1 está configurado para segmentar la población de sujetos de ensayo de tal manera que los sujetos del subconjunto poblacional de primera generación A tengan una probabilidad de tener/desarrollar la afección superior a un valor de corte de PPV de exclusión predefinido;

el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de tal manera que los sujetos en el subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar la afección inferior a una probabilidad de corte de PPV de exclusión predefinido; y

el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de tal manera que los sujetos de al menos uno de los subconjuntos poblacionales de tercera generación tengan una probabilidad de tener/desarrollar la afección superior a un valor corte de PPV de inclusión predefinido.

9. Un método implementado por ordenador según la reivindicación 4 en el que:

el primer modelo M1 está configurado para segmentar la población de sujetos de prueba de tal manera que los sujetos el subconjunto poblacional de primera generación A tengan una probabilidad de tener/desarrollar la afección inferior a un valor de corte de NPV de exclusión predefinido;

el segundo modelo M2 está configurado para segmentar el subconjunto poblacional de primera generación B de tal manera que los sujetos en el subconjunto poblacional de segunda generación A tengan una probabilidad de tener/desarrollar la afección superior a una probabilidad de corte de inclusión predefinida; y el tercer modelo M3 está configurado para segmentar el subconjunto poblacional de segunda generación B de tal manera que los sujetos de al menos uno de los subconjuntos poblacionales de tercera generación tengan una probabilidad de tener/desarrollar la afección inferior a un valor de corte de NPV de exclusión predefinido.

10. Un método implementado por ordenador según la reivindicación 1, que incluye una o más etapas de segmentación adicionales en las que cada etapa de segmentación comprende:

cuando el subconjunto poblacional de enésima generación B comprende un número suficiente de sujetos, proporcionar un (n+1).ésimo modelo Mn+1 configurado para predecir la presencia o el riesgo de la afección en el subconjunto poblacional de enésima generación B, comprendiendo el modelo de 1 a n variables, en donde el modelo Mn+1 está configurado para segregar el subconjunto poblacional de enésima generación B en el subconjunto poblacional de (n+1).ésima generación A y B tal que los sujetos del subconjunto poblacional de (n+1).ésima generación A tienen una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar la afección inferior o igual a un valor de corte de NPV de exclusión predefinido; o una probabilidad de tener/desarrollar la afección superior o igual a un valor de corte de PPV de inclusión predefinido; y segmentar el subconjunto poblacional de enésima generación B basado en el (n+1).ésimo modelo multivariante en los subconjuntos poblacionales de (n+1).ésima generación A y B.

11. Un método implementado por ordenador según la reivindicación 10, en la que una etapa de segregación final emplea un modelo final configurado para predecir la presencia o el riesgo de la afección en el subconjunto poblacional de penúltima generación B, comprendiendo el modelo de 1 a n variables, en donde el modelo final está configurado para segregar el subconjunto poblacional de penúltima generación B en el subconjunto poblacional A y B de la generación final de tal manera que los sujetos en el subconjunto poblacional A de la generación final tengan una probabilidad seleccionada entre una de: una probabilidad de tener/desarrollar la afección inferior o igual a un valor de corte de NPV de exclusión predefinido; o una probabilidad de tener/desarrollar la afección superior o igual a un valor de corte de PPV de inclusión predefinido.

12. Un método implementado por ordenador según la reivindicación 1, que incluye una o más etapas de segmentación adicionales en las que cada etapa de segmentación comprende:

(a) cuando el subconjunto poblacional de enésima generación B comprende un número suficiente de sujetos, generar un modelo (n+1).ésimo Mn+1 que comprende de 1 a n variables, configurado para predecir la presencia o el riesgo de desarrollar una afección en el subconjunto poblacional de enésima generación B, en donde el modelo Mn+1 está configurado para segregar el subconjunto poblacional de enésima generación B en el subconjunto poblacional de (n+1).ésima generación A y B, en donde cuando los sujetos en el subconjunto poblacional de (n+1).ésima generación A se añaden a los subconjuntos poblacionales combinados de la generación anterior A, la población compuesta de inclusión tiene una probabilidad mayor o igual a un valor de corte de PPV de inclusión predefinido de tener/desarrollar la afección; o cuando los sujetos del subconjunto poblacional de (n+1).ésima generación A se añaden a los subconjuntos poblacionales combinados A de exclusión de la generación anterior, la población compuesta de exclusión tiene una probabilidad menor o igual que un valor de corte de NPV de exclusión predefinido de tener/desarrollar la afección; y

(b) segmentar el subconjunto poblacional de enésima generación B basado en el (n+1).ésimo modelo multivariante en los subconjuntos poblacionales de (n+1).ésima generación A y B.

13. Un método implementado por ordenador según la reivindicación 10, 11 o 12 en el que se repiten sucesivas etapas de segmentación hasta que se genera un subconjunto poblacional que no puede seguir segmentándose.

14. Un sistema implementado por ordenador para generar un modelo M para detectar o predecir el riesgo de una afección en un sujeto, que comprende:

un dispositivo de entrada; un procesador;

una memoria; un dispositivo de salida;

dicho procesador acoplado operativamente al dispositivo de entrada, la memoria y el dispositivo de salida, dicho procesador configurado con:

un módulo o medios para proporcionar una población de sujetos de prueba y datos de medición para una pluralidad (n) de variables para cada uno de los sujetos de prueba seleccionadas entre características biométricas, de estilo de vida y/o fisiológicas;

un módulo o medios para proporcionar un primer modelo M1 configurado para predecir la presencia o riesgo de la afección en la población de sujetos de prueba que comprende de 1 a n variables, en donde el modelo M1 está configurado para segregar la población de sujetos de prueba en subconjuntos poblacionales de primera generación A y B en donde los sujetos en el subconjunto poblacional de primera generación A tienen una probabilidad seleccionada de una de: una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar la afección superior o igual a una probabilidad de corte de inclusión

predefinida; caracterizado por:

un módulo o medios para segmentar la población de sujetos basándose en el primer modelo M1 en subconjuntos poblacionales de primera generación A y B; un módulo o medios para determinar cuando el subconjunto poblacional de primera generación B comprende un número suficiente de sujetos; un módulo o medios para proporcionar un segundo modelo M2 configurado para predecir la presencia o el riesgo de la afección en el subconjunto poblacional de primera generación B, comprendiendo el modelo de 1 a n variables, en donde el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en los que los sujetos del subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre las otras de: una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar la afección superior o igual a una probabilidad de corte de inclusión predefinida; en donde, cuando uno de los subconjuntos poblacionales no comprende un número suficiente de sujetos, se repite la etapa de segregación anterior utilizando un modelo alternativo configurado para generar un subconjunto poblacional con un número suficiente de sujetos,

un módulo o medios para segmentar el subconjunto poblacional de primera generación B basado en el segundo modelo M2 en subconjuntos poblacionales de segunda generación A y B;

en donde el modelo M comprende el primer modelo M1 y el segundo modelo M2; y

medios para emitir un valor indicativo de una detección, o una predicción de riesgo, de la afección en el sujeto basado en dicho modelo M y en donde la afección es un trastorno del embarazo.

15. Un producto de programa informático almacenado en un medio de almacenamiento no transitorio, dicho medio de almacenamiento acoplado operativamente a un procesador y haciendo dicho producto de programa de ordenador que el procesador genere un modelo M para detectar o predecir el riesgo de una afección en un sujeto, estando el procesador configurado para implementar las etapas de:

proporcionar un primer modelo M1 configurado para predecir la presencia o riesgo de la afección en la población de sujetos de prueba que comprende de 1 a n variables, en donde el modelo M1 está configurado para segregar la población de sujetos de prueba en subconjuntos poblacionales de primera generación A y B en donde los sujetos en el subconjunto poblacional de primera generación A tienen una probabilidad seleccionada de una de: una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar la afección superior o igual a una probabilidad de corte de inclusión predefinida;

segmentar la población de sujetos basándose en el primer modelo M1 en subconjuntos poblacionales de primera generación A y B;

caracterizado por que el subconjunto poblacional de primera generación B comprende un número suficiente de sujetos, proporcionando un segundo modelo M2 configurado para predecir la presencia o riesgo de la afección en el subconjunto poblacional de primera generación B, el modelo comprende de 1 a n variables, en donde el modelo M2 está configurado para segregar el subconjunto poblacional de primera generación B en subconjuntos poblacionales de segunda generación A y B en donde los sujetos en el subconjunto poblacional de segunda generación A tienen una probabilidad seleccionada entre la otra de: una probabilidad de tener/desarrollar la afección inferior o igual a una probabilidad de corte de exclusión predefinida; o una probabilidad de tener/desarrollar la afección superior o igual a una probabilidad de corte de inclusión predefinida;

en donde, cuando uno de los subconjuntos poblacionales no comprende un número suficiente de sujetos, se repite la etapa de segregación anterior utilizando un modelo alternativo configurado para generar un subconjunto poblacional con un número suficiente de sujetos, segmentando el subconjunto poblacional de primera generación B basado en el segundo modelo M2 en subconjuntos poblacionales de segunda generación A y B; y

en donde el modelo M comprende el primer modelo M1 y el segundo modelo M2; y emitiendo un valor indicativo de una detección, o una predicción de riesgo, de la afección en el sujeto basado en dicho modelo M y en donde la afección es un trastorno del embarazo.