MXPA06001170A - Caracteristicas proteomicas de suero de alta resolucion multiples para deteccion de cancer de ovarios. - Google Patents

Caracteristicas proteomicas de suero de alta resolucion multiples para deteccion de cancer de ovarios.

Info

Publication number
MXPA06001170A
MXPA06001170A MXPA06001170A MXPA06001170A MXPA06001170A MX PA06001170 A MXPA06001170 A MX PA06001170A MX PA06001170 A MXPA06001170 A MX PA06001170A MX PA06001170 A MXPA06001170 A MX PA06001170A MX PA06001170 A MXPA06001170 A MX PA06001170A
Authority
MX
Mexico
Prior art keywords
swarm
disease
subject
ovarian cancer
vector space
Prior art date
Application number
MXPA06001170A
Other languages
English (en)
Inventor
Emanuel F Petricoin
Original Assignee
Correlogic Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Correlogic Systems Inc filed Critical Correlogic Systems Inc
Publication of MXPA06001170A publication Critical patent/MXPA06001170A/es

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding

Landscapes

  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Analytical Chemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Se empleo un conjunto bien controlado para estudio en suero (n = 248) de mujeres a quienes se les da seguimiento y evaluacion por la presencia de cancer de ovarios para extender analisis de patron proteomico de suero a una plataforma de instrumento espectrometro de masas de superior resolucion para explorar la existencia de conjuntos de diagnosticos altamente precisos multiples distintos, de caracteristicas presentes en el mismo especto de masas. Existen multiples conjuntos de caracteristicas proteomicas para diagnostico altamente preciso dentro de los espectros de masas de sueros humanos. Utilizando datos espectrales de masas de alta resolucion, se descubrio que al menos 56 patrones diferentes logran mas de 85% de sensibilidad y especificidad en prueba y validacion. Cuatro de esos juegos de caracteristicas exhibieron 100% de sensibilidad y especificidad en validacion ciega. La sensibilidad y especificidad de modelos de diagnostico generados a partir de datos espectrales de masas de alta resolucion, fueron superiores (P < 0.00001) que aquellos generados a partir de datos espectrales de masas de baja resolucion utilizando la misma muestra alimentada.

Description

CARACTERÍSTICAS PROTEÓMICAS DE SUERO DE ALTA RESOLUCIÓN MÚLTIPLES PARA DETECCIÓN DE CÁNCER DE OVARIOS ANTECEDENTES
[1001] El análisis de patrón proteómico de suero por espectrometría de masas (MS) , es una tecnología emergente que se' utiliza para identificar perfiles de enfermedad de biomarcador. Utilizando este enfoque basado en MS , los espectros de masas generados de un conjunto de entrenamiento de muestras de suero, se analizan por un algoritmo bioinformático para identificar patrones de firma de diagnostico que comprenden un sub-con nto de especies clave de masa-a-carga {m/z) y sus intensidades relativas . Espectros de masas de muestras desconocidas se clasifican subsecuentemente por semejanza al patrón que se encuentra en espectros de masas utilizados en el equipo o conjunto de entrenamiento. El número de especies clave m/z cuyas intensidades relativas combinadas definen el patrón, representa un sub-conjunto muy pequeño de todo el número de especies presentes en cualquier espectro de masas de suero determinado.
[1002] se ha demostrado la facilidad de utilizar análisis de patrón proteómico MS para el diagnóstico de cáncer de ovarios, de pecho y próstata. Mientras que los investigadores han utilizado una variedad de diferentes algoritmos bioinformáticos para descubrimiento de patrón, la plataforma analítica más común comprende un espectrómetro de masas de tiempo-devuelo de baja resolución (TOF = time-of-flight) , en donde las muestras se ionizan por desorción/ionización de láser mejorada de superficie (SELDI = surface enhanced láser desorption/ionization) , una tecnología de retención cromatográfica basada en colección ordenada de chips de proteínas que permite análisis espectrométrico de masas directo de analitos retenidos en la colección ordenada.
[1003] El cáncer de ovarios es la causa principal de malignidad ginecológica y es la quinta causa más común de muerte relacionada con cáncer en mujeres. La American Cáncer Society (Sociedad Americana de Cáncer) estima que habrá 23,300 nuevos casos de cáncer de ovarios y hubo 13,900 muertes en 2002. Desafortunadamente, casi a 80% de las mujeres con cáncer de ovarios epitelial común no se les diagnostica hasta que la enfermedad está avanzada, es decir se ha dispersado al abdomen superior (etapa III) o más allá (etapa IV) . La tasa de supervivencia de 5 años para estas mujeres es de solo 15 a 20%, mientras que la tasa de supervivencia a 5 años para cáncer de ovarios en la etapa I alcanza a 95% con intervención quirúrgica. El diagnóstico temprano de cáncer de ovarios por lo tanto puede disminuir dramáticamente el número de muertes por este cáncer.
[1004] El biomarcador para diagnóstico más ampliamente empleado para cáncer de ovarios es el Cáncer Antigen 125 (CA 125) como se detecta por el anticuerpo monoclonal , OC 125. Aunque 80% de las pacientes con cáncer de ovarios poseen niveles elevados de CA 125, es elevado en solo 50-60% de las pacientes en la etapa I, que lleva a un valor de pronóstico positivo de 10%. Aún más, CA 125 puede ser elevado en otras condiciones no-ginecológicas y benignas. Una estrategia combinada para determinación de CA 125 con ultrasonografía, aumenta el valor positivo-predictivo a aproximadamente 20%.
[1005] Patrones proteómicos de suero de bajo peso molecular de datos SELDI-TOF MS de baja resolución pueden distinguir enfermedad neoplástica de no-neoplástica dentro del ovario. Ver Petricoin, E. F. III y colaboradores . Use of proteomic patterns in serum to identify ovarían cáncer. The Lancet 359,572-577 (2002). Los patrones proteómicos pueden identificarse por aplicación de una herramienta de bioinformática de inteligencia artificial, que emplea un sistema no supervisado (cartografía de enjambre de auto-organización) como una prueba de aptitud para un sistema supervisado (un algoritmo genético) . Se emplea un conjunto de entrenamiento que comprende espectros de masas SELDI-TOF de suero derivado ya sea de mujeres no afectadas o mujeres con cáncer de ovarios, de manera tal que la combinación que más ajusta de características de m/z (junto con sus intensidades relativas) trazada en espacio n, puede distinguir confiablemente las cohortes empleadas en entrenamiento. El algoritmo "entrenado" se aplica a un conjunto enmascarado de muestras que resultan en una sensibilidad de 100% y especificidad de 95%. Esta técnica se describe con más detalle en WO 02/06829A2 "A Process for Discrimination Between Biological Atates based on Hidden Patterns From Biological Data" ("Hidden Patterns") la descripción de la cual aquí se incorpora expresamente por referencia .
[1006] Aunque esta técnica trabaja bien, la instrumentación espectrométrica de masas de baja-resolución y de esta manera los datos que vienen del instrumento, pueden limitar la capacidad alcanzable de reproducción, sensibilidad y especificidad para análisis de patrón proteómico en uso clínico rutinario. COMPENDIO
[1007] El concepto de análisis de patrón de proteínas de patrones ocultos (Hidden Patterns) se extiende a una plataforma MS de alta-resolución, para generar modelos de diagnóstico que poseen superiores sensibilidades y especificidades, en un formato que genera espectros más estables, tiene una precisión de masa de tiempo-de- uelo real, e inherentemente es más reproducible máquina-a-máquina y día-a-día debido al aumento en precisión de masas. Se emplearon sueros de una prueba de supervisión de cáncer de ovarios bien controlada, grande, y se condujo análisis de patrón proteómico en las mismas muestras en dos plataformas espectrales de masas, que difieren en su resolución efectiva y precisión de masas. Los datos se analizaron para calificar la sensibilidad y especificidad de las series de modelos de diagnósticos que surgieron.
[1008] Se compararon los espectros de un espectrómetro de masas de alta-resolución y de baja-resolución con las mismas muestras de sueros de pacientes, aplicadas y analizadas en la misma colección ordenada de chip de proteína SELDI . Aunque los espectros de masas, de superior resolución puede generar conjuntos más distinguibles de características de diagnóstico, las incrementadas comple idades y dimensionalidades de datos pueden reducir la probabilidad de un descubrimiento de patrón fructífero. Conjuntos de características proteó icas de diagnóstico pueden discernirse dentro de los espectros de alta-resolución de los conjuntos de estudio de pacientes relevantes clínicamente, y los resultados de modelación entre las dos plataformas de instrumentos pueden ser comparados . El número y carácter de modelos de diagnóstico que emergen de operaciones de extracción de datos, pueden calificarse. Análisis de patrón proteómico de suero puede emplearse para generación de múltiples modelos altamente precisos utilizando un MS de tiempo-de-vuelo de cuadrupolo híbrido (Qq-TOF) para un diagnóstico temprano mejorado de cáncer de ovarios . BREVE DESCRIPCIÓN DE LAS FIGURAS
[1009] Las Figuras 1A y IB comparan los espectros de masas de sueros de control preparados en una colección ordenada de chips de proteína WCX2 y analizaron con un espectrómetro de masas de PBS-11 TOF (panel A) o un Qq-TOF (panel B) .
[1010] Las Figuras 2A y 2B muestran histogramas que representan los resultados de pruebas de- sensibilidad (2A) y especificidad (2B) de 108 modelos para datos MS adquiridos ya sea en un espectrómetro de masas Qq-TOF o un PBS-11 TOF.
[1011] Las Figuras 3A y 3B muestran histogramas que representan los resultados de pruebas y validación ciega de sensibilidad (3A) y especificidad (3B) de 108 modelos para datos MS adquiridos ya sea en un espectrómetro de masas Qq-TOF o un PBS-11 TOF.
[1012] Las Figuras 4A y 4B comparan espectros de masas SELDI Qq-TOF de suero de un individuo no afectado (4A) y una paciente con cáncer de ovarios (4B) . DESCRIPCIÓN DETALLADA Análisis de Muestras de Suero
[1013] Un total de 248 muestras de suero se proporcionaron de la Clínica del Programa Nacional para Detección Temprano de Cáncer en Ovarios (NOCEDP = National Ovarían Cáncer Early Detection Program) en Northwestern University Hospital (Chicago, Illinios) . Las muestras se procesaron y fueron empleados sus patrones proteómicos adquiridos por MS como se describe a continuación en la descripción de los métodos. Las muestras de suero en el presente estudio se analizaron en la misma colección ordenada de chips de proteínas tanto por un PBS-11 como un Qq-TOF MS adaptado con una interfase de la colección ordenada de chips de proteína SELDI . Mientras que los espectros adquiridos de ambos instrumentos son cualitativamente similares, la superior resolución que se logra por Qq-TOF MS, es aparente de la Figura 1. Esta resolución incrementada permite que especies cercanas en m/z sin resolver por el PBS-11 TOF MS, se observen distintivamente en el espectro de masas Qq-TOF. Sin duda, simulaciones demuestran la capacidad de Qq-TOF MS (resolución rutinaria aprox. 8000) que resuelve completamente especies que difieren en m/z de solo 0.375 (por ejemplo a m/z 3000) mientras que la resolución completa de especies con PBS-II TOF MS (resolución rutinaria aprox. 150) solo es posible para especies que difieren por m/z de 20 (simulación no mostrada) .
[1014] Los espectros de masas se analizaron utilizando la herramienta de bioinformática ProteomeQuestMR que emplea archivos ASCII que consisten de valores m/z y de intensidad de cualquiera de espectros de masas PBS-11 TOF o Qq-TOF, como alimentación. Los datos espectrales de masas adquiridos utilizando Qq-TOF MS, se vincularon para definir en forma precisa el número de características en cada espectro a 7,084, con cada característica que comprende un valor de amplitud y m/z vinculado . El algoritmo examina los datos para encontrar un conjunto de características a valores m/z vinculados precisos, cuyos valores de intensidad relativa normalizados y combinados en n-espacio segregan mejor los datos derivados del conjunto de entrenamiento. Espectros de masas adquiridos en los instrumentos Qq-TOF y PBS-11 TOF de los mismos conjuntos de muestras, se restringieron al intervalo m/z de 700 a 11,893, para comparación directa entre las dos plataformas. Todo el conjunto de espectros adquiridos de las muestras de suero se dividió en tres conjuntos de datos: a) un conjunto de entrenamiento que se utiliza para descubrir los patrones de diagnóstico ocultos, b) un conjunto de prueba y c) un conjunto de validación. Con este enfoque, solo las intensidades normalizadas del subconjunto clave de valores m/z identificados utilizando el conjunto de entrenamiento, fueron empleados para clasificar los conjuntos de prueba y validación, y el algoritmo previamente no había "visto" los espectros en los conjuntos de prueba y validación.
[1015] El conjunto de entrenamiento comprendió suero de 28 mu eres no afectadas y 56 mujeres con cáncer de ovarios. Los espectros de masas de los conjuntos de entrenamiento y prueba se analizaron por el algoritmo bioinformático para generar una serie de modelos bajo los siguientes parámetros de modelación del conjunto: a) un espacio de similaridad de 85%, 90% o 95% de probabilidad para clasificación de enjambre; b) un tamaño de conjunto característico de 5, 10 o 15 valores aleatorios m/z cuyas intensidades combinadas comprenden cada patrón; y c) una tasa de aprendizaje de 0.1%, 0.2% o 0.3% para la generación de patrón por el algoritmo genético. Cuatros conjuntos de modelos generados aleatoriamente para cada una de las 27 permutaciones, se derivaron e interrogaron con el mismo conjunto de prueba. Resultados de pruebas de sensibilidad y especificidad para cada uno de los 108 modelos (cuatro rondas de entrenamiento para cada una de las 27 permutaciones) fueron generados, como se ilustra en las Figuras 2A y 2B. Estos resultados demuestran que los datos Qq-TOF MS producen mejores resultados que los espectros de menor resolución (P < 0.00001) utilizando la prueba Cochran-Armitage exacta (ver -- Agresti A. Categorical Data Analysis New York: John Wiley and Sons (1990)) para tendencia) a través de un intervalo de condiciones de modelación.
[1016] La capacidad para generar los modelos de mejor desempeño para prueba y validación se evaluó estadísticamente como modelos múltiples se generaron y calificaron utilizando todo el intervalo de los parámetros de modelación anteriores . Modelos para el conjunto de entrenamiento se validaron utilizando un conjunto de prueba que consiste de 31 muestras de suero sin afectar y 63 de cáncer de ovarios. Para validar adicionalmente la capacidad en diagnosticar cáncer de ovarios, un conjunto ciego de espectros de masas de muestra que consisten de adicionales 37 espectros de masas normales y 40 de suero de cáncer de ovario se probaron contra el modelo que se encuentra en entrenamiento previamente discutido. Como se muestra en las ¦ Figuras 3A y 3B, los resultados demuestran la capacidad de los espectros de masas de Qq-TOF MS de superior resolución, para generar modelos superiores estadísticamente significantes (P < 0.00001) sobre los espectros de masas PBS-11 de menor resolución.
[1017] Se encontró que quince modelos fueron 100% sensibles en su capacidad para discriminar en forma correcta mujeres no afectadas de aquellas que sufren de cáncer de ovarios, que fueron 100% específicos para discriminar mujeres en el conjunto de prueba y al menos 97% específicos en el conjunto de validación. Estos modelos se ilustran en el Apéndice A, e identifican como Modelo 1 a Modelo 15. De estos modelos, se encontró que cuatro fueron tanto 100% sensibles como específicos para ambos conjuntos (Modelos 4, 9, 10 y 15) .
[1018] El apéndice A identifica para cada modelo la siguiente información. Primero, la especificidad y sensibilidad para cada modelo se ilustra para el conjunto de prueba y para el conjunto de Validez. El número de muestras para los cuales el modelo agrupó correctamente mujeres con un "Estado Normal" (es decir que no tienen cáncer de ovarios) y con "Estado de Cáncer de Ovarios", se ilustra para cada una de las pruebas y pruebas de validez, comparado con el número total de muestras en los conjuntos correspondientes. Por ejemplo, en el Modelo 1, el modelo identificó correctamente 36 de las 37 mujeres que tienen estado normal en la prueba de Validez .
[1019] Finalmente, para cada modelo se establece una tabla que muestra los "patrones" constituyentes que comprenden el modelo. Cada patrón corresponde a un punto, o nodo, en el espacio N-dimensional definido por los valores N m/z (o "característicos") incluidos en el modelo. De esta manera, cada patrón es un conjunto de características, cada característica tiene una amplitud. El apéndice A, por lo tanto muestra para cada modelo una tabla que contiene los patrones constituyentes, cada patrón está en una hilera identificado por un número de "Nodo" . La tabla también incluye columnas para las características constituyentes de los patrones, con el valor m/z para cada patrón identificado en la parte superior de la columna. Las amplitudes se ilustran para cada característica, para cada patrón y se normalizan a 1.0. Las cuatro columnas restantes en cada tabla se etiquetan "Cuenta", "Estado", "Suma de Estado" y "Error". "Cuenta" es el número de muestras en el conjunto de Entrenamiento que corresponde al nodo identificado. "Estado" indica el estado del nodo, en donde 1 indica enfermedad (en este caso, que tiene cáncer de ovarios) y 0 indica normal (que no tiene la enfermedad) . "Suma de Estado" (StateSum) es la suma de los valores de estado para todos los miembros correctamente clasificados del nodo indicado, mientras que "Error" es el número de miembros incorrectamente clasificados del nodo indicado. De esta manera, para el nodo 5 en el Modelo 1, 13 muestras se asignaron al nodo, mientras que 11 muestras estaban actualmente enfermas . Suma de Estado de esta manera es 11 (en lugar de 13) y el Error es 2.
[1020] El examen de las características clave m/z que comprenden los cuatro mejores modelos de desempeño (Modelos 4, 9, 10 y 15) revelan ciertas características (es decir contenidas dentro de los cajones m/z 7060.121, 8605.678 y 8706.065) que están consistentemente presentes como clasificadores en estos modelos .
[1021] Aunque los patrones proteómicos generados tanto para pacientes sanas como con cáncer utilizando Qq-TOF MS, son bastante similares (como se ve al comparar las Figuras 4A a 4B) , una inspección cuidadosa de los espectros de masas en bruto, revela que los picos dentro de los valores vinculados m/z 7060.121 y 8605.678 son abundantes en forma diferencial en una selección de las muestras de suero que se obtienen de pacientes de cáncer de ovarios, en comparación con individuos no afectados y que las características que el programa ProteomeQuest seleccionó son características "reales" y no son interferencia o ruido. Los insertos en las Figuras 4? y 4B muestran regiones expandidas m/z que resultan diferencias de intensidad significante de los picos en los cajones m/z 7060.121 y 8605.678 (indicados por paréntesis cuadrados) identificados por el algoritmo que pertenecen al patrón discriminatorio óptimo. Estos resultados indican que estos picos MS se originan de especies que pueden ser indicadores consistentes de la presencia de cáncer de ovarios . La capacidad por distinguir sueros de un individuo no afectado o un individuo con cáncer de ovario, con base en una sola característica proteómica de suero m/z, sin embargo no es posible por todo el conjunto de estudio de suero. Mientras que una especie clave m/z sencilla es insuficiente para distinguir en forma global a todas las pacientes no afectadas y con cáncer de ovarios, en conjunto, las intensidades pico combinadas de iones clave no permite que los dos conjuntos de datos se distingan completamente .
[1022] Los cuatro modelos de mejor desempeño que son 100% sensibles y específicos para las pruebas de validación y pruebas ciegas, se eligen para mayor análisis. La Tabla 1 muestra resultados de clasificación de bioinformática de muestras de suero a partir de conjuntos de validación y de prueba enmascarados por clasificación de patrón proteómico utilizando los modelos de mejor desempeño.
Tabla 1 Cada uno de estos modelos fue capaz de diagnosticar exitosamente la presencia de cáncer de ovarios en todas las muestras de suero de mujeres afectadas. Además, no ocurrieron clasificaciones falso positivo o falso negativo con estos modelos de mejor desempeño . Discusión
[1023] Una limitación de biomarcadores de cáncer individuales es la falta de sensibilidad y especificidad cuando se aplican a grandes poblaciones heterogéneas. Análisis de patrón de biomarcador busca superar la limitación de biomarcadores individuales. Análisis de patrón proteómico de suero puede proporcionar nuevas herramientas para diagnóstico temprano, supervisión terapéutica y análisis de resultados. Su utilidad se mejora por la capacidad de un conjunto de características selectas para trascender la heterogeneidad biológica y el "ruido" o "interferencia" de fondo metodológico. Esta meta de diagnóstico es auxiliada al emplear un algoritmo genético acoplado con un análisis de enjambre de auto-organización para descubrir sub-conj untos de diagnóstico de características m/z y sus intensidades relativas contenidas dentro de los datos espectrales de masas Qq-TOF de alta resolución.
[1024] Se considera que existen conjuntos de características proteómicas de suero de diagnóstico, dentro de constelaciones de pequeñas proteínas y péptidos. Un patrón de firma determinado refleja cambios en el estado fisiológico o patológico de un tejido objetivo o diana. Con respecto a marcadores de cáncer, se considera que patrones de diagnóstico de suero son un producto del complejo micro-ambiente tumor-anfitrión. Se considera probable que el conjunto de características de diagnóstico se deriva parcialmente de múltiples proteínas anfitrión modificadas, en vez de que emanan exclusivamente de las células de cáncer. El perfil de biomarcador puede amplificarse por interacciones tumor-anfitrión. Esta ampliación incluye por ejemplo la generación de productos de escisión péptido por proteasas de anfitrión o tumor. Pueden existir múltiples conjuntos de protelnas/péptidos dependientes, o independientes, que reflejan la patología de tejido subyacente. Por lo tanto, el contenido de información de patrón proteómico relacionado a enfermedad en la sangre puede ser más rico que lo previamente anticipado. En vez de un solo conjunto característico "mejor", múltiples conjuntos característicos proteomicos pueden existir que logran una discriminación altamente precisa y por lo tanto poder de diagnóstico. Esta posibilidad es soportada por los datos descritos anteriormente.
[1025] El proteoma de suero de bajo peso molecular es un archivo no explorado, aún cuando este es la región de masas en donde MS está mejor adecuado para análisis. Se cree probable que especies asociadas con enfermedad comprenden especies de péptido/proteína de bajo peso molecular que varían en masa por tan poco por como unos cuantos Daltons . De esta manera, un espectrómetro de masas de superior resolución se esperará que discrimine y descubra patrones que no se resuelven por un instrumento de menor resolución. Los espectros producidos por Qq-TOF MS se compararon con los de Ciphergen PBS-11 TOF MS . La resolución rutinaria que se obtiene es en exceso de 8000 (a m/z = 1500) para Qq-TOF MS y 150 (a m/z = 1500) para el espectrómetro de masas PBS-11 TOF. Una fuente SELDI se utiliza de manera tal que ambos instrumentos analizan la misma muestra en distintas regiones de la superficie sebo de la colección ordenada de chips de proteínas . Mientras que el perfil espectral total es similar, un solo pico en el PBS-11 TOF MS se resuelve en una multitud de picos en Qq-TOF MS (que se ve al comparar las Figuras 1A y IB con las Figuras 4A y 4B) . Aún más, el aumento inherente en precisión de masa por instrumentación de superior resolución que no tiene acoplado el analizador de masas desde la fuente, proporcionará espectros más limpios ya que esto suprime iones meta-estables de confusión, genera espectros con menor desplazamiento de masas sobre el tiempo e instrumenta al mismo tiempo .como generar datos de superior resolución, más complejos.
[1026] En la primera fase de comparación, patrones proteómicos de espectros de masas derivados de los mismos conjuntos de entrenamiento y generados en espectrómetros de masas de alta y baja resolución, se escrutinaron-por-su-total sensibilidad y especificidad sobre una serie de restricciones de modelado, en donde se generaron patrones utilizando tres diferentes grados de similaridad de espacio para los enjambres de auto-organización para formar tres conjuntos diferentes de tamaños de características selectos, y tres tasas de mutación diferentes para un total de 27 permutaciones de modelado. Resultados de pruebas de sensibilidad y especificidad para cada uno de los 108 modelos (mostrados en las Figuras 2A y 2B) , producidos de cuatro rondas de entrenamiento para cada una de las 27 permutaciones, demuestran que el espectro generado por Qq-TOF MS supera en desempeño en forma consistente a los espectros TOF-MS de menor resolución (P <0.00001) independientemente de los criterios de modelación empleados .
[1027] Ya que los espectros para la plataforma de superior resolución generan patrones con un nivel superior de sensibilidad y especificidad, estos espectros pueden generar modelos más precisos con un grado superior de sensibilidad y especificidad-esto es, generar los modelos de mejor diagnóstico. Estos resultados se generaron utilizando criterios aún más estrictos, ya que un conjunto de validación enmascarado adicional se empleó después de prueba para determinar la precisión total . Los espectros de superior resolución producen consistentemente modelos significativamente más precisos como se ve tanto en los estudios de prueba como de validación (como se ilustra en las Figuras 3A y 3B) . Los modelos derivados de Qq-TOF MS fueron consistentemente más sensibles y específicos (P < 0.00001) que aquellos de PBS-11 TOF MS . Cuatro modelos se generaron que alcanzan 100% de sensibilidad y especificidad tanto en prueba como en validación. El número de valores clave m/z empleado como clasificadores en los cuatro modelos de mejor diagnóstico estuvo en el intervalo de 5 a 9. Tres valores de cajón m/z se encontraron en dos de estos cuatro modelos y dos cajones m/z se encontraron en tres de los cuatro mejores modelos. Los picos distintos presentes en los cajones m/z recurrentes 7060.121, 8605.678 y 8706.065 pueden ser buenos candidatos para componentes de bajo peso molecular en suero que pueden ser los indicadores de avance clave de la enfermedad.
[1028] Estos datos soportan la existencia de múltiples conjuntos de característica proteómicas altamente precisas y distintas, que pueden distinguir en forma precisa cáncer de ovarios. Para supervisar enfermedades de frecuencia relativamente baja, tales como cáncer de ovarios, una prueba de diagnóstico de preferencia excede 99% de sensibilidad y especificidad para reducir falsos positivos, mientras que detecta correctamente enfermedad de etapa temprana, cuando está presente. Como se discutió anteriormente, cuatro modelos generados utilizando datos Qq-TOF MS de alta resolución lograron 100% de sensibilidad y especificidad. En estudios de prueba y validación ciegos, cualquiera de estos modelos se empleó para clasificar correctamente 22/22 de cáncer de ovarios en etapa I, 81/81 cáncer de ovarios en etapas I, III y IV y 68/68 controles de enfermedad benigna.
[1029] De esta manera, una prueba clínica puede emplear simultáneamente varias combinaciones de patrones proteómicos de diagnóstico altamente precisos que surgen de manera concomitante de las mismas corrientes de datos, que tomadas en conjunto pueden lograr un grado de precisión incluso superior en un ambiente de supervisión, en donde una prueba de diagnóstico enfrentará una gran heterogeneidad de población y variabilidad potencial en calidad y manejo de muestra. Por tanto, un sistema de alta resolución tal como Qg-TOF MS que emplea este estudio, se prefiere con base en los presentes resultados . Métodos
[1030] Muestras de Suero: Muestras de suero se obtuvieron de la clínica National Ovarían Cáncer Early Detection Program (NOCEDP) en Northwestern University Hospital (Chicago, Illinois) . Doscientos cuarenta y ocho muestras se prepararon utilizando un aparato para manejo de líquidos robótico Biomek 2000 (Beckman Coulter, Inc., Palo Alto, California) . Todos los análisis se realizaron utilizando chips de interacción para intercambio de cationes débiles ProteinChip (WCX2 , Ciphergen Biosystems Inc;, Fremont, California) . Una muestra de control se aplicó aleatoriamente a un punto en cada conjunto ordenado de proteínas como un control de calidad, para preparación de muestras y función de espectrómetro de masa. La muestra de control, SRM1951A que está constituida por sueros de humanos recolectados, se proporciona por National Institute of Standards and Technology (NIST) .
[1031] Preparación de Muestra: Conjuntos ordenados WCX2 ProteinChip se procesaron en paralelo utilizando una estación de trabajo Biomek Laboratory (Beckman-Coulter) modificada para utilizar un bioprocesador de conjuntos ordenados de proteínas ProteinChip (Ciphergen Biosystems Inc.). El bioprocesador contiene 12 ProteinChips , cada una que tiene 8 "puntos" cromatográficos , permitiendo que se procesen en paralelo 96 muestras. Cien µ? de HCl 10 mM se aplican a los conjuntos ordenados de proteína WCX2 y se deja que incuben por 5 minutos. El HCl se succionó, descartó y 100 µ? de agua desionizada destilada (ddH20) se aplica y deja que incube por 1 minuto. El ddH20 se aspira, descarta y reaplica por otro minuto. Cien µ? de NH4HC03 10 mM con Tritón X-100 al 0.1%, se aplican a la superficie y deja que incuben por 5 minutos, después de lo cual la solución se aspira y descarta. Una segunda aplicación de 100 µ? de NH4HC03 10 mM con Triton-X100 0.1% se aplica y deja que incube por 5 minutos, después de lo cual se aspiraron las superficies cebo del conjunto ordenado de ProteinChip . Cinco µ? de suero no diluido en bruto se aplican a cada superficie de cebo ProteinChip CX2 y se deja que incuben por 55 minutos. Cada conjunto ordenado ProteinChip se lava 3 veces con salino amortiguado con fosfato Dulbecco (PBS) y ddH20. Para cada lavado, 150 µ? de cualquiera de PBS o ddH20 se surte secuencialmente, mezclan por aspiración y surten por un total de 10 veces en el bioprocesador después de lo cual la solución se aspira al desecho . Esta solución de lavado se repite por un total de 6 lavados por superficie de cebo del conjunto ordenado de ProteinChip. Las superficies de cebo del conjunto ordenado de ProteinChip se secaron al vacío para evitar contaminación cruzada cuando el empaque del bioprocesador se retiró. Después de retirar el empaque de bioprocesador, 1.0 µ? de una solución saturada de ácido alfa-ciano-5-hidroxicinnámico en acetonitrilo al 50% (v/v) , ácido trifluoroacético 0.5% (v/v) se aplica a cada punto en el conjunto ordenado ProteinChip dos veces, permitiendo que la solución seque entre aplicaciones .
[1032] Análisis PBS-II: Conjunto ordenados ProteinChip se colocaron en el espectrómetro de masas de tiempo-de-vuelo Protein Biological System II (PBS-II, Ciphergen Biosystems Iiic . ) y se registraron espectros de masas utilizando los siguientes ajustes: 195 tiros de láser/espectros recolectados en modo positivo, intensidad de láser 220, sensibilidad de detector 5, voltaje de detector 1850, y un foco de masa de 6,000 Da. El PBS-II se calibró externamente utilizando la norma de masa péptido "All-In-One" (Ciphergen Biosystems, Inc.).
[1033] Análisis Qq-TOF MS: Conjuntos ordenados ProteinChip se analizaron utilizando un espectrómetro de masas de tiempo-de-vuelo cuadrupolo (QSTA pulsar i, Applied Biosystems Inc., Framingham, Massachusetts) adaptado con una interfase de conjunto ordenado ProteinChip (Ciphergen Biosystems Inc., Fremont, California) . Se ionizaron muestras con un láser de nitrógeno pulsado de 337 nm (ThermoLaser Sciences modelo VSL-337-ND-S, altham, Massachusetts) que opera a 30 Hz . Aproximadamente 20 mTorr de gas nitrógeno se utilizan para enfriamiento de iones de colisión. Cada espectro representa 100 exploraciones promediadas de múltiples canales (1.S67 min adquisición/espectro) . El espectrómetro de masas se calibró externamente utilizando una mezcla de péptidos conocidos .
[1034] Análisis de Patrón Proteómico: El análisis de patrón proteómico se realizó al exportar el archivo de datos en bruto generado del espectro de masas Qq-TOF en un formato delimitado por tabuladores, que genera aproximadamente 350,000 puntos de datos por espectro. Los archivos de datos se vincularon en cajones utilizando una función de 400 partes por millón (ppm) tal que todos los archivos de datos poseen idénticos valores m/z [por ejemplo, tamaños de cajones m/z aumentan linealmente de 0.28 a m/z 700 a 4.75 a m/z 12,000). Las intensidades en cada cajón de 400 ppm se sumaron. Este proceso de vinculación condensa el número de puntos de datos a exactamente 7,084 puntos por muestra. Los datos espectrales vinculados se separaron en aproximadamente tres grupos iguales para entrenamiento, prueba y validación ciega. El conjunto de entrenamiento consiste de 28 muestras normales y 56 de cáncer de ovarios. Los modelos se construyeron en un conjunto de entrenamiento utilizando ProteomeQuestMR (Correlogic Systems Inc., Bethesda, Maryland) y validaron utilizando las muestras de prueba, que consisten de 30 muestras normales y 57 muestras de cáncer de ovarios. El modelo se validó utilizando muestras ciegas, que consisten de 37 muestras normales y 40 de cáncer de ovarios. Estos valores m/z que se encontraron como clasificadores empleados para distinguir suero de una paciente con cáncer de ovarios, de aquellos de un individuo sin afectar, se basan en los datos vinculados y no los valores m/z actuales del espectro de masas en bruto.
[1035] La significancia estadística de los resultados generados utilizando Qq-TOF y PBS-11 MS se realiza utilizando la prueba Cochran-Armitage exacta para tendencia en comparar las distribuciones de estos valores de especificidad y sensibilidad entre las dos plataformas instrumentales evaluadas, ya que los modelos se construyen independientemente entre sí . Apéndice A m/z Nodo conté Estado Suma de estado error 8688.674 o 0 7 1 7 0 0.129292 1 3 0 0 0 0.666673 2 6 1 6 0 0.134574 3 16 1 16 0 0.157213 m/z Nodo conté Estado Suma de estado error 8588.674 4 3 0 0.65332 5 13 11 0.320183 6 4 1 0.425972 7 2 2 0.232833 8 2 0 0.683164 9 2 2 0.211945 10 5 0 0.976017 11 3 1 0.341464 12 2 2 0.14915 13 2 0 0.682325 14 1 0 0.859213 15 1 0 0.645833 16 1 0 0.794486 17 2 0 0.97861 18 2 2 0.446107 m/z Modo 8602.237 4644.793 7060.121 1464.593 0 1 0.404121 0.577349 0 1 1 0.236546 0.242727 0 2 1 0.381099 0.319833 0 3 1 0.091906 0.149974 0 m/z Nodo 8602.237 4544.793 7060.121 1464.593 4 0.714489 0.108038 1 0 5 1 0.123428 0.39002 0 6 1 0.178253 0.191287 0 7 1 0.146285 0.79188 0 8 0.613282 0.408828 1 0 9 0.666812 0.115333 1 0 10 0.954457 0.170029 0.628189 0 11 1 0.443244 0.367961 1 12 1 0.690447 0.340318 0 13 1 0.359043 0.559506 o 14 0.724638 0.26087 1 o 15 1 0.502083 0.835417 o 16 0.894737 0.694236 1 o 17 1 0.4223406 0.63491 o 18 1 0.163052 0.753369 o Modelo 2 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 95% Estado normal 30/30 35/37 (100%) (95%) Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) m/z Nodo conté Estad Suma de estado error 8605.67 o o 8 0 7 0.93624 5 0.99191 6 10 10 1 3 0 0.66889 7 13 0.96850 1 0.59520 3 6 2 0.61090 89497 7 1 9 7 0 69096 10 10 10 1 11 1 0 1 12 4 0 59S57 m/z Nodo conté Estad Suma de estado error 8605.67 o o 8 13 1 1 1 0 0.41176 5 14 1 0 0 0 0.81995 1 15 1 0 0 0 0.86590 9 m/z Nodo 5773.642 6256.91 7060.121 8706.065 748.048 0 0.103495 0.112529 0.966826 0.445348 0 1 0.304599 0.273147 0.468784 0.965088 0 2 0.069882 0.103221 0.545584 0.405998 0 3 0.155636 0.241726 0.965208 0.964241 0 0.107261 0.192038 0.625891 0.857142 0 0.103657 0.125338 0.430678 0.26603 0.555267 0.974007 7 0.117567 0.231772 0.813855 0.112112 0.122806 0.745443 0.523196 0.178288 0.258633 0.503651 Nodo 5773.642 6256.91 7060.121 8706.065 10 0.047377 0.061828 0. 284495 0.405995 11 0.133102 0.208333 0. 305556 0.803241 12 0.159346 0. 30219 0. 707978 1 13 0.12549 0.137255 1 0.266667 14 0.311436 0.408759 1 0.961071 15 0.315909 0.404545 0. 711364 1 Modelo 3 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 97% Estado normal 30/30 36/37 (100%) (97%) Estado de cáncer de 57/57 40/40 ovario (100%) (100%) m/z Nodo conté Estad Suma de estado Error 8605.678 o o 0 30 1 29 1 1 1 6 0 1 1 1 m/z Nodo conté Estad Suma de estado Error 8605.678 8688.674 o o 2 5 0 0 0 0.943078 0.9957 3 19 1 14 5 1 0.582078 4 1 0 0 0 0.918569 1 5 1 0 0 0 0.820513 1 6 3 1 3 0 1 0.715204 7 1 1 1 0 1 0.573192 8 3 0 0 0 0.937262 0.9936 9 3 0 0 0 0.722109 1 10 1 0 0 0 0.950943 1 11 2 1 2 0 1 0.41404 12 1 0 0 0 0.980798 1 13 1 0 0 0 0.906907 1 m/z Nodo 6345.106 9843.343 3354.195 7374.687 5968.506 0 0.015495 0.128241 0.006888 0.213168 0.032564 1 0.049105 0.266494 0.031062 0.354791 0.060409 2 0.023126 0.32079 0.05742 0.600263 0.033526 3 0.049422 0.20029 0.026914 0.389413 0.026103 4 0.042514 0.260628 0.170055 0.914972 0 5 0.125356 0 0.333333 0.948718 0.321937 6 0.006153 0.19096 0.060695 0.722323 0.025888 m/z Nodo 6345.106 9843.343 3354.195 7374.687 5968.506 7 0 0.151675 0.130511 0.982363 0.044092 8 0.115137 0.159158 0 0.830834 0.113328 9 0.017883 0.045724 0.057432 0.617682 0.059098 10 0.320755 0.230189 0 0.664151 0.301887 11 0.079637 0.146901 0.038536 0.645357 0 12 0.075332 0.51551 0 0.401773 0.025111 13 0.081081 0.012012 0.189189 0.429429 0 m/z Modo conté Estad Suma de estado Error 7060.121 7096.922 o o 0 8 1 8 0 0.917113 0.21551 1 3 0 0 0 0.492091 0.305348 m/z Nodo conté Estad Suma de estado Error 7060.121 7096.922 o o 2 10 1 10 0 0.547669 0.173669 3 3 0 0 0 0.929844 0.33378 4 8 1 8 0 0.732832 0.276292 5 10 1 7 3 0.648423 0.304081 6 3 0 0 0 0.346591 0.221128 7 4 1 4 0 1 0.262028 8 2 0 0 0 0.794377 0.531631 9 1 1 1 0 1 0.270156 10 6 0 0 0 0.437313 0.281307 11 10 1 10 0 0.282366 0.113517 12 3 0 0 0 0.652298 0.545487 13 3 0 0 0 0.663094 0.35973 14 2 0 1 1 1 0.636476 15 1 1 1 0 1 0.237154 m/z Nodo 8605.67 6548.77 8706.065 818.4801 8540.536 6352.723 8 1 0 0.96139 0.12120 0.444445 0 0.518113 0.110812 8 8 1 0.96639 0.20515 0.994171 0 0.951383 0.236869 /z Nodo 8605.67 6548.77 8706.065 818.4801 8540.536 6352.723 8 1 2 1 0.10423 0.409816 0 0.51695 0.092858 1 3 0.67422 0.16669 0.963615 0 0.90104 0.157423 8 5 4 1 0.13582 0.570368 0 0.683495 0.107333 5 5 0.98320 0.14831 0.82462 0 0.916506 0.12435 9 6 6 1 0.17395 0.806024 0 0.827509 0.179187 1 7 0.56594 0.12425 0.40729 0 0.422331 0.10647 8 0.51598 0.29095 0.814304 0 1 0.29799 3 7 9 0.93210 0.14568 0.831683 0 0.946252 0.132956 8 6 10 0.61551 0.17082 0.890092 0 0.966262 0.143115 8 6 11 1 0.06052 0.405555 0 0.507878 0.047164 12 0.75815 0.39144 0.993289 0 0.878634 0.361204 4 7 13 0.50183 0.21418 0.872976 1 0.191813 /z Nodo 8605.67 6548.77 8706.065 818.4801 8540.536 6352.723 8 1 4 1 14 0.84579 0.37227 0.937743 0 0.965217 0.311208 5 7 15 0.73517 0.10540 0.753623 · 0 0.75S258 0.102767 8 2 m/z Nodo conté Estad Suma de Error 11601.83 8716.517 3419.205 o o estado 0 30 1 30 0 0.045973 0.188625 0.031336 1 2 0 0 0 0.190458 0.752349 0.206444 2 2 0 0 0 0.195637 0.728544 0.15697 /z Nodo conté Estad Suma de Error 11601.83 8716.517 3419.205 o o estado 3 17 1 11 0 0.076996 0.33797 0.088986 4 2 0 0 0 0.115091 0.512947 0.110247 5 5 1 5 0 0.090591 0.267811 0.087215 6 1 0 0 0 0.202229 0.542994 0.402866 7 2 1 2 0 0.106417 0.226812 0.165819 8 2 0 0 0 0.143113 1 0.214746 9 1 0 0 0 0.178571 0.921053 0.274436 10 2 0 0 0 0.127322 0.855385 0.298389 11 3 0 0 0 0.230129 0.726008 0.290667 12 2 0 0 0 0.18007 0.762553 0.209338 13 1 0 0 0 0.127701 0.565815 0.125737 14 1 0 0 0 0.138095 0.784127 0.163492 15 1 0 0 0 0.291045 0.808458 0.271134 16 1 0 0 0 0.158163 0.785714 0.318878 17 2 1 2 0 0.154471 0.472129 0.131158 m/z Nodo 4260.403 1229.752 2007.145 8602.237 7060.121 846.104 1 0 0.084657 0.008804 0.010191 1 0.232181 0.01422 9 1 0.438551 0 0.0639 1 0.321633 0.37653 m/z Nodo 4260.403 1229.752 2007.145 8602.237 7060.121 846.104 1 9 2 0.355362 0 0.029894 0.730036 1 0.05202 4 3 0.20709 0.029195 0.022459 1 0.437262 0.04329 2 4 0.353616 0.002096 0.043823 1 0.23049S 0.20994 6 5 0.154745 0.015436 0.049325 1 0.740332 0.01422 6 6 0.52707 0.197452 0 0.621019 1 0.25955 4 7 0.205581 0.014039 0.018811 0.69364 1 0.03502 6 8 0.826275 0.086988 0 0.92163 0.582268 0.48305 4 9 0.744361 0 0.067669 1 0.772556 0.24812 10 0.341074 0.000943 0.066154 0.973585 0.601901 0.55581 3 11 0.633693 0.045805 0.024148 0.754434 1 0.10436 5 12 0.57439 0 0.086841 1 0.675463 0.40007 m/z Nodo 4260.403 1229.752 2007.145 8602.237 7060.121 846.104 1 13 0.675835 0.037328 0 1 0.844794 0.14931 2 14 0.477778 0 0.014286 1 0.760317 0.06349 2 15 0.41791 0 0.014925 0.895522 1 0.36318 4 16 0.558673 0 0.035714 1 0.612245 0.87755 1 17 0.216488 0.027597 0 1 0.784209 0.16777 1 Modelo 6 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 97% Estado normal 30/30 36/37 (100%) (97%) Estado de cáncer de 57/57 40/40 ovario (100%) (100%) m/z Nodo conté Estad Suma de Erro 8688.674 8602.237 estado r 0 12 1 12 0 0.212098 1 1 2 o 0 0 0.7195 1 2 19 1 19 0 0.181351 1 3 o O 0 0.721687 0.728508 4 1 5 2 0.326961 1 5 1 6 2 0.430797 1 6 4 o 0 0 0.479363 1 7 3 1 3 o O .265618 1 8 1 1 1 o 0.264706 0.703013 9 1 1 1 o 0.218579 1 10 6 o 0 o 0.979239 0.960156 11 2 o 0 o 0.687882 1 12 1 1 1 o 0.195426 0.60499 13 1 o o o 0.686347 1 14 1 o o o 0.786458 0.890625 15 1 o o o 0.987805 1 16 1 1 1 o 0.486765 1 17 1 1 1 o 0.478368 1 Nodo 7060.121 4920.131 10431.02 2817.487 0 0.44328 0.05893 0.243359 0 Nodo 7060.121 4920.131 10431.02 2817.487 1 0.320393 0.194065 0.325502 0 2 0.188047 0.02468 0.074401 0 3 1 0.146456 0.244383 0 4 0.392833 0.054395 0.118492 0 5 0.446652 0.061423 0.253657 0 6 0.241389 0.13775 0.184372 0 7 0.781812 0.070789 0.199972 0 8 1 0.066715 0.351506 0 9 0.672131 0.213115 0.464481 0 10 0.668669 0.134247 0.169243 0 11 0.567495 0.248281 0.240037 0 12 1 0.04262 0.096674 0 13 0.854244 0.156827 0.560886 0 14 1 0.330729 0.5625 0 15 0.536585 0.140244 0 0 16 0.741176 0.066177 0.448529 0 17 0.886279 0.088999 0.25958 0 Modelo 8 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 95% Estado normal 30/30 35/37 (100%) (95%) Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) /z Nod conté Estad Suma Error 708.165 3605.67 6606.64 7060.121 o o o de 7 8 3 estad 0 9 0 0.97875 0.12933 0.890026 9 5 1 5 0 0.99406 0.16851 0.384269 4 4 2 15 15 0 0 1 0.09269 0.597216 4 3 4 0 0 0 0 0.66034 0.19312 0.967633 4 12 0.00089 0.96622 0.16072 0.635568 ' ' 6 8 8 5 4 0 0.54876 0.09407 1 5 2 6 1 0 0 0 0 0.58993 0.28353 0.972561 9 7 7 1 0 0.80769 0.46154 m/z Nod conté Estad Suma Error 708.165 8605.67 6606.64 7060.121 o o o de 7 8 3 estad o 2 8 3 1 3 0 0 0.89266 0.16009 1 6 5 9 5 0 0 0 0 0.67702 0.16947 0.449973 10 10 1 10 0 0.00114 1 0.06250 0.272652 5 2 11 2 0 0 0 0 0.70167 0.32565 0.593859 1 2 12 4 0 0 0 0 0.58597 0.20168 0.598887 6 4 13 1 0 0 0 0 0.81025 0.30512 1 5 8 14 1 0 0 0 0 0.8742 0.34754 0.729211 m/z Nodo 6761.677 2472.108 8706.065 5511.917 1195.325 5009.477 0 0.141874 0.08436 0.465115 0.117064 0.112831 0.095015 1 0.247993 0.078075 0.898872 0.147354 0.126049 0.163713 2 0.154853 0.061148 0.463791 0.081717 0.104318 0.086327 m/z Nodo 6761.677 2472.108 8706.065 5511.917 1195.325 5009.477 3 0.301109 0.102143 0.97033 0.184698 0.154734 0.169276 4 0.230458 0.048255 0.860368 0.09372 0.147295 0.097005 5 0.130738 0.048314 0.384022 0.087314 0.084237 0.066898 6 0.705793 0.10061 1 0.181402 0.385671 0.205793 7 0.084615 0.151538 0423077 0.0384S2 0.315385 0.207692 8 0.274763 0.063765 0.814652 0.091036 0.151456 0.110595 9 0.283484 0.093472 1 0.116756 0.184678 0.151863 10 0.076581 0.027031 0.397883 0.035259 0.049178 0.049993 11 0.401201 0.083416 1 0.270312 0.134062 0.270049 12 0.327029 0.059685 1 0.153016 0.12643 0.136824 13 0.412821 0.002564 0.958974 0.269231 0.010256 0.315385 14 0.663113 0.132196 1 0.289979 0.249467 0.253731 Modelo 9 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 100% Estado normal 30/30 37/37 (100%) (100%) Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) m/z Nodo conté Estad Suma de Error 7046.018 8602.237 8664.385 o o estado 0 29 1 29 0 0.117795 1 0.189136 1 0 0 0 0.44898 1 0.724911 2 3 0 0 0 0.618286 0.993434 0.914925 3 12 1 9 3 0.191145 1 0.325061 4 7 0 1 1 0.214739 1 0.50704 5 9 1 9 0 0.3496 1 0.389951 6 4 0 0 0 0.745345 1 0.898562 7 1 0 0 0 1 0.740741 0.618519 8 1 1 1 0 0.646484 1 0.373047 9 1 0 0 0 0.46337 0.946886 1 10 2 0 0 0 0.515608 1 0.903216 11 1 0 0 0 0.739766 1 0.862573 12 1 1 1 0 0.513566 1 0.25969 13 1 0 0 0 0.346457 1 0.602362 14 1 0 0 0 0.933148 1 0.793872 m/z Nodo 1144.796 4260.403 0 0.00018 0.098646 1 0 0.518046 2 0 0.472577 3 0 0.159693 m/z Nodo 114 .796 4260. 03 4 0 0.340581 5 0 0.221401 6 0 0.634987 7 0 0.522222 8 0. 0.303711 9 0 0.897436 10 0 0.728896 11 0 0.944444 12 0 0.108527 13 0 0.675197 14 0 0.465181 /z od conté Estad Suma de Error 7202.716 6004.417 7060.121 O o o estado 0 4 1 4 0.173188 0.074963 0.970492 1 2 0 o 0.319725 0.176894 0.393018 2 10 1 10 0.199442 0.082052 0.660658 3 2 o 1 0.361857 0.113665 1 4 2 1 2 0.211306 0.072628 0.578867 5 1 1 1 0.284091 0.113636 0.940341 S 3 1 3 0.263962 0.121837 0.831316 7 7 1 5 0.235242 0.08713 0.676821 8 2 1 2 0.227143 0.128687 1 9 2 o 0 0.280298 0.087375 0.746658 0 1 o 0 0.564168 0.180432 0.791614 1 1 1 1 0.383361 0.168026 0.71615 2 2 1 2 0.254143 0.094635 1 3 2 1 2 0.464786 0.101004 0.647496 4 1 1 1 0.303093 0.053608 0.465979 5 1 1 1 0.237762 0.167832 1 6 2 o o 0.335049 0.15409 0.489544 7 2 1 2 0.359959 0.068265 1 8 2 o 0 0.243242 0.067837 0.335432 9 8 1 8 0.123575 0.048128 0.311115 0 2 o 0 0.211598 0.059313 0.548008 1 4 o 0 0.329776 0.110944 0.509651 2 1 o 0 0.253837 0.126328 0.291617 m/z Nod conté Estad Suma de Error 7202.716 6004.417 7060.121 o o o estado 23 1 0 0 0.601351 0.344595 0.763514 24 1 0 0 0.329101 0.116402 0.569312 25 2 0 0 0.453461 0.170665 0.800839 26 3 3 0 0.119065 0.10091 0.491402 27 1 0 0 0.178475 0.119283 0.300448 28 1 0 0 0.554656 0.297571 0.870445 29 1 1 0 0.083564 0.030732 0.097721 30 1 0 0 0.457023 0.180294 0.57652 31 1 0 0 0.679325 0.276371 0.736287 32 1 1 0 0.169982 0.060579 0.289331 m/z Nodo 1001.654 1255.593 9367.113 4377.854 8605.678 8709.548 0 0.003208 0..042568 0.029361 0.14722 0.958894 0.37964 1 0 0.164671 0.825989 0.379272 0.917131 0.967378 2 0 0.055131 0.403149 0.151314 1 0.459917 3 0 0.121266 0.562191 0.202878 0.70216 0.929028 4 0 0.050346 0.662743 0.155164 1 0.502169 5 0 0.150568 0.605114 0.207386 1 0.471591 6 0 0.080509 0.411379 0.183044 1 0.601066 7 0 0.082517 0.506915 0.140705 1 0.866277 m/z Nodo 1001.654 1255.593 9367.113 4377.854 8605.678 8709.548 8 0 0.061198 0.421919 0.159605 0.619174 0.385692 9 0 0.066565 0.418376 0.128141 0.52401 1 10 0 0.15756 0.302414 0.123253 0.472681 1 11 0 0.174551 0.597064 0.17292 0.982055 1 12 0 0.04466 0.198106 0.105066 0.463184 0.430675 13 0 0.086878 0.386489 0.190463 1 0.822623 14 0 0.083505 0.313402 0.130928 1 0.904124 15 0 0.125874 0.454545 0.202797 0.825175 0.573427 16 0 0.070396 0.522135 0.262555 0.933444 0.971329 17 0 0.105538 0.508054 0.173701 0.930654 0.874639 18 0 0.106513 0.341438 0.109465 0.518447 1 19 0 0.045892 0.286053 0.113572 1 0.382414 20 0 0.113593 0.450127 0.132826 0.7S0771 21 0 0.132027 0.484959 0.19387 0.567533 22 0 0.11098 0.5183 0.20307 1 0.9185 23 0 0.096847 0.86036 0.481982 0.878378 24 0 0.076191 0.274074 0.111111 0.3S4709 25 0 0.119823 0.618036 0.254696 0.552077 26 0 0.082836 0.204372 0.145723 1 0.2959 27 0 0.101345 0.917489 0.220628 0.673543 28 0 0.109312 0.534413 0.317814 0.720648 29 0 0.02797 0.11982 0.058356 1 0.3080 30 0 0.125786 0.574423 0.400419 0.698113 m/z Nodo 1001.654 1255.593 3367.113 4377.854 8605.678 8709.548 31 0 0.187764 0.601266 0.398734 0.879747 32 0 0.063291 0.352622 0.136528 1 0.6084 m/z Nod conté Estad Suma Error 4391.88 8619.45 1151.68 890.8998 o o o de 2 5 4 estad o 0 5 1 5 0 0.14643 1 0.24950 0 9 1 1 1 0 0 0 0.40909 0.94697 1 0 1 2 2 1 2 0 0.12366 0.75439 0.35117 0 m/z nté Estad Suma Error 4391.88 8619.45 1151.68 890.8998 o de 8 6 1 0.03943 0.45469 0.09605 8 7 3 0 0 0 0.62375 0.96648 0.68626 2 3 8 6 0.19240 1 0.49708 1 2 1 0.19471 1 0.94389 9 4 2 0.21283 1 0.32950 9 2 4 1 0.22784 1 0.41049 3 .18133 0.94574 0.50625 1 0 0 0 0.38028 1 0.42765 0.134443 2 7 1 0.32489 1 0.24472 0 5 6 2 0 0 0 0.3223 0.83188 0.98185 0 m/z od conté Estad Suma Error 4391.88 8619.45 1151.68 890.8998 o o de 13 i i 0.19628 78512 1 4 14 4 0.24248 68666 3 15 1 0.35357 80535 1 7 16 2 0.23975 0.99126 0.37415 8 9 6 17 2 0.15754 0.81331 0.33888 IB 1 0.18454 0.67811 9 2 19 1 0 0 0 0.28767 1 0.21917 1 8 20 1 0.15068 1 0.67671 5 2 21 2 0 0 0 0.32504 0.9441 0.86959 4 22 7 0.16320 1 0.30646 m/z nté Estad Suma Error 4391.88 8619.45 1151.68 890.8998 o de 3 0 0 0 0.18500 1 0.57371 0 7 2 1 0 0 0 0.59429 1 0.56359 0 6 2 1 2 0 0.18423 1 0.55516 0.033929 6 2 0 0 0 0.29325 0.81259 0.70292 1 0 0 0.2737 22782 9 1 1 0 0.24258 54798 2 8 1 0 0 0 0.35779 1 0.44342 8 5 1 0 0 0 0.40255 0.89799 0.46448 6 1 2 0 0 0 0.33671 0.97511 0.49395 5 1 6 1 0 0 0 0.52531 0.92088 0.30063 m/z od conté Estad Suma Error 4391.88 8619.45 1151.68 890.899E o o o de 2 5 4 est d o 6 6 3 3 3 1 3 0 0.08709 1 0.18318 ( 7 2 4 1 1 1 0 0.07678 1 0.14442 C 3 4 5 1 0 0 0 0.42891 0.86492 0.64691 C 9 9 6 1 1 1 0 0.17492 1 0.51702 C 3 8 7 1 1 1 0 0.13404 1 0.61276 C 3 6 8 1 0 0 0 0.30357 0748016 0.26447 C 1 6 m/z Nodo 8688.674 4620.708 4260.403 6848.765 1439.047 10485.39 0 0.340138 0.141393 0.173282 0.219086 0.066197 0.221251 1 0.911616 0.578283 0.626263 0.348485 0.199495 0.388889 2 0.304239 0.211129 0.211595 1 0.061103 0.151736 3 0.162752 0.097735 0.097315 1 0.020554 0.064597 m/ z Nodo 8688.674 4620.708 4260.403 6848.765 1439.047 10485.39 4 0.990886 0.326104 0.594814 0.382 0.148411 0.404762 5 0.64152 0.256213 0.315258 0.32085 0.122937 0.391669 6 0.574257 0.339934 0.277228 0.749175 0.052805 0.366337 7 0.556667 0.202068 0.235864 0.628961 0.031436 0.127915 8 0.725683 0.218632 0.324713 0.331147 0.089938 0.219111 9 0.438843 0.294054 0.316824 0.966505 0.028208 0.297222 10 0.496799 0.276569 0.385403 0.18822 0 0.213828 11 0.447257 0.35865 0.329114 0.227848 0.046414 0.421941 12 0.99322 0.441819 0.734281 0.576025 0.165179 0.278007 13 0.444215 0.289256 0.340909 0.21281 0.115702 0.386364 14 0.687229 0.222129 0.419095 0.487583 0.148942 0.378599 15 0.830357 0.348214 0.648214 0.594643 0.201786 0.532143 16 0.739857 0.272116 0.351161 0.985558 0.135604 0.224056 17 0.561209 0.189797 0.31758 0.987784 0.059326 0.135926 18 0.274678 0.206009 0.27897 0.077253 0.128755 0.283262 19 0.880626 0.223092 0.315068 0.260274 0.058708 0.164384 20 0.471233 0.30411 0.35068 0.745205 0.210959 0.252055 21 1 0.337625 0.940181 0.381157 0.190878 0.337762 22 0.551426 0.178093 0.223762 0.212152 0.090616 0.194181 23 0.801758 0.254962 0.719139 0.316285 0.190385 0.333372 24 0.855263 0.532895 0.434211 0.475877 0.236842 0.344298 25 0.433112 0.279979 0.2783 0.612685 0.009195 0.271917 26 1 0.325657 0.802751 0.403117 0.171496 0.325454 m/z Nodo 8688.674 4620.708 4260.403 6848.765 1439.047 10485.39 27 0.640673 0.30581 0.440367 0.366972 0.114679 0.246177 28 0.668731 0.390093 0.340557 0.804954 0.065016 0.312694 29 1 0.357798 0.82263 0.477064 0.140673 0.33945 30 1 0.48816 0.741348 0.990893 0.127505 0.338798 31 0.956469 0.375087 0.519177 0.279772 0.161407 0.392333 32 0.993671 0.389241 0.512658 1 0.018987 0.518987 33 0.445501 0.125676 0.182921 0.453176 0.055861 0.100297 34 0.26691 0.096892 0.122486 0.025594 0.074954 0.067642 35 1 0.400474 0.599526 0.575829 0.151659 0.272512 36 0.377709 0.227554 0.309598 0.28483 0.085139 0.329721 37 0.859574 0.282979 0.353191 0.653192 0.131915 0.391489 38 1 0.329365 0.414683 0.337302 0.188492 0.198413 Modelo 12 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 95% Estado normal 30/30 35/37 (100%) (95%) Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) m/z Nodo conté Estad Suma de Error 8685.2 8709.548 o o estado 0 6 1 6 0 0.227355 0.285099 1 2 0 - 1 1 0.579419 0.996678 2 5 1 5 0 0.286212 0.46104 3 2 1 0 0 0.639955 1 4 2 1 2 0 0.444594 0.494724 5 7 1 7 0 0.328116 0.404957 6 3 0 3 0 0.420975 0.599319 7 6 1 4 2 0.51664 0.902203 8 3 0 0 0 0.653035 0.84379 9 1 1 1 0 0.545 0.645 10 4 0 0 0 0.430854 1 11 1 0 0 0 0.155009 1 12 11 1 11 0 0.281647 0.357539 13 1 1 1 0 0.650505 1 14 1 1 1 0 0.313343 0.812594 15 2 1 2 0 0.640593 0.804083 16 1 0 0 0 0.771379 1 17 2 1 2 0 0.395313 0.746361 18 2 0 0 0 0.358251 1 19 2 0 0 0 0.357038 1 20 1 0 0 0 0.966006 1 21 1 0 0 0 0.334625 1 m/z Nodo conté Estad Suma de Error 8685.2 8709.548 o o estado 22 1 1 1 1 0.376205 0.533762 23 2 0 0 0 0.356085 1 24 2 0 0 0 0.579131 1 25 1 0 0 0 0.471058 1 26 1 0 0 0 0.66581 1 27 1 1 1 0 0.619256 0.833698 28 1 0 0 0 0.782258 1 29 1 1 1 0 0.516 1 30 1 1 1 0 0.403558 0.594569 m/z Nodo 7065.711 1132.049 8605.678 0 0.294878 0 1 1 0.249831 0 0.904368 2 0.3373.54 0 1 3 0.545907 0 0.694336 4 0.255931 0 1 5 0.471929 0 1 6 0.470769 0 1 7 0.355835 0 1 8 0.223522 0 1 9 0.9675 0 1 m/z Nodo 7065.711 1132.049 8605.678 10 0.405585 0.471429 11 0.449905 0.215501 12 0.14853 1 13 0.35596 0.977778 14 1 0.830585 15 0.442778 1 15 0.319372 0.91274 17 0.349265 1 18 0.141059 0.455528 9 0.251898 0.762878 20 0.68272 0.847026 21 0.31137 0.260982 22 1 0.951769 23 0.272623 0.537859 24 0.240333 0.640437 25 0.560679 0.51497 25 0.398458 0.62982 27 0.569584 1 28 0.629032 0.846774 29 0.518 0.898 30 0.152622 1 Modelo 13 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 95% Estado normal 30/30 35/37 (100%) (95%) Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) m/z Nodo conté Estad Suma de Erro 11098.07 6501.799 2087.371 estado 0 1 8 0.053842 0.050306 0 1 1 o 0 0.194366 0.016901 0 2 1 o 0 0.230024 0.179177 0 3 8 1 6 0.047783 0.03069 0.000757 4 10 1 9 0.074636 0.064462 0 5 8 1 7 0.094925 0.130769 6 1 1 1 0.059567 0.032491 7 1 o 0 0.236797 0.139693 8 1 1 1 0.205333 0.056 9 1 o 0 0.108929 0.123214 10 1 o 0 0.068063 0.408377 11 12 1 12 0.0376 0.018129 0.005735 12 1 1 1 0.066486 0.115332 0 m/z Nodo conté Estad Suma de Erro 11098.07 6501.799 2087.371 o o estado r 13 1 1 1 0 0 0.082474 0.195875 14 1 0 o 0 0.12326 0.280318 0 15 2 0 o 0 0.043452 0.088573 0 16 1 0 o 0 0.124457 0.059334 0 17 1 0 o 0 0.192394 0.127517 0 18 1 0 o 0 0.091245 0.165228 0 19 1 0 o 0 0 0.313726 0.124183 20 1 1 1 0 0.153302 0.179245 0 21 1 0 o 0 0.128713 0.165842 0 22 2 0 o 0 0.194312 0.20655 0 23 1 1 1 0 0.2125 0.2 0 24 1 0 o 0 0.270089 0.084821 0 25 1 0 o 0 0.134441 0.128399 0 26 1 0 o 0 0.397436 0.33744 0 27 1 0 o 0 0 0.257908 0 28 1 0 o 0 0.29085 0.362745 0 29 1 0 o 0 0 0.147287 0.036176 30 1 0 o 0 0.047222 0.175 0 31 1 1 1 0 0.16996 0.278656 0 32 1 0 o 0 0.061404 0.285088 0 33 1 1 1 0 0.090909 0.130165 0 m/z Nodo 8605.678 8688.674 7048.836 4262.107 0 1 0.277113 0.258017 0.126978 1 1 0.780282 0.24507 0.416901 2 1 0.990315 0.736077 0.493947 3 1 0.473931 0.24506 0.11983 4 1 0.43221 0.343755 0.20137 5 1 0.671994 0.378017 0.273367 6 1 0.644404 0.355596 0.034296 7 1 0.630324 0.199319 0.459966 8 1 0.514667 0.794667 0.122667 9 0.921429 1 0.883929 0.457143 10 0.832461 0.997382 1 0.505236 11 1 0.292722 0.108974 0.075537 12 0.82768 0.499322 1 0.238806 13 1 0.402062 0.237113 0.154639 14 1 0.852883 0.274354 0.310139 15 1 0.935869 0.380821 0.614702 16 1 0.609262 0.357453 0.444284 17 0.876957 1 0.438479 0.628635 18 1 0.641184 0.181258 0.282367 19 0.95098 1 0.650327 0.441176 20 1 0.415094 0.566038 0.235849 21 0.759901 1 0.675743 0.537129 22 0.94264 1 0.528225 0.430212 m/z Nodo ¡605.678 8688.674 7048.836 4262.107 23 0.905 0.47 1 0.19 24 0.841518 1 0.870536 0.546875 25 0.980363 1 0.311178 0.303625 26 0.858974 1 0.903846 0.490385 27 0.924574 1 0.491484 0.593674 28 1 0.973856 0.990196 0.470588 29 0.976744 1 0.50646 0.423773 30 0.75 1 0.497222 0.480556 31 1 0.733202 0.743083 0.320158 32 0.813596 1 0.598684 0.33114 33 1 0.733471 0.607438 0.208678 Modelo 14 Prueba Validez Sensibilidad 100% 100% Especif cidad 100% 97% Estado normal 30/30 36/37 (100%) (97%) Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) m/z nté Estad Suma de Erro 4162.719 8588.487 8709.548 o o estado r 3 1 3 0 0.095692 0.344856 0.319228 1 0 0 0 0.486175 0.68894 1 5 1 5 0 0.117272 0.439503 0.401233 6 1 6 0 0.085015 0.429557 0.325561 1 0 0 0 0.153971 0.58671 0.95624 1 1 1 0 0.109524 0.5S1667 0.504762 3 1 3 0 0.127988 0.493341 0.417544 2 1 2 0 0.207404 0.724887 0.602076 7 1 5 2 0.178699 0.715138 0.912647 1 0 0 0 0.697262 0.824477 0.827697 1 1 1 0 0.108787 0.426778 0.361227 2 1 2 0 0.106972 0.628005 0.453237 3 0 0 0 0.152024 0.439361 1 1 1 1 0 0.109208 0.304069 0.432548 2 1 1 1 0.253559 0.657705 0.891482 1 1 1 0 0.242188 0.335938 0.523438 1 0 0 0 0.225275 0.807692 1 1 1 1 0 0.182909 0.587706 0.890555 1 1 1 0 0.14269 0.621053 0.768421 2 0 0 0 0.172991 0.469996 1 5 1 5 0 0.062151 0.474033 0.407928 m/z od conté Estad Suma de Erro 4162.719 8588.487 '8709.548 o o o estado r 1 2 0 0 0 0.16018 0.506442 1 2 3 1 3 0 0.153558 0.656383 0.450659 3 1 1 1 0 0.2021 0.645669 0.703412 4 4 0 0 0 0.2007 0.575951 1 5 1 0 0 0 0.209799 0.757538 0.913317 6 2 0 0 0 0.387106 0.8472 1 7 1 1 1 0 0.164818 0.438986 0.29794 8 1 0 0 0 0.132353 0438914 1 9 1 1 1 0 0.123829 0.300728 0.240375 0 2 0 0 0 0.222129 0.625426 1 1 1 0 0 0 0.101695 0.52343 1 2 1 0 0 0 0.232258 0.673118 1 3 2 1 2 0 0.132722 0.535865 0.63435 4 1 1 1 0 0.035639 0.539873 0.292872 5 1 0 0 0 0.306122 0.716837 1 6 1 1 1 0 0.210428 0.724395 0.787709 7 1 1 1 0 0.154391 0.627479 0.787535 8 1 1 1 0 0.070746 0.626195 0.586042 m/z Nodo 8664.385 1319.956 8605.678 2280.256 7060.121 0 0.242556 0.007524 0.969059 0.009948 0.959932 m/z 8664.385 1319.956 8605.678 2280.256 7060.121 O .626728 O O .880184 O .004608 O .31106 0.284Q7 O 1 0.039692 0.653983 O .664506 0.00115 1 0.014817 0.410254 O .657143 O 0.662885 O .006483 1 O .3649 O 1 0.105952 0.55 O .532475 0.002772 0.984158 O .050381 0.925263 O .551972 O 1 O .037880 0.814917 0.68599 O .005477 0.998362 0.018468 0.650556 O .403068 O 1 0.119163 0.310789 O .363568 O 0.559275 0.026499 1 O .428457 0.005034 1 0.030471 0.406813 O .246253 0.005728 0.479396 O .0065 0.730046 O .592764 O 0.441114 O .068523 1 0.328125 0.013306 1 O .006591 O .449839 0.723443 O O .804688 0.226562 1 0.605697 0.021978 O .908425 O 0.448718 0.492398 O .043478 0.928036 O 1 O .492398 0.014035 1 O O .817544 0.484749 O .004406 0.484017 O O .287822 O .324867 O 1 O .013184 0.257572 O .439991 0.008219 0.7738 O 0.511529 O . 32756 0.004074 1 0.033124 O .717648 0.671916 0.026247 1 O O .55643 m/z Nodo 8664.385 1319.956 8605.678 2280.256 7060.121 24 0.530549 0 0.522931 0.024103 0.485578 25 0.604271 0 1 0.035176 0.246231 26 0.935186 0 0.850562 0.070583 0.702616 27 0.282092 0 0.729002 0.041204 1 28 0.335973 0 0.352941 0.001131 0.539593 29 0.207076 0.009365 0.37565 0 1 30 0.575785 0 0.504059 0.049331 0.779349 31 0.57328 0 0.637089 0.041874 0.222333 32 0.612903 0 0.703226 0.124731 0.862366 33 0.388105 0.008025 1 0.01513 0.569126 34 0.246295 0 1 0.000706 0.077982 35 0.665816 0 0.632653 0.030612 0.484694 36 0.581006 0 0.929236 0.130354 1 37 0.405099 0.031162 0.715297 0 1 38 0.378585 0 1 0.015296 0.248566 Modelo 15 Prueba Validez Sensibilidad 100% 100% Especificidad 100% 100% Estado normal 30/30 37/37 (100%) (100%) Modelo 15 Prueba Validez Estado de cáncer de 57/57 40/40 ovarios (100%) (100%) m/z Nod conté Estad Suma de Error 9870.938 2374.244 1276.861 o o o estado 0 33 1 33 0 0.120039 0.024623 0.01125 1 23 1 16 7 0.141653 0.02381 0.020885 2 7 0 2 2 0.186489 0 0.153321 3 16 0 1 1 0.144659 0 0.181107 4 3 1 3 0 0.056967 0 0.043224 5 1 1 1 0 0.04065 0 0.000353 6 1 0 0 0 0.358639 0.146597 0 m/z Nodo 7060.121 4292.9 8706.065 8605.678 0 0.949945 0.171834 0.527519 0.872924 1 0.528664 0.162886 0.626018 0.999723 2 0.882675 0.152271 0.953348 0.714632 3 0.595845 0.178005 1 0.741938 4 1 0.088753 0.359943 0.468551 5 0.076352 0.138211 0.276423 1 6 0.337696 0.397906 1 0.984293

Claims (22)

  1. REIVINDICACIONES 1. Un modelo que se utiliza para determinar si una muestra biológica tomada de un sujeto indica que el sujeto tiene cáncer de ovarios, caracterizado porque comprende: un espacio vectorial que tiene al menos tres dimensiones; y cuando menos un enjambre de diagnóstico definido en el espacio vectorial, el enjambre de diagnóstico corresponde a uno de un enjambre de estado de enfermedad y un enjambre de estado sano, el espacio vectorial tiene una primera dimensión que corresponde a un primer valor de proporción de masa a carga de un espectro de masas, la primera proporción de masa a carga es aproximadamente 7060, el espacio vectorial tiene una segunda dimensión que corresponde a un segundo valor de proporción de masas a carga de un espectro de masas, la segunda proporción de masa a carga es aproximadamente 8605·, y el espacio vectorial tiene una tercera dimensión que corresponde a un tercer valor de proporción de masas a carga desde un espectro de masas , la tercer proporción de masas a carga es aproximadamente 8706.
  2. 2. El modelo de conformidad con la reivindicación 1, caracterizado porque el espacio vectorial tiene cuando menos cuatro dimensiones, el espacio vectorial tiene una cuarta dimensión que corresponde a un cuarto valor de proporción de masa a carga de un espectro de masas, la cuarta proporción de masas a carga es aproximadamente 6548.
  3. 3. Un modelo para utilizar en determinar si una muestra biológica tomada de un sujeto indica que el sujeto tiene cáncer de ovarios, caracterizado porque comprende: un espacio vectorial que tiene al menos tres dimensiones; y al menos un enjambre de diagnóstico definido en el espacio vectorial, el enjambre de diagnóstico corresponde a uno de un enjambre de estado de enfermedad y un enjambre de estado sano, el espacio vectorial tiene una primera dimensión que corresponde a un primer valor de proporción de masas a carga de un espectro de masas, la primera proporción de masa de carga es aproximadamente 9807, el espacio vectorial tiene una segunda dimensión que corresponde' a un segundo valor de proporción de masas a carga de un espectro de masas, la segunda proporción de masas a carga es aproximadamente 2374, y el espacio vectorial tiene una tercera dimensión que corresponde a un tercer valor de proporción de masas a carga de un espectro de masas, la tercer proporción de masas a carga es aproximadamente 1276.
  4. 4. El modelo de conformidad con la reivindicación 3 , caracterizado porque el espacio vectorial tiene al menos cuatro dimensiones, el espacio vectorial tiene una cuarta dimensión que corresponde a un cuarto valor de proporción de masas a carga en un espectro de masas, la cuarta proporción de masas a carga es de aproximadamente 292.
  5. 5. Un método para determinar si una muestra biológica tomada de un sujeto indica que el sujeto tiene cáncer de ovario, al analizar la muestra biológica para obtener ' una corriente de datos que describe la muestra biológica, caracterizado porque comprende: a. extraer la corriente de datos para producir un vector de muestra que caracteriza la corriente de datos en un espacio vectorial predeterminado que contiene un enjambre de diagnóstico, el enjambre de diagnóstico es un enjambre de cáncer de ovarios, el enjambre de cáncer de ovarios corresponde a la presencia de cáncer de ovario; b. determinar si el vector de muestras se encuentra dentro del enjambre de cáncer de ovarios; y c. si el vector de muestra se encuentra dentro de o reposa dentro del enjambre de cáncer de ovarios, identificar la muestra biológica que se toma de un sujeto que tiene cáncer de ovarios.
  6. 6. Método para determinar si una muestra biológica tomada de un sujeto indica que el sujeto tiene una enfermedad al analizar una corriente de datos que se obtiene realizando un análisis de la muestra biológica, la corriente de datos tiene un primer número de puntos de datos, caracterizado porque comprende: condensar la corriente de datos de manera tal que la corriente de datos condensada tiene un segundo número de puntos de datos, el segundo número es menor que el primer número de puntos de datos; extraer la corriente de datos condensados para producir un vector muestra que caracteriza la corriente de datos condensados en un espacio vectorial predeterminado que contiene un enjambre de diagnóstico, el enjambre de diagnóstico es un enjambre de estado de enfermedad, el enjambre de estado de enfermedad corresponde a la presencia de la enfermedad; determinar si el vector de muestra se encuentra dentro del enjambre de estado de la enfermedad; y si el vector de muestra se encuentra dentro del enjambre de estado de enfermedad, identificar la muestra biológica que indica que el sujeto tiene la enfermedad.
  7. 7. El método de conformidad con la reivindicación 6, caracterizado porque la indicación de que el sujeto tiene la enfermedad, es altamente precisa.
  8. 8. El método de conformidad con la reivindicación 7, caracterizado porque la corriente de datos proviene de un espectrómetro de masas.
  9. 9. El método de conformidad con la reivindicación 8, caracterizado porque cada punto de datos de la corriente de datos incluye un valor m/z y una intensidad asociada, la condensación incluye utilizar la intensidad asociada con una pluralidad de valores m/z.
  10. 10. El método de conformidad con la reivindicación 9, caracterizado porque la condensación se logra por vinculación en cajones.
  11. 11. El método de conformidad con la reivindicación 7, caracterizado porque la enfermedad es cáncer .
  12. 12. El método de conformidad con la reivindicación 11, caracterizado porque el cáncer es cáncer de ovarios .
  13. 13. Un modelo que se utiliza para determinar si una muestra biológica tomada de un sujeto, indica que el sujeto tiene una enfermedad, caracterizado porque comprende: un espacio vectorial; y al menos un enjambre de diagnóstico está definido en el espacio vectorial, en donde el modelo tiene una sensibilidad de cuando menos 99%.
  14. 14. El modelo de conformidad con la reivindicación 13, caracterizado porque la sensibilidad del modelo es 100%.
  15. 15. El modelo de conformidad con la reivindicación 13, caracterizado porque la enfermedad es cáncer de ovarios .
  16. 16. Un modelo para utilizar en determinar si una muestra biológica tomada de un sujeto indica que el sujeto tiene una enfermedad, caracterizado porque comprende: un espacio vectorial; y al menos un enjambre de diagnóstico definido en el espacio vectorial, en donde el modelo tiene una especificidad de al menos 95%.
  17. 17. El modelo de conformidad con la reivindicación 16, caracterizado porque la especificidad es al menos 99%.
  18. 18. El modelo de conformidad con la reivindicación 16, caracterizado porque la enfermedad es cáncer de ovarios .
  19. 19. Un método para determinar si una muestra biológica retirada de un sujeto indica que el sujeto tiene una enfermedad, al analizar una corriente de datos que se obtiene al realizar un análisis de la muestra biológica, la corriente de datos tiene un primer número de puntos de datos, caracterizado porque comprende: extraer la corriente de datos para producir un vector muestra que caracteriza la corriente de datos en un espacio vectorial predeterminado que contiene un enjambre de diagnóstico, el enj mbre de diagnóstico es un enjambre de estado de enfermedad, el enjambre de estado de enfermedad corresponde a la presencia de la enfermedad; determinar si el vector de muestra se encuentra dentro del enjambre de estado de la enfermedad; y si el vector de muestra se encuentra dentro del enjambre de estado de enfermedad, identificar la muestra biológica que indica con alto grado de precisión, que el sujeto tiene la enfermedad.
  20. 20. El método de conformidad con la reivindicación 19, caracterizado porque la identificación tiene una sensibilidad de cuando menos 99%.
  21. 21. El método de conformidad con la reivindicación 19, caracterizado porque la identificación tiene una especificidad de cuando menos 95%.
  22. 22. El método de conformidad con cualquiera de las reivindicaciones 19, 20 y 21, caracterizado porque la enfermedad es cáncer de ovarios .
MXPA06001170A 2003-08-01 2004-07-30 Caracteristicas proteomicas de suero de alta resolucion multiples para deteccion de cancer de ovarios. MXPA06001170A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US49152403P 2003-08-01 2003-08-01
US90242704A 2004-07-30 2004-07-30
PCT/US2004/024413 WO2005011474A2 (en) 2003-08-01 2004-07-30 Multiple high-resolution serum proteomic features for ovarian cancer detection

Publications (1)

Publication Number Publication Date
MXPA06001170A true MXPA06001170A (es) 2006-05-15

Family

ID=34118868

Family Applications (1)

Application Number Title Priority Date Filing Date
MXPA06001170A MXPA06001170A (es) 2003-08-01 2004-07-30 Caracteristicas proteomicas de suero de alta resolucion multiples para deteccion de cancer de ovarios.

Country Status (11)

Country Link
US (1) US20060064253A1 (es)
EP (1) EP1649281A4 (es)
JP (1) JP2007501380A (es)
AU (1) AU2004261222A1 (es)
BR (1) BRPI0413190A (es)
CA (1) CA2534336A1 (es)
EA (1) EA200600346A1 (es)
IL (1) IL173471A0 (es)
MX (1) MXPA06001170A (es)
SG (1) SG145705A1 (es)
WO (1) WO2005011474A2 (es)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR0111742A (pt) 2000-06-19 2004-02-03 Correlogic Systems Inc Método heurìstico de classificação
WO2004011905A2 (en) * 2002-07-29 2004-02-05 Correlogic Systems, Inc. Quality assurance/quality control for electrospray ionization processes
US7425700B2 (en) 2003-05-22 2008-09-16 Stults John T Systems and methods for discovery and analysis of markers
JP2008530555A (ja) * 2005-02-09 2008-08-07 コレロジック システムズ,インコーポレイテッド 細菌及び芽胞の同定
US20080312514A1 (en) * 2005-05-12 2008-12-18 Mansfield Brian C Serum Patterns Predictive of Breast Cancer
US7972802B2 (en) 2005-10-31 2011-07-05 University Of Washington Lipoprotein-associated markers for cardiovascular disease
US7736905B2 (en) * 2006-03-31 2010-06-15 Biodesix, Inc. Method and system for determining whether a drug will be effective on a patient with a disease
EP2076860B1 (en) * 2006-09-28 2016-11-16 Private Universität für Gesundheitswissenschaften Medizinische Informatik und Technik - UMIT Feature selection on proteomic data for identifying biomarker candidates
EP2115458A4 (en) * 2007-02-01 2011-06-08 Phenomenome Discoveries Inc METHOD FOR DIAGNOSIS OF HEALTH CONDITIONS FOR OVARIAL CARCINOMA AND THE RISK OF HEALTH CONDITIONS IN OVARIAL CARCINOMA
WO2008100941A2 (en) * 2007-02-12 2008-08-21 Correlogic Systems Inc. A method for calibrating an analytical instrument
US8664358B2 (en) 2007-06-29 2014-03-04 Vermillion, Inc. Predictive markers for ovarian cancer
US8241861B1 (en) 2008-07-08 2012-08-14 Insilicos, Llc Methods and compositions for diagnosis or prognosis of cardiovascular disease
JP2013520681A (ja) * 2010-02-24 2013-06-06 バイオデシックス・インコーポレイテッド 質量スペクトル分析を用いた、治療薬投与のための癌患者のセレクション
KR101439975B1 (ko) 2012-01-03 2014-11-21 국립암센터 대장암 진단 장치
WO2013103197A1 (ko) * 2012-01-03 2013-07-11 국립암센터 암 진단 장치
KR101439977B1 (ko) 2012-01-03 2014-09-12 국립암센터 위암 진단 장치
KR101439981B1 (ko) 2012-01-03 2014-09-12 국립암센터 유방암 진단 장치
EP2741224A1 (en) * 2012-11-20 2014-06-11 Thermo Finnigan LLC Methods for generating local mass spectral libraries for interpreting multiplexed mass spectra
CN117233413A (zh) 2019-08-05 2023-12-15 禧尔公司 用于样品制备、数据生成和蛋白质冠分析的系统和方法

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3935562A (en) * 1974-02-22 1976-01-27 Stephens Richard G Pattern recognition method and apparatus
US4075475A (en) * 1976-05-03 1978-02-21 Chemetron Corporation Programmed thermal degradation-mass spectrometry analysis method facilitating identification of a biological specimen
US4122518A (en) * 1976-05-17 1978-10-24 The United States Of America As Represented By The Administrator Of The National Aeronautics & Space Administration Automated clinical system for chromosome analysis
US4697242A (en) * 1984-06-11 1987-09-29 Holland John H Adaptive computing system capable of learning and discovery
US4881178A (en) * 1987-05-07 1989-11-14 The Regents Of The University Of Michigan Method of controlling a classifier system
US5697369A (en) * 1988-12-22 1997-12-16 Biofield Corp. Method and apparatus for disease, injury and bodily condition screening or sensing
AU7563191A (en) * 1990-03-28 1991-10-21 John R. Koza Non-linear genetic algorithms for solving problems by finding a fit composition of functions
US5210412A (en) * 1991-01-31 1993-05-11 Wayne State University Method for analyzing an organic sample
US5784162A (en) * 1993-08-18 1998-07-21 Applied Spectral Imaging Ltd. Spectral bio-imaging methods for biological research, medical diagnostics and therapy
US5632957A (en) * 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
US6114114A (en) * 1992-07-17 2000-09-05 Incyte Pharmaceuticals, Inc. Comparative gene transcript analysis
JPH08502865A (ja) * 1992-09-01 1996-03-26 アプル・コンピュータ・インコーポレーテッド 改良されたベクトルの量子化
JP3639594B2 (ja) * 1993-05-28 2005-04-20 ベイラー カレッジ オブ メディシン 分析対象物の脱着およびイオン化のための方法および装置
US5995645A (en) * 1993-08-18 1999-11-30 Applied Spectral Imaging Ltd. Method of cancer cell detection
US5352613A (en) * 1993-10-07 1994-10-04 Tafas Triantafillos P Cytological screening method
US5553616A (en) * 1993-11-30 1996-09-10 Florida Institute Of Technology Determination of concentrations of biological substances using raman spectroscopy and artificial neural network discriminator
US6025128A (en) * 1994-09-29 2000-02-15 The University Of Tulsa Prediction of prostate cancer progression by analysis of selected predictive parameters
WO1996012187A1 (en) * 1994-10-13 1996-04-25 Horus Therapeutics, Inc. Computer assisted methods for diagnosing diseases
US5848177A (en) * 1994-12-29 1998-12-08 Board Of Trustees Operating Michigan State University Method and system for detection of biological materials using fractal dimensions
GB2301897B (en) * 1995-06-08 1999-05-26 Univ Wales Aberystwyth The Composition analysis
KR100197580B1 (ko) * 1995-09-13 1999-06-15 이민화 무선 통신망을 이용한 실시간 생체신호모니터링시스템
US5716825A (en) * 1995-11-01 1998-02-10 Hewlett Packard Company Integrated nucleic acid analysis system for MALDI-TOF MS
US5687716A (en) * 1995-11-15 1997-11-18 Kaufmann; Peter Selective differentiating diagnostic process based on broad data bases
DE19543020A1 (de) * 1995-11-18 1997-05-22 Boehringer Mannheim Gmbh Verfahren und Vorrichtung zur Bestimmung von analytischen Daten über das Innere einer streuenden Matrix
US5760761A (en) * 1995-12-15 1998-06-02 Xerox Corporation Highlight color twisting ball display
US5839438A (en) * 1996-09-10 1998-11-24 Neuralmed, Inc. Computer-based neural network system and method for medical diagnosis and interpretation
US6571227B1 (en) * 1996-11-04 2003-05-27 3-Dimensional Pharmaceuticals, Inc. Method, system and computer program product for non-linear mapping of multi-dimensional data
US6295514B1 (en) * 1996-11-04 2001-09-25 3-Dimensional Pharmaceuticals, Inc. Method, system, and computer program product for representing similarity/dissimilarity between chemical compounds
ATE375403T1 (de) * 1996-11-06 2007-10-15 Sequenom Inc Dna-diagnostik mittels massenspektrometrie
US6157921A (en) * 1998-05-01 2000-12-05 Barnhill Technologies, Llc Enhancing knowledge discovery using support vector machines in a distributed network environment
AU6816998A (en) * 1997-03-24 1998-10-20 Queen's University At Kingston Coincidence detection method, products and apparatus
US5905258A (en) * 1997-06-02 1999-05-18 Advanced Research & Techology Institute Hybrid ion mobility and mass spectrometer
NZ516848A (en) * 1997-06-20 2004-03-26 Ciphergen Biosystems Inc Retentate chromatography apparatus with applications in biology and medicine
US6081797A (en) * 1997-07-09 2000-06-27 American Heuristics Corporation Adaptive temporal correlation network
US5974412A (en) * 1997-09-24 1999-10-26 Sapient Health Network Intelligent query system for automatically indexing information in a database and automatically categorizing users
US6085576A (en) * 1998-03-20 2000-07-11 Cyrano Sciences, Inc. Handheld sensing apparatus
US6723564B2 (en) * 1998-05-07 2004-04-20 Sequenom, Inc. IR MALDI mass spectrometry of nucleic acids using liquid matrices
AU1133200A (en) * 1998-10-26 2000-05-15 Visionary Medical, Inc. Prescription-controlled data collection system and method
US5989824A (en) * 1998-11-04 1999-11-23 Mesosystems Technology, Inc. Apparatus and method for lysing bacterial spores to facilitate their identification
US6631333B1 (en) * 1999-05-10 2003-10-07 California Institute Of Technology Methods for remote characterization of an odor
US7057168B2 (en) * 1999-07-21 2006-06-06 Sionex Corporation Systems for differential ion mobility analysis
US6329652B1 (en) * 1999-07-28 2001-12-11 Eastman Kodak Company Method for comparison of similar samples in liquid chromatography/mass spectrometry
US6615199B1 (en) * 1999-08-31 2003-09-02 Accenture, Llp Abstraction factory in a base services pattern environment
BR0111742A (pt) * 2000-06-19 2004-02-03 Correlogic Systems Inc Método heurìstico de classificação
US6680203B2 (en) * 2000-07-10 2004-01-20 Esperion Therapeutics, Inc. Fourier transform mass spectrometry of complex biological samples
US20020059030A1 (en) * 2000-07-17 2002-05-16 Otworth Michael J. Method and apparatus for the processing of remotely collected electronic information characterizing properties of biological entities
EP1386275A2 (en) * 2000-07-18 2004-02-04 Correlogic Systems, Inc. A process for discriminating between biological states based on hidden patterns from biological data
CN1262337C (zh) * 2000-11-16 2006-07-05 赛弗根生物系统股份有限公司 质谱分析方法
EP1356121A2 (en) * 2001-02-01 2003-10-29 Ciphergen Biosystems, Inc. Improved methods for protein identification, characterization and sequencing by tandem mass spectrometry
AU2002314715B2 (en) * 2001-02-16 2006-07-27 Ciphergen Biosystems, Inc. Method for correlating gene expression profiles with protein expression profiles
WO2002086168A1 (en) * 2001-04-19 2002-10-31 Ciphergen Biosystems, Inc. Biomolecule characterization using mass spectrometry and affinity tags
US20040260478A1 (en) * 2001-08-03 2004-12-23 Schwamm Lee H. System, process and diagnostic arrangement establishing and monitoring medication doses for patients
IL160324A0 (en) * 2001-08-13 2004-07-25 Beyond Genomics Inc Method and system for profiling biological systems
AU2003235749A1 (en) * 2002-01-07 2003-07-24 John Hopkins University Biomarkers for detecting ovarian cancer
US20020193950A1 (en) * 2002-02-25 2002-12-19 Gavin Edward J. Method for analyzing mass spectra
WO2004011905A2 (en) * 2002-07-29 2004-02-05 Correlogic Systems, Inc. Quality assurance/quality control for electrospray ionization processes
JP4585167B2 (ja) * 2002-11-29 2010-11-24 東芝医用システムエンジニアリング株式会社 X線コンピュータ断層撮影システム
EP1709442A4 (en) * 2003-12-11 2010-01-20 Correlogic Systems Inc METHOD FOR DIAGNOSING BIOLOGICAL CONDITIONS BY USING A CENTRALIZED ADAPTIVE MODEL AND SAMPLE PREPARATION
JP2008530555A (ja) * 2005-02-09 2008-08-07 コレロジック システムズ,インコーポレイテッド 細菌及び芽胞の同定

Also Published As

Publication number Publication date
AU2004261222A1 (en) 2005-02-10
BRPI0413190A (pt) 2006-10-03
JP2007501380A (ja) 2007-01-25
WO2005011474A2 (en) 2005-02-10
IL173471A0 (en) 2006-06-11
US20060064253A1 (en) 2006-03-23
WO2005011474A3 (en) 2005-06-09
EA200600346A1 (ru) 2006-08-25
AU2004261222A2 (en) 2005-02-10
EP1649281A4 (en) 2007-11-07
CA2534336A1 (en) 2005-02-10
SG145705A1 (en) 2008-09-29
EP1649281A2 (en) 2006-04-26

Similar Documents

Publication Publication Date Title
US20060064253A1 (en) Multiple high-resolution serum proteomic features for ovarian cancer detection
US6925389B2 (en) Process for discriminating between biological states based on hidden patterns from biological data
AU2002241535C1 (en) Method for analyzing mass spectra
Conrads et al. High-resolution serum proteomic features for ovarian cancer detection.
Petricoin et al. SELDI-TOF-based serum proteomic pattern diagnostics for early detection of cancer
US20020193950A1 (en) Method for analyzing mass spectra
US10713590B2 (en) Bagged filtering method for selection and deselection of features for classification
AU2002241535A1 (en) Method for analyzing mass spectra
Chan et al. An ensemble method for identifying robust features for biomarker discovery
AU2008201163A1 (en) A process for discriminating between biological states based on hidden patterns from biological data