MX2008016352A - Analisis diagnostico para cancer de pulmon. - Google Patents

Analisis diagnostico para cancer de pulmon.

Info

Publication number
MX2008016352A
MX2008016352A MX2008016352A MX2008016352A MX2008016352A MX 2008016352 A MX2008016352 A MX 2008016352A MX 2008016352 A MX2008016352 A MX 2008016352A MX 2008016352 A MX2008016352 A MX 2008016352A MX 2008016352 A MX2008016352 A MX 2008016352A
Authority
MX
Mexico
Prior art keywords
markers
seq
lung cancer
samples
analysis
Prior art date
Application number
MX2008016352A
Other languages
English (en)
Inventor
Edward A Hirschowitz
Li Zhong
Nada H Khattar
Arnold J Stromberg
Original Assignee
Univ Kentucky Res Found
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US2006/060796 external-priority patent/WO2007079284A2/en
Application filed by Univ Kentucky Res Found filed Critical Univ Kentucky Res Found
Publication of MX2008016352A publication Critical patent/MX2008016352A/es

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/536Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase
    • G01N33/537Immunoassay; Biospecific binding assay; Materials therefor with immune complex formed in liquid phase with separation of immune complex from unbound antigen or antibody
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/564Immunoassay; Biospecific binding assay; Materials therefor for pre-existing immune complex or autoimmune disease, i.e. systemic lupus erythematosus, rheumatoid arthritis, multiple sclerosis, rheumatoid factors or complement components C1-C9

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Hematology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Rehabilitation Therapy (AREA)
  • Rheumatology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

Un análisis diagnostico para determinar la presencia de cáncer de pulmón en un paciente depende, en parte, de la verificación de la presencia de un anticuerpo asociado con cáncer de pulmón utilizando polipéptidos aleatorios. El análisis predice el cáncer de pulmón antes de la evidencia de tejido canceroso detectable de manera radiográfica.

Description

ANÁLISIS DIAGNÓSTICO PARA CÁNCER DE PULMÓN DERECHOS GUBERNAMENTALES Una parte de la investigación descrita en la presente se soportó con dinero proporcionado por los National Institutes of Health (Institutos Nacionales de Salud) (ROI, CA10032-01) , el Veteran' s Administration Merit Review Program (Programa de Revisión de Administración de Méritos a Veteranos) y la Kentucky Lung Cáncer Research Administration (Administración de Kentucky para la Investigación del Cáncer Pulmonar) . ANTECEDENTES El cáncer de pulmón es la principal causa de muerte por cáncer tanto para hombres como para mujeres en los Estados Unidos y en muchas otras naciones. El número de muertes por esta enfermedad se ha elevado anualmente durante los pasados cinco años a cerca de 164,000 solo en los Estados Unidos, la mayoría sucumbiendo ante cánceres de célula no pequeña (NSCLC) . Esto excede las tasas de mortandad de cáncer de mama, próstata y colorrectal combinadas. Muchos expertos consideran que la detección temprana del cáncer de pulmón es la clave para mejorar la supervivencia. Los estudios indican que cuando la enfermedad se detecta en una etapa temprana, localizada y puede retirarse quirúrgicamente, la tasa de supervivencia de cinco años puede alcanzar el 85%. Pero la tasa de supervivencia disminuye dramáticamente una vez que el cáncer se ha difundido hacia otros órganos, especialmente a sitios lejanos, después de lo cual, tan pocos como el 2% de los pacientes sobreviven cinco años. Desafortunadamente, el cáncer de pulmón es una enfermedad heterogénea y comúnmente asintomática hasta que ha alcanzado una etapa avanzada. Asi que, únicamente el 15% de los cánceres de pulmón se encuentran en una etapa temprana localizada. Existe, por tanto, una necesidad apremiante por herramientas que ayuden en la detección sistemática de personas asintomáticas que conduzca a la detección del cáncer de pulmón en sus etapas más tempranas y más ' tratables . La radiografía de tórax y la exploración por tomografía computarizada (CT) se han estudiado como potenciales herramientas de detección sistemática para detectar el cáncer de pulmón en etapas tempranas. Desafortunadamente, el alto costo y la alta tasa de positivos falsos hacen que estas herramientas radiográficas sean imprácticas para su uso extendido. Por ejemplo, un estudio reciente del U.S. National Cáncer Institute concluyó que la detección para cáncer de pulmón con radiografía de tórax puede detectar el cáncer de pulmón temprano pero produce muchos resultados de prueba positivos falsos, ocasionando posteriores pruebas no necesarias, Oken et al., Journal of the National Cáncer Institute, 97(24)1832-1839, 2005. De los 67,000 pacientes que recibieron rayos X de linea base en la prueba inicial, cerca de 6,000 (9%) tuvieron resultados anormales que requerían seguimiento. De estos, únicamente 126 (2% de los 6,000 participantes con rayos X anormales) se diagnosticaron con cáncer de pulmón dentro de los 12 meses del inicio de la radiografía de tórax. Se ha encontrado un problema similar con falsos positivos con pruebas en curso que involucran exploraciones CT . La especificidad de la detección CT se calcula en alrededor del 65% en base al número de hallazgos radiográficos indeterminados. Han surgido en los expertos serias preocupaciones acerca del costo de salud por vida salvada cuando se evalúa el número de cánceres detectados por número de exploraciones de detección CT llevadas a cabo, debido a que una gran porción de los costos del cuidado de la salud incurridos pueden atribuirse al número de nodulos pulmonares indeterminados encontrados en la exploración- prevaleciente que requieren investigación adicional, muchos de los cuales finalmente se han encontrado benignos. Las exploraciones PET son otra opción 'de diagnóstico, pero las exploraciones PET son costosas, y generalmente no susceptibles para su uso en programas de exploración.
Actualmente, la edad y el historial de fumador son los únicos dos factores de riesgo que se han utilizado como criterios de selección por los grandes estudios de detección. Una prueba de sangre que podría detectar radiográficamente cánceres aparentes (>0.5 cm) así como el cáncer oculto y pre-maligno (por debajo del límite de la detección radiográfica) identificaría individuos para quienes la detección radiográfica es más garantizada y de hecho reduciría el número de hallazgos pulmonares benignos que requieren trabajo adicional. Esta claro, por lo tanto, que existe una necesidad urgente para la detección de cáncer de pulmón mejorada, y herramientas de detección que superen las limitaciones antes mencionadas de las técnicas radiográficas. SUMARIO La presente invención se refiere a análisis, métodos, y equipos para la detección temprana del cáncer de pulmón utilizando muestras de fluido corporal. En particular, la invención se refiere a la detección de cáncer de pulmón mediante la evaluación de la presencia de uno o un panel de marcadores, tales como los biomarcadores autoanticuerpos . La presente invención puede emplearse en una estrategia de detección sistemática de cáncer de pulmón completa, especialmente cuando se utiliza conjuntamente con la representación de imágenes radiográficas y otras modalidades de detección sistemática. La presente invención puede utilizarse para enriquecer a la población para análisis radiográficos adicionales que descarten la posible presencia de cáncer de pulmón. En resumen, la invención se dirige a un método para detectar la probable presencia de cáncer de pulmón en un paciente, en una modalidad, proporcionando una muestra de sangre del paciente y analizando la muestra de sangre del paciente por la presencia de uno o un panel de autoanticuerpos asociados con cáncer de pulmón. El panel puede identificarse, por ejemplo, evaluando la máxima probabilidad de cáncer asociada con los miembros de panel. Puede utilizarse cualquiera de una variedad de herramientas estadísticas para evaluar la contribución simultánea de múltiples variables en un resultado. La presente invención se empleó para analizar muestras obtenidas durante una prueba principal de detección sistemática CT y para distinguir el cáncer de pulmón de etapa temprana y tardía así como la enfermedad oculta a partir de los controles comparados con el riesgo. El presente análisis predijo con casi 90% de exactitud la presencia de cáncer de pulmón tanto como cinco años antes de la detección radiográfica. El presente análisis puede utilizarse como una prueba de detección para pacientes asintomáticos, o pacientes de un grupo de alto riesgo que aún no han sido diagnosticados con cáncer de pulmón utilizando pruebas y protocolos aceptables, es decir, por ejemplo, que carecen de cáncer de pulmón radiográficamente detectable. La invención proporciona una alternativa a los altos costos y baja especificidad de los métodos de detección sistemática de cáncer de pulmón actuales, tales como radiografía de tórax o CT de Dosis Baja. El presente análisis maximiza las tasas de detección de cáncer mientras que limita la detección de nodulos pulmonares benignos que pueden requerir de evaluación adicional y por tanto, es una herramienta poderosa y de rentable que puede incorporarse fácilmente en una estrategia de detección temprana completa. Estas y otras características, aspectos, y ventajas de la presente invención se entenderán mejor con respecto a la siguiente descripción y reivindicaciones adjuntas. DESCRIPCIÓN DETALLADA El diagnóstico temprano de estados patológicos es benéfico. Sin embargo, no todos los estados patológicos tienen señales simples, fáciles de detectar. Otros estados patológicos son heterogéneos en etiología o fenotipo, o a lo largo de su etapa de desarrollo. En tales circunstancias, es poco probable que exista una señal o marcador de diagnóstico único, sensible y específico. No obstante, ahora es posible desarrollar un análisis de diagnóstico adecuado utilizando una pluralidad de marcadores, que por si solos no tienen suficiente poder predictivo, pero en ciertas combinaciones, un panel tiene suficiente especificidad y sensibilidad para su uso práctico. Además, las múltiples técnicas y la capacidad de manejo de datos permiten la flexibilidad de desarrollar análisis de diagnóstico particularizados y personalizados con facilidad de uso y mayor poder predictivo para poblaciones definidas o para la población en general. La presente invención proporciona un nuevo análisis y método para detectar enfermedad, tal como cáncer de pulmón, más pronto y con mayor exactitud que los medios convencionales. En resumen, una muestra del paciente o sujeto, tal como una muestra de sangre, se obtiene y se analiza por la presencia o ausencia de un panel de biomarcadores de anticuerpo. Para el cáncer de pulmón, se utiliza uno o un panel de marcadores, cada marcador asociado en algún grado con el cáncer de pulmón, y la mayoría de los cuales, cuando se utiliza un panel, produce una medida predecible de la probabilidad de tener cáncer de pulmón en una población heterogénea. Como se establece en mayor detalle más adelante, el análisis y método de acuerdo con la presente invención identifican pacientes correctamente con cáncer de pulmón de etapa temprana y tardía. La identificación de pacientes con cáncer de pulmón de etapa temprana es particularmente valiosa dado que los análisis actuales y modalidades de detección tienen poca capacidad para lograrlo de forma robusta y de rentable. El presente análisis de detección proporciona mayor capacidad de predicción y produce menos positivos falsos que los análisis actualmente utilizados, que frecuentemente son también costosos. El presente análisis es también versátil, al utilizar un formato de análisis que permite probar un gran número de muestras simultáneamente, tal como utilizando una micro-instalación, las muestras control en relación a cualquier población pueden utilizarse en paralelo para obtener datos discriminatorios de alta confianza, en donde la pluralidad de controles se igualan para tantos parámetros como sea posible para probar a la población. Esto permite la corrección de las diferencias de población, tales como raza, sexo, edad, polimorfismo y etcétera que pueden surgir y que podrían confundir los resultados. Definiciones Como se utiliza en la presente, los siguientes términos deben tener los siguientes significados. "Cáncer de pulmón" significa un proceso, estado y tejido maligno en el pulmón. "Proteína" es un péptido, oligopéptido o polipéptido, los términos se utilizan de manera intercambiable en la presente, que es un polímero de aminoácidos. En el contexto de una biblioteca, el polipéptido no necesita codificar para una molécula con actividad biológica. Un anticuerpo de interés se enlaza a una epitope o determinante. Las epitopes son porciones de una molécula funcional intacta, y en el contexto de una proteína, pueden comprender tan pocos como aproximadamente tres a aproximadamente cinco aminoácidos contiguos. "Normalizado" se refiere a un tratamiento estadístico de una métrica o medida para corregir o ajustar contribuciones de fondo y aleatorias al resultado observado para determinar si la métrica, estadística o medida es una reflexión, respuesta o resultado real de una reacción o es no significativa y aleatoria. "Cáncer de Pulmón de Célula No Pequeña" (NSCLC) es un subtipo de cáncer de pulmón que representa aproximadamente el 80% del total de cánceres de pulmón, comparado con el cáncer de célula pequeña que se caracteriza por células pequeñas, ovoides, también conocido como cáncer de célula de avena. Se incluyen en el subtipo NSCLC el carcinoma de célula escamosa, adenocarcinoma y carcinoma de célula grande. "Fluido Corporal" es cualquier muestra de líquido obtenida o derivada de un cuerpo, tal como sangre, saliva, semen, lágrimas, extractos de tejido, exudados, lavado de cavidad corporal, suero, plasma, fluido de tejido y lo similar que pueda utilizarse como muestra del paciente para pruebas. Preferentemente el fluido puede utilizarse como es, sin embargo, tratamientos, tales como clarificación, por ejemplo, mediante centrifugación, pueden utilizarse antes de la prueba. Una muestra de fluido corporal es una muestra de fluido . "Muestra de Sangre" significa una pequeña alícuota generalmente de sangre de vena obtenida de un individuo. La sangre puede procesarse, por ejemplo, los factores de coagulación se desactivan, tal como mediante heparina o EDTA, y las células de glóbulos rojos se retiran para producir una muestra de plasma. Puede permitirse la coagulación de la sangre, y separar las fases sólida y líquida para producir suero. Todas esas muestras de sangre "procesadas" yacen dentro del alcance de la definición de "muestra de sangre" como se utiliza en la presente. "Epitope" significa la estructura molecular particular enlazada por un anticuerpo. Un sinónimo es "determinante". Un epitope de polipéptido puede ser tan pequeño como de 3-5 aminoácidos. "Biomarcador" denota un factor, indicador, puntuación, métrica, manipulación matemática y lo similar que se evalúa y se encuentra útil para predecir un resultado, tal como el estado actual o un futuro estado de salud en una entidad biológica. Un biomarcador es sinónimo de marcador.
"Panel" significa un juego de marcadores compilado que se miden juntos para y en un análisis. Un panel puede comprender 2 marcadores, 3 marcadores, 4 marcadores, 5 marcadores, 6 marcadores, 7 marcadores, 8 marcadores, 9 marcadores, 10 marcadores, 11 marcadores, 12 marcadores o más. El tratamiento estadístico y los métodos de análisis descritos en la presente solicitud y que pueden aplicarse en la práctica de la presente invención proporcionan el uso de cualquiera de un número de marcadores informativos en un análisis de interés. "Resultado" es aquello que se predice o detecta. "Autoanticuerpos" significa inmunoglobulinas o anticuerpos (los términos se utilizan de forma intercambiable en la presente) dirigidos a (auto) proteínas "autólogas" que incluyen células patológicas, tales como células infectadas y células de tumor. En este caso, los anticuerpos contra el tumor se derivan de un tumor del propio individuo, el cual es una aberración genética de sus propias células. "Suma ponderada" significa una compilación de puntuaciones de marcadores individuales, cada una con un valor predictivo. Los marcadores con mayor valor predictivo contribuyen más a la suma. El valor relativo de los marcadores individuales se deriva estadísticamente para maximizar el valor de una expresión multivariable, utilizando paradigmas estadísticos conocidos, tales como la regresión logística. Puede utilizarse un número de paquetes estadísticos comercialmente disponibles. En una fórmula, tal como una ecuación de regresión, de factores aditivos, el "peso" de cada factor (marcador) se revela como el coeficiente de tal factor. "Estadísticamente significativo" significa las diferencias sin probabilidad de relación solamente con la casualidad. "Marcador" es un factor, indicador, métrica, puntuación, manipulación matemática o lo similar que se evalúa y puede utilizarse en un diagnóstico. ün marcador puede ser, por ejemplo, un polipéptido o antígeno, o puede ser un anticuerpo que se enlaza a un antígeno. Un marcador puede ser también cualquiera de un par de enlace o socios de enlace, siendo un par de enlace o socios de enlace entidades con una especificidad entre sí, tal como un anticuerpo y un antígeno, hormona y receptor, un ligando y la molécula a la que se enlaza el ligando para formar un complejo, una enzima y co-enzima, una enzima y sustrato y así sucesivamente. "Marcador de Pronóstico" es un marcador que se encuentra presente antes de la detección del cáncer de pulmón utilizando técnicas conocidas. Por tanto, el presente análisis detecta autoanticuerpos específicos del cáncer de pulmón antes de que se encuentre un cáncer radiográficamente detectable en un paciente, por ejemplo, hasta cinco años antes de que se note un cáncer radiográficamente detectable. Tales anticuerpos son marcadores de pronóstico. "Población Objetivo" significa cualquier subconjunto de una población tipificada mediante un marcador, estado, condición, enfermedad, etc., en particular. Por tanto, la población objetivo puede ser pacientes con una particular forma o etapa de cáncer de pulmón, o una población de fumadores, por ejemplo. Una población objetivo puede comprender personas con uno o más factores de riesgo. Una población objetivo puede comprender personas con un resultado de prueba sospechoso, tal como la presencia de anormalidades en el pulmón que ameriten monitoreo adicional y más cronometrado . "Radiográfico" se refiere a cualquier método de visualización, tal como CAT, PET, rayos X etcétera. "Cáncer radiográficamente detectable" se refiere al diagnóstico o detección del cáncer mediante medios radiográficos. La presencia de cáncer se confirma generalmente mediante histología. "Muestra de tejido" se refiere a una muestra de un tejido en particular. Para una muestra de tejido que se encuentra en forma líquida, la muestra puede ser un fluido corporal o puede provenir de un tejido líquido, tal como sangre, o una alícuota de sangre procesada. La frase se refiere también a un fluido obtenido a partir de un tejido sólido, tal como, por ejemplo, un exudado, restos de fluido de cultivo de tejido, los lavados de un tejido sólido triturado etcétera. Selección del Biomarcador La selección e identificación de los marcadores asociados con el cáncer de pulmón, tales como, autoanticuerpos, y las proteínas que tienen afinidad específica con estos o que se enlazan por los mismos, puede ser mediante cualquier medio utilizando métodos disponibles para el técnico. En el caso de biomarcadores de anticuerpo, pueden practicarse cualquiera de una variedad de métodos en base a inmunología. Como se conoce en la técnica, los aptámeros, spiegelmeros y lo similar que tiene una especificidad de enlace pueden utilizarse también en lugar del anticuerpo. Muchos métodos de alto rendimiento conocidos que se basan en una reacción anticuerpo-antígeno pueden practicarse en la presente invención. Las moléculas de individuos en la población objetivo pueden compararse con aquellas de la población de control para identificar cualquiera que sea específica de cáncer de pulmón, utilizando, por ejemplo, selección por sustracción etcétera. Alternativamente, las muestras de la población objetivo y de la población normal (control) pueden utilizarse para identificar moléculas que son específicas para la población objetivo a partir de una biblioteca de moléculas . Una forma de selección por afinidad puede llevarse a cabo con bibliotecas, utilizando un anticuerpo como sonda para detectar una biblioteca de moléculas candidato. El uso de un anticuerpo para detectar a los candidatos se conoce como "biopanorámica" . Entonces, queda validar las moléculas especificas de la población objetivo y su uso, y después determinar el poder de los marcadores individuales como vaticinadores de los miembros de la población objetivo. Un medio adecuado es obtener bibliotecas de moléculas, ya sea especificas para cáncer de pulmón o no, y seleccionar esas bibliotecas por moléculas que se enlazan a anticuerpos en miembros de la población objetivo. Debido a que los epitopes de proteínas o polipéptidos pueden ser tan pequeños como 3 aminoácidos, pero pueden tener una longitud menor que 10 aminoácidos, una longitud menor que 20 aminoácidos etcétera, el tamaño promedio de los miembros individuales de la biblioteca es una elección de diseño. Por tanto, los miembros más pequeños de la biblioteca pueden ser de aproximadamente 3-5 aminoácidos para imitar una determinante única, mientras que los miembros de 20 o más aminoácidos pueden imitar o contener 2 o más determinantes. La biblioteca tampoco necesita restringirse a polipéptidos como otras moléculas, tales como carbohidratos, lípidos, ácidos nucléicos y combinaciones de los mismos, pueden ser epítopes y utilizarse por tanto como o para identificar marcadores de cáncer de pulmón. Debido a que el proceso de identificación de biomarcadores busca identificar epitopes en lugar de proteínas intactas u otras moléculas, las bibliotecas escaneadas o seleccionadas no necesitan ser especificas para cáncer de pulmón sino que pueden obtenerse de moléculas de individuos normales, o pueden obtenerse de poblaciones de moléculas aleatorias, aunque el uso de muestras de pacientes con cáncer de pulmón puede mejorar la probabilidad de identificar biomarcadores de cáncer de pulmón adecuados. Los epitopes, moléculas de reacción cruzada, no obstante, se encuentran presentes y son inmunogénicos en pacientes con cáncer de pulmón, irrespectivo de la función de las moléculas que contienen los epitopes. Por tanto, las bibliotecas de polipéptidos aleatorios se encuentran comercialmente disponibles, por ejemplo, de Clontech y New England Biolabs (NEB) . Tales bibliotecas comprenden la mayoría, si no todas, las permutaciones posibles de "mers" utilizando, por ejemplo, los veinte aminoácidos comúnmente encontrados en sistemas biológicos. Por tanto, tal biblioteca de tetrámeros aleatorios o tetrapéptidos que utilizan los 20 aminoácidos puede comprender la mayoría, si no todos, los tetrapéptidos teóricamente 1.6 x 105. Algunas bibliotecas se configuran como los correspondientes oligonucleótidos que codifican para la expresión en un huésped adecuado, tal como una partícula de virus. Por tanto, "aleatorio" se utiliza en la presente como se conoce en la técnica, en el caso de polipéptidos, el polipéptido se genera, por ejemplo, como uno de una biblioteca o banco de posibles permutaciones de polipéptidos, o puede sintetizarse sin importar el origen, estructura o función, en donde cada residuo puede ser cualquiera de un género de residuos. Las ejemplificaciones de esos métodos se describen en los Ejemplos utilizando bibliotecas de fago de ADNc específico para cáncer de pulmón T7 y una biblioteca de péptido aleatorio M13. Ambas fueron cargadas en bibliotecas de visualización de fago, como se conoce en la técnica. Una de las bibliotecas de ADNc NSCLC de fago T7 utilizada se encuentra comercialmente disponible (Novagen, Madison, WI, USA) , y la otra biblioteca T7 se fabricó a partir de la línea de célula de adenocarcinoma, NCI.1650 (donación de H. Oie, NCI, National Institutes of Health, Bethesda, MD, USA) . Por tanto, una biblioteca de fago puede fabricarse como se conoce en la técnica. Se extrae y se selecciona el total de ARN del tejido o células objetivo. Se lleva a cabo la síntesis de ADNc de primera cadena asegurando la representación de las secuencias de aminoácido tanto de terminal-N como de terminal-C. El producto de ADNc se liga dentro de un vector de fago compatible para generar la biblioteca. La biblioteca se amplifica en un huésped de bacteria adecuado y para fago litico, tal como T7, las células se lisan para obtener una preparación de fago. Los Usados se titulan bajo condiciones estándar y se almacenan después de la purificación. Para el otro fago, debe derramarse el virus dentro del medio, tal como con M13, en cuyo caso el virus se recolecta a partir del sobrenadante y se titula. La biblioteca de fago se biopanea o se detecta con una muestra de tejido, preferentemente una muestra de fluido, tal como plasma o suero, a partir de pacientes con cáncer de pulmón, y con una muestra de tejido análoga, tal como plasma o suero de donantes sanos normales, para identificar a las moléculas potenciales visualizadas reconocidas por los ligandos, tales como anticuerpos circulatorios, en pacientes con cáncer de pulmón. En una modalidad, la muestra de tejido es una muestra de sangre, tal como plasma o suero, y el objetivo es identificar los marcadores reconocidos por anticuerpos encontrados en el plasma o suero de la población objetivo, tal como, pacientes con cáncer de pulmón de célula no pequeña. Para retirar los fagos que se reconocen por los anticuerpos de la población no objetivo de la biblioteca, la biblioteca de visualización de fago, por ejemplo, se expone al suero normal o a suero mezclado. Los fagos no reactivados se separan de aquellos que se hacen reaccionar con las muestras de la población no objetivo. Después los fagos no reactivados se exponen a suero NSCLC para aislar a los fagos reconocidos por los anticuerpos en el suero de pacientes con NSCLC. Se recolecta el fago reactivo, amplificado en un huésped de bacteria adecuado, se recolectan los Usados, se almacenan, y se identifican como "muestra 1" o como biopanorárnica 1". Los procesos de biopanorámica y de amplificación pueden repetirse múltiples veces, utilizando generalmente las mismas muestras control y objetivo para mejorar el proceso de purificación. Los fagos de las biopanorámicas representan una población enriquecida que es más probable que contenga moléculas expresadas reconocidas específicamente por los anticuerpos en muestras a partir de pacientes NSCLC. Dado que muchas bibliotecas de fago expresan polipéptidos, puede decirse que los fagos seleccionados expresan y representan "péptidos de captura" para anticuerpos asociados con NSCLC. Para seleccionar adicionalmente los clones de fago que expresan moléculas que se enlazan mediante anticuerpos específicos de NSCLC, pueden marcarse robóticamente los lisados de fago individuales seleccionados en las biopanorámicas, por ejemplo, en portaobjetos (Schleicher and Schuell, Keene, NH) utilizando un seleccionador (Affymetrix, Santa Clara, CA) para producir una micro-instalación con una pluralidad de moléculas candidato de expresión de fago que se enlazaron mediante anticuerpos en el suero de pacientes NSCLC. Para identificar que moléculas de visualización de fago son probables moléculas de captura especifica de NSCLC (capaces de enlazarse a anticuerpos específicos de NSCLC) , el portaobjetos de detección se incuba, por ejemplo, con muestras de suero de pacientes NSCLC individuales, idealmente, no aquellas utilizadas en las biopanorámicas , y se detectan adicionalmente utilizando metodología de inmunoanálisis estándar. Los anticuerpos que se enlazan a fagos pueden identificarse, por ejemplo, mediante marcado de doble color con reactivos inmunes adecuados, como se conoce en la técnica, en donde el producto de expresión del vector de fago se marca con una primera molécula informante coloreada o detectable, para justificar la cantidad de producto de expresión en cada sitio, y el anticuerpo que se enlaza al polipéptido expresado en el fago se marca con una segunda molécula informante coloreada o detectable, que puede distinguirse de la primera molécula informante. Una forma conveniente para interpretar los datos para identificar las moléculas de captura asociadas o específicas para NSCLC enlazadas mediante anticuerpos en muestras NSCLC, es mediante análisis de regresión asistido por computadora de múltiples variables que indica la señal media y la desviación estándar de todos los polipéptidos en el portaobjetos. El tratamiento estadístico se dirige en un fago individual para determinar la especificidad, y también se dirige en una pluralidad de fagos para determinar si un subconjunto de fago puede proporcionar mayor poder predictivo para determinar si una muestra es de un paciente con o que es probable que tenga NSCLC. El tratamiento estadístico de monitoreo de muestras plurales permite determinar el nivel de variabilidad dentro de un análisis. A medida que el muestreo de poblaciones aumenta, la variabilidad puede utilizarse para evaluar entre la variabilidad del análisis y proporcionar parámetros de población confiables . Por tanto, los fagos que se enlazan a anticuerpos en muestras de paciente en mayor gradó que otro fago en el portaob etos, chip etcétera, se consideran candidatos, cuando, por ejemplo, la señal es >1, >2, >3 o más desviaciones estándar desde la línea de regresión (la señal media en el chip) . En algunos experimentos descritos en la presente, los candidatos representaron aproximadamente 1/100 de los polipéptidos visualizados en fago en el chip de detección fabricado con una biblioteca T7 en biopanorámica cuatro veces . Los clones de fago candidato se recopilan en un "chip de diagnóstico" y se evalúan adicionalmente por el - - valor predictivo independiente en muestras de discriminación de pacientes NSCLC a partir de muestras de una población no NSCLC. Los marcadores de diagnóstico se seleccionan por la capacidad de señalizar/detectar/identificar la presencia de o la futura presencia de cáncer de pulmón radiográficamente detectable en un sujeto. Dado que algunas condiciones tienen múltiples etiologías, múltiples orígenes celulares etcétera, y con cualquier enfermedad se presenta en un entorno heterogéneo, un panel o una pluralidad de . marcadores pueden ser más predictivos o diagnósticos de esa condición en particular. El cáncer de pulmón es una de tales condiciones. Como se conoce en las técnicas bioestadísticas, existe un número de esquemas estadísticos diferentes que pueden implementarse para asegurar el poder predictivo colectivo de múltiples variables relacionadas, tal como un panel de marcadores o la reactividad con un panel de marcadores. Por tanto, por ejemplo, un modelo estadístico dinámico puede utilizarse para interpretar los datos a partir de una pluralidad de factores para desarrollar una prueba pronóstico basada en el uso de dos o más de tales factores. Otros métodos incluyen el modelo Bayesian que utiliza probabilidades condicionales, análisis de cuadrados menores, análisis parciales de cuadrados menores, regresión logística múltiple, redes neurales, análisis discriminatorios, análisis - - en base a puntuación sin distribución, combinaciones de los mismos, variaciones de los mismos y etcétera para seleccionar un panel de marcadores adecuado para su inclusión en el análisis diagnóstico. El objetivo es manejar múltiples variables, y después procesar los datos para maximizar una métrica deseada, ver por ejemplo, Pepe & Thompson, Biostatistics 1, 123-140, 2000; Mclntosh & Pepe, Biometrics 58, 657-664, 2002; Baker, Biometrics 56, 1082-1087, 2000; Delong et al., Biometrics 44, 837-845, 1988; y Kendziorski et al., Biometrics 62, 19-27, 2006, por ejemplo. Por tanto, en ciertas circunstancias, el tratamiento estadístico busca maximizar la métrica predictiva, tal como el área debajo de la curva (AÜC) de las curvas de recepción de operación características (ROC) . Los tratamientos generan un procedimiento formuláico o algoritmo para maximizar los resultados que se basan en un conjunto seleccionado de variables, revelando la influencia relativa de cualquiera o todas las variables al resultado maximizado. La influencia relativa de un marcador puede visualizarse en una fórmula derivada que describe la relación como un coeficiente de una variable. Por tanto, por ejemplo, los dos paneles de cinco marcadores identificados en los estudios ejemplificados descritos en la presente más adelante, se seleccionaron a partir de tal análisis, y la AÜC máxima, una marca, se describe mediante una fórmula que incluye los cinco marcadores, con el peso relativo de cualquier marcador en la fórmula para obtener el máximo poder predictivo representado como un coeficiente de esa variable cualquiera. El coeficiente representa una ponderación, y la fórmula derivada puede observarse como una suma de variables ponderadas que producen una suma ponderada. El objetivo es encontrar un balance en la maximización, por ejemplo, especificidad y sensibilidad, o el valor predictivo positivo, sobre una pluralidad seleccionada y preferentemente mínima de variables (los marcadores) para permitir un análisis de diagnóstico robusto en función a esos parámetros. El peso o influencia de una variable para el resultado maximizado se deriva de los datos hasta ahora comprobados y analizados, y recalculados a medida que el número de pacientes analizados aumenta. A medida que el número de pacientes aumenta, también lo hace la confianza de que una métrica representa un valor medio de población con un rango límite de confianza de valores de aproximadamente la media . Como se notará en los ejemplos en la presente más adelante, los paneles de cinco marcadores ejemplificados contienen marcadores que tienen especificidad individual que excede la especificidad observada del escaneo CT. Por tanto, cualquiera de los marcadores que tiene una especificidad mayor que aproximadamente 65% puede utilizarse como ventaja - - como un análisis de diagnóstico para cáncer de pulmón dado que el presente análisis seria tan eficiente diagnosticando el cáncer de pulmón como el estándar actual, y suministrado a menor costo y de manera menos invasiva. También, debe notarse que los cinco marcadores ejemplares para el fago T7 proporcionan conjuntamente un mayor poder predictivo, cualquiera que sea la métrica, que cualquier otro marcador. Los marcadores pueden ser predictivos en diferentes subpoblaciones o la expresión de de dos o más de los marcadores puede coordinarse, por ejemplo, pueden compartir una presencia o función biológica en común. El valor predictivo agregado no es necesariamente aditivo y diferentes combinaciones de marcadores pueden proporcionar diferentes grados de exactitud predictiva. El tratamiento estadístico utilizó un poder predictivo maximizado y la combinación de los cinco marcadores fue el resultado en base a las poblaciones de referencia estudiadas. Por tanto, se prueba una muestra del paciente con los cinco marcadores y el diagnóstico, en principio, se calcula en base a los cinco marcadores, debido a la presencia coordinada de dos o más de los marcadores y a la métrica de diagnóstico en base a la pluralidad de marcadores, tal como uno de los paneles de cinco marcadores mostrados en la presente más adelante. Como se describe en la presente, debido al tratamiento estadístico, tal como la regresión - - logística, cualquiera de las variables que contribuyen a la métrica multivariable puede tener una contribución mayor o menor al total maximizado . Si el paciente tiene una puntuación, una suma y lo similar que es de al menos 30%, al menos 40%, al menos 50%, al menos 60% o mayor de la métrica agregada de los cinco marcadores, incluso en circunstancias en las que un paciente puede ser negativo para uno o más marcadores, debido a que es positivo para algunos o más de los marcadores ponderados más pesados, se considera que es más probable que ese paciente sea positivo para cáncer de pulmón. La puntuación de umbral, suma y o similar, que pueden ser un valor de referencia o estándar, que puede ser un valor medio de población, y el nivel aceptable de similitud de muestra paciente/experimental para esa marca, suma y lo similar para producir un resultado de prueba positivo, indicativo de la posibilidad de la presencia del cáncer de pulmón, es una elección de diseño y puede determinarse mediante un análisis estadístico que proporciona un límite o nivel de confianza para detectar una muestra positiva o puede desarrollarse empíricamente, con el riesgo de un positivo falso. Como se mostró en la presente anteriormente, ese nivel puede ser de al menos 30%, al menos 40%, al menos 50%, al menos 60% o mayor, de la métrica agregada de los cinco marcadores o la suma de población, el valor de referencia etcétera. El umbral o "tolerancia", es decir, el grado de similitud aceptable de la marca, suma y lo similar del paciente a partir de la marca, suma y lo similar de la población, puede aumentar, es decir, la marca del paciente debe encontrarse muy cerca de la marca de población, para aumentar la sensibilidad. El poder predictivo de un marcador o un panel puede medirse utilizando cualquiera de una variedad de estadísticas, tales como, especificidad, sensibilidad, valor predictivo positivo, valor predictivo negativo, exactitud de diagnóstico, AUC, de, por ejemplo, curvas ROC que son una relación entre la especificidad y la sensibilidad, aunque se sabe que la forma de la curva ROC es una consideración relevante del valor predictivo, etcétera, como se conoce en la técnica. El uso de múltiples marcadores permite una prueba de diagnóstico que es más robusta y es más probable que diagnostique a una población mayor debido al mayor poder predictivo agregado de la pluralidad de marcadores considerados conjuntamente en comparación con el uso de cualquier marcador por sí solo. Como se describirá con mayor detalle más adelante, la presente invención contempla el uso de diferentes formatos de análisis. Las micro-instalaciones permiten probar simultáneamente múltiples' marcadores y muestras. Por tanto, un número de controles, positivo y negativo, pueden incluirse en la micro-instalación. Después el análisis puede llevarse a cabo con tratamiento simultáneo de muestras plurales, tales como una muestra de uno o más los pacientes afectados conocidos, y una o más muestras de los normales, junto con una o más muestras que se probarán y compararán, los experimentales, la muestra del paciente, la muestra que se probará etcétera. La inclusión de controles internos en el análisis permite la normalización, calibración y estandarización de la fuerza de señal dentro del análisis. Por ejemplo, cada uno de los controles positivos, controles negativos y experimentales pueden llevarse a cabo en plural, y las muestras plurales pueden ser una dilución serial. Los sitios control y experimental pueden también disponerse aleatoriamente en el dispositivo de micro-instalación para minimizar la variación debida a la ubicación del sitio de muestra sobre el dispositivo de prueba. Por tanto, tal micro-instalación o chip con controles internos permite el diagnóstico de experimentales (pacientes) probados simultáneamente sobre la micro-instalación o chip. Tal método múltiple de prueba y la adquisición de datos de manera controlada permite el diagnóstico de pacientes dentro de un dispositivo de análisis mientras se explican los controles adecuados y si el panel de marcadores son aquellos que tiene individualmente un poder predictivo razonablemente alto, tal como, por ejemplo, una AÜC .para una curva ROC de >.85, y una AUC total a través de los cinco marcadores de > .95 , entonces puede obtenerse un resultado de diagnóstico de punto de cuidado. El análisis puede operarse de forma cualitativa cuando se encuentra que cada uno de los marcadores de un panel tiene características relativamente comparables, tales como aquellas de los ejemplos más adelante. Por tanto, una muestra de paciente con cáncer de pulmón será probablemente positiva para todos los cinco marcadores, y tal muestra, es muy probable que sea positiva para el cáncer de pulmón. Eso se validaría determinando las probabilidades en base a los cinco marcadores como un total como se describe en la presente, obteniendo la suma o marca de una métrica para los cinco marcadores para el paciente y después comparando esa figura con el poder predictivo de los marcadores, derivado utilizando una herramienta estadística como se describió en la presente anteriormente. ün paciente positivo para cuatro de los marcadores, debido a que el poder de los cuatro marcadores probablemente permanece sustancial, también debe ser considerado en riesgo, podría diagnosticarse con cáncer de pulmón y/o debería examinarse con mayor detalle. Un paciente positivo para únicamente tres marcadores puede desencadenar una necesidad de otra prueba, una prueba utilizando otros marcadores, o una prueba radiográfica u otra, o puede llamarse para otra prueba con el presente análisis dentro de otro intervalo de tiempo dado. De aquí que, para un panel de n marcadores, existe una fórmula de poder predictivo derivada, tal como una fórmula de regresión, que define la gráfica de probabilidad máxima que define la relación de los cinco marcadores en el resultado. El paciente puede ser positivo para menos de n marcadores en cuyo caso el paciente puede considerarse positivo o probable positivo para consideración adicional cuando una mayoría, digamos 50% o más de la mitad, de los marcadores se encuentran presentes en ese paciente. También, si el paciente se presenta con signos abiertos potencíaImente sintomáticos de trastorno pulmonar, dado que algunos paneles pueden ser específicos para una enfermedad en particular, tal como NSCLC, -puede ser que el paciente necesite análisis adicional para descartar otros trastornos pulmonares. Por tanto, en cualquier análisis que utilice n marcadores, puede obtenerse un resultado preliminar, cualitativo en base al número en bruto de señales positivas del número total de marcadores probados. Un umbral razonable puede ser resultar positivo para el 50% o más de los marcadores. Por tanto, si se prueban cuatro marcadores, una muestra positiva para 2, 3 o 4 de los marcadores puede presuntamente considerarse como posible portadora de cáncer de pulmón. Si se prueban cinco marcadores, una muestra positiva para 3, 4 o 5 marcadores puede considerarse presuntamente positiva. El umbral puede variar como una elección de diseño. En base a la adquisición y al tratamiento estadístico de datos, desde el punto de vista de una población, un panel de marcadores optimizado puede ser dinámico y puede variar con el tiempo, puede variar con el desarrollo, de nuevos marcadores, puede variar conforme cambia la población, aumentar y etcétera. También, a medida que la población probada aumenta su tamaño, la confianza del subconjunto de marcadores, los coeficientes pesados y la posibilidad de probabilidad precisa de diagnóstico puede ser más precisa si los marcadores se relacionan biológica o mecánicamente, y por tanto las desviaciones, límites de confianza y límites de error disminuirán. Por tanto, la invención contempla también el uso de un subconjunto de marcadores que pueden utilizarse en la población en general. Alternativamente, un dispositivo de análisis de interés puede contener únicamente un subconjunto de marcadores, tal como el panel de cinco marcadores que se utilizan en los ejemplos mostrados en la presente más adelante, que se optimizan para cierta población. Los insertos de clon de fago que codifican para polipéptidos pueden analizarse para determinar la secuencia de aminoácidos del polipéptido expresado. Por ejemplo, los insertos de fago pueden amplificarse con PCR utilizando iniciadores de vector de fago comercialmente disponibles. Los clones únicos se identifican en base a las diferencias en tamaño y en el patrón de digestión de enzimas de los productos de PCR y después los productos de PCR únicos se purifican y se secuencian. Los polipéptidos codificados se identifican mediante comparación con secuencias conocidas, tales como, la base de datos GenBank utilizando el programa de investigación BLAST. Por tanto, por ejemplo, las Tablas 1 y 2 a continuación resumen los clones de fago T7 de ADNc de cáncer de pulmón que se enlazan a un autoanticuerpo en pacientes con cáncer de pulmón.
Clon de ID Putativa- Secuencia Putativa de Secuencia de Nucleótidos Fago # Símbolo Péptidos Genético PC84* ZNF440 TLERNHVNVNSWNP ACACTGGAGAGAAACCATGTGAATG LVILLPIEYIKELTLEKS TAAACAGTGTGGTAAATCCTTTAGTT LMNIRNVGKHFIVPDPI ATTCTGCTACCCATCGAATACATAAA VDMKGFTWEKRLINV AGAACTCACACTGGAGAAAAGCCTT RNVEKHSRVPVMFVY ATGAATATCAGGAATGTGGGAAAGC MKGPTLGKISMNVSSV ATTTCATAGTCCCAGATCCTATCGTA (SEQ ID NO: 1) GACATGAAAGGATTCACATGGGAGA AAAGGCTTATCAATGTAAGGAATGT GGAAAAGCATTCACGTGTCCCCGTTA TGTTCGTATACATGAAAGGACCCACT CTAGGAAAAATCTCTATGAATGTAA GCAGTGTGGGAAAGCATTATCCTCTC TTACAAGTTTTCAAACACACGTAAGA TTGCACTCTGGAGAAAGACCTTATGA ATGTAAGATATTGTGGAAAAGACTTT TGTTCTGTGAATTCATTTCAAAGACA TGAAAAAATTCACAGTGGAGAGAAA CGCTATAAATGTAAGCAGTGTGGTAA AGCCTTCCCTCATTCCAGTTCCCTTC GATATCATGAAAGGACTCACACTGG AGAGAAACCCTATGAGTGTAAGCAA TGTGGGAA (SEQ ID NO: 2) PC87 STK2 GKVDVTSTQKEAENQ RRVVTGSVSSSRSSEM GGGAAGGTGGATGTCACATCAACAC SSSKDRPLSARERRR AAAAAGAGGCTGAAAACCAACGTAG (SEQ ID NO: 3) AGTGGTCACTGGGTCTGTGAGCAGTT CAAGGAGCAGTGAGATGTCATCATC AAAGGATCGACCATTATCAGCCAGA GAGAGGAGGCGAC (SEQ ID NO: 4) PC125 SOCS5 NSSRRNQNCATEIPQIV EISIEKDNDSCVTPGTR AATTCTTCAAGGAGAAATCAAAATT LARPvDSYSRHAPWGG GTGCCACAGAAATCCCTCAAATTGTT KKKHSCSTKTQSSLDA GAAATAAGCATCGAAAAGGATAATG DK F (SEQ ID NO: 5) ATTCTTGTGTTACCCCAGGAACAAGA CTTGCACGAAGAGATTCCTACTCTCG ACATGCTCCATGGGGTGGGAAGAAA AAACATTCCTGTTCTACAAAGACCCA GAGTTCATTGGATGCTGATAAAAAGT TTGG (SEQ ID NO: 6) PC123 RPL4 RNTILRQARNHKLRVD KAAAAAAALQAKSDE CGGAACACCATTCTTCGCCAGGCCG KAAVAGK PWGKK GAATCACAAGCTCCGGGTGGATAAG G (SEQ ID NO: 7) GCAGCTGCTGCAGCAGCGGCACTAC AAGCCAAATCAGATGAGAAGGCGGC GGTTGCAGGCAAGAAGCCTGTGGTA GGTAAGAAAGGAAA (SEQ ID NO: 8) PC88 PRL15 YWVGEDSTYKFFEVIL PCI 14 IDPFHKAIRRNPDTQWI TACTGGGTTGGTGAAGATTCCACATA TKPVHKHREMRGLTS CAAATTTTTTGAGGTTATCCTCATTG PC126* AGRKSRGLGKGH FH ATCCATTCCATAAAGCTATCAGAAGA HTIGGSRRAAWRRRN AATCCTGACACCCAGTGGATCACCA TLQLHRYR AACCAGTCCACAAGCACAGGGAGAT (SEQ ID NO: 9) GCGTGGGCTGACATCTGCAGGCCGA AAGAGCCGTGGCCTTGGAAAGGGCC ACAAGTTCCACCACACTATTGGTGGC TCTCGCCGGGCAGCTTGGAGAAGGC GCAATACTCTCCAGCTCCACCGTTAC CGCTAA (SEQ ID NO: 10) PC40 NPM1 KLLSISGKRSAPGGGS KVPQKKVKLAADED AAACTCTTAAGTATATCTGGAAAGCG (SEQ ID NO: 11) GTCTGCCCCTGGAGGTGGTAGCAAG GTTCCACAGAAAAAAGTAAAACTTG CTGCTGATGAAGATGATGACGATGA TGATGAAGAGGATGATGATGAAGAT GATGATGATGATGATTTTGATGATGA GGAAGCTGAAGAAAAAGCGCCA (SEQ ID NO: 12) G1802 pl30 KPAVTTKSPAVKPA AATTCTTCAAATAAGCCAGCTGTCAC PC20 AAPKQPVGGGQKLLT CACCAAGTCACCTGCAGTGAAGCCA RKADSSSSEEESSSSEE GCTGCAGCCCCCAAGCAACCTGTGG PC22 EKTKKMVATTKPKAT GCGGTGGCCAGAAGCTTCTGACGAG AKAALSLPAKQAPQG AAAGGCTGACAGCAGCTCCAGTGAG SRDSSSDSDSSSSEEEE GAAGAGAGCAGCTCCAGTGAGGAGG EKTSKSAVKKKPQKV AGAAGACAAAGAAGATGGTGGCCAC AGGAAPXKPASAKKG CACTAAGCCCAAGGCGACTGCCAAA KAESSNSSSSDDSSEEE GCAGCTCTATCTCTGCCTGCCAAGCA (SEQ ID NO: 13) GGCTCCTCAGGGTAGTAGGGACAGC AGCTCTGATTCAGACAGCTCCAGCAG TGAGGAGGAGGAAGAGAAGACATCT AAGTCTGCAGTTAAGAAGAAGCCAC AGAAGGTAGCAGGAGGTGCAGCCCC TTCCAAGCCAGCCTCTGCAAAGAAA GGAAAGGCTGAGAGCAGCAACAGTT CTTCTTCTGATGACTCCAGTGAGGAA GAGGA (SEQ ID NO: 14) PC57 NFI-B FPQHHHPGIPGVAHSV TTCCCCCAGCACCACCATCCCGGAAT ISTRTPPPPSPLPFPTQA ACCTGGAGTTGCACACAGTGTCATCT ILPPAPSSYFSHPTIRYP CAACTCGAACTCCACCTCCACCTTCA PHLNPQDTL NYVPSY CCGTTGCCATTTCCAACACAAGCTAT DPSSPQTSQSWYLG CCTTCCTCCAGCCCCATCGAGCTACT (SEQ ID NO: 15) TTTCTCATCCAACAATCAGATATCCT CCCCACCTGAATCCTCAGGATACTCT GAAGAACTATGTACCTTCTTATGACC CATCCAGTCCACAAACCAGCCAGTCC TGGTACCTGGGCTAGCTTGGTTCCTT TCCAAGTGTCAAATAGGACACCCATC TTACCGGCCAATGTCCAAAATTACGG TTTGAACATAATTGGAGAACCTTTCC TTCAAGCAGAAACAAGCAACTGAGG GAAAAAGAAACACAACAATAGTTTA AGAAA (SEQ ID NO: 16) PC94 HMG14 P RRSARLSAKPPAKV CCCAAGAGGAGATCGGCGCGGTTGT EAKPKKAAAKDKSSD CAGCTAAACCTCCTGCAAAAGTGGA K VQTKGKRGA G AGCGAAGCCGAAAAAGGCAGCAGCG QAEVANQETKEDLPA AAGGATAAATCTTCAGACAAAAAAG ENGET TEESPASDEA TGCAAACAAAAGGGAAAAGGGGAGC GEKEAKSD AAAGGGAAAACAGGCCGAAGTGGCT (SEQ ID NO: 17) AACCAAGAAACTAAAGAAGACTTAC CTGCGGAAAACGGGGAAACGAAGAC TGAGGAGAGTCCAGCCTCTGATGAA GCAGGAGAGAAAGAAGCCAAGTCTG ATTAATAACCATATACCATGTCTTAT CAGTGGTCCCTGTCTCCCTTCTTCTA CAATCCAGAGGAATATTTTTATCAAC TATTTTGTAAATGCAAGTTTTTTAGT AGCTCTAGAAACATTTTTAAGAAGG AGGGAATCCCACCTCATCCCATTTTT GTGAAATCATTrGCTGGT GTTTATT (SEQ ID NO: 18) PC16 COX4 AMFFIGFTALVIMWQK GCCATGTTCTTCATCGGTTTCACCGC HYVYGPLPQSFDKEW GCTCGTTATCATGTGGCAGAAGCACT VAKQT RMLDMKVN ATGTGTACGGCCCCCTCCCGCAAAGC PIQGLASKWDYEK E TTTGACAAAGAGTGGGTGGCCAAGC WKK (SEQ ID NO: 19) AGACCAAGAGGATGCTGGACATGAA GGTGAACCCCATCCAGGGCTTAGCCT CCAAGTGGGACTACGAAAAGAACGA GTGGAAGAAGTGAGAGATGCTGGCC TGCGCCTGCACCTGCGCCTGGCTCTG TCACCGCCA (SEQ ID NO: 20) PC112 SF S11 ATKKKS DKEKDRER GCAACGAAGAAGAAGAGTAAAGATA KSESDKDVKVTRDYD AGGAAAAGGACCGGGAAAGAAAATC EEEQGYDSEKEKKEE AGAGAGTGATAAAGATGTAAAAGTT KPIETGSPKTKECSVEK ACACGGGATTATGATGAAGAGGAAC GTGDS (SEQ ID NO: 21) AGGGGTATGACAGTGAGAAAGAGAA AAAAGAAGAGAAGAAACCAATAGA AACAGGTTCCCCTAAAACAAAGGAA TGTTCTGTGGAAAAGGGAACTGGTG ATTCACT (SEQ ID NO: 22) PC91 AKAP12 ESFKRLVTPRKKSKSK GAGTCATTTAAAAGGTTAGTCACGCC LEEKSEDSIAGSGVEH AAGAAAAAAATCAAAGTCCAAGCTG STPDTEPGKEESWVSI GAAGAGAAAAGCGAAGACTCCATAG KKFIPGRRKKRPDGKQ CTGGGTCTGGTGTAGAACATTCCACT EQAPVEDAGPTGANE CCAGACACTGAACCCGGTAAAGAAG DDSDVPAWPLSEYD AATCCTGGGTCTCAATCAAGAAGTTT AVERE (SEQ ID NO: 23) ATTCCTGGACGAAGGAAGAAAAGGC CAGATGGGAAACAAGAACAAGCCCC TGTTGAAGACGCAGGGCCAACAGGG GCCAACGAAGATGACTCTGATGTCCC GGCCGTGGTCCCTCTGTCTGAGTATG ATGCTGTAGAAAGGGAGAA (SEQ ID NO: 24) L1804 GAGE NSAPEQFSDEVEPATP AATTCAGCGCCCGAGCAGTTCAGTG L1862 EEGEPATQRQDPAAA ATGAAGTGGAACCAGCAACACCTGA QEGEDEGASAGQGPK AGAAGGGGANCCAGCAACTCAACGT L1864 PEAHSQEQGHPQTGCE CAGGATCCTGCAGCTGCTCAGGAGG L1873 CEDGPDGQEMDPPNP GAGAGGATGAGGGAGCATCTGCAGG EEVKTPEEGEKQSQC TCAAGGGCCGAAGCCTGAAGCTCAT (SEQ ID NO:25) AGTCAGGAACAGGGTCACCCACAGA CTGGGTGTGAGTGTGAAGATGGTCCT GATGGGCAGGAGATGGACCCGCCAA ATCCAGAGGAGGTGAAAACGCCTGA AGAAGGTGAAAAGCAATCACAGTGT TAAAAGAAGGCACGTTGAAATGATG CAGGCTGCTCCTATGTTGGAAATTTG TTCATTAAAATTCTCCCAATAAAGCT T (SEQ ID NO: 26) * La porción alfabética del nombre del clon de fago en esta y las siguientes tablas se fija como una designación de laboratorio. Como se utiliza en la presente, la porción numérica del nombre del clon de fago es una identificación no ambigua de un, clon. ** Clones redundantes. La Tabla 2 proporciona otros clones identificados como asociados con NSCLC que no parecen codificar para un polipéptido conocido.
Clon de DO Putativa- Secuencia Putativa de Secuencia de Nucleótidos Fago # Simbolo Péptidos Genético L1896 BAC Clone NSCSSFSRWKVEGTQN AATTCCTGTAGCTCATTCAGCCGATG RP11-499F19 FRPNSAFYLAPRMKGL GAAGGTAGAAGGGACTCAGAACTTC FVNLHVDLF IQPAENG AGGCCTaATTCTGCGTTTTTGTATGCC R (SEQ ID NO:30) CCAAGAATGAAAGGGCTCTTTGTGA ATTTGCATGTAGATTTATTTAACATT CAACCGGCAGAAAACGGAAGGTAGT GCATGACACTGGGGGGAACCAGGCC CCCGCCCACCTCACATCGTCATGGCA TTAGCTGTTTACTGGCTCCCGTGGAA ACATTGGAAGGGGATT GTTTTGTGG TTGGGTTTCCTTTTTITITITI ^ (SEQ ID NO: 31) G922 Placofilina NSAWNCGAPRIADGW AATTCAGCATGGAACTGTGGAGCTCC SHRFSRYWKSTKDIQPT AAGGATCGCAGACGGCGTTGTATCG KYPYIP K (SEQ ID CACAGGTTCAGTAGGTATTGGAAATC NO:32) TACAAAGGACATCCAGCCAACGAAG TACCCTTACATACCAAAGAAATAATT ATGCTCTGAACACAACAGCTACCTAC GCGGAGCCCTACAGGCCTATACAAT ACCGAGTGCAAGAGTGCAATTATAA CAGGCTTCAGCATGCAGTGCCGGCTG ATGATGGCACCACAAGATCCCCATC AATAGACAGCATTCAGGATCACGCC AGGCAAACTCCCTGGGGTCCTTCTGA (SEQ ID NO: 33) L1919 SEC15L2 NS SLPLS ATELLLGREV AATTCTTCACTACCTTTGTCAGCTAC LPCPSPTPLPHHILSYLD TGAGTTGCTTCTGGGGAGGGAAGTA SHGEEDVHTDIQISSKL CTTCCTTGCCCCTCCCCAACCCCCCT ERPGYM (SEQ ID NO:34) ACCTCACCATATCCTATCATATCTTG ATAGTCATGGGGAAGAGGATGTGCA CACAGACATACAAATTTCCTCAAAGC TGGAGAGACCAGGCTACATGTGAGC TCATAGATGCTGCTGAGGCTCATCCT GAGGGCTGGATGGTTGGCCAGGGTT TCAGAATGAGGGTAAGGGATGAGCA CTGCCACCCA (SEQ ID NO: 35) L1761 PMS2L15 NSASH (SEQ ID NO:36) AATTCAGCATCTCATTGAAGTTTCAG GCAATGGATGTGGGGTAGAAGAAGA AAACTNCGNAGGCTTAATCTCTTTCA GCTCTGAAACATCACACATCTAAGAT TCGAGAGTTTGCCGACCTAACTCGGG TTGAAACTTTTGGCTTTCAGGGGAAA GCTCTGAGCTCACTTTGTGCACTGAG TGATGTCACCATTTCTACCTGCCACG TATCGGCGAAGGTTGGGACTCGACT GGTGTTTGATCACGATGGGAAAATC ATCCAGAAAACCCCCTACCCCCACCC CAGAGGGACCACAGTCAGCGTGAAG CAGTTATTTTCTACGCTACCTGTGCG CCATAAGGAATTTCAAAGGAATATT AAGAAGTACAGAACCTGCTAAGGCC ATCAAACCTATTGATCGGAAGTCAGT CCATCAGATTTGCTCTGGGCCGGTGG TACTGAGTCTAAGCACTGCGGTGAA GAAGATAGTAGGAAACAGTCTGGAT GCTGGTGCCACTAATATTGATCTAAA GCTTGCGGCCGCACTC (SEQ ID NO: 37) L1747 EEFIA NSASICANFWLEW AATTCAGCTAGCATTTGTGCCAATTT (SEQ ID NO:38) CTGGTTGGAATGGTGACAACATGCTG GAGCCAAGTGCTAACATGCCTTGGTT CAAGGGATGGAAAGTCACCCGTAAG GATGGCAATGCCAGTGGAACCACGC TGCTTGAGGCTCTGGACTGCATCCTA CCACCAACTCGTCCAACTGACAAGCC CTTGCGCCTGCCTCTCCAGGATGTCT ACAAAATTGGTGGTATTGGTACTGTT CCTGTTGGCCGAGTGGAGACTGGTGT TCTCAAACCCGGTATGGTGGTCACCT TTGCTCCAGTCAACGTTACAACGGAA GTAAAATCTGTCGAAATGCACCATG A (SEO ID NO: 39) G1954 MAL ATI NFKRQEFQIENEKQAKT AATTTCAAGCGGCAAGAGTTTCAGAT SIGEV (SEQ ID NO:40) AGAAAATGAAAAACAAGCTAAGACA AGTATTGGAGAAGTATAGAAGATAG AAAAATATAAAGCCAAAAATTGGAT AAAATAGCACTGAAAAAATGAGGAA ATTATTGGTAACCAATTTATTTTAAA AGCCCATCAATTTAATTTCTGGTGGT GCAGAAGTTAGAAGGTAAAGCTTGA GAAGATGAGGGTGTTTACGTAGACC AGAACCAATTTAGAAGAATACTTGA AGCTAGAAGGGGA (SEQ ID NO: 41) G1689 XRCC5 NSAWERGHSRGAKISR AATTCAGCTTGGGAACGCGGCCATTC NSQQVTWRRII (SEQ ID AAGGGGAGCCAAAATCTCAAGAAAT NO:42) TCCCAGCAGGTTACCTGGAGGCGGA TCATCTAATTCTCTGTGGAATGAATA CACACATATATATTACAAGGGATA (SEO ID NO: 43) G740 CD44 NSVLNECWLQNQFLVL AATTCAGTATTGAATGAATGTTGGCT variante 5 de YQRSRREETFDLSGKA ACAAAATCAATTCTTGGTGTTATATC transcripción KCT (SEQ ID NO:44) AGAGGAGTAGGAGAGAGGAAACATT TGACTTATCTGGAAAAGCAAAATGT ACTTAAGAATAAGAATAACATGGTC CATTCACCTTTATGTTATAGATATGT CTTTGTGTAAATCATTTGTTTTGAGTT TTCAAAGAATAGCCCATTGTTCATTC TTGTGCTGTACAATGACCACTGNTTA TTGTTACTTTGACTTTTCAGAGCACA CCCTTCCTCTGGTTTTTGTATATTTAT TGATGGATCAATAATAATGAGGAAA GCATGATATGTATATTGCTGAGTTGT TAGCCTTTTA (SEQ ID NO: 45) G313 Paxilina NSRPKRVQHPSTSFSEE AATTCTAGGCCCAAAAGGGTGCAAC G1750 (PXN) LAGLGSKEGVSKYSSL ACCCTTCAACCAGTTTCAGTGAAGAG G1792 (SEQ ID NO:46) CTTGCTGGCCTGGGAAGTAAAGAAG G1896 GGGTTTCCAAATACAGCAGTTTATAA G1923 AACAGTCCTGGTGAGCTATGAAGTG G2004 AAAGAGGGGGAGTCACAGAGCTGCT L1839 CCCAGTTCACCTGCTTGTGCTAAGAA L1857 ACAATAAAATACAAATTGCTTCCCCA CCCCAACCCTCAGTACAAAGCAAAC TTCACACCAGAGCCACCATCAGTGAC AGGCCCAGTGGCGGTGGATGAGGAA GCTT (SEQ ID NO: 47) L1676 BMI-1 NSARDRGETMGMWAR AATTCAGCCAGAGATCGGGGCGAGA L1829 EPRSGLAAPPSPAE CAATGGGGATGTGGGCGCGGGAGCC L1841 (SEQ ID NO:48) CCGTTCCGGCTTAGCAGCACCTCCCA L1916 GCCCCGCAGAATAAAACCGATCGCG CCCCCTCCGCGCGCGCCCTCCCCCGA GTGCGGAGCGGGAGGAGGCGGCGGC GGCCGAGGAGGAGGAGGAGGAGGC CCCGGAGGAGGAGGCGTTGGAGGTC GAGGCGGAGGCGGAGGAGGAGGAG GCCGAGGCGCCGGAGGAGGCCGAGG CGCCGGAGCAGGAGGAGGCCGGCCG GAGGCGGCATGAGACGAGCGTGGCG GCCGCGGCTGCTCGGGGCCGCGCTG GTTGCCCATTGACAGCGGCGTCTGCA GCTCGCTTCAAGATGGCCGCTTGGCT CGCATTCATTTTCTGCTGAACGACTT TTAACTTTCATTGTCTTTTCCGCCCGC TTCGATCGCCTCGCGCCGGCTGCTCT TTCCGGGATTTTTTATCAAGCAGAAA TGCATCGAACAACGAGAATCAAGAT CACTGAGCTAAATCCCCACCTGATGT GTGTGCTTTGTGGAGGGTACTTCATT GATGCCACAAC (SEQ ID NO: 49) También pueden utilizarse bibliotecas de péptido aleatorias para identificar polipéptidos candidato que se enlazan a anticuerpos circulantes en pacientes de NSCLC pero no en normales. Por tanto, por ejemplo, una biblioteca de péptido de visualización fago que comprende 109 péptidos aleatorios fusionados a una proteina de recubrimiento de virus menor puede detectarse para capturar proteínas que se enlazan al anticuerpo del paciente con cáncer de pulmón utilizando técnicas similares a la descrita anteriormente, tal como utilizando micro-instalaciones, y como se conoce en la técnica. Una biblioteca M13 que se utilizó (New England Biolabs) expresa un inserto de polipéptido de 7 aminoácidos como una estructura de bucle en la superficie del fago. Como se describe en la presente, la biblioteca es biopanorámica para enriquecer las proteínas de expresión fago que se reconocen específicamente por los anticuerpos circulantes en el suero del paciente de NSCLC. Los cultivos de fago de clones seleccionados se pueden localizar de forma robótica (Affymetrix, Santa Clara, CA; Arraylt®, Sunnyvale, CA) en duplicado sobre portaobjetos (Schleicher and Schuell, Keene, NH) . Los fagos dispuestos se incuban con una muestra de suero o plasma de un paciente con NSCLC para identificar las proteínas que expresan fago enlazadas por anticuerpos circulantes asociados con el tumor pulmonar. Utilizando un inmunoanálisis conocido, con moléculas informantes adecuadas, las líneas de regresión generadas por computadora que indican la señal media y la desviación estándar de todos los polipéptidos en el portaobjetos, se utilizan para identificar péptidos que se enlazaron por anticuerpos en el plasma del paciente de NSCLC. Las cantidades significativas de enlace fago del anticuerpo de una muestra de plasma NSCLC (por ejemplo, >2 desviaciones estándar a partir de la línea de regresión) se consideran candidatos para evaluación adicional.
TABLA 3 Clones Mi 3 ID de Secuencia de Nucleótidos Secuencia de Aminoácidos Fago (3 letras) MC0425 AAG GAG ACG AGT CGT TTT ACG Lys Glu Thr Ser Arg Phe Thr (SEQ ID NO:50) (SEQ ID NO:51) MC0457 ATT GTG AAT AAG CAT AAG GTT lie Val Asn Lys His Lys Val (SEQ ID NO:52) (SEQ ID NO:53) MC0838 CCG CCG GCG ACG CAG GGG CAT Pro Pro Ala Thr Gln Gly His (SEQ ID NO:54) (SEQ ID NO:55) MC0908 GAG CGG TCT CTG AGT CCG ATT Glu Arg Ser Leu Ser Pro lie - (SEQ ID NO:56) (SEQ ID NO:57) MC0919 TTG AGT CAG AAT CCG CAT AAG Leu Ser Gln Asn Pro His Lys (SEQ ID NO:58) (SEQ ID NO:59) MC0996 ATT CAT AAT AAG TGG GGG TAT lie His Asn Lys Cys Gly Tyr (SEQ ID NO:60) (SEQ ID NO:61) MC1000 TCT AAT AAT AGT ATT CAT CAG Ser Asn Asn Ser lie His Gln (SEQ ID NO:62) (SEQ ID NO:63) MC1011 AGT ATG ACG CAG TCG GAT AAG Ser Met Thr Gln Ser Asp Lys (SEQ ID NO:64) (SEQ ID NO:65) MC1326 ATT GCT AAG GGT ACT CCG CTG lie Ala Lys Gly Thr Pro Leu (SEQ ID NO:66) (SEQ ID NO:67) MC0425 AAG GAG ACG AGT CGT TTT ACG Lys Glu Thr Ser Arg Phe Thr (SEQ ID NO:50) (SEQ ID NO:51) MC1484 AAT GCG AGT CAT AAG TGT TCT Asn Ala Ser His Lys Cys Ser (SEQ ID NO:68) (SEQ ID NO:69) MC1509 AAT GCG CTG GCT AAT CCT TCG Asn Ala Leu Ala Asn Pro Ser (SEQ ID NO:70) (SEQ ID NO:71) MC1521 GCG AAG CCG CCG AAG CTG TCT Ala Lys Pro Pro Lys Leu Ser (SEQ ID NO:72) (SEQ ID NO:73) MC1524 AGG GCT CTG GAT CCG GAT TCG Arg Ala Leu Asp Pro Asp Ser (SEQ ID NO:74) (SEQ ID NO:75) MC1694 CAT CAG CAT CCT CAT CAT ACT His Gln His Pro His His Thr (SEQ ID NO:76) (SEQ ID NO:77) MC1760 TTA TCT ACT GGG TCG GGT CTG Leu Ser Thr Gly Ser Pro Leu (SEQ ID NO:78) (SEQ ID NO:79) MC1786 AAG GTT AAT ACT CAT CAT ACT Lys Val Asn Thr His His Thr (SEQ ID NO:80) (SEQ ID NO:81) MC1805 ATT CTG ACT CTT CAT AAG AGT lie Leu Thr Leu His Lys Ser (SEQ ID NO: 82) (SEQ ID NO:83) MC2238 MC2628 AAG AAT TGG TTT GGT CAT ACG Lys Asn Trp Phe Gly His Thr MC2978 (SEQ ID NO:84) (SEQ ID NO:85) MC3018 MC2434 GGT ACT AGT CAG AAG GAG ACG Gly Thr Ser Gln Lys Glu Thr (SEQ ID NO:86) (SEQ ID NO: 87) MC2541 CTG TTT CTG ACG GCG CAG GCG Leu Phe Leu Thr Ala Gln Ala (SEQ ID NO:88) (SEQ ID NO:89) MC2624 GCG CAT GTG CCG AAG CAG ACG Ala His Val Pro Lys Gln Thr (SEQ ID NO:90) (SEQ ID NO:91) MC2645 TTT AAT TGG TAT AAT TCG TCG Phe Asn Trp Tyr Asn Ser Ser MC2720 (SEQ ID NO:92) (SEQ ID NO:93) MC2729 CTT CCG CAT CAG CTG CGG TGG Leu Pro His Gln Leu Ala Trp (SEQ ID NO:94) (SEQ ID NO:95) MC2853 CTT GCG TGG TAT GCG AAG AGT Leu Ala Trp Tyr Ala Lys Ser (SEQ ID NO:96) (SEQ ID NO:97) MC2900 AAG ATT GGG ACG GCG TGG CTT Lys lie Gly Thr Ala Trp Leu (SEQ ID NO:98) (SEQ ID NO:99) MC2984 ACG CTG AAT CAG ACG AGG GTG Thr Leu Asn Gln Thr Arg Val (SEQ ID NO: 100) (SEQ ID NO: 101) MC2986 ACG CCT ACT CAT GGT GGG AAG Thr Pro Thr His Gly Gly Lys (SEQ ID NO: 102) (SEQ ID NO: 103) MC2987 ACT GTG AAT GCT AAG GGT TAT Thr Val Asn Ala Lys Gly Tyr (SEQ ID NO: 104) (SEQ ID NO: 105) MC2993 CAT ACG ACT TCG CCG TGG ACG His Thr Thr Ser Pro Trp Thr (SEQ ID NO: 106) (SEQ ID NO: 107) MC2996 ACT CCT ACT TAT GCG GGG TAT Thr Pro Thr Tyr Ala Gly Tyr (SEQ ID NO: 108) (SEQ ID NO: 109) MC2997 TCG CCT ACG CAT GCT GGG CTG Ser Pro Thr His Ala Gly Leu (SEQ ID NO: 110) (SEQ ID NO: 111) MC2998 ATG CCG GCT ACT ACG CCT CAG Met Pro Ala Phr Phr Pro Gln (SEQ ID NO: 112) (SEQ ID NO: 113) MC3000 AAG GCG TGG TTT GGG CAG ATT Lys Ala Trp Phe Gly Gln lie (SEQ ID NO:114) (SEQ ID NO: 115) MC3001 CCT CCG CTT CAT AAG TGT AGT Pro Pro Leu His Lys Cys Ser (SEQ ID NO: 116) (SEQ ID NO: 117) MC0425 AAG GAG ACG AGT CGT TTT ACG Lys Glu Thr Ser Arg Phe Thr (SEQ ID NO:50) (SEQ ID NO:51) MC3007 AAG CAT GAG ACT AAT CAG TGG Lys His Glu Thr Asn Gln Trp (SEQ ID NO: 118) (SEQ ID NO: 119) MC3010 MC3063 CAG TCT TAT CAT AAG CGT ACT Gln Ser Tyr His Lys Arg Thr MC3008 (SEQ ID NO:120) (SEQ ID NO: 121) MC3146 MC3013 AAG AAT CAG ACT AAT AAT ATT Lys Asn Gln Thr Asn Asn lie (SEQ ID NO:122) (SEQ ID NO: 123) MC3014 CAG ATG CCG CAT TCT AAG ACG Gln Met Pro His Ser Lys Thr (SEQ ID NO: 124) (SEQ ID NO: 125) MC3015 MC3045 ACG GCG CTT CAT CAG CTT AGT Thr Ala Leu His Gln Leu Ser MC3047 (SEQ ID NO:126) (SEQ ID NO: 127) MC3055 MC3019 CTT TCG CAT ATT TCT ACG TCG Leu Ser His lie Ser Thr Ser (SEQ ID NO: 128) (SEQ ID NO: 129) MC3020 GCT TCT GTT CCG AAG CGG TCT Ala Ser Val Pro Lys Arg Ser (SEQ ID NO:130) (SEQ ID NO: 131) MC3023 CAT ACT CAT CAT GAT AAG CAT His Thr His His Asp Lys His (SEQ ID NO: 132) (SEQ ID NO: 133) MC3032 AAT TTG CAT GCT GCT CGG CCT Asn Leu His Ala Ala Arg Pro (SEQ ID NO: 134) (SEQ ID NO:135) MC3033 GAT TCG TCG CCT TCT CCG CTT Asp Ser Ser Pro Ser Pro Leu (SEQ ID NO:136) (SEQ ID NO: 137) MC3046 ATT ACG AAT AAG TGG GGG TAT lie Thr Asn Lys Trp Gly Tyr (SEQ ID NO: 138) (SEQ ID NO: 139) MC3048 GTG GTT AAT AAG CAT AAT ACG Val Val Asn Lys His Asn Thr (SEQ ID NO: 140) (SEQ ID NO: 141) MC3050 CTG AAT ACG CAT TCG TCT CAG Leu Asn Thr His Ser Ser Gln (SEQ ID NO: 142) (SEQ ID NO: 143) MC3052 AGT GGT ACG TCT CCT CAT TTG Ser Gly Thr Ser Pro His Leu (SEQ ID NO: 144) (SEQ ID NO: 145) MC3058 TTG GCG GAT CAG CTG CCG ACT Leu Ala Asp Gln Leu Pro Ser (SEQ ID NO: 146) (SEQ ID NO: 147) MC3059 AAG GTG GGG CGT CTG CCT GAT Lys Val Gly Arg Leu Pro Asp (SEQ ID NO: 148) (SEQ ID NO: 149) MC3096 ACT AAG ACT TGG TAT GGG TCG Thr Lys Thr Trp Tyr Gly Ser MC3127 (SEQ ID NO: 150) (SEQ ID NO:151) MC3100 ATT ACT TCT TGG TAT GGG CGT lie Thr Ser Trp Tyr Gly Arg (SEQ ID NO: 152) (SEQ ID NO: 153) MC3130 CCT TCT AGT AGT AAG GAG GAG Pro Ser Ser Ser Lys Glu Glu (SEQ ID NO: 154) (SEQ ID NO: 155) MC3135 TCT CCG ATT TCT CTT AAG GTG Ser Pro lie Ser Leu Lys Val (SEQ ID NO:156) (SEQ ID NO: 157) MC3143 GGG GGT GCG TGG GAG GAT CCG Gly Pro Ala Trp Glu Asp Pro (SEQ ID O:158) (SEQ ID NO: 159) MC3148 CCT CAG GCG TCT AAT CCG CTT Pro Gln Ala Ser Asn Pro Leu (SEQ ID NO:160) (SEQ ID NO: 161) MC3156 AGT GAT AAG CAG CCT AAG GAT Ser Asp Lys Gln Pro Lys Asp (SEQ ID NO:162) (SEQ ID NO: 163) Ciertos aminoácidos de los péptidos de interés pueden reemplazarse por otro aminoácido u otra molécula, siempre que el péptido retenga la capacidad para enlazarse a un autoanticuerpos de diagnóstico de interés. Por tanto, por ejemplo un aminoácido puede reemplazarse por otro aminoácido. Generalmente, el aminoácido de reemplazo es uno con una cadena lateral de tamaño, forma y/o carga similar. Por ejemplo, Ala (A) puede reemplazarse con Val (V), Leu (L) o lie (I) ; Arg (R) puede reemplazarse con Lys (K) , Gln (Q) o Asn (N) ; N puede reemplazarse con Q, His (H) , K o R; Asp (D) puede reemplazarse con Glu (E) ; Cys (C) puede reemplazarse con Ser (S) ; Q puede reemplazarse con N; E puede reemplazarse con D; Gly (G) puede reemplazarse con Pro (P) o A; H puede reemplazarse con N, Q, K o R; I puede reemplazarse con L, V, Met (M) , A, Phe (F) o norL; L puede reemplazarse con norL, I, V, M, A o F; K puede reemplazarse con R, Q o N, M puede reemplazarse con L, F o I; F puede reemplazarse con L, V, I, A o Tyr (Y) ; P puede reemplazarse con A; S puede reemplazarse con Thr (T) ; T puede reemplazarse con S; Trp (W) puede reemplazarse con Y o F; Y puede reemplazarse con W, F, T o S; y V puede reemplazarse con I, L, M, F, ? o norL . Como se muestra en la presente, un péptido modificado puede determinarse como utilizable en la presente invención mediante la sustitución del péptido modificado para el pariente en el presente inmunoanálisis y el nivel de enlace de una muestra de plasma de un paciente con cáncer de pulmón puede compararse con el del péptido de origen. El enlace que es sustancialmente el mismo o mejor es aceptable. Se entenderá también que pueden hacerse varios cambios en la secuencia de ácido nucleico, siempre que el polipéptido expresado continúe enlazado al autoanticuerpo de cáncer de pulmón. Esto puede determinarse mediante cualquiera de los análisis de enlace mostrados en la presente, haciendo una comparación con el polipéptido expresado en la secuencia de clon de origen no modificada. El objetivo de la detección de alto rendimiento de ¦bibliotecas no es identificar todas las proteínas específicas de cáncer, sino por el contrario, identificar un cohorte de marcadores de predicción que como panel puede utilizarse para predecir la inclusión de un sujeto dentro de un cohorte de cáncer de pulmón o no con un grado máximo de especificidad y sensibilidad. Como tal, el procedimiento no se dirige a generar un perfil proteómico completo, o a identificar per se, proteínas de la enfermedad, tales como proteínas de cáncer de pulmón, sino a identificar un número de marcadores que predicen enfermedad y cuando se agregan como un panel, permiten un análisis de predicción robusto para una enfermedad heterogénea en una población heterogénea. Cualquier marcador puede tener o puede no tener un papel directo en la oncogénesis pulmonar, o como un péptido, el papel real de la molécula de la cual se origina el péptido puede ser desconocido en el presente. Medición del enlace de anticuerpo a proteínas de captura individuales La captura de proteínas recopiladas en un chip de diagnóstico puede utilizarse para medir la cantidad relativa de anticuerpos específicos de cáncer de pulmón en una muestra de sangre. Esto puede lograrse utilizando una variedad de plataformas, diferentes formulaciones del polipéptido (e . g . , expresados en fago, derivados de ADNc, biblioteca de péptido o proteína purificada) , y diferentes permutaciones estadísticas que permiten la comparación entre y conjuntamente con las muestras. La comparación requerirá que las mediciones se estandaricen, ya sea mediante calibración externa o normalización interna. Por tanto, en la instalación de portaobjetos de vidrio ejemplificada comprendida de múltiples proteínas de captura de expresión de fago (por ejemplo, fago M13 y T7 ) y múltiples proteínas de control externo negativas (fagos no enlazados mediante anticuerpos en plasmas de paciente y fagos M13 o T7 que carecen de insertos - llamados fagos "vacíos") utilizando un inmunoanálisis como medio de exploración, los datos se normalizaron mediante marcado fluorescente de dos colores de cápsidos de fago y enlace de anticuerpo de muestra de plasma utilizando dos procedimientos estadísticos no limitados: Proporción de la señal anticuerpo/cápsido fago Las proteínas de captura identificadas en la detección, los múltiples fagos no reactivos, más los fagos "vacíos" en chips de diagnóstico únicos se incuban con muestra (s) utilizando técnicas inmunoquímicas estándar y tintado de doble color. La señal media (o media) del enlace de anticuerpo a la proteína de captura se divide entre la señal media (o media) de un anticuerpo comercial contra la proteína de cápsido de fago para justificar la cantidad total de proteína en el punto. Por tanto, la proporción de señal de plasma/cápsido de fago (por ejemplo, la proporción de señal Cy5/Cy3) proporciona una medición normalizada de los anticuerpos humanos contra una única proteína de expresión de fago. Las mediciones pueden después normalizarse adicionalmente sustrayendo la reactividad de fondo contra el fago vacío y dividiéndola entre la señal media de fago (o media) , [ (Cy5/Cy3 de fago) - (Cy5/Cy3 de fago vacío) / (Cy5/Cy3 del fago vacío) ] . Esta metodología es cuantitativa, reproducible, y compensa la variabilidad de chip-a-chip, permitiendo la comparación de las muestras. Residual estandarizado Las proteínas de captura identificadas en la detección, los fagos múltiples no reactivos, más los fagos "vacíos" en chips de diagnóstico únicos se incuban con muestra (s) utilizando técnicas inmunoquímicas estándar y tintado de doble color. La distancia desde una línea de regresión estadísticamente determinada se mide, después se estandariza dividiendo esa medida entre la desviación residual estándar. Este procedimiento produce además una medida confiable de la cantidad del enlace de anticuerpo a cada proteína única de expresión de fago sobre la cantidad de proteína en cada punto, es cuantitativa, reproducible, y compensa la variabilidad de chip-a-chip, permitiendo la comparación de las muestras. Tal normalización de señal puede utilizarse con los desconocidos que serán probados en un análisis de diagnóstico para determinar si un paciente es positivo o no para un marcador. El análisis puede basarse en una determinación cualitativa de la presencia de anticuerpo, por ejemplo, cualquier valor normalizado por encima del fondo se considera una evidencia de ese anticuerpo. Alternativamente, el análisis puede cuantificarse determinando la resistencia de la señal para un marcador, como un reflejo del vigor de la respuesta del anticuerpo. Por tanto, el valor numérico real normalizado de una reacción a un marcador puede utilizarse en la determinación de fórmula de diagnóstico de cáncer como se describe en la presente. Identificación de marcadores de predicción Las mediciones normalizadas para todas las proteínas candidato de expresión de fago pueden analizarse independientemente por las diferencias estadísticas significativas entre un grupo de paciente y un grupo normal, por ejemplo, mediante prueba t utilizando software estadístico J P (SAS, Inc., Cary, NC) . Varias combinaciones de marcadores con diferentes niveles de discriminación independiente para las muestras probadas pueden combinarse estadísticamente en una variedad de formas. El tratamiento estadístico es aquel que compara, de forma analítica multivariable, todos los marcadores en varias combinaciones para obtener un panel de marcadores con máxima probabilidad de ser asociados con la presencia de enfermedad. Como en cualquier población estadística, la selección de marcadores se dicta por el nombre y tipo de muestras utilizadas. Como tal, una "combinación de marcadores óptima" puede variar de población a población o basarse en la etapa de la anomalía, por ejemplo. Una combinación de marcadores óptima puede alterarse cuando se prueba en un conjunto de muestras grande (>1000) en base a la variabilidad que puede no ser aparente en dimensiones de muestra más pequeñas (<100) o puede demostrar desviación reducida debida a la validación predominante en la población del marcador. La regresión logística ponderada es un procedimiento lógico para combinar marcadores con un valor de predicción independiente mayor y menor. Una combinación de marcadores óptima para discriminar muestras probadas puede definirse organizando y analizando los datos utilizando curvas ROC, por ejemplo. Predicción de clase Las respuestas estandarizadas para todas las proteínas candidato de expresión de fago se analizan independientemente para diferencias estadísticamente significativas entre un grupo de paciente y un grupo normal, por ejemplo, mediante prueba t. El tratamiento estadístico es aquel que compara, de forma analítica multi ariable, todos los marcadores en varias combinaciones para obtener un panel de marcadores con máxima probabilidad de asociarse con la presencia de cáncer. Los paneles (la medidas combinadas de dos o más marcadores) ejemplificados en la presente para cáncer de pulmón tienen un alto valor de predicción combinado y demuestran una excelente discriminación (cáncer si vs . cáncer no) . Aunque la presente invención incluye paneles de péptido particulares que se seleccionaron por la capacidad para discriminar entre muestras disponibles de cáncer y normales, se apreciará que la invención se ha desarrollado utilizando algunos, pero no todos los marcadores identificados, y no todos los marcadores potencialmente identificables , o combinaciones de los mismos. Por tanto, un panel puede comprender al menos dos marcadores; al menos tres marcadores; al menos cuatro marcadores; al menos cinco marcadores; al menos seis marcadores; al menos siete marcadores; al menos ocho marcadores; al menos nueve marcadores; al menos diez marcadores y asi sucesivamente, el número de marcadores se rige por el análisis estadístico para obtener la máxima capacidad de predicción de los resultados. Por tanto, por ejemplo, los ejemplos y paneles descritos en la presente son únicamente ejemplos. Desde un punto de vista estadístico, la inclusión de marcadores adicionales finalmente llevará a una prueba que identificará todos los individuos afectados en una muestra. Sin embargo, una modalidad comercial puede no requerir o necesitar o desear un gran número de marcadores debido a consideraciones de costo, los tratamientos estadísticos que pueden requerirse debido a que un gran número de variables se consideran, quizá la necesidad de un mayor número de controles reduciendo por · consiguiente el número de experimentales que pueden probarse al mismo tiempo etcétera. La comercialidad tiene diferentes puntos finales desde la certeza científica. Sin embargo, la observación de que un mayor número de marcadores o un panel de marcadores diferentes pueden mejorar la sensibilidad y/o la especificidad, conduce a la modalidad en donde los estudios de seguimiento subsecuentes para un análisis positivo con un número menor de marcadores, probará la muestra de paciente con un número menor o mayor de marcadores, o un panel de marcadores diferente para descartar la posibilidad de un positivo falso. Tales estudios de seguimiento utilizando un análisis de interés con un panel de biomarcadores reconfigurado es una alternativa atractiva a técnicas más costosas y potencialmente invasivas, tales como CT que exponen al paciente a niveles altos de radiación, o una biopsia. Por tanto, por ejemplo, un paciente positivo para tres o menos de un panel de cinco marcadores, puede probarse con un panel de marcadores más grande como una prueba confirmatoria. El presente análisis puede servir también como confirmación de otro formato de análisis, tal como una detección de rayos X o CT, particularmente si la detección de rayos X o CT es aquella que no proporciona un diagnóstico definitivo, lo cual conducirá a la necesidad de repetir la prueba, para un seguimiento rápido de un periodo prolongado o acortado hasta la próxima prueba y asi sucesivamente. Por tanto, el presente análisis puede utilizarse como un seguimiento en tales pacientes. Una prueba positiva confirmará la probabilidad de cáncer de pulmón, y una prueba negativa indicará ya sea un cáncer benigno o ningún tipo de cáncer, y la detección no-diagnóstica de rayos X o CT reveló una variación del tejido normal. Debido a que la predicción de tipo precisa en un análisis "comercialmente disponible" se basará en mediciones de un gran número de muestras de una demografía amplia, toda la prueba de muestra retrospectiva durante el desarrollo puede finalmente incorporarse como clasificadores, y la capacidad del análisis, tal como el valor de predicción, se mejorará continuamente. Además de este aspecto dinámico del desarrollo del análisis, la naturaleza de un análisis múltiple (marcador múltiple) permite agregar marcadores de predicción en cualquier punto en el desarrollo o la implementación . En contexto, validar marcadores para su uso en diagnóstico servirá al propósito secundario de generar un conjunto altamente estable de clasificadores que mejoren la exactitud de predicción definiendo un "rango normal". La desviación desde ese rango normal proporcionará una probabilidad estadística de enfermedad (por ejemplo >2 desviaciones estándar a partir de la línea de regresión) aunque los valores límite que son más apropiados para el diagnóstico clínico tendrán que determinarse por la variabilidad en una población objetivo dada. Análisis de marcador múltiple y aplicación Como se trata en mayor detalle en la presente, la presente invención contempla el uso de diferentes formatos de análisis. Las micro-instalaciones permiten la prueba simultánea de múltiples muestras. Por tanto, puede incluirse un número de muestras de control, positivas y negativas, en la micro-instalación. De aqui que, el análisis puede llevarse a cabo con el tratamiento simultáneo de muestras plurales, tales como una muestra de un paciente que se conoce afectado y una muestra con uno normal, conjuntamente con una muestra que se probará. Llevar a cabo controles internos permitirá la normalización, calibración y estandarización de la resistencia de la señal dentro del análisis. Por tanto, tal micro-instalación, dispositivo MEMS, dispositivo NEMS o chip con controles internos permite un diagnóstico inmediato para experimentales (pacientes) probados simultáneamente en el dispositivo. Los dispositivos MEMS y NEMS pueden ser aquellos utilizados para análisis de micro-instalación, o pueden encontrarse en un formato de "laboratorio en un chip", tal como incorporando microfluidicos etcétera que permitirán formatos e informantes de análisis adicionales. Para mejorar el poder y el valor de predicción, y la capacidad de aplicación a través de poblaciones en general, y para reducir costos, el formato del presente análisis puede variar desde inmunoanálisis estándar, tal como el inmunoanálisis de tira reactiva y de flujo lateral, que generalmente detectan uno o un número reducido de objetivos de forma simultánea a un bajo costo de fabricación, hasta formatos de tipo ELISA que frecuentemente se configuran para operar en un plato de cultivo de pozo múltiple que puede procesar, por ejemplo, 96, 384 o más muestras de forma simultánea y son comunes en entornos de laboratorios clínicos y son dóciles para automatización, para formatos de disposición y micro-instalación cuando se prueban muchas más muestras simultáneamente en forma de alto rendimiento. El análisis también puede configurarse para producir una discriminación simple, cualitativa (cáncer si vs . cáncer no). Sin embargo son posibles múltiples aplicaciones diferentes en el manejo de enfermedades y pueden producirse marcadores únicos para cualquier aplicación como se muestra en la presente. Se obtienen diferentes conjuntos de marcadores para distinguir el cáncer de pulmón de otros tipos de cáncer, distinguir el cáncer en etapa temprana del tardío, distinguir subconjuntos específicos de cáncer y para seguir el progreso de la enfermedad después de la intervención terapéutica. Por tanto, un régimen de tratamiento puede evaluarse y manipularse según sea necesario mediante pruebas seriales repetidas con el presente análisis para monitorear el progreso o la remisión del tratamiento. Una versión cuantitativa del análisis, por ejemplo, conteniendo una dilución serial de moléculas de captura, puede discriminar la disminución del tamaño del cáncer con el tratamiento. Una vez que los epitopes particulares, tales como péptidos, se identifican para detectar autoanticuerpos circulantes, los epitopes particulares pueden utilizarse en análisis de diagnóstico, en formatos conocidos en la técnica. Debido a que la interacción es una reacción inmune, puede presentarse un diagnóstico adecuado en cualquiera de una variedad de formatos de inmunoanálisis conocidos. Por tanto, un epitope puede fijarse a una fase sólida, por ejemplo, utilizando química conocida. También, los epitopes pueden conjugarse a otra molécula, frecuentemente más grande que el epitope para formar una molécula conjugada sintética o puede fabricarse con una molécula compuesta utilizando métodos recombinantes, como se conoce en la técnica. Muchos polipéptidos se enlazan de forma natural a superficies plásticas, tales como superficies de polietileno, que pueden encontrarse en dispositivos de cultivo de tejido, tales como placas de pozo múltiple. Frecuentemente, tales superficies plásticas se tratan para mejorar el enlace de moléculas biológicamente compatibles a ellas. Por tanto, los polipéptidos forman un elemento de captura, se expone un líquido sospechoso de portar un autoanticuerpo que se enlaza específicamente a ese epitope, al elemento de captura, el anticuerpo se fija e inmoviliza al elemento de captura, y entonces, después de un lavado, el anticuerpo enlazado se detecta utilizando una molécula informante marcada detectable adecuada, tal como un anticuerpo anti-humano marcado con un metal coloidal, tal como oro coloidal, un fluorocromo, tal como fluoresceina, y etcétera. Ese mecanismo se representa, por ejemplo, mediante un ELISA, RIA, inmunoanálisis Western etcétera. El formato particular del inmunoanálisis para detectar autoanticuerpo es una selección de diseño. Alternativamente, debido a que el fago particular expresa un epitope enlazado específicamente mediante los autoanticuerpos encontrados en pacientes con cáncer de pulmón (cuyos clones se nombran específicamente y se almacenan como reservas, y se encontrarán disponibles bajo petición cuando madure una patente a partir de la presente solicitud) , el elemento de captura de un análisis puede ser el fago individual, tal como se obtuvo a partir de un lisado celular, cada uno en un sitio de captura en una fase sólida. También puede utilizarse un vehículo reactivamente inerte, tal como una proteína, tal como albúmina y hemocianina de lapa californiana, o un vehículo sintético, tal como un polímero sintético, al cual se enlaza el epitope expresado, similar a un hapteno en un vehículo, o cualquier otro medio para presentar un epitope de interés en la fase sólida para un inmunoanálisis . También, un formato puede tomar la configuración en donde un elemento de captura fijado a una fase sólida es aquel que se enlaza a las porciones de no enlace de antigeno de inmunoglobulina, tal como la porción Fc del anticuerpo. Por consiguiente, un elemento de captura adecuado puede ser Proteina A, Proteina G o un anticuerpo -Fc. El plasma del paciente se expone al reactivo de captura y después se detecta la presencia del anticuerpo especifico del cáncer de pulmón utilizando, por ejemplo, un marcador marcado en un formato directo o de competición, como se conoce en la técnica. De forma similar, el elemento de captura puede ser un anticuerpo que se enlaza al fago visualizando el epitope para proporcionar otros medios para producir un reactivo de captura especifico, como se trató anteriormente. Como se conoce en la técnica del inmunoanálisis , el elemento de captura es un determinante al que se enlaza un anticuerpo. Como se muestra en la presente, el determinante puede ser cualquier molécula, tal como una molécula biológica, o porción de la misma, tal como un polipéptido, polinucleótido, lipido, polisacárido, etcétera, y combinaciones de los mismos, tales como glicoproteina o una lipoproteina, cuya presencia se correlaciona con la presencia de un anticuerpo encontrado en pacientes con cáncer de pulmón. El determinante puede ser de origen natural, y purificado, por ejemplo. Alternativamente, el determinante puede producirse mediante medios recombinantes o producirse de forma sintética, lo cual puede minimizar la reactividad cruzada. El determinante puede no tener una función biológica aparente o no necesariamente asociarse con un estado particular, sin embargo, esto no resta valor a su uso en un análisis de diagnóstico de interés. La fase sólida de un inmunoanálisis puede ser cualquiera de las conocidas en la técnica, y en formas conocidas en la técnica. Por tanto, la fase sólida puede ser un plástico, tal como poliestireno o polipropileno, un vidrio, una estructura a base de sílice, tal como un chip de silicona, una membrana, tal como nilón, un papel etcétera. La fase sólida puede presentarse en un número de formatos diferentes y conocidos, tales como en formato de papel, una microesfera, como parte de una tira reactiva o dispositivo de flujo lateral, que generalmente emplea membranas, una placa de microtitulación, un portaobjetos, un chip etcétera. La fase sólida puede presentarse como una superficie plana rígida, como la que se encuentra en un portaobjetos de vidrio o un chip. Algunos dispositivos de detección automatizada han dedicado desechables asociados con un medio para leer la señal detectable, por ejemplo, un espectrofotómetro, un contador de escintilación líquido, un colorímetro, un fluorómetro y lo similar para detectar y leer una señal a base de fotones.
Otros reactivos inmunes para detectar el enlace del anticuerpo se conocen en la técnica. Por ejemplo, un anticuerpo Ig anti-humano seria adecuado para formar un intercalado que comprende el determinante de captura, el autoanticuerpo y el anticuerpo Ig anti-humano. El anticuerpo Ig anti-humano, el elemento detector, puede marcarse directamente con una molécula informante, tal como una enzima, un metal coloidal, radionuclido, un tinte etcétera, o puede enlazarse por si mismo mediante una molécula secundaria que sirve la función de informante. Esencialmente, puede utilizarse cualquier medio para detectar un anticuerpo enlazado, y tales medios pueden contener cualquier medio para una función de informante para producir una señal discernible por el operador. El marcado de moléculas para formar un informante se conoce en la técnica. En el contexto de un dispositivo que permite el análisis simultáneo de una multitud de muestras, un número de elementos de control, pueden incluirse controles tanto positivos como negativos en el dispositivo de análisis para permitir controlar el desempeño del análisis, el desempeño de reactivo, la especificidad y la sensibilidad. Frecuentemente, como se mencionó, la mayoría, si no todas las etapas para producir el dispositivo de interés y muchas de las etapas del análisis pueden conducirse mediante medios mecánicos, tales como un robot, para disminuir el error técnico. También, los datos de tales dispositivos pueden digitalizarse mediante medios de escaneo, la información digital se comunica a medios de almacenamiento de datos y los datos se comunican también a un medio de procesamiento de datos, en donde el tipo de análisis estadístico tratado en la presente, o como se conoce en la técnica, puede efectuarse sobre los datos para producir una medida del resultado, que puede compararse después con una referencia estándar o compararse internamente con el presente con un resultado de análisis mediante medios de presentación de datos, tales como una pantalla o lector de información, para proporcionar la información de diagnóstico. Para dispositivos que analizan un menor número de muestras o en donde se encuentran disponibles suficientes datos de población, puede proporcionarse una métrica derivada para lo que constituye un resultado positivo y un resultado negativo, con mediciones de error apropiadas. En esos casos, un único control positivo y un único control negativo pueden ser todo lo necesario para la validación interna, como se conoce en la técnica. El dispositivo de análisis puede configurarse para producir un resultado más cualitativo, ya sea incluido o no en una agrupación de cáncer de pulmón, por ej emplo . Otros formatos de inmunoanálisis de alto rendimiento y/o automatizados pueden utilizarse como se conoce y se encuentra disponible en la técnica. Por tanto, por ejemplo, puede utilizarse un análisis en base a microesferas , enterrado, por ejemplo, en señales colorimétricas, fluorescentes o luminiscentes, tal como la tecnología Luminex (Austin TX) que se basa en microesferas rellenas de tinte y el sistema BD ( Franklin Lakes, NJ) Cytometric Bead Array. En cualquier caso, los epítopes de interés se fijan a una microesfera. Otro análisis múltiple es el método de disposición en capas de Gannot et al., J. Mol. Diagnostics 7, 427-436, 2005. El método se basa en el uso de múltiples membranas, cada una portando un par de enlace diferente, tal como una molécula objetivo, tal como un antígeno o un marcador, las membranas configuradas en registro para aceptar una muestra que se sospecha que contiene el otro del par de enlace, para transferencia cromatográfica en registro. Se permite que la muestra se absorba o se transporte a través de un número de membranas alineadas para proporcionar una matriz tridimensional. Por tanto, por ejemplo, puede apilarse un número de membranas sobre un gel de separación y se permite que salgan los contenidos del gel del gel de separación y que pasen a través de las membranas apiladas. Cualquier asociación de moléculas entre aquellas fijas a cualquier membrana y aquellas transportadas a través de la pila de membranas, tal como un antígeno enlazado con un anticuerpo, puede visualizarse utilizando materiales y métodos conocidos informantes y de detección, ver por ejemplo, Patentes de E.U. Nos. 6,602,661 y 6,969,615; asi como las Publicaciones de E.ü. Nos 20050255473 y 20040081987. En otras modalidades, puede utilizarse una composición o dispositivo de interés para detectar diferentes clases de moléculas asociadas o correlacionadas con el cáncer de pulmón. Por tanto, un análisis puede detectar el autoanticuerpo circulante y las moléculas de no-anticuerpo asociadas o correlacionadas con el cáncer de pulmón, tales como un antigeno de cáncer de pulmón, ver, por ejemplo, Weynants et al., Eur. Respir. J. , 10:1703-1719, 1997 y Hirsch et al., Eur. Respir. J. , 19:1151-1158, 2002. Por consiguiente, un dispositivo puede contener como elementos de captura, epitopes para autoanticuerpos y moléculas de enlace para moléculas de cáncer de pulmón, tales como anticuerpos específicos, aptámeros, ligandos etcétera. Ejamplificación de Maestreo y Prueba Las muestras susceptibles para la prueba, particularmente en análisis de detección, generalmente, son aquellas fáciles de obtener de un paciente, y quizá, de forma no intrusiva o mínimamente invasiva. La muestra también es aquella que se sabe que contiene un anticuerpo. Una muestra de sangre es una muestra adecuada tal, y se encuentra fácilmente disponible en la mayoría de los formatos de inmuno-análisis . En el contexto de una muestra de sangre, existen varios tubos de recolección de sangre conocidos, muchos recolectan 5 o 10 mi de fluido. De forma similar a la mayoría de las pruebas de diagnóstico de sangre comúnmente ordenadas, se recolectan 5 mi de sangre, pero el presente análisis que opera como una micro-instalación posiblemente puede requerir menos de 1 mi de sangre. El recipiente de recolección de sangre puede contener un anticoagulante, tal como heparina, citrato o EDTA. Los elementos celulares se separan, generalmente mediante centrifugación, por ejemplo, a 1000 x g (RFC) durante 10 minutos a 4°C (produciendo -40% de plasma por análisis) y pueden almacenarse, generalmente a temperatura refrigerante o a 4°C hasta su uso. Las muestras de plasma preferentemente se analizan dentro de los 3 dias de recolección o se almacenan congeladas, por ejemplo a -20°C. El exceso de muestra se almacena a -20°C (en un refrigerador sin escarcha para evitar el congelamiento descongelamiento de la muestra) durante hasta dos semanas para análisis repetido según se necesite. El almacenamiento durante periodos de más de dos semanas debe ser a -80°C. Los métodos de manejo y almacenamiento para preservar la estructura y función del anticuerpo se practican como se conoce en la técnica. Las muestras de fluido se aplican entonces a una composición de prueba, tal como una micro-instalación que contiene sitios cargados con, por ejemplo, muestras de polipéptidos purificados de uno de los cinco paneles de marcadores tratados en la presente, conjuntamente con muestras positivas y negativas adecuadas. Las muestras pueden proporcionarse en cantidades graduadas, tal como una dilución serial, para permitir la cuantificación . Las muestras pueden situarse de forma aleatoria en la micro-instalación para dirigir cualquier efecto de ubicación. Después de la incubación, la micro-instalación se lava y después se expone a un detector, tal como un anticuerpo antihumano que se encuentra marcado con un marcador en particular. Para permitir la normalización de señal, puede agregarse un segundo detector a la micro-instalación por ejemplo, para proporcionar una medición de la muestra en cada sitio. Ese podría ser un anticuerpo dirigido a otro sitio en las muestras de polipéptido aisladas, el polipéptido puede modificarse para contener secuencias adicionales o una molécula que es inerte a la reacción específica, o los polipéptidos pueden modificarse para contener un informante antes de agregarse a la micro-instalación. La micro-instalación se lava otra vez, y después si es necesario, se expone a un reactivo para permitir la detección del informante. Por tanto, si el informante comprende partículas coloreadas, tales como solenoides metálicos, no son necesarios medios de detección particulares. Si se utilizan moléculas fluorescentes, se utiliza la luz incidente apropiada. Si se utilizan enzimas, la micro-instalación se expone a sustratos adecuados. Después la micro-instalación se evalúa por el producto de reacción enlazado a los sitos. Aunque esa puede ser una evaluación visual, existen dispositivos que detectarán y, si es necesario, cuantificarán la resistencia de la señal. Después se interpretan los datos para proporcionar información sobre la validez de la reacción, por ejemplo, observando las muestras de control positivas y negativas, y, si son válidas, se evalúan las muestras experimentales: Esa información se interpreta después por la presencia de cáncer. Por ejemplo, si el paciente es positivo para tres o más de los anticuerpos, el paciente se diagnostica como positivo para cáncer de pulmón. Alternativamente, la información en los marcadores puede aplicarse a la fórmula que describe la proporción de máxima probabilidad de los cinco marcadores conjuntamente con el resultado, la presencia de cáncer de pulmón, y si el indicio de una marca del paciente es mayor que 50% del valor de esa misma marca del panel, el paciente se diagnostica como positivo para cáncer. Una marca adecuada pueden ser los valores AÜC calculados. Uso del Equipo y Análisis La prueba de sangre de acuerdo con la presente invención tiene múltiples usos y aplicaciones, aunque el diagnóstico temprano o advertencia temprana para el seguimiento subsecuente es altamente convincente por su impacto potencial en resultados de enfermedad. La invención puede emplearse como una herramienta para complementar la detección radiográfica para cáncer de pulmón. La detección serial CT es generalmente sensible para cáncer de pulmón, pero tiende a ser bastante costosa y no especifica (64% de especificidad reportada) . Por tanto, la CT da como resultado un alto número de positivos falsos, cerca de cuatro en diez. La identificación rutinaria de nodulos pulmonares indeterminados durante la representación de imágenes radiográficas conduce frecuentemente a un trabajo costoso y a una intervención potencialmente dañina, incluyendo cirugía mayor. Actualmente, la edad y el historial de fumador son los únicos dos factores de riesgo que se han utilizado como criterio de selección por los grandes estudios de detección para cáncer de pulmón. El uso de la prueba de sangre de acuerdo con la presente invención para detectar cánceres radiográficamente aparentes (>0.5 cm) y/o cáncer oculto o pre-maligno (por debajo del límite de detección radiográfica convencional) definiría individuos para los cuales se garantiza más una detección adicional. Por tanto, el presente análisis puede servir como una prueba de detección primaria, en donde un resultado positivo indica un examen adicional, como es convencional y conocido en la técnica, tal como análisis radiográfico, tal como un CT, PET, rayos X y lo similar. Adicionalmente, la repetición periódica de la prueba puede identificar un NSCLC emergente. Un ejemplo de cómo se puede incorporar la prueba sujeto en la práctica médica seria en donde los fumadores de alto riesgo (por ejemplo, personas que fuman el equivalente a un paquete por dia durante veinte años o más) pueden recibir la prueba de sangre sujeto como parte de un examen físico anual. Un resultado negativo sin ningún síntoma abierto adicional puede indicar una prueba adicional al menos anualmente. Si el resultado de la prueba es positivo, el paciente recibirá una prueba adicional, tal como la repetición del presente análisis y/o una detección CT o rayos X para identificar posibles tumores. Si no es aparente ningún tumor en la detección CT o en rayos X, quizá el presente análisis, se repetirá una o dos veces dentro del año, y múltiples veces en los siguientes años hasta que el tumor tenga un diámetro de al menos 0.5 mm y pueda detectarse y retirarse quirúrgicamente. Como se expone en los siguientes Ejemplos, el ~90% de la sensibilidad de un perfil de autoanticuerpo para NSCLC utilizando los paneles de cinco marcadores ejemplificados se compara bastante favorablemente al de la detección CT sola, y mediante la comparación puede llevarse a cabo especialmente bien para tumores pequeños, y representa un avance sin paralelo en la detección de enfermedades ocultas. Además, la especificidad mayor de 80% del presente análisis excede la de la detección CT, que se vuelve mucho más importante a medida que el porcentaje de nodulos pulmonares benignos aumenta en la población en riesgo, aumentando a niveles de aproximadamente 70% de participantes en el Mayo Clinic Screening Trial, por ejemplo. Además del uso en la detección, el análisis y el método de la presente invención pueden también ser "útiles para los problemas clínicos estrechamente relacionados de distinción de nodulos benignos de malignos identificados en la detección CT. El nodulo pulmonar solitario (SPN) se define como una única lesión esférica de un diámetro menor a 3 cm que se encuentra completamente rodeada por tejido pulmonar normal. Aunque la predominancia de malignidad reportada en SPNs ha oscilado de aproximadamente 10% a aproximadamente 70%, los estudios más recientes que utilizan la definición moderna de SPN revelan que la predominancia de malignidad es de aproximadamente 40% a aproximadamente 60%. La mayoría de las lesiones benignas son el resultado de granulomas mientras que la mayoría de las lesiones malignas son cáncer de pulmón primario. La evaluación inicial de diagnóstico de un SPN se basa en la evaluación de factores de riesgo para malignidad tales como la edad, la historia de fumador, historia de malignidad previa y características de radiografía de tórax del nodulo tales como el tamaño, la calcificación, el borde (especulado, o suave) y el patrón de crecimiento basado en la evaluación de antiguas radiografías de tórax. Estos factores se utilizan después para determinar la probabilidad de malignidad y para guiar el manejo adicional del paciente. Después de una evaluación inicial, muchos nodulos se clasificarán como poseedores de una probabilidad intermedia de malignidad (25-75%) . Los pacientes en este grupo pueden beneficiarse de la prueba adicional con el presente análisis antes de proceder a la biopsia o a la cirugía. La detección serial que evalúa el crecimiento o la visualización metabólica (e.g. , detección PET) es la única opción no invasiva actualmente disponible y se encuentran lejos del ideal. El análisis radiográfico serial se basa en las mediciones de crecimiento, que requieren que una lesión no muestre crecimiento durante un periodo de tiempo de dos años; no se ha determinado un intervalo ideal entre las exploraciones aunque las exploraciones CT cada 3 meses durante dos años es una evaluación longitudinal convencional. La exploración PET tiene un 90-95% de especificidad para el cáncer de pulmón y un 80-85% de sensibilidad. Estos valores de predicción pueden variar en base a la predominancia regional de enfermedades granulomatosas benignas (e.g., histoplasmosis ) . Actualmente las exploraciones PET cuestan entre $2000 y $4000 por prueba. Los rendimientos del diagnóstico de los procedimientos no quirúrgicos tales como broncoscopia o biopsia de aguja transtorácica (TTNB) oscilan de 40% a 95%. El manejo subsecuente en el entorno de un procedimiento no diagnóstico puede ser problemático. Frecuentemente se busca la intervención quirúrgica como la opción más viable con o sin llevar a cabo otro diagnóstico. La elección dependerá de si el riego de malignidad antes de la prueba es alto o bajo, de la disponibilidad de prueba en una institución particular, las características del nodulo (e . g. , tamaño y ubicación), el riego quirúrgico del paciente, y las preferencias del paciente. La historia previa de otras malignidades extratorácicas sugiere de inmediato la posibilidad de cáncer metastásico al pulmón, y la relevancia de la prueba no invasiva se vuelve insignificante. En el escenario clínico confuso de SPN con sospecha clínica indeterminada para cáncer de pulmón, los marcadores de tumor circulantes pueden ayudar a evitar llevar a cabo un diagnóstico invasivo potencialmente dañino y por el contrario apoyan el fundamento de intervención quirúrgica agresiva. La invención · descrita, por tanto, mejora la comodidad clínica de elegir visualizar serialmente un nodulo en lugar de un diagnóstico invasivo. La invención también tendrá una influencia en el intervalo para detección por rayos X o CT, reduciendo por consiguiente los costos clínicos del cuidado de la salud. La invención descrita complementará o suplantará la detección PET como un método efectivo en costo para incrementar adicionalmente la probabilidad de presencia o ausencia del cáncer de pulmón. La invención será útil en la evaluación de recurrencia de la enfermedad después de la intervención terapéutica. Las pruebas de sangre para cáncer de colon y próstata se emplean comúnmente en esta capacidad, en donde los niveles del marcador se siguen como un indicador de éxito o fracaso del tratamiento y en donde los niveles de marcador elevados indican la necesidad de evaluación de diagnóstico adicional por recurrencia que conduce a la intervención terapéutica. La invención proporcionará información importante acerca de las características del tumor; determinar los subtipos del tumor con bajo pronóstico puede tener un impacto significativo en una decisión clínica para recomendar terapias adicionales con toxicidad potencial debido a que el análisis se basa en múltiples marcadores, de los cuales cualquiera puede ser característico de un cáncer en particular o de un parámetro único del mismo. El desarrollo de más novedosos tratamientos utilizados para la consolidación a largo plazo de la cirugía convencional o la quimioterapia puede requerir análisis cuidadosos en costo/beneficio y la selección de paciente. De aqui que, el presente análisis será una herramienta valiosa para la detección sistemática, selección del tratamiento y para su uso continuo durante el tratamiento para monitorear el curso del tratamiento, el éxito del tratamiento, la recaída, la cura etcétera. Los reactivos del presente análisis, el panel de marcadores particulares pueden manipularse para ajustarse al propósito en particular. Por ejemplo, en un análisis de detección, se utiliza un panel de marcadores más grande o un panel de marcadores muy predominante para maximizar la capacidad de predicción para un mayor número de individuos. Sin embargo, en el contexto de un individuo, que experimenta el tratamiento, por ejemplo, puede obtenerse la huella del anticuerpo en particular del tumor del paciente, que puede requerir o no todos los marcadores utilizados para la detección, y ese subconjunto de marcadores particularizado puede utilizarse para monitorear la presencia del tumor en ese paciente, y la intervención terapéutica subsecuente. Los componentes de un análisis de interés pueden configurarse en un número de formatos para distribución diferentes y lo similar. Por tanto, uno o más epítopes pueden alicuotarse y almacenarse en uno o más recipientes, tales como viales de vidrio, tubos de centrífuga y lo similar. La solución de epitope puede contener amortiguadores adecuados y lo similar, incluyendo preservativos, agentes antimicrobianos, estabilizadores y lo similar, como se conoce en la técnica. El epitope puede encontrarse en forma conservada, tal como desecado, secado por congelación etcétera. Los epitopes pueden colocarse en una fase sólida adecuada para su uso en un análisis particular. Por tanto, los epitopes pueden colocarse, y secarse, en los pozos de una placa de cultivo, colocados sobre una membrana en una disposición en capas o en un dispositivo de inmunoanálisis de flujo lateral, localizados en un portaobjetos u otro soporte para micro-instalación, etcétera. Los artículos pueden empaquetarse como se conoce en la técnica para asegurar una máxima vida en anaquel, tal como con una envoltura de película plástica o una envoltura opaca, y en una caja. El contenedor del análisis puede contener también, muestras de control positivas y negativas, cada una en un recipiente, que incluyen, cuando la muestra es un líquido, un recipiente con un gotero o que tiene una tapa que permite el suministro de gotas, dispositivos de recolección de muestra, otros dispositivos de transferencia de líquidos, reactivos de detección, reactivos de revelado, tales como reactivos de tintura de plata y sustratos de enzima, solución de ácido/base, agua etcétera. Pueden incluirse instrucciones de uso adecuadas.
En otros formatos, tales como el uso de análisis en base a microesferas, los epitopes plurales pueden fijarse a diferentes poblaciones de microesferas, que pueden combinarse después en un único reactivo, listo para exponerse a una muestra de paciente. La invención se ejemplificará ahora en los siguientes ejemplos no limitantes, cuyos datos se han reportado en Zhong et.al., Am. J. Respir. Crit. Care Med. , 172:1308-1314, 2005 y Zhong et . Al., J. Thoracic Oncol . , 1:513-519, 2006, cuyos contenidos se incorporan mediante la referencia en la presente, en su totalidad. EJEMPLOS Ejemplo 1-Análisis Diagnóstico de NSCLC Utilizando clones T7 En este ejemplo, se emprendió la identificación de --los marcadores para diagnosticar NSCLC en etapa tardía (II, II y IV) . Dos bibliotecas de NSCLC del fago T7 se sometieron a biopanorámica con plasma de paciente de NSCLC y normal para enriquecer una población de clones inmunológicos que expresan polipéptidos reconocidos por el anticuerpo circulante en pacientes de NSCLC. Se adquirió una biblioteca ADNc de NSCLC fago T7 (Novagen, Madison, WI, USA) y se construyó una segunda biblioteca a partir de la línea celular de adenocarcinoma NCI-1650 utilizando los sistemas Novagen OrientExpress ADNc Synthesis and Cloning. Las bibliotecas se sometieron a biopanorárnica con plasma depositado de 5 pacientes de NSCLC (etapas 2-4; diagnóstico confirmado mediante histología) y de donantes normales sanos, para enriquecer la población de proteínas de expresión fago reconocidas por los anticuerpos asociados al tumor. Brevemente, la biblioteca de fago visualizada se seleccionó por afinidad incubando con microesferas de agarosa de proteína G recubiertas con anticuerpos de suero normal depositado (250 µ? de suero normal depositado, diluido 1:20, a 4°C o/n) para retirar proteínas no específicas al tumor. Los fagos no enlazados se separaron del fago enlazado a anticuerpos en plasma normal mediante centrifugación. El sobrenadante se sometió después a biopanorámica contra microesferas de agarosa de proteína G recubiertas con plasma de paciente depositado (4°C o/n) y se separó del fago no enlazado mediante centrifugación. Los fagos enlazados/reactivos se eluyeron con 1% SDS y después se recolectaron mediante centrifugación. Los fagos se amplificaron en E coli NLY5615 (Gibco BRL Grand Island, NY) en presencia de 1 mM IPTG y 50 µg/ml de carbenicilina hasta la lisis. Los lisados que contienen fago amplificado se recolectaron y se sometieron a tres rondas secuenciales adicionales de enriquecimiento biopanorámico . Los lisados que contienen fago del cuarto biopanorámico se amplificaron, los clones de fago individuales se aislaron y después se incorporaron en disposiciones de proteína como se describe a continuación . Construcción de Instalación y Detección Sistemática de Alto Rendimiento Los lisados de fago de la cuarta ronda de biopanorámica se amplificaron y cultivaron en placas de LB-agar cubiertas con 6% agarosa para aislar el fago individual. Se utilizó un robot de recolección de colonia (Genetic QPix 2, Hampshire, UK) para aislar 4000 colonias individuales (2000/biblioteca) . Los fagos seleccionados se amplificaron en placas de 96 pozos, después 5 ni del lisado limpio de cada pozo se rociaron en duplicado de forma robótica sobre portaobjetos FAST (Schleicher and Schuell, Keene, NH) utilizando un Posicionador Affymetrix 417 (Affymetrix, Santa Clara, CA) . Los 4000 fagos de detectaron después con cinco plasmas de paciente de NSCLC individuales no utilizados en la biopanorámica para identificar al fago inmunogénico . Se utilizó anticuerpo primario de conejo anti-T7 (Jackson Immuno-Research, West Grove, PA) para detectar proteínas de cápsido T7 como control para la cantidad del fago. Tanto las muestras de plasma pre absorbido (plasma: lisado bacteriano, 1:30) como los anticuerpos anti-T7 se disolvieron 1:3000 con 1 X TBS más 0.1% Tween 20 (TBST) y se incubaron con los portaobjetos de detección durante 1 hora a temperatura ambiente. Los portaobjetos de lavaron y se sondearon entonces con anticuerpos secundarios anti-humano marcados Cy5 y anti-conejo marcados Cy3 (Jackson ImmunoResearch; 1:4000 cada anticuerpo en 1 X TBST) juntos durante 1 hora a temperatura ambiente. Los portaobjetos se lavaron otra vez y después se escanearon utilizando un escáner Affymetrix 428. Las imágenes se analizaron utilizando el software GenePix 5.0 (Axon Instruments, Union City, CA) . Los fagos que contienen una proporción de señal Cy5/Cy3 mayor a 2 desviaciones estándar desde una regresión lineal se seleccionaron como candidatos para su uso en un "chip de diagnóstico". Diseño del chip de diagnóstico y medición del anticuerpo Doscientos doce fagos inmunorreactivos identificados en la detección de alto rendimiento descrita anteriormente, más 120 fagos . T7 "vacíos", se combinaron se-re-amplificaron y se colocaron en duplicado sobre los portaobjetos FAST como chips de diagnóstico único. Los chips duplicados se utilizaron para analizar 40 muestras de NSCLC en etapa tardía utilizando el protocolo para detección descrito anteriormente. La media de la señal Cy5 se normalizó a la media de la señal Cy3 (proporción de señal Cy5/Cy3) como la medición del anticuerpo humano contra una proteína única de expresión de fago. Para compensar la variabilidad de chip a chip, las mediciones se normalizaron adicionalmente sustrayendo la reactividad de fondo del plasma contra las proteínas del fago T7 vacío y dividiendo la media de la señal T7 [ (Cy5/Cy3 del fago) - (Cy5/Cy3 de T7) / (Cy5/Cy3 de T7) ] . La prueba t de estudiante de la señal normalizada de 40 pacientes (etapa II-IV) y 41 normales permitió un limite estadístico (p<0.01) que sugirió un valor de predicción relativo de cada marcador candidato. De los 212 candidatos, 17 cumplieron ese criterio de límite (p=0.00003 a p=0.01) . La redundancia dentro del grupo se evaluó mediante PCR y análisis de secuencia revelando varios clones duplicados y triplicados. Cuando se eliminaron los clones redundantes, se identificó un conjunto de 7 proteínas de expresión del fago. Análisis estadístico El análisis de regresión logística se llevó a cabo para predecir la probabilidad de que una muestra proviniera de un paciente de NSCLC. Se dividieron un total de 81 muestras de pacientes y normales en 2 grupos. Los pacientes se diagnosticaron en las Etapas II-IV de NSCLC. El primer grupo consistió de 21 muestras de plasma normales seleccionadas de forma aleatoria y 20 de pacientes que se utilizaron como un conjunto guía para identificar marcadores que se distinguieron entre las muestras de paciente y las muestras normales utilizando marcadores individuales o una combinación. El segundo grupo consistió de 20 muestras de paciente y 20 normales que se utilizaron para validar la tasa de predicción de los marcadores identificados utilizando el grupo guia. Se generaron curvas de características de operación del receptor (ROC) para comparar la sensibilidad y la especificidad de predicción con diferentes marcadores, y se determinó el área bajo la curva (AUC) . Los clasificadores se examinaron adicionalmente utilizando validación cruzada de exclusión. También se analizaron y se compararon las historias de fumador y la etapa de la enfermedad. Después se invirtieron los dos grupos, y el grupo de 40 se convirtió en el grupo guía para identificar marcadores que indicaron la presencia de NSCLC. Los marcadores así identificados como proveedores de la máxima capacidad de predicción se utilizaron después para diagnosticar NSCLC en el otro grupo de 41 muestras. Tabla 4 Áreas bajo las curvas ROC y exactitud predictiva Conj. Guía.* Conj. De Val.† Clon de Fago AUC8 (%) Espec (%) Sens (%) Espec (%)Sens 1864 .857 75 81 65 85 1896 .857 70 86 70 75 1919 .824 75 81 70 90 1761 .798 70 81 70 85 1747 .864 70 86 70 80 Combinado .983 92 95 90 95 * El conjunto guia consistió de 21 muestras normales y 20 de pacientes de NSCLC. † El conjunto de validación consistió de 20 muestras normales y 20 de pacientes de NSCLC. § AUC:. área bajo la curva ROC Tabla 5 Validación de exclusión Clon de Fago % Especificidad % Sensibilidad % Exac.de Diag. †, 1864 70 82.9 76.5 1896 70 82.9 75.3 1919 70 82.9 76.5 1761 60 82.9 71.6 1747 72.5 82.9 77.8 Combinado 873 902 88^ * Validación de exclusión: una muestra se retiró del conjunto de prueba conteniendo un total de 81 muestras, se generó un clasificador para predecir el estado (normal o de paciente) de la muestra retirada utilizando el resto de las muestras. Este procedimiento se repitió para todas las muestras. † Exactitud del diagnóstico = (número de positivos verdaderos + número de negativos verdaderos) /número total de muestras Análisis de secuencia de proteínas de expresión de fago Los 17 fagos que se seleccionaron para el valor de predicción putativo utilizando la prueba t y el valor p <0.01 se secuenciaron para identificar la redundancia, que reveló 7 secuencias únicas. Aunque la identidad de las proteínas de expresión de fago no es crítica para su uso en un análisis diagnóstico de interés, las secuencias se compararon con aquellas obtenidas en estudios previos que utilizaron metodología de detección diferente (independiente) y se compararon también con la base de datos del GenBank para obtener una posible identidad. Las secuencias de nucleótidos obtenidas a partir de los 7 clones mostraron homología con GAGE 7, NOPP140, EEFIA, PMS2L15, SEC15L2, paxillina y clon BAC RP11-499F19. De las 7 proteínas, EEFIA (factor 1 de alargamiento de translación eucariótica) , un componente de núcleo de la maquinaria de la síntesis de proteína, y GAGE7, un antígeno de cáncer de testículo, se sobre expresan en algunos cánceres de pulmón. La paxillina es una proteína de adhesión focal que regula la adhesión y la migración de la célula. La expresión aberrante y actividad anómala de la paxillina se ha asociado con un fenotipo metastásico agresivo en algunas enfermedades incluido el cáncer de pulmón. PMS2L15 es una proteína de ADN que no forma pares relacionada a la reparación pero hasta ahora no se ha detectado ninguna mutación en cáncer. De forma similar, SEC15L2, una proteína de tráfico intracelular, y NOPP140, una proteína nucleolar involucrada en la regulación de la actividad transcripcional, no tienen asociación maligna conocida. La función fisiológica de esas tres proteínas, sin embargo, sugiere que cada una podría tener un papel en el fenotipo maligno. Modelo estadístico y exactitud de predicción del análisis Para desarrollar clasificadores utilizando las proteínas únicas de expresión fago 7 para tasas de predicción más altas, las 81 muestras se dividieron de forma aleatoria en dos grupos, uno fue utilizado para propósitos de guía y el otro para validación. La regresión logística se utilizó para calcular la sensibilidad y la especificidad de la exactitud de predicción utilizando proteínas individuales de expresión de fago así como una combinación de múltiples marcadores de expresión de fago. Los resultados muestran que 5 marcadores de fago tuvieron una capacidad significativa para distinguir muestras de paciente de controles normales en el conjunto guía. La AUC de ROC para cada individuo varió de 0.79 a 0.86. Una combinación de 5 marcadores logró una tasa de predicción prometedora (AUC=0.98 ) , con 95% de sensibilidad y 85% de especificidad (Tabla 4) . Utilizando este modelo estadístico para probar al grupo de validación que consiste de 20 muestras de control normales y 20 NSCLC, el análisis proporcionó una sensibilidad de 90% y una especificidad de 95% (Tabla 4). Para examinar adicionalmente la asociación de los clasificadores con sensibilidad y especificidad de diagnóstico, se llevó a cabo una predicción de clase utilizando validación cruzada de exclusión en los todos los 81 chips . La sensibilidad y especificidad fueron de 90% y 87%, respectivamente, con las 81 muestras, y la exactitud de diagnóstico total fue de 89% (Tabla 5) . También utilizando todas las 81 muestras, la ID del clon correspondiente, el nombre del gen y el valor p fueron los siguientes: 1864, GAGE7, p=9.1 x 10"9; 1896, BAC clon RP11-499F19, p=3.5 x 10~8; 1919, SEC15L2, p=l .2 x 10~6; 1761, PMS2L15, p=5.2 x 10"7; y 1747, EEFIA, p=5.9 x 10-7. Todos los 5 marcadores pasaron una corrección Bonferroni de 0.001/262 = 3.8 x 10~6 haciendo la probabilidad de que uno o más de ellos sea un positivo falso menor que 0.001. Por tanto, en general, el panel de cinco marcadores se utilizó para segregar las muestras de 40 pacientes de NSCLC y 41 normales con una tasa de 89% de identificación exitosa cuando una muestra contenia todos los cinco marcadores. Ejemplo 2 - Detección de cáncer de pulmón en etapa temprana utilizando clones T7 En este ejemplo, se investigó la capacidad del análisis y el método de acuerdo con la presente invención para identificar marcadores capaces de- distinguir cáncer de pulmón en etapa I y enfermedades ocultas a partir de muestras de control comparadas con riesgo. Sujetos humanos Después del consentimiento informado, se obtuvieron muestras de plasma de individuos con histología confirmada de NSCLC en la Universidad de Kentucky y el Lexington Veterans Administration Medical Center. Se seleccionaron los controles no cancerígenos de forma aleatoria a partir de 1520 sujetos que participaron en el Mayo Clinic Lung screening Trial. Brevemente, los individuos fueron elegibles para la prueba de detección CT con un historial de fumador de un mínimo de 20 paquetes al año, edad entre 50-75, y ninguna otra enfermedad dentro de los 5 años de la entrada al estudio. Además de las muestras no cancerígenas del Mayo Lung Screening Trial, se encontraron disponibles seis muestras de NSCLC en etapa I, .y 40 muestras pre diagnóstico para el análisis. Se extrajeron muestras pre diagnóstico a la entrada al estudio de sujetos diagnosticados con cánceres de incidencia de NSCLC en detección CT de uno a cinco años después de la donación de la muestra. Biblioteca de fago Las bibliotecas de fago, el paneo y la detección fueron como se describió anteriormente. Diseño de chip de diagnóstico y medición de anticuerpo Doscientos doce fagos inmunorreactivos identificados en la detección de alto rendimiento anterior, mas 120 fago T7 "vacíos", se combinaron, se re amplificaron y se colocaron en duplicado sobre portaobjetos FAST como chips de diagnóstico único. Los chips replicados se utilizaron para analizar 23 muestras de plasma de NSCLC en etapa I, y 23 de combinación de riesgo utilizando el protocolo para detección descrito anteriormente. Análisis estadístico La proporción Cy5/Cy3 normalizada para cada una de las 212 proteínas de expresión de fago se analizó independientemente por diferencias estadísticamente significativas entre 23 muestras de pacientes y 23 de control mediante la prueba t utilizando software estadístico JMP (SAS, Inc., Cary, NC) como se describió en el ejemplo previo. Todas las 46 muestras se utilizaron para construir clasificadores que fueron capaces de distinguir las muestras de paciente de las normales utilizando marcadores individuales o en combinación. Las curvas de ROC se generaron para comparar la sensibilidad y la especificidad de predicción y se determinó la AÜC. Después se examinaron los clasificadores utilizando validación cruzada de exclusión para todas las 46 muestras. Después el conjunto de clasificadores se utilizó para predecir la probabilidad de enfermedad en un conjunto independiente de 102 casos y controles de combinación de riesgo del Mayo Clinic Lung Screening Trial . Los efectos relativos de la enfermedad pulmonar de fumador y otras no malignas también se evaluaron. La AUC de ROC para cada marcador individual, lograda analizando todas las 46 muestras para estimar la capacidad de predicción, fluctuaron de .74 a .95; y la combinación de los cinco marcadores indicó una capacidad significativa para distinguir las muestras de paciente en etapa temprana de los controles de combinación de riesgo (AYC=0.99). La sensibilidad y la especificidad computarizadas utilizando validación cruzada de exclusión fueron de 91.3% y 91.3% respectivamente (Tabla 7). Un cohorte de muestra del proceso de detección CT de la Clínica Mayo que incluyó 46 muestras extraídas 0-5 años antes del diagnóstico (6 muestras de cánceres predominantes y 40 de pre cáncer) y 56 muestras de combinación de riesgo de la población explorada se analizaron después como un conjunto de datos independiente. Los resultados indicaron una clasificación precisa de las muestras no cancerígenas 49/56, 6/6 muestras de cáncer extraídas en el momento de la detección radiográfica en una detección CT, 9/12 muestras extraídas un año antes del diagnóstico, 8/11 extraídas dos años antes, 10/11 extraídas 3 años antes, 4/4 extraídas 4 años antes del diagnóstico, 1/2 extraídas cinco años antes del diagnóstico, que corresponden a 87.5% de especificidad y 82.6% de sensibilidad. Tres de las ocho muestras pre cáncer se clasificaron de forma incorrecta por medio el análisis tuvieron una histología de célula broncoalveolar . En los conjuntos de prueba, 6/6 controles no cancerígenos se identificaron apropiadamente con un diagnóstico clínico de enfermedad pulmonar obstructiva crónica (EPOC) , un individuo con sarcoidosis y un individuo con un intervalo de diagnóstico de cáncer de mama. En el último conjunto de prueba independiente, dos individuos con cáncer de próstata localizado se clasificaron también correctamente como normales. Un individuo con un diagnóstico previo de cáncer de mama (>5 años antes) se clasificó como no cancerígeno, pero un segundo fue clasificado como cáncer. Treinta y cuatro de setenta y nueve sujetos no cancerígenos tuvieron nodulos benignos detectados en las exploraciones CT de detección. La historia de los fumadores activos contra los antiguos no pareció afectar la exactitud de predicción de la prueba. Tampoco existió ninguna asociación de sensibilidad del análisis con el tiempo para el diagnóstico. Análisis de secuencia de proteínas de expresión de fago Las secuencias de nucleótidos de las cinco proteínas de expresión de fago de predicción se compararon con la base de datos del GenBank. Las secuencias de nucleótidos obtenidas a partir de los cinco clones utilizados en el modelo final de predicción mostraron gran homología a paxillina, SEC15L2, BAC clon RP11-499F19, XRCC5 y MALAT1. Los primeros tres se identificaron como inmunorreacti os con plasma de los pacientes con cáncer de pulmón de etapa avanzada descrito en el ejemplo anterior. XRCC5 es un gen de reparación de ADN sobre expresado en algunos cánceres de pulmón. La actividad anómala y la expresión aberrante de paxillina, una proteina de adhesión focal, se ha asociado con un fenotipo metastásico agresivo en cáncer de pulmón y otras enfermedades. ALATl es un ARN regulatorio conocido por ser expresado de manera anómala en cáncer de pulmón. El potencial del presente análisis para complementar la detección radiográfica para cáncer de pulmón puede reconocerse en la validación subsecuente en donde las mediciones combinadas de estos cinco marcadores de anticuerpo predijeron correctamente 49/56 muestras no cancerígenas del Mayo Clinic Lung Screening Trial, asi como 6/6 cánceres predominantes y 32/40 cánceres de incidencia a partir de la sangre extraída 1-5 años antes de la detección radiográfica, que corresponden a 87.5% de especificidad y 82.6% de sensibilidad. El reporte inicial del Mayo Clinic Lung Screening Trial describió 35 NSCLC diagnosticados mediante CT únicamente, un NSCLC detectado mediante el examen citológico del esputo únicamente, y un NSCLC en etapa IV clínicamente detectado entre las exploraciones de detección anuales, que corresponden a 94.5% de sensibilidad de la exploración CT únicamente. Además, la revisión retrospectiva después de la primera exploración de incidencia anual reveló que pequeños nodulos pulmonares se perdieron en el 26% de las exploraciones predominantes, concordando con las tasas significativas de negativos falsos reportadas en otras pruebas de detección CT. El diámetro de los nodulos retrospectivamente identificados fue menor a 4 mm en 231 participantes (62% de los 375 participantes), 4-7 mm en 137 (37%), y 8-20 mm en 6 (2%). Como tal, el 82.6% de la sensibilidad del perfil del autoanticuerpo para NSCLC se compara de forma bastante favorable al de la detección CT únicamente, mediante la comparación puede llevarse a cabo especialmente bien para tumores pequeños, y representa un avance sin paralelo en la detección de enfermedades ocultas. Además, el 87.5% de la especificidad del presente análisis excede el de la detección CT, que se hace más importante a medida que el porcentaje de nodulos pulmonares benignos se incrementa en la población en riesgo, que se eleva a niveles de 69% de los participantes en el Mayo Clinic Screening Trial.
Tabla 6 Regresión de logística/ alidación de exclusión en el grupo guía Guía* Validacion† Clon de AUC8 (%) Espec (%) Sens (%) Espec (%)Sens Fago L1919 0.85 82.6 78.3 82.6 60.9 L1896 0.95 87 87 87 87 G2004 0.80 82.6 65.2 82.6 65.2 G1954 0.74 82.6 87 73.9 69.6 G1689 0.82 82.6 65.2 82.6 65.2 Combinado 0.99 100 95.7 91.3 91.3 * El conjunto guia consistió de 23 muestras normales de alto riesgo y 23 de pacientes de NSCLC en etapa uno. † Validación de Exclusión: La predicción de una muestra única basada en 45 casos y controles. §AÜC: área bajo la curva de ROC Los cinco marcadores diagnosticaron con exactitud cáncer de pulmón oculto y en Fase I. La presencia de dos o más marcadores en un sujeto puede y predijo el cáncer antes del diagnóstico utilizando metodologías estándar. Los anticuerpos circulantes que se enlazan a células NSCLC se presentan en pacientes que actualmente se diagnostican como negativos utilizando las metodologías disponibles. En el ejemplo, aproximadamente la mitad de los controles en ese conjunto de muestra tuvo evidencia radiográfica de enfermedad granulomatosa benigna que no pareció confundir nuestra capacidad para distinguir cáncer de no cáncer. Ejemplo 3- Identificación de Marcadores de Péptido Aleatorios Específicos para Cáncer de Pulmón y Desarrollo del Análisis de Diagnóstico NSCLC Utilizando los Mismos Los marcadores específicos para cáncer de pulmón se obtuvieron también utilizando péptidos aleatorios visualizados en fago. Tales bibliotecas se encuentran comercialmente disponibles o pueden fabricarse como se conoce en la técnica. Se escogió M13 como vector. Identificación de marcadores Se utilizó una biblioteca de péptido de visualización de fago 13 comercialmente disponible que comprende 2 x 109 péptidos aleatorios fusionados a una proteína de recubrimiento menor ( Ph . D . ™-C7C, NEB) . Cada clon de fago expresa un péptido de aminoácido 7 único en una estructura de bucle sobre la superficie de fago. La estructura de bucle se contrae mediante un enlace disulfuro de flanco único que se forma en el periplasma bacteriano. La biblioteca se sometió a dos rondas de "biopanorámica" utilizando plasma de pacientes con cáncer de pulmón y controles como se describió anteriormente. Después la biblioteca biopanoramizada se amplificó para el aislamiento de fago individual. Un robot de recolección de colonia autómata (Q-Pix II, Genetix Ltd., New Milton, Hampshire, UK) se utilizó para elegir las colonias individuales. Los fagos seleccionados se re-amplificaron en placas de 96 pozos y el sobrenadante de cada pozo se roció de forma robótica en duplicado sobre portaobjetos FAST (Schleicher and Schuell, Keene, NH) utilizando un Posicionador Affymetrix 417 (Affymetrix, Santa Clara, CA) . Después los fagos dispuestos se incubaron con muestras de plasma de pacientes con NSCLC y de individuos sin NSCLC para identificar clones reactivos con autoanticuerpos específicos de cáncer de pulmón. El anticuerpo enlazado a fago se reveló mediante un anticuerpo secundario marcado con fluorescencia roja que se enlaza a IgG humano. Para justificar las cantidades variables de proteína que deben estar presentes en cada punto, se utilizó un anticuerpo con marca de fluorescencia verde que se enlaza directamente al cápsido de fago. El escaneo de doble color del portaobjetos proporcionó una señal roja que indicó la cantidad de anticuerpo que se enlaza a cada proteína y una señal verde que indica la cantidad de proteína en cada punto. Los datos se recopilaron y visualizaron mediante un programa que produce un diagrama de dispersión de señal roja (cantidad de anticuerpo) por encima de una señal verde (cantidad de proteína) para cada punto en el portaobjetos. Utilizando análisis de regresión generado por computadora que indica la señal media y la desviación estándar de todas las proteínas en el portaobjetos, se identificaron las proteínas enlazadas por anticuerpo en plasma de paciente NSCLC. Los fagos que se enlazan a cantidades significativas de anticuerpos a partir de una muestra de plasma NSCLC (>2 desviaciones estándar a partir de la línea de regresión) se consideraron candidatos para evaluación adicional. Aproximadamente 500 fagos candidatos se seleccionaron para evaluar el potencial para distinguir muestras NSCLC de controles. Estos fagos inmunoreactivos se recopilaron, cultivaron y posicionaron junto con los fagos vacíos (fagos sin inserto de oligonucleótido aleatorio) en una micro-instalación prototipo refinada. Se analizó ésta micro-instalación con muestras de plasma individuales NSCLC y de no cáncer. Selección del Panel Cuatrocientos ochenta y tres fagos inmunoreactivos identificados en la detección de alto rendimiento (HT) como altamente reactivos (al menos dos desviaciones estándar utilizando una línea de regresión generada por computadora) con al menos una de cinco muestras NSCLC, mas sesenta y tres fagos sin péptidos injertados, se reamplificaron y se colocaron en duplicado sobre portaobjetos FAST. Una medición residual estándar (distancia desde la línea de regresión dividida entre la desviación estándar residual) permitió una medida confiable de la cantidad de anticuerpo que se enlaza a cada proteina de expresión de fago única sobre la cantidad de proteina en cada punto. La metodología fue cuantitativa, reproducible y compensa la variabilidad de chip-a-chip, permitiendo la comparación entre y junto con las muestras. Se utilizó análisis de secuencia de ADN para confirmar que los fagos redundantes no se habían seleccionado. Se observó un nivel bajo de redundancia (<4%) en los fagos candidato seleccionados. Los residuos estandarizados para cada uno de los 483 marcadores candidato se analizaron independientemente mediante prueba t utilizando el software estadístico JMP (SAS, Inc., Cary, NC) por las diferencias estadísticamente significativas entre 63 casos y controles a partir de la mitad del conjunto de muestras disponible. Doscientos veinticuatro de los 483 marcadores candidato mostraron diferencias estadísticamente significativas entre 32 casos y 31 controles (p<0.05) , 155 de los marcadores tuvieron un nivel de significación de p<0.01; 85 de los marcadores tuvieron un nivel de significación de p<0.001; y 32 de los marcadores tuvieron un nivel de significación de p<0.0001. Treinta y dos marcadores únicos con niveles de discriminación altamente independientes se evaluaron adicionalmente por el valor predictivo independiente y combinado determinado por ROC. La AUC de ROC de los marcadores individuales derivada de la media del conjunto de muestra (grupo A: 62 casos y controles) varió de 0.729 a 0.954 (promedio de 0.811). La AUC para marcadores individuales medida utilizando los 125 casos y controles (los conjuntos de muestras A y B combinados) varió de 0.727 a 0.908 (promedio de 0.766). Se utilizaron chips duplicados para analizar muestras de plasma NSCLC (etapas II-IV) , los pacientes con cáncer de etapa temprana (las muestras se recolectaron en la University of Kentucky bajo un protocolo aprobado Institutional Review Board (IRB) ) , los casos obtenidos de la Mayo Clinic Prospective Screening Trial (Bach et al., JAMA 297, 953, 2007) que representaron las muestras de sangre extraídas 1-5 años antes de la detección radiográfica de cáncer en normales y controles (fumadores de alto riesgo >50 años de edad, y donadores de sangre en el Central Kentucky Blood Center) utilizando un protocolo descrito para su detección en la presente. Validación del análisis Se evaluaron varias combinaciones de marcadores con la más alta discriminación independiente con regresión logística ponderada para determinar la exactitud predictiva. Por ejemplo, una combinación de 12 marcadores con valores p que varían de p<0.007 a p<2 x 10~6 generó un área debajo de la curva ROC de .973 y se evaluaron adicionalmente por la exactitud predictiva en una validación estadística de exclusión. El análisis ROC para marcadores individuales produjo valores AÜC que variaron de .591 a.893. Ejemplo 4- Un Panel de Cuatro Péptidos Aleatorios para Detectar Cáncer en Etapa Temprana Un panel de cuatro clones (MC1484, MC2628, MC2853 y MC3050) obtenido de la experimentación presentada en el Ejemplo 3, se probó con muestras de pacientes diagnosticados con cáncer en etapa temprana (generalmente en etapa I) en un estudio en curso en la University of Kentucky (ÜK) y con muestras de pacientes sin cáncer. Se obtuvo una especificidad (n = 39) de 95%, y con validación cruzada de exclusión (LOO), la especificidad fue de 90%. La sensibilidad (n = 17) fue de 94% y con validación cruzada LOO, la sensibilidad fue de 82%. Ejemplo 5- El Panel de Cuatro Péptidos Aleatorios para Detectar Cáncer Antes del Cáncer Radiográficamente Detectable Cuando se probó el mismo panel de marcadores aleatorios obtenido de la biblioteca M13 en muestras del Mayo Clinic Study descrito anteriormente en el Ejemplo 2 (en donde las muestras se encontraron disponibles de individuos en riesgo de cáncer de pulmón que no tuvieron cáncer radiográficamente detectable, pero que eventualmente desarrollaron cáncer de pulmón) , , 18 de 26 muestras se identificaron como positivas para cáncer. Las muestras fueron de individuos que se encontró que tenían cáncer de pulmón radiográficamente detectable de uno a cuatro años después de obtener la muestra probada. Ejemplo 6- Un Panel de Diez Péptidos Aleatorios para Detectar Cáncer de Pulmón en Etapa Tardía ün panel diferente de diez clones Mi3 (MC908 , MC919, MC1011, MC1521, MC1524, MC1760, MC2645, MC2900, MC3000 y MC3127) obtenidos de la experimentación descrita en el Ejemplo 3, se probó en muestras de pacientes con etapas avanzadas de cáncer, y con un número adecuado de muestras "normales (sangre de individuos sin cáncer) . Se obtuvo una sensibilidad (n = 36) de 94% (LOO fue de 86%) y una especificidad (n = 38) de 94% (LOO fue de 84%) . Por tanto, 36 de 38 muestras normales se identificaron negativas para el cáncer, y 34 de 36 muestras de pacientes con cáncer de pulmón se identificaron como positivas para cáncer. Ejemplo 7- Un Panel de Catorce Péptidos Aleatorios para Detectar Cáncer de Pulmón Cuando los paneles de clones de fago de los Ejemplos 4-6 se combinaron para detectar cáncer en pacientes con cáncer de pulmón temprano y tardío en comparación con los normales, la sensibilidad observada (n = 52) fue de 94% (LOO fue de 86%) y la especificidad (n = 38) fue de 92% (LOO fue de 71%). De aquí que, este Ejemplo demuestra que ciertas combinaciones de marcadores pueden utilizarse para diagnosticar cualquier etapa de cáncer de pulmón. Ejemplo 8- Un Panel de Cinco Péptidos Aleatorios para Detectar el Cáncer de Pulmón Utilizando una estrategia de validación de "guia y prueba", la mitad del conjunto de muestras designado para guia modelo estadístico se utilizó como clasificadores para la predicción de clase en la segunda mitad, comprendida de manera similar de 32 casos de NSCLC (20 avanzados 11 en etapa temprana), y 31 controles comparados con riesgo. Los marcadores individuales con la AÜC más alta se agregaron de modo secuencial en un modelo de regresión logística. Una combinación de cinco marcadores (908, 3148, 1011, 3052 y 1000) proporcionó sensibilidad del 90.6% y especificidad de 73.3% (exactitud predictiva 82%) en el conjunto de validación independiente de todas las etapas del cáncer . Ejemplo 9- Un Panel de Seis Péptidos Aleatorios para Detectar Cáncer de Pulmón Se obtuvo un conjunto de datos diferente pero traslapado de 124 casos de NSCLC y de muestras de control comparadas con riesgo (Tabla 7) divididas en dos grupos para guía y validación, o alternativamente, evaluadas en un análisis de exclusión que redujo la pendiente del tamaño de la muestra; los anticuerpos-marcadores candidato se ordenaron estadísticamente por niveles de discriminación entre casos y controles .
Tabla 7 Características del Paciente Número Edad3 Histologíab Etapa A S N I II III IV Conj. Muestra A Controles 30 63.8+6.4 Cáncer 32 65.6±9.9 9 12 9 11 3 8 6 Conj. Muestra B Controles 30 64.1+7.4 Cáncer 32 66.2+10.3 9 11 8 11 10 10 1 edad promedio b Histología: A: adenocarcinoma; S: escamosis; N: Sin NSCLC especificado de otra manera.
El análisis de ROC-AUC sugirió el potencial predictivo de varias combinaciones de marcadores. La predicción de clase se llevó a cabo en cohorte de muestra independiente dividiendo las muestras disponibles en grupos guía y prueba, o determinadas de forma secuencial en cada uno de los 124 casos y controles en una estrategia de validación de exclusión. Cada uno de los 483 marcadores candidato se analizó independientemente mediante prueba t por diferencias estadísticamente significativas entre los 62 casos y controles de la mitad del conjunto de muestras disponible. Doscientos veinticuatro de los 483 marcadores candidato mostraron diferencias estadísticamente significativas entre 32 casos y 30 controles (p<0.05) , 155 de los marcadores mostraron significación estadística en el nivel p<0.01; 85 de los marcadores mostraron significación estadística en el p<0.001; y 33 de los marcadores mostraron significación estadística en el nivel p<0.0001. El análisis de secuencia reveló una proporción muy limitada de redundancia entre las proteínas de captura. En la validación de "guía y prueba", una combinación de seis marcadores logró una discriminación perfecta (AUC 1.0) entre 32 casos y 31 controles, ver Tabla 8. Treinta y tres marcadores únicos con niveles altamente independientes de discriminación se evaluaron adicionalmente por el valor predictivo independiente y combinado determinado por ROC. La AUC de ROC de los marcadores individuales derivada de la media del conjunto de muestra (grupo A: 62 casos y controles) varió de 0.729 a 0.954 (promedio de 0.811). La AUC para marcadores individuales medida utilizando todos los 124 casos y controles (los conjuntos de muestras A y B combinados) varió de 0.727 a 0.908 (promedio de 0.766). Validación del Análisis Utilizando una estrategia de validación de "guía y prueba", la mitad del conjunto de muestras designado para guia modelo estadístico se utilizó como clasificadores para la predicción de clase en la otra mitad de las muestras, comprendida de manera similar de 32 casos de NSCLC (20 avanzados 11 en etapa temprana) , y 31 controles comparados con riesgo. Los marcadores individuales con la AÜC más alta se agregaron de modo secuencial en un modelo de regresión logística. En la validación de "guía y prueba", un panel de seis marcadores logró una discriminación perfecta (AÜC 1.0) entre 32 casos y 31 controles (Tabla 8) . En todas las 124 muestras, un panel de siete marcadores produjo una AÜC de 0.949 (ver Tabla 9), once marcadores produjeron una AUC de 0.947 y un conjunto de 25 marcadores logró una discriminación perfecta. Varias combinaciones de marcadores alternativas proporcionaron también altos niveles de discriminación. Una variedad de combinaciones de marcadores produjeron una AÜC similar. La predicción de clase utilizando la validación de guía y prueba generó una sensibilidad de 90% y una especificidad de 73%. Para reducir la pendiente del tamaño de muestra, se utilizó validación cruzada de exclusión que incorpora las mediciones de todos los 124 casos disponibles y las muestras de control. Se probaron varias combinaciones de marcadores. Los siete marcadores superiores que produjeron discriminación perfecta en el cohorte de muestra A, generaron una AUC de 0.944 en el conjunto de muestras completo; las validaciones de exclusión produjeron una sensibilidad de 90.4% y especificidad de 82.7% (exactitud predictiva 86%). La adición de hasta once marcadores incrementó la AUC a 0.947, produjo una sensibilidad de 87.3% y especificidad de 86.6%, lo cual no alteró significativamente la exactitud predictiva de 86%. Utilizando marcadores ordenados en serie derivados de todas las 124 muestras, se obtuvo una AUC = 0.944 utilizando una combinación de nueve marcadores con una sensibilidad y especificidad calculadas de 87.3% y 84.5%, respectivamente. Combinaciones de marcadores alternativas proporcionaron niveles de predicción muy similares. Como se esperaba, se requirió un mayor número de marcadores con valor predictivo menos independiente (mediante AUC) para incrementar la AUC.
Tabla 8 Combinación de Marcador Secuencial, Guia y Validación de Prueba .
Los 32 casos de cáncer incluyeron 11 muestras de cáncer en etapa I y 21 muestras de cáncer en etapa II-IV. Los marcadores se agregaron de forma secuencial en un modelo de regresión logística. La predicción de clase en un conjunto de muestras independiente de 31 casos de cáncer (11 en etapa I y 20 en etapa II-IV) y 31 controles no cancerosos, se calculó para combinaciones de cinco marcadores. MC 838 es la SEQ ID NO: 55; MC 908 es la SEQ ID NO: 57; MC 1000 es la SEQ ID NO: 63; MC 1011 es la SEQ ID NO: 65; MC 3052 es la SEQ ID NO: 145; y MC 3148 es la SEQ ID NO; 161. Para reducir la pendiente de tamaño de muestra, se empleó un modelo de validación cruzada de exclusión que incorpora las mediciones de todos los 125 casos disponibles y las muestras de control. Se probaron varias combinaciones de marcadores (ver, por ejemplo, Tabla 9).
Tabla 9 : Adición Secuencial de Marcadores y Validación de Exclusión Se probaron ciento veinticinco casos y controles. Los marcadores con el valor AUC más alto se agregaron en secuencia. La sensibilidad y la especificidad se calcularon utilizando una estrategia de exclusión. Ejemplo 10- Un Panel de Trece Péptidos Aleatorios para Predecir el Cáncer de Pulmón Antes de la Detección Radiográfica Se evaluó otra combinación de péptidos candidato seleccionados mediante la prueba t (Tabla 10) por la capacidad para predecir el inicio del cáncer de uno a cuatro años antes de la detección radiográfica. Se utilizó validación de guia y prueba para determinar la sensibilidad y la especificidad de una combinación de 13 marcadores únicos para 31 casos de detección pre diagnóstico y 30 casos no cáncer obtenidos al entrar a la prueba de detección CT de la Mayo Clinic (Swensen et al., Radiology 2003;226:756-61; y Swensen et al., Radiology 2005; 235:259-65).
Tabla 10 : Trece péptidos expresados en el fago MI3 para predicción de Pre-cáncer MC0908 MC3001 C3100 C3050 C3052 SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID NO: 57 NO: 117 NO: 153 NO: 143 NO: 145 MC3010 C3014 MC1011 MC0838 MC1694 SEQ ID SEQ ID SEQ ID SEQ ID SEQ ID NO: 121 NO: 125 NO: 65 NO: 55 NO: 77 MC2624 MC3148 MC2984 SEQ ID SEQ ID SEQ ID NO: 91 NO: 161 NO: 101 Se diagnosticó NSCLC en la incidencia de la detección CT de uno a cuatro años después de la donación de sangre acumulara y la exploración CT de prevalencia. Las muestras disponibles utilizadas como un conjunto guia incluyeron 42 NSCLC en etapa avanzada, 22 NSCLC en etapa temprana y 30 controles no cancerosos. Los péptidos se expresaron en fago M13 y se analizaron en una micro-instalación de portaobjetos de vidrio como se describe en la presente . Los marcadores proporcionaron colectivamente una AUC de la curva de ROC de 0.987 en el conjunto guia. Utilizando el conjunto guia como clasificadores, la predicción del cáncer en el conjunto de prueba demostró una sensibilidad de 80.6% y una especificidad de 70%. Los datos corresponden a la predicción precisa de 8 de 10 casos de cáncer un año antes de la detección radiográfica; de 7/9 dos años antes de la detección; de 9/10 tres años antes de la detección; de 2/3 cuatro años antes de la detección y de 21/30 controles no cancerosos.
Tabla 11 : Predicción de Cáncer de Pulmón Ejemplo 11- Un Panel de Veintiún Péptidos Aleatorios para Detectar Cáncer de Pulmón Un depósito de marcadores candidato de 21 péptidos únicos (Tabla 12) seleccionados mediante prueba t, se probaron en casos NSCLC que incluyeron 42 en etapa avanzada, 22 en etapa temprana, 38 casos de detección pre diagnóstico y 59 casos no cancerosos. Los valores p se calcularon a partir de los datos para casos no cancerosos vs . casos en etapa única, en todas las etapas, de detección pre diagnóstico o combinaciones de los varios grupos de cáncer. Los valores p en la prueba t variaron de 0.04 a <0.0000001. Los marcadores con valores p <0.05 para todas las comparaciones, se seleccionaron por inclusión en el panel. Los datos en las columnas 2, 3 y 4 de la Tabla 12 muestran que los clones en este panel de péptidos aleatorios expresados en el fago M13 podrían discriminar entre casos no cancerosos y casos con cáncer de pulmón en etapa temprana, de cáncer de pulmón en etapa tardía y en casos con enfermedades ocultas no aparentes en exploraciones CT, respectivamente, como se describió en los Ejemplos 1 y 2 utilizando péptidos de una biblioteca de visualización de fago T7.
Tabla 12: Panel de 21 péptidos expresados en fago MI3 Todas las referencias citadas en la presente se incorporan en la presente mediante la referencia en su totalidad. Será evidente que pueden efectuarse varias modificaciones a las enseñanzas de la presente sin alejarse del espíritu y del alcance de la presente invención.

Claims (17)

  1. REIVINDICACIONES 1. Un método para seleccionar un paciente para experimentar una prueba radiográfica para cáncer de pulmón que comprende : (a) proporcionar una muestra de fluido de dicho paciente; (b) determinar la presencia de un marcador asociado con cáncer de pulmón en dicha muestra utilizando un polipéptido aleatorio; y (c) seleccionar pacientes de pruebas radiográficas que tengan dicho marcador en dicha muestra.
  2. 2. El método de la reivindicación 1, en donde dicho marcador es un autoanticuerpo .
  3. 3. El método de la reivindicación 1, en donde dicho paciente es asintomático .
  4. 4. El método de la reivindicación 1, en donde dicho paciente es un paciente de alto riesgo sin cáncer de pulmón radiográficamente detectable.
  5. 5. El método de la reivindicación 1, en donde dicho marcador se expresa hasta cinco años antes de que el cáncer de pulmón radiográficamente detectable, se encuentre presente en dicho paciente.
  6. 6. Una composición que comprende un marcador de cáncer de pulmón, en donde dicho marcador es un socio de enlace de una molécula presente en una muestra de fluido de un paciente hasta cinco años de que el cáncer de pulmón radiográficamente detectable, se encuentre presente en dicho paciente y que es un polipéptido aleatorio.
  7. 7. La composición de la reivindicación 6, en donde dicha molécula en dicha muestra es un autoanticuerpo .
  8. 8. La composición de la reivindicación 6 que comprende una microesfera.
  9. 9. La composición de la reivindicación 6 que comprende una membrana .
  10. 10. La composición de la reivindicación 6 que comprende una superficie plana.
  11. 11. Un dispositivo de análisis que comprende la composición de la reivindicación 6.
  12. 12. El dispositivo de análisis de la reivindicación 11 que comprende una micro-instalación.
  13. 13. Un dispositivo de diagnóstico que comprende al menos dos marcadores de cáncer de pulmón y una fase sólida, en donde dichos marcadores son polipéptidos aleatorios.
  14. 14. El dispositivo de la reivindicación 13, en donde dichos marcadores son epitopes de autoanticuerpos.
  15. 15. El dispositivo de la reivindicación 13, en donde dicha fase sólida comprende una microesfera.
  16. 16. El dispositivo de la reivindicación 13, en donde dicha fase sólida comprende una membrana.
  17. 17. El dispositivo de la reivindicación 13, que comprende una instalación.
MX2008016352A 2006-07-08 2007-07-06 Analisis diagnostico para cancer de pulmon. MX2008016352A (es)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US80677806P 2006-07-08 2006-07-08
PCT/US2006/060796 WO2007079284A2 (en) 2005-11-10 2006-11-10 Lung cancer diagnostic assay
PCT/US2007/072943 WO2008008708A2 (en) 2006-07-08 2007-07-06 Lung cancer diagnostic assay

Publications (1)

Publication Number Publication Date
MX2008016352A true MX2008016352A (es) 2009-04-17

Family

ID=40364151

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2008016352A MX2008016352A (es) 2006-07-08 2007-07-06 Analisis diagnostico para cancer de pulmon.

Country Status (10)

Country Link
US (2) US20100093108A1 (es)
EP (1) EP2041569A4 (es)
JP (1) JP2010507069A (es)
KR (1) KR20090034961A (es)
CN (1) CN101490550A (es)
AU (1) AU2007272607A1 (es)
CA (1) CA2657328A1 (es)
IL (1) IL196326A0 (es)
MX (1) MX2008016352A (es)
WO (1) WO2008008708A2 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7989160B2 (en) 2006-02-13 2011-08-02 Alethia Biotherapeutics Inc. Polynucleotides and polypeptide sequences involved in the process of bone remodeling
US8168181B2 (en) 2006-02-13 2012-05-01 Alethia Biotherapeutics, Inc. Methods of impairing osteoclast differentiation using antibodies that bind siglec-15
KR20100119868A (ko) * 2008-01-15 2010-11-11 벤자민 가비쉬 반복된 혈압 측정치를 이용하여 생리학적 파라미터를 판정하는 방법 및 시스템
EP2446272A2 (en) 2009-06-23 2012-05-02 Eventus Diagnostics Israel Ltd. A method and system for the detection of cancer
CN103003693B (zh) * 2010-04-13 2016-07-06 M-Lab股份有限公司 青光眼的诊断方法
US11913957B2 (en) 2011-12-21 2024-02-27 Biodesix, Inc. Compositions, methods and kits for diagnosis of lung cancer
US9304137B2 (en) 2011-12-21 2016-04-05 Integrated Diagnostics, Inc. Compositions, methods and kits for diagnosis of lung cancer
AU2012358246B2 (en) * 2011-12-21 2018-01-25 Integrated Diagnostics, Inc. Methods for diagnosis of lung cancer
US9493562B2 (en) 2012-07-19 2016-11-15 Alethia Biotherapeutics Inc. Anti-Siglec-15 antibodies
WO2014100717A2 (en) * 2012-12-21 2014-06-26 Integrated Diagnostics, Inc. Compositions, methods and kits for diagnosis of lung cancer
US9297805B2 (en) 2013-07-26 2016-03-29 Integrated Diagnostics, Inc. Compositions, methods and kits for diagnosis of lung cancer
WO2015134668A1 (en) * 2014-03-04 2015-09-11 The Regents Of The University Of California Automated quality control of diagnostic radiology
CN106046134B (zh) * 2016-06-03 2019-08-30 南通大学 小分子多肽nfib的应用
BR102017010169A2 (pt) * 2017-05-15 2019-02-26 Remer Consultores Assessoria Empresarial Ltda. composto, intermediário de síntese, uso na preparação de anticonvulsivante, composição farmacêutica anticonvulsivante
CN109387633A (zh) * 2018-11-07 2019-02-26 国家纳米科学中心 基于热泳细胞外囊泡检测的肺癌检测系统及方法
CN114317745B (zh) * 2020-03-30 2022-06-07 中国医学科学院肿瘤医院 外泌体arpc5、eri3等在肺癌诊断中的应用

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4351824A (en) * 1981-02-05 1982-09-28 Icl Scientific Polystyrene latex reagents, methods of preparation, and use in immunological procedures
ES2216295T5 (es) * 1997-06-26 2008-06-01 The Regents Of The University Of Michigan Metodo para la identificacion de antigenos tumorales con autoanticuerpos en suero.
GB9810040D0 (en) * 1998-05-11 1998-07-08 Univ Nottingham Blood borne tumour markers
GB9827228D0 (en) * 1998-12-10 1999-02-03 Univ Nottingham Cancer detection method and reagents
US6645465B2 (en) * 1999-08-06 2003-11-11 Michigan, University Of The Regents Annexin proteins and autoantibodies as serum markers for cancer
EP1259545A2 (en) * 2000-01-21 2002-11-27 Ludwig Institute For Cancer Research Small cell lung cancer associated antigens and uses therefor
AU2002365228A1 (en) * 2001-11-09 2003-09-02 Brad Nelson Antigen panels and methods of using the same

Also Published As

Publication number Publication date
CN101490550A (zh) 2009-07-22
CA2657328A1 (en) 2008-01-17
JP2010507069A (ja) 2010-03-04
AU2007272607A1 (en) 2008-01-17
IL196326A0 (en) 2009-09-22
US20150153347A1 (en) 2015-06-04
EP2041569A2 (en) 2009-04-01
KR20090034961A (ko) 2009-04-08
WO2008008708A2 (en) 2008-01-17
EP2041569A4 (en) 2009-11-18
US20100093108A1 (en) 2010-04-15
WO2008008708A3 (en) 2008-10-09

Similar Documents

Publication Publication Date Title
MX2008016352A (es) Analisis diagnostico para cancer de pulmon.
US20120231966A1 (en) Lung cancer diagnostic assay
Simon et al. Evaluation of the novel serum markers B7-H4, Spondin 2, and DcR3 for diagnosis and early detection of ovarian cancer
CN109142755B (zh) 一种诊断早期食管鳞状细胞癌的四种自身抗体联合检测试剂盒及应用
JP5591711B2 (ja) 結腸直腸癌のためのマーカーパネル
JP6026422B2 (ja) 肺がん試験
EP2074422A2 (en) Methods and kits for detecting prostate cancer biomarkers
CN109342727B (zh) 食管鳞状细胞癌自身抗体分子标志物模型及其应用
WO2009040782A2 (en) A method of assessing colorectal cancer status in an individual
US20140371098A1 (en) Marker sequences for breast cancer and the use thereof
Wang et al. Evaluation of the clinical application of multiple tumor marker protein chip in the diagnostic of lung cancer
CN109187979B (zh) 蛋白芯片、蛋白质芯片诊断试剂盒制备及使用方法
Patwa et al. The identification of phosphoglycerate kinase‐1 and histone H4 autoantibodies in pancreatic cancer patient serum using a natural protein microarray
US20210318316A1 (en) Lung cancer protein epitomic biomarkers
Scarlett et al. Classification of pancreatic cystic lesions using SELDI‐TOF mass spectrometry
MX2008006130A (es) Analisis diagnostico de cancer de pulmon
AU2019290743A1 (en) Biomarkers for urothelial carcinoma and applications thereof
CN101374962A (zh) 肺癌的诊断分析法
TWI842716B (zh) 泌尿道上皮細胞癌生物標記及其應用
KR102128251B1 (ko) 아르기닌이 메틸화된 drd2에 특이적으로 결합하는 대장암 진단용 바이오마커 조성물
EP2619218B1 (en) Kits for detecting breast or ovarian cancer in a body fluid sample and use thereof
EP3242132B1 (en) Methods of detecting cancer
KR20230068378A (ko) 폐암에서 자가항체를 검출하기 위한 항원 조합의 용도
WO2016040178A1 (en) Methods for colon hyperproliferative disorder detection, prognosis, and diagnosis

Legal Events

Date Code Title Description
FA Abandonment or withdrawal