ES2658921T3 - Multigenic prognosis test for lung cancer - Google Patents

Multigenic prognosis test for lung cancer Download PDF

Info

Publication number
ES2658921T3
ES2658921T3 ES12807429.1T ES12807429T ES2658921T3 ES 2658921 T3 ES2658921 T3 ES 2658921T3 ES 12807429 T ES12807429 T ES 12807429T ES 2658921 T3 ES2658921 T3 ES 2658921T3
Authority
ES
Spain
Prior art keywords
risk
regulation
forecast
protein
cdc6
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES12807429.1T
Other languages
Spanish (es)
Inventor
Michael J. Mann
David M. Jablons
Johannes KRATZ
David Berryman
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Encore Clinical Inc
University of California
Original Assignee
Encore Clinical Inc
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Encore Clinical Inc, University of California filed Critical Encore Clinical Inc
Application granted granted Critical
Publication of ES2658921T3 publication Critical patent/ES2658921T3/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57423Specifically defined cancers of lung
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Abstract

Un método para proporcionar un pronóstico para el cáncer de pulmón no microcítico (CPNM) en un sujeto, comprendiendo el método las etapas de: (a) poner en contacto una muestra biológica del sujeto con reactivos que se unen de forma específica a cada miembro de un panel de biomarcadores que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A; y (b) determinar una puntuación de riesgo del sujeto basada en los niveles de ácido nucleico de expresión de los biomarcadores en la muestra o determinar si los biomarcadores se expresan de forma diferencial o no a nivel de ácido nucleico en la muestra; y (c) proporcionar un pronóstico para el CPNM basado en la puntuación de riesgo del sujeto o en la expresión diferencial.A method of providing a prognosis for non-small cell lung cancer (NSCLC) in a subject, the method comprising the steps of: (a) contacting a biological sample of the subject with reagents that specifically bind each member of a biomarker panel consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A; and (b) determine a subject risk score based on the levels of nucleic acid expression of the biomarkers in the sample or determine whether the biomarkers are differentially expressed or not at the level of nucleic acid in the sample; and (c) provide a prognosis for NSCLC based on the subject's risk score or differential expression.

Description

Ensayo de pronóstico multigénico para el cáncer de pulmón Multigenic prognosis test for lung cancer

5 Referencia a solicitudes relacionadas 5 Reference to related requests

La presente solicitud reivindica el beneficio de prioridad de la Solicitud de Patente Provisoria de Estados Unidos n.º de serie 61/504.063, presentada el 1 de julio de 2011, y la Solicitud de Patente Provisoria de Estados Unidos n.º de serie 61/504.193, presentada el 2 de julio de 2011. This application claims the priority benefit of U.S. Provisional Patent Application Serial No. 61 / 504,063, filed July 1, 2011, and U.S. Provisional Patent Application Serial No. 61 / 504,193, filed July 2, 2011.

Antecedentes de la invención Background of the invention

La probabilidad de una supervivencia a largo plazo para los pacientes con cáncer del pulmón está poco definida por la fase clínica y los hallazgos histopatológicos. Se ha publicado la identificación por micromatriz de genes The probability of long-term survival for patients with lung cancer is poorly defined by the clinical phase and histopathological findings. Gene microarray identification has been published

15 identificados como pronósticos para el cáncer de pulmón, aunque existe una necesidad de un ensayo de reacción en cadena de la polimerasa (PCR) cuantitativo multigénico preciso que pueda predecir el riesgo de mortalidad entre los pacientes con cáncer de pulmón. 15 identified as prognoses for lung cancer, although there is a need for a precise multigenic polymerase chain reaction (PCR) assay that can predict the risk of mortality among patients with lung cancer.

Breve sumario de la invención Brief summary of the invention

En un aspecto, se proporciona un método para proporcionar un pronóstico para el cáncer de pulmón en un sujeto, comprendiendo el método las etapas de: (a) poner en contacto una muestra biológica del sujeto con reactivos que se unen de forma específica a un panel de biomarcadores que comprenden BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3, y (b) determinar si los marcadores se expresan de forma diferencial en In one aspect, a method is provided to provide a prognosis for lung cancer in a subject, the method comprising the steps of: (a) contacting a biological sample of the subject with reagents that specifically bind a panel of biomarkers comprising BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3, and (b) determine whether markers are differentially expressed in

25 la muestra o no; proporcionando de este modo un pronóstico para el cáncer de pulmón. 25 the sample or not; thus providing a prognosis for lung cancer.

En una realización, el reactivo es un ácido nucleico. En otra realización, el reactivo es un oligonucleótido. En otra realización, el reactivo es un conjunto de cebadores de PCR. En otra realización, el reactivo es un anticuerpo. In one embodiment, the reagent is a nucleic acid. In another embodiment, the reagent is an oligonucleotide. In another embodiment, the reagent is a set of PCR primers. In another embodiment, the reagent is an antibody.

En una realización, el cáncer de pulmón es cáncer de pulmón no escamoso. En otra realización, el cáncer de pulmón no escamoso está en estadio I. En otra realización, el cáncer de pulmón no escamoso está en estadio II. En otra realización, el cáncer de pulmón no escamoso está en estadio III. En otra realización, el cáncer de pulmón no escamoso está en estadio IV. In one embodiment, lung cancer is non-squamous lung cancer. In another embodiment, non-squamous lung cancer is stage I. In another embodiment, non-squamous lung cancer is stage II. In another embodiment, non-squamous lung cancer is stage III. In another embodiment, non-squamous lung cancer is stage IV.

35 En una realización, la muestra es de tejido pulmonar o una biopsia de tumor pulmonar. In one embodiment, the sample is from lung tissue or a lung tumor biopsy.

En una realización, el pronóstico proporciona una evaluación del riesgo. En algunas realizaciones, la evaluación del riesgo está basada en la mortalidad a 5 años. En algunas realizaciones, la evaluación del riesgo es una evaluación de riesgo alto, intermedio o bajo para la mortalidad a 5 años. In one embodiment, the forecast provides a risk assessment. In some embodiments, the risk assessment is based on 5-year mortality. In some embodiments, the risk assessment is a high, intermediate or low risk assessment for 5-year mortality.

En un aspecto, se proporciona un kit, comprendiendo el kit reactivos que se unen de forma específica a un panel de biomarcadores que comprenden BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3. En una realización, el reactivo es un conjunto de transcriptasa inversa. In one aspect, a kit is provided, the kit comprising reagents that specifically bind to a panel of biomarkers comprising BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3. In one embodiment, the reagent is a set of reverse transcriptase.

45 En aún otro aspecto, se proporciona un método de determinación del pronóstico de un sujeto que tiene un cáncer de pulmón mediante la medición en una muestra biológica de los niveles de metilación de un panel de biomarcadores que comprende BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3; en el que dicha muestra biológica se obtiene de dicho sujeto y dichos niveles de metilación son indicativos de dicho pronóstico. In yet another aspect, a method of determining the prognosis of a subject having lung cancer is provided by measuring in a biological sample the methylation levels of a biomarker panel comprising BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3; wherein said biological sample is obtained from said subject and said levels of methylation are indicative of said prognosis.

En otro aspecto, se proporciona un informe, comprendiendo el informe un pronóstico de un sujeto que tiene un cáncer de pulmón, habiéndose determinado dicho pronóstico cuantificando en una muestra biológica del sujeto los niveles de expresión de un panel de biomarcadores que comprenden BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3; en el que dichos niveles de expresión son indicativos de dicho In another aspect, a report is provided, the report comprising a prognosis of a subject having lung cancer, said prognosis having been determined by quantifying in a biological sample of the subject the expression levels of a panel of biomarkers comprising BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3; wherein said expression levels are indicative of said

55 pronóstico. 55 forecast.

En otro aspecto, se proporciona un método para determinar un plan de tratamiento, comprendiendo el método las etapas de: (a) poner en contacto una muestra biológica del sujeto con reactivos que se unen cada uno de forma específica a un miembro de un panel de biomarcadores que comprenden BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3, (b) determinar si los marcadores se expresan de forma diferencial en la muestra o no, (c) proporcionar un pronóstico para el cáncer de pulmón, (d) determinar una evaluación del riesgo para la mortalidad a 5 años basada en el pronóstico para el cáncer de pulmón y (c) idear un plan de tratamiento basado en la evaluación del riesgo. In another aspect, a method is provided for determining a treatment plan, the method comprising the steps of: (a) contacting a biological sample of the subject with reagents that each specifically bind a member of a panel of Biomarkers comprising BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3, (b) determine whether markers are differentially expressed in the sample or not, (c) provide a prognosis for lung cancer, (d) determine a risk assessment for 5-year mortality based on the prognosis for lung cancer and (c) devise a treatment plan based on risk assessment.

65 En otro aspecto, se proporciona un método para proporcionar un pronóstico para el cáncer de pulmón en un sujeto, comprendiendo el método las etapas de: (a) poner en contacto una muestra biológica del sujeto con reactivos que se In another aspect, a method is provided to provide a prognosis for lung cancer in a subject, the method comprising the steps of: (a) contacting a biological sample of the subject with reagents that are

unen cada uno de forma específica a un miembro de un panel de biomarcadores que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A, y (b) determinar si los biomarcadores se expresan de forma diferencial en la muestra o no; proporcionando de este modo un pronóstico para el cáncer de pulmón. En algunas realizaciones, la determinación de si los biomarcadores se expresan de forma diferencial en la each specifically bind a member of a biomarker panel consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A, and (b) determine whether biomarkers are expressed in differential form in the sample or not; thus providing a prognosis for lung cancer. In some embodiments, the determination of whether biomarkers are differentially expressed in the

5 muestra o no comprende adicionalmente normalizar los niveles de expresión de los biomarcadores con respecto a genes constitutivos seleccionados del grupo que consiste en ESD, TBP, YAP1 y cualquiera de las combinaciones de los mismos. En determinadas realizaciones, los niveles de expresión de los biomarcadores se normalizan frente al valor CT (del inglés cycle threshold: ciclo umbral) promedio de los genes constitutivos. En una realización, BAG1, BRCA1, CDC6, CDK2AP1, FUT3, IL11 y RND3 indican en el sujeto una probabilidad aumentada de mortalidad y en los que ERBB3, LCK, SH3BGR y WNT3A indican en el sujeto una probabilidad disminuida de mortalidad. 5 shows or does not additionally comprise normalizing the expression levels of the biomarkers with respect to constitutive genes selected from the group consisting of ESD, TBP, YAP1 and any combination thereof. In certain embodiments, the expression levels of the biomarkers are normalized against the average CT value of the constituent genes. In one embodiment, BAG1, BRCA1, CDC6, CDK2AP1, FUT3, IL11 and RND3 indicate in the subject an increased probability of mortality and in which ERBB3, LCK, SH3BGR and WNT3A indicate in the subject a decreased probability of mortality.

En una realización, los reactivos son ácidos nucleicos. En otra realización, los reactivos son oligonucleótidos. En otra realización, los reactivos son conjuntos de cebadores de PCR. En otra realización, los reactivos son anticuerpos. In one embodiment, the reagents are nucleic acids. In another embodiment, the reagents are oligonucleotides. In another embodiment, the reagents are sets of PCR primers. In another embodiment, the reagents are antibodies.

15 En una realización, el cáncer de pulmón es cáncer de pulmón no escamoso. En otra realización, el cáncer de pulmón no escamoso está en estadio I. En otra realización, el cáncer de pulmón no escamoso está en estadio II. En otra realización, el cáncer de pulmón no escamoso está en estadio III. En otra realización, el cáncer de pulmón no escamoso está en estadio IV. 15 In one embodiment, lung cancer is non-squamous lung cancer. In another embodiment, non-squamous lung cancer is stage I. In another embodiment, non-squamous lung cancer is stage II. In another embodiment, non-squamous lung cancer is stage III. In another embodiment, non-squamous lung cancer is stage IV.

En una realización, la muestra es de un tumor extirpado de forma quirúrgica. En otra realización, la muestra procede de tejido pulmonar o de una biopsia de tumor pulmonar. In one embodiment, the sample is from a tumor surgically removed. In another embodiment, the sample is from lung tissue or a lung tumor biopsy.

En una realización, el pronóstico proporciona una evaluación del riesgo. En algunas realizaciones, la evaluación del riesgo está basada en la mortalidad a 5 años. En algunas realizaciones, la evaluación del riesgo es una evaluación In one embodiment, the forecast provides a risk assessment. In some embodiments, the risk assessment is based on 5-year mortality. In some embodiments, the risk assessment is an assessment

25 de riesgo alto, intermedio o bajo para la mortalidad a 5 años. 25 high, intermediate or low risk for 5-year mortality.

En otro aspecto, se proporciona un kit que comprende reactivos que se unen cada uno de forma específica a un miembro de un panel de biomarcadores que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A. En determinadas realizaciones, los reactivos son conjuntos de transcriptasa inversa. En algunas realizaciones, el kit comprende adicionalmente genes constitutivos seleccionados del grupo que consiste en ESD, TBP, YAP1 y cualquier combinación de los mismos. In another aspect, a kit is provided comprising reagents that each specifically bind a member of a biomarker panel consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A In certain embodiments, the reagents are reverse transcriptase sets. In some embodiments, the kit additionally comprises constitutive genes selected from the group consisting of ESD, TBP, YAP1 and any combination thereof.

En otro aspecto, se proporciona un método para proporcionar un pronóstico de un sujeto que tiene cáncer de pulmón, comprendiendo dicho método medir en una muestra biológica los niveles de metilación de un panel de In another aspect, a method is provided to provide a prognosis of a subject having lung cancer, said method comprising measuring in a biological sample the methylation levels of a panel of

35 biomarcadores que consisten en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A; en el que dicha muestra biológica se obtiene de dicho sujeto y dichos niveles de metilación son indicativos de dicho pronóstico. 35 biomarkers consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A; wherein said biological sample is obtained from said subject and said levels of methylation are indicative of said prognosis.

En aún otro aspecto, se proporciona un informe que comprende un pronóstico de un sujeto que tiene un cáncer de pulmón, habiéndose determinado dicho pronóstico cuantificando en una muestra biológica del sujeto los niveles de expresión de un panel de biomarcadores que consisten en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A; en el que dichos niveles de expresión son indicativos de dicho pronóstico. En algunas realizaciones, la cuantificación del sujeto de los niveles de expresión de un panel de biomarcadores en la muestra biológica comprende adicionalmente normalizar los niveles de expresión de los biomarcadores con respecto In yet another aspect, a report is provided that comprises a prognosis of a subject having lung cancer, said prognosis having been determined by quantifying in a biological sample of the subject the expression levels of a biomarker panel consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A; wherein said expression levels are indicative of said prognosis. In some embodiments, the subject quantification of the expression levels of a biomarker panel in the biological sample further comprises normalizing the expression levels of the biomarkers with respect to

45 a genes constitutivos seleccionados del grupo que consiste en ESD, TBP, YAP1 y cualquiera de las combinaciones de los mismos. En determinadas realizaciones, los niveles de expresión de los biomarcadores se normalizan frente al valor CT promedio de los genes constitutivos. 45 to constitutive genes selected from the group consisting of ESD, TBP, YAP1 and any combination thereof. In certain embodiments, the biomarker expression levels are normalized against the average CT value of the constitutive genes.

En aún otro aspecto, se proporciona un método para determinar un plan de tratamiento, comprendiendo el método las etapas de: (a) poner en contacto una muestra biológica del sujeto con reactivos que se unen cada uno de forma específica a un miembro de un panel de biomarcadores que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A, (b) determinar si los marcadores se expresan de forma diferencial en la muestra o no, (c) proporcionar un pronóstico para el cáncer de pulmón, (d) determinar una evaluación del riesgo para la mortalidad a 5 años basada en el pronóstico para el cáncer de pulmón, y (e) idear un plan de tratamiento In yet another aspect, a method is provided for determining a treatment plan, the method comprising the steps of: (a) contacting a biological sample of the subject with reagents that each specifically bind a member of a panel of biomarkers consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A, (b) determine whether the markers are differentially expressed in the sample or not, (c) provide a prognosis for lung cancer, (d) determine a risk assessment for 5-year mortality based on the prognosis for lung cancer, and (e) devise a treatment plan

55 basado en la evaluación del riesgo. En algunas realizaciones, la determinación de si los biomarcadores se expresan en la muestra de forma diferencial o no comprende adicionalmente normalizar los niveles de expresión de los biomarcadores con respecto a genes constitutivos seleccionados del grupo que consiste en ESD, TBP, YAP1 y cualquiera de las combinaciones de los mismos. En determinadas realizaciones, los niveles de expresión de los biomarcadores se normalizan frente al valor CT promedio de los genes constitutivos. 55 based on risk assessment. In some embodiments, the determination of whether the biomarkers are expressed in the sample differentially or does not additionally comprise normalizing the expression levels of the biomarkers with respect to constitutive genes selected from the group consisting of ESD, TBP, YAP1 and any of the combinations thereof. In certain embodiments, the biomarker expression levels are normalized against the average CT value of the constitutive genes.

En aún otro aspecto, se proporciona un método para proporcionar un pronóstico para el cáncer de pulmón en un sujeto, comprendiendo el método las etapas de: (a) poner en contacto una muestra biológica del sujeto con reactivos que se unen cada uno de forma específica a un miembro de un panel de biomarcadores que consiste en BAG 1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A; (b) determinar una puntuación de 65 riesgo del sujeto basada en los niveles de expresión de los biomarcadores en la muestra; y (c) proporcionar un pronóstico para el cáncer de pulmón basado en la puntuación de riesgo del sujeto. En algunas realizaciones, la In yet another aspect, a method is provided to provide a prognosis for lung cancer in a subject, the method comprising the steps of: (a) contacting a biological sample of the subject with reagents that each specifically bind to a member of a biomarker panel consisting of BAG 1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A; (b) determine a subject risk score based on the levels of expression of the biomarkers in the sample; and (c) provide a prognosis for lung cancer based on the subject's risk score. In some embodiments, the

determinación de una puntuación de riesgo del sujeto basada en los niveles de expresión de los biomarcadores en la muestra comprende adicionalmente normalizar los niveles de expresión de los biomarcadores con respecto a genes constitutivos seleccionados del grupo que consiste en ESD, TBP, YAP1 y cualquiera de las combinaciones de los mismos. En determinadas realizaciones, los niveles de expresión de los biomarcadores se normalizan frente al valor Determination of a subject risk score based on the levels of expression of the biomarkers in the sample further comprises normalizing the levels of expression of the biomarkers with respect to constitutive genes selected from the group consisting of ESD, TBP, YAP1 and any of the combinations thereof. In certain embodiments, the expression levels of the biomarkers are normalized against the value

5 CT promedio de los genes constitutivos. 5 CT average of the constitutive genes.

Breve descripción de las figuras Brief description of the figures

La Figura 1 muestra que el cáncer de pulmón es la causa más común de muerte por cáncer y muestra que para los cánceres en estadio 1 el pronóstico para la supervivencia a 5 años es aproximadamente del 60 %. Figure 1 shows that lung cancer is the most common cause of cancer death and shows that for stage 1 cancers the prognosis for 5-year survival is approximately 60%.

La Figura 2 muestra modelos genómicos de pronóstico. Figure 2 shows prognostic genomic models.

La Figura 3 es un ejemplo de un análisis de supervivencia de Kaplan-Meier de pacientes de riesgo bajo, 15 intermedio y alto, agrupados por la puntuación de riesgo utilizando el algoritmo del Ejemplo 1. Figure 3 is an example of a Kaplan-Meier survival analysis of low, intermediate and high risk patients, grouped by risk score using the algorithm of Example 1.

La Figura 4 es un cuadro que resume los genes de algoritmo utilizados en el algoritmo del Ejemplo 2. Figure 4 is a table summarizing the algorithm genes used in the algorithm of Example 2.

La Figura 5A es un gráfico que ilustra la probabilidad de mortalidad a 5 años por la puntuación de riesgo, en donde las líneas discontinuas son intervalos de confianza (los IC) del 95 % y las líneas cortas perpendiculares al eje X son puntuaciones de riesgo individuales para cada paciente. La Figura 5B es un gráfico que ilustra el aumento de la razón de riesgos instantáneos (RRI) de la mortalidad global a 5 años por subgrupo para cada aumento gradual en la categoría de riesgo (por ejemplo, bajo a intermedio e intermedio a alto), en donde los tamaños de los cuadrados son proporcionales al tamaño del grupo y AJCC se refiere a American Joint Figure 5A is a graph illustrating the probability of 5-year mortality by risk score, where the dashed lines are 95% confidence intervals (CI) and short lines perpendicular to the X axis are individual risk scores For each patient. Figure 5B is a graph illustrating the increase in the instantaneous risk ratio (RRI) of the global mortality at 5 years per subgroup for each gradual increase in the risk category (for example, low to intermediate and intermediate to high), where the square sizes are proportional to the group size and AJCC refers to American Joint

25 Committee on Cancer. 25 Committee on Cancer.

La Figura 6A es un gráfico que ilustra la supervivencia global para toda la cohorte. La Figura 6B es un gráfico que ilustra la supervivencia específica para el cáncer de pulmón para toda la cohorte, en el que las muertes por cáncer que no es de pulmón están censuradas. La Figura 6C es un gráfico que ilustra la supervivencia global para 330 pacientes con enfermedad en estadio IA y IB de la American Joint Commission on Cancer, considerados como de riesgo bajo según los criterios patológicos convencionales (National Comprehensive Cancer Network). Figure 6A is a graph illustrating overall survival for the entire cohort. Figure 6B is a graph illustrating the specific survival for lung cancer for the entire cohort, in which deaths from non-lung cancer are censored. Figure 6C is a graph illustrating the overall survival for 330 patients with stage IA and IB disease of the American Joint Commission on Cancer, considered as low risk according to conventional pathological criteria (National Comprehensive Cancer Network).

La Figura 7 muestra gráficos que representan (A) la supervivencia global para toda la cohorte y la supervivencia 35 en pacientes con enfermedad en (B) estadio I, (C) en estadio II y (D) en estadio III. Figure 7 shows graphs that represent (A) overall survival for the entire cohort and survival in patients with disease in (B) stage I, (C) in stage II and (D) in stage III.

La Figura 8 es un diagrama de bloques que ilustra un sistema de ordenador ejemplar, en conformidad con diversas realizaciones. Figure 8 is a block diagram illustrating an exemplary computer system, in accordance with various embodiments.

La Figura 9 es un diagrama de flujo que ilustra aspectos de un método de acuerdo con una realización de la divulgación. Figure 9 is a flow chart illustrating aspects of a method according to an embodiment of the disclosure.

Descripción detallada de la invención Detailed description of the invention

45 Introducción 45 Introduction

La invención presenta la identificación de perfiles de expresión de determinados grupos de genes que permiten el pronóstico preciso de la mortalidad en el cáncer de pulmón en fase precoz. De forma ideal, una herramienta de pronóstico debería proporcionar una estratificación del riesgo precisa, debería ser factible desde el punto de vista clínico de emplear en la práctica cotidiana y debería ser económica. Tal ensayo sería de beneficio particular para los pacientes con CPNM no escamoso en estadio I o II extirpado de forma quirúrgica. El tratamiento habitual actual para la mayoría del CPNM no escamoso en estadio I es la lobulectomía y linfadenectomía de ganglios mediastínicos, sin quimioterapia adyuvante. Una mejor identificación de subconjuntos de pacientes con buen pronóstico podría permitir emplear procedimientos quirúrgicos menores con un potencial de supervivencia equivalente. A la inversa, los The invention presents the identification of expression profiles of certain groups of genes that allow the precise prognosis of mortality in early stage lung cancer. Ideally, a prognostic tool should provide accurate risk stratification, should be clinically feasible to use in everyday practice and should be economical. Such a trial would be of particular benefit for patients with non-squamous NSCLC in stage I or II surgically removed. The current usual treatment for most non-squamous NSCLC in stage I is lobulectomy and lymphadenectomy of mediastinal nodes, without adjuvant chemotherapy. A better identification of subsets of patients with a good prognosis could allow the use of minor surgical procedures with equivalent survival potential. Conversely, the

55 subconjuntos de estadio I con un mal pronóstico podrían seleccionarse para el tratamiento con una quimioterapia adyuvante para reducir el riesgo de metástasis a distancia utilizando los agentes de tratamiento habituales actuales. Además, los pacientes identificados con un mal pronóstico también podrían considerarse para la inclusión en ensayos clínicos que prueban estrategias novedosas y nuevos agentes terapéuticos. Teniendo en cuenta las actuales limitaciones de la quimioterapia en la enfermedad en estadio I, sería especialmente beneficioso un bioensayo que sea pronóstico y predictivo del beneficio de la quimioterapia. Por último, es probable que el CPNM no escamoso en estadio I sea de creciente importancia en el futuro. Aunque aproximadamente el 20-30 % de los pacientes actualmente diagnosticados con CPNM no escamoso son de estadio I, esta proporción probablemente crecerá debido al reciente advenimiento del crivado del cáncer del pulmón mediante tomografía computarizada. 55 stage I subsets with a poor prognosis could be selected for treatment with adjuvant chemotherapy to reduce the risk of distant metastases using current usual treatment agents. In addition, patients identified with a poor prognosis could also be considered for inclusion in clinical trials that test novel strategies and new therapeutic agents. Given the current limitations of chemotherapy in stage I disease, a bioassay that is prognostic and predictive of the benefit of chemotherapy would be especially beneficial. Finally, it is likely that non-squamous NSCLC in stage I will be of increasing importance in the future. Although approximately 20-30% of patients currently diagnosed with non-squamous NSCLC are stage I, this proportion is likely to grow due to the recent advent of lung cancer screening by CT scan.

65 Actualmente, a los pacientes con CPNM en estadio II se les recomienda someterse a quimioterapia adyuvante tras un intento de extirpación curativa. Sin embargo, el beneficio documentado de la quimioterapia para estos pacientes 65 Currently, patients with stage II NSCLC are advised to undergo adjuvant chemotherapy after an attempt at curative excision. However, the documented benefit of chemotherapy for these patients

en términos de mejora absoluta de la supervivencia a 5 años es pequeño. Como resultado, muchos pacientes renuncian a la quimioterapia, en particular a medida que se recuperan de su intento cirugía curativa. Un bioensayo que pueda asignar mejor el riesgo de recurrencia para los pacientes en estadio II puede, por lo tanto, mejorar el cumplimiento de las recomendaciones habituales actuales para la terapia adyuvante en pacientes que se encuentran in terms of absolute improvement of 5-year survival is small. As a result, many patients give up chemotherapy, particularly as they recover from their attempted curative surgery. A bioassay that can better assign the risk of recurrence for stage II patients may therefore improve compliance with current usual recommendations for adjuvant therapy in patients who are

5 en mayor riesgo de recurrencia. En un contexto experimental controlado, la terapia puede incluso suspenderse en pacientes que se encuentran en el riesgo más bajo de recurrencia incluso en el estadio II. 5 at higher risk of recurrence. In a controlled experimental context, therapy may even be discontinued in patients who are at the lowest risk of recurrence even in stage II.

En una realización descrita en el presente documento, se desarrolló un ensayo basado en los patrones de expresión de 426 pacientes que se habían sometido a la extracción de un cáncer de pulmón escamoso (CPNM) de estadio I-IV 10 en la Universidad de California, San Francisco. Se extrajo ARN de muestras de tejidos FFIP (fijados en formalina e incluidos en parafina) y se evaluaron los niveles de expresión para 11 genes diana relacionados con el pronóstico del paciente. Se buscó un ensayo que tendiese a asignar una puntuación de riesgo más alta en promedio a los pacientes que hubiesen fallecido que a los que habían sobrevivido a un período de seguimiento de 5 años. Los pacientes cuyas muestras recibieron las puntuaciones de riesgo más altas se considerarían en mayor riesgo de In one embodiment described herein, a trial was developed based on the expression patterns of 426 patients who had undergone the removal of a stage I-IV squamous lung cancer (NSCLC) at the University of California, San Francisco. RNA was extracted from samples of FFIP tissues (fixed in formalin and included in paraffin) and expression levels were evaluated for 11 target genes related to patient prognosis. We sought a trial that tended to assign a higher average risk score to patients who had died than to those who had survived a 5-year follow-up period. Patients whose samples received the highest risk scores would be considered at increased risk of

15 fallecer dentro de un período de 5 años después de la operación, mientras que los pacientes cuyas muestras recibieron una puntuación baja tendrían más probabilidades de haber sobrevivido durante este intervalo de tiempo después de sus operaciones. 15 die within a period of 5 years after the operation, while patients whose samples received a low score would be more likely to have survived during this time interval after their operations.

El ensayo pronóstico se desarrolló correlacionando los patrones de expresión de BAG1, BRCA1, CDC6, CDK2AP1, The prognostic trial was developed by correlating the expression patterns of BAG1, BRCA1, CDC6, CDK2AP1,

20 ERBB3, FUT3, IL11, LCK, RND3, SH3BGR, WNT3A, que están relacionados con el pronóstico del paciente (en particular porque el pronóstico se relaciona con los resultados de supervivencia global a 5 años) utilizando el modelo de riesgos instantáneos proporcionales de Cox. El ensayo pronóstico proporciona un pronóstico para el cáncer de pulmón en un sujeto determinando en una muestra la expresión de BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A. La selección de cada uno de un panel de biomarcadores que incluye 20 ERBB3, FUT3, IL11, LCK, RND3, SH3BGR, WNT3A, which are related to the patient's prognosis (in particular because the prognosis is related to the 5-year overall survival results) using the Cox proportional instantaneous risk model . The prognostic test provides a prognosis for lung cancer in a subject by determining in one sample the expression of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A. The selection of each of a biomarker panel that includes

25 BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A, ofrece una gran mejora con respecto a la técnica anterior. El documento WO2008/151072 (The Regents of the University of California) describe métodos para el pronóstico de pacientes de cáncer de pulmón que están basados en el análisis de expresión de un conjunto de biomarcadores. BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A, offers a great improvement over the prior art. WO2008 / 151072 (The Regents of the University of California) describes methods for the prognosis of lung cancer patients that are based on the expression analysis of a set of biomarkers.

30 Después, se obtiene para cada paciente una puntuación del riesgo insertando los niveles de expresión de cada uno de los 11 genes pronósticos en un algoritmo de puntuación de riesgo. Los grupos de riesgo también se describen en el presente documento a base de estas puntuaciones de riesgo, colocando a los pacientes en distintas categorías de riesgo de acuerdo con su puntuación de riesgo. Por ejemplo, “Riesgo Bajo”, “Riesgo Intermedio” o “Riesgo Alto”. 30 Next, a risk score is obtained for each patient by inserting the expression levels of each of the 11 prognostic genes into a risk scoring algorithm. The risk groups are also described in this document based on these risk scores, placing patients in different risk categories according to their risk score. For example, "Low Risk", "Intermediate Risk" or "High Risk".

35 Adicionalmente, se describe en el presente documento un kit de diagnóstico multigénico, compuesto de los marcadores descritos en el presente documento, que pueden utilizarse para proporcionar un pronóstico para pacientes de cáncer de pulmón, y de un informe que comprende un pronóstico de un sujeto que tiene cáncer de pulmón mediante la cuantificación de los niveles de expresión de los marcadores descritos en el presente documento. Additionally, a multigenic diagnostic kit is described herein, composed of the markers described herein, which can be used to provide a prognosis for lung cancer patients, and a report comprising a prognosis of a subject. who has lung cancer by quantifying the levels of expression of the markers described herein.

Definiciones Definitions

“Cáncer de pulmón” se refiere en general a dos tipos principales de cáncer de pulmón categorizados por el tamaño y el aspecto de las células malignas: cáncer de pulmón no microcítico (aproximadamente el 80 % de los casos) y 45 microcítico (aproximadamente el 20 % de los casos). “Cáncer de pulmón no microcítico” (CPNM) incluye al carcinoma escamoso. El adenocarcinoma de pulmón es el subtipo más común de CPNM y otros subtipos de cáncer de pulmón incluyen al carcinoma bronquioalveolar, el carcinoma de células grandes, el tumor carcinoide, el carcinoma adenoide quístico, el cilindroma y el carcinoma mucoepidermoide. En una realización, los cánceres de pulmón se estadifican de acuerdo con los estadios I-IV, siendo el I un estadio temprano y siendo el IV el más "Lung cancer" generally refers to two main types of lung cancer categorized by the size and appearance of malignant cells: non-small cell lung cancer (approximately 80% of cases) and microcytic (approximately 20). % of the cases). "Non-small cell lung cancer" (NSCLC) includes squamous carcinoma. Lung adenocarcinoma is the most common subtype of NSCLC and other subtypes of lung cancer include bronchioalveolar carcinoma, large cell carcinoma, carcinoid tumor, adenoid cystic carcinoma, cylindroma and mucoepidermoid carcinoma. In one embodiment, lung cancers are staged according to stages I-IV, with I being an early stage and IV being the most

50 avanzado. 50 advanced.

“Pronóstico” se refiere, por ejemplo, a la supervivencia global, la mortalidad a largo plazo y la supervivencia sin enfermedad. En una realización, mortalidad a largo plazo se refiere al fallecimiento dentro de los 5 años después del diagnóstico del cáncer de pulmón. "Prognosis" refers, for example, to overall survival, long-term mortality and disease-free survival. In one embodiment, long-term mortality refers to death within 5 years after the diagnosis of lung cancer.

55 “Evaluación de riesgo” se refiere al riesgo relativo que afronta un individuo con respecto a la mortalidad. Por ejemplo, un pronóstico que proporciona una evaluación de alto riesgo para la mortalidad a 5 años, tiene una mayor probabilidad de mortalidad dentro de los 5 años que un individuo que tiene una evaluación de bajo riesgo para la mortalidad a 5 años. En una realización, el pronóstico para la mortalidad a largo plazo es “riesgo alto”, por ejemplo, 55 “Risk assessment” refers to the relative risk an individual faces with respect to mortality. For example, a prognosis that provides a high-risk assessment for 5-year mortality has a higher probability of mortality within 5 years than an individual who has a low-risk assessment for 5-year mortality. In one embodiment, the prognosis for long-term mortality is "high risk", for example,

60 riesgo alto de mortalidad, “riesgo intermedio”, por ejemplo, riesgo intermedio de mortalidad o “riesgo bajo”, por ejemplo, riesgo bajo de mortalidad. El estadio del cáncer y el pronóstico pueden utilizarse para ajustar una terapia para el paciente que proporcione un mejor resultado, por ejemplo, terapia sistémica y cirugía, solo cirugía o terapia sistémica sola. La evaluación del riesgo puede dividirse como se desee, por ejemplo, en la mediana, en grupos terciarios, grupos cuaternarios, etc. 60 high risk of mortality, "intermediate risk", for example, intermediate risk of mortality or "low risk", for example, low risk of mortality. The stage of the cancer and the prognosis can be used to adjust a therapy for the patient that provides a better outcome, for example, systemic therapy and surgery, only surgery or systemic therapy alone. The risk assessment can be divided as desired, for example, in the median, in tertiary groups, quaternary groups, etc.

Otras formas de cáncer incluyen carcinomas, sarcomas, adenocarcinomas, linfomas, leucemias, etc., incluyendo los cánceres sólidos y linfocíticos, el cáncer de cabeza y cuello, por ejemplo, el cáncer de cavidad oral, faríngeo o de lengua, el cáncer de riñón, mama, riñón, vejiga, colon, ovario, próstata, páncreas, estómago, cerebro, cabeza y cuello, piel, uterino, de testículo, de esófago y de hígado, incluyendo hepatocarcinoma, linfoma, incluyendo linfomas Other forms of cancer include carcinomas, sarcomas, adenocarcinomas, lymphomas, leukemias, etc., including solid and lymphocytic cancers, head and neck cancer, for example, oral, pharyngeal or tongue cancer, kidney cancer , breast, kidney, bladder, colon, ovary, prostate, pancreas, stomach, brain, head and neck, skin, uterine, testis, esophagus and liver, including hepatocarcinoma, lymphoma, including lymphomas

5 no Hodgkin (por ejemplo, linfomas de Burkitt, microcítico y células grandes) y el linfoma de Hodgkin, leucemia y mieloma múltiple. 5 non-Hodgkin (eg, Burkitt, small cell and large cell lymphomas) and Hodgkin lymphoma, leukemia and multiple myeloma.

El término “marcador” se refiere a una molécula (normalmente una proteína, ácido nucleico, hidrato de carbono o lípido) que se expresa en la célula, expresada en la superficie de una célula cancerosa o secretada por una célula cancerosa, en comparación con una célula no cancerosa, y que es útil para el diagnóstico del cáncer, para proporcionar un pronóstico y para direccionar de forma preferencial un agente farmacológico hacia la célula cancerosa. A menudo, tales marcadores son moléculas que se sobreexpresan en un cáncer de pulmón u otras células cancerosas, en comparación con una célula no cancerosa, por ejemplo, una sobreexpresión de 1 vez, una sobreexpresión de 2 veces, una sobreexpresión de 3 veces o más, en comparación con una célula normal. The term "marker" refers to a molecule (usually a protein, nucleic acid, carbohydrate or lipid) that is expressed in the cell, expressed on the surface of a cancer cell or secreted by a cancer cell, compared to a non-cancerous cell, and which is useful for the diagnosis of cancer, to provide a prognosis and to preferentially direct a pharmacological agent towards the cancer cell. Often, such markers are molecules that are overexpressed in a lung cancer or other cancer cells, compared to a non-cancerous cell, for example, an overexpression of 1 time, an overexpression of 2 times, an overexpression of 3 times or more , compared to a normal cell.

15 Adicionalmente, un marcador puede ser una molécula que se sintetiza de forma inapropiada en la célula cancerosa, por ejemplo, una molécula que contenga deleciones, adiciones o mutaciones, en comparación con la molécula expresada en una célula normal. Como alternativa, tales biomarcadores son moléculas que se subexpresan en una célula cancerosa, en comparación con una célula no cancerosa, por ejemplo, una subexpresión de 1 vez, una subexpresión de 2 veces, una subexpresión de 3 veces o más. Adicionalmente, un marcador puede ser una molécula que se sintetiza de forma inapropiada en un cáncer, por ejemplo, una molécula que contiene deleciones, adiciones o mutaciones, en comparación con la molécula expresada en una célula normal. Additionally, a marker can be a molecule that is inappropriately synthesized in the cancer cell, for example, a molecule that contains deletions, additions or mutations, compared to the molecule expressed in a normal cell. Alternatively, such biomarkers are molecules that are underexpressed in a cancer cell, as compared to a non-cancerous cell, for example, a 1-time subexpression, a 2-time subexpression, a 3-fold or more subexpression. Additionally, a marker can be a molecule that is inappropriately synthesized in a cancer, for example, a molecule that contains deletions, additions or mutations, compared to the molecule expressed in a normal cell.

El experto en la materia entenderá que los marcadores pueden utilizarse en combinación con otros marcadores o pruebas para cualquiera de los usos, por ejemplo, la predicción, el diagnóstico o el pronóstico del cáncer, divulgados The person skilled in the art will understand that the markers can be used in combination with other markers or tests for any of the uses, for example, the prediction, diagnosis or prognosis of the cancer, disclosed

25 en el presente documento. 25 in this document.

“Muestra biológica” incluye cortes de tejidos tales como muestras de biopsia y autopsia, y cortes congelados tomados con fines histológicos. Tales muestras incluyen sangre y fracciones o productos hematológicos (por ejemplo, suero, plaquetas, glóbulos rojos y similares), esputo, lavado broncoalveolar, células cultivadas, por ejemplo, cultivos primarios, explantes y células transformadas, heces, orina, etc. Una muestra biológica se obtiene normalmente de un organismo eucariota, más preferentemente un mamífero tal como un primate, por ejemplo, un chimpancé o ser humano; vaca; perro; gato; un roedor, por ejemplo, cobaya, rata, ratón; conejo o un ave; reptil o pez. "Biological sample" includes tissue cuts such as biopsy and autopsy samples, and frozen cuts taken for histological purposes. Such samples include blood and hematological fractions or products (for example, serum, platelets, red blood cells and the like), sputum, bronchoalveolar lavage, cultured cells, for example, primary cultures, explants and transformed cells, feces, urine, etc. A biological sample is usually obtained from a eukaryotic organism, more preferably a mammal such as a primate, for example, a chimpanzee or a human being; cow; dog; cat; a rodent, for example, guinea pig, rat, mouse; rabbit or a bird; reptile or fish

35 Una “biopsia” se refiere al procedimiento de extraer una muestra de tejido para la evaluación diagnóstica o pronóstica, y a la propia muestra de tejido de ensayo. Para los métodos de diagnóstico y pronóstico de la presente invención puede aplicarse en la técnica cualquier técnica de biopsia conocida. La técnica de biopsia aplicada dependerá del tipo de tejido a evaluar (por ejemplo, pulmón, etc.), el tamaño y tipo del tumor, entre otros factores. Las técnicas de biopsia representativas incluyen, pero sin limitación, biopsia por escisión, biopsia por incisión, biopsia por punción, biopsia quirúrgica y biopsia de médula ósea. Una “biopsia por escisión” se refiere a la extracción de toda la masa tumoral con un pequeño margen de tejido normal que la rodee. Una “biopsia por incisión” se refiere a la extracción de tejido en cuña de dentro del tumor. Un diagnóstico o pronóstico hecho mediante la orientación por endoscopía o radiográfica requiere “biopsia biopsia por punción con aguja gruesa” o una “punción biópsica con aguja fina”, que en general obtiene una suspensión de células de dentro de un tejido diana. Las A "biopsy" refers to the procedure of extracting a tissue sample for diagnostic or prognostic evaluation, and to the test tissue sample itself. Any known biopsy technique can be applied in the art for the diagnostic and prognostic methods of the present invention. The biopsy technique applied will depend on the type of tissue to be evaluated (for example, lung, etc.), the size and type of the tumor, among other factors. Representative biopsy techniques include, but are not limited to, excisional biopsy, incision biopsy, puncture biopsy, surgical biopsy and bone marrow biopsy. A "excisional biopsy" refers to the removal of the entire tumor mass with a small margin of normal tissue surrounding it. An "incision biopsy" refers to the removal of wedge tissue from within the tumor. A diagnosis or prognosis made by endoscopic or radiographic guidance requires "biopsy by thick needle puncture" or a "fine needle biopsy," which generally results in a suspension of cells from within a target tissue. The

45 técnicas de biopsia se discuten, por ejemplo, en Harrison's Principles of Internal Medicine, Kasper, et al., eds., 16ª ed., 2005, Capítulo 70 y en toda la Parte V. 45 biopsy techniques are discussed, for example, in Harrison's Principles of Internal Medicine, Kasper, et al., Eds., 16th ed., 2005, Chapter 70 and throughout Part V.

Los términos “sobreexpresar”, “sobreexpresión” o “sobreexpresado” se refieren de forma indistinta a una proteína o ácido nucleico (ARN) que se traduce o transcribe a un nivel detectablemente mayor, habitualmente en una célula cancerosa, en comparación con una célula normal. Los términos incluyen la sobreexpresión debida a la transcripción, el procesamiento postranscripcional, la traducción, el procesamiento postraduccional, la localización celular (por ejemplo, orgánulo, citoplasma, núcleo, superficie celular) y la estabilidad del ARN y las proteínas, en comparación con una célula normal. La sobreexpresión puede detectarse utilizando técnicas convencionales para la detección de ARNm (es decir, RT-PCR, PCR, hibridación) o proteínas (es decir, ELISA, técnicas The terms "overexpress", "overexpression" or "overexpressed" refer interchangeably to a protein or nucleic acid (RNA) that is translated or transcribed at a detectably higher level, usually in a cancer cell, compared to a normal cell . The terms include overexpression due to transcription, posttranscriptional processing, translation, posttranslational processing, cell localization (eg, organelle, cytoplasm, nucleus, cell surface) and the stability of RNA and proteins, compared to a normal cell Overexpression can be detected using conventional techniques for the detection of mRNA (i.e. RT-PCR, PCR, hybridization) or proteins (i.e., ELISA, techniques

55 inmunohistoquímicas). La sobreexpresión puede ser del 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % o más en comparación con una célula normal. En determinados casos, la sobreexpresión es de 1 vez, 2 veces, 3 veces, 4 veces o más niveles de transcripción o traducción mayor, en comparación con una célula normal. 55 immunohistochemicals). Overexpression can be 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% or more compared to a normal cell. In certain cases, overexpression is 1 time, 2 times, 3 times, 4 times or more levels of transcription or higher translation, compared to a normal cell.

Los términos “subexpresar”, “subexpresión” o “subexpresado”, o “regulado de forma negativa” se refieren indistintamente a una proteína o ácido nucleico que se traduce o transcribe en una célula cancerosa a un nivel detectablemente inferior, en comparación con una célula normal. El término incluye la subexpresión debida a la transcripción, el procesamiento postranscripcional, la traducción, el procesamiento postraduccional, la localización celular (por ejemplo, orgánulo, citoplasma, núcleo, superficie celular) y la estabilidad del ARN y las proteínas, en comparación con un control. La subexpresión puede detectarse utilizando técnicas convencionales para la detección 65 de ARNm (es decir, RT-PCR, PCR, hibridación) o proteínas (es decir, ELISA, técnicas inmunohistoquímicas). La subexpresión puede ser del 10 %, 20 %, 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % o menos, en comparación con The terms "subexpress", "subexpression" or "underexpressed", or "negatively regulated" refer interchangeably to a protein or nucleic acid that is translated or transcribed in a cancer cell at a detectably lower level, compared to a cell normal. The term includes subexpression due to transcription, post-transcriptional processing, translation, post-translational processing, cell localization (eg, organelle, cytoplasm, nucleus, cell surface) and the stability of RNA and proteins, compared to a control. Underexpression can be detected using conventional techniques for the detection of mRNA (i.e. RT-PCR, PCR, hybridization) or proteins (i.e., ELISA, immunohistochemical techniques). The underexpression can be 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% or less, compared to

un control. En determinados casos, la subexpresión es 1 vez, 2 veces, 3 veces, 4 veces o más niveles de transcripción o traducción más baja, en comparación con un control. a control. In certain cases, subexpression is 1 time, 2 times, 3 times, 4 times or more levels of transcription or lower translation, compared to a control.

La expresión “expresado de forma diferencial” o “regulado de forma diferencial” se refiere en general a una proteína The term "differentially expressed" or "differentially regulated" generally refers to a protein

5 o ácido nucleico que se sobreexpresa (se regula de forma positiva) o se subexpresa (se regula de forma negativa) en una muestra, en comparación con al menos una otra muestra, en general un paciente de cáncer, comparado con una muestra de tejido no canceroso en el contexto de la presente invención. 5 or nucleic acid that is overexpressed (positively regulated) or underexpressed (negatively regulated) in a sample, compared to at least one other sample, generally a cancer patient, compared to a tissue sample non-cancerous in the context of the present invention.

“Tratamiento terapéutico” y “terapias para el cáncer” se refieren a la quimioterapia, terapia hormonal, radioterapia, inmunoterapia y terapia biológica (dirigida). "Therapeutic treatment" and "cancer therapies" refer to chemotherapy, hormonal therapy, radiotherapy, immunotherapy and biological (targeted) therapy.

Por “cantidad o dosis terapéuticamente eficaz” o “cantidad o dosis suficiente” se entiende una dosis que produce los efectos para los cuales se administra. La dosis exacta dependerá del fin del tratamiento y la determinará un experto en la materia utilizando técnicas conocidas (véase, por ejemplo, Lieberman, Pharmaceutical Dosage Forms (vols. 1By "therapeutically effective amount or dose" or "sufficient amount or dose" is meant a dose that produces the effects for which it is administered. The exact dose will depend on the end of the treatment and will be determined by one skilled in the art using known techniques (see, for example, Lieberman, Pharmaceutical Dosage Forms (vols. 1

15 3, 1992); Lloyd, The Art, Science and Technology of Pharmaceutical Compounding (1999); Pickar, Dosage Calculations (1999) y Remington: The Science and Practice of Pharmacy, 20ª Edición, 2003, Gennaro, Ed., Lippincott, Williams & Wilkins). 15 3, 1992); Lloyd, The Art, Science and Technology of Pharmaceutical Compounding (1999); Pickar, Dosage Calculations (1999) and Remington: The Science and Practice of Pharmacy, 20th Edition, 2003, Gennaro, Ed., Lippincott, Williams & Wilkins).

“Ácido nucleico” se refiere a desoxirribonucleótidos o ribonucleótidos, y polímeros de los mismos, en forma mono o bicatenaria y a sus complementarios. El término abarca ácidos nucleicos que contienen análogos de nucleótido conocidos, o restos o uniones del esqueleto modificados, que son sintéticos, de origen natural o de origen no natural, que tienen propiedades de unión similares al ácido nucleico de referencia y que se metabolizan de forma similar a los nucleótidos de referencia. Los ejemplos de tales análogos incluyen, sin limitación, fosforotioatos, fosforamidatos, metilfosfonatos, metilfosfonatos quirales, 2-O-metil ribonucleótidos, ácidos nucleicos peptídicos (los "Nucleic acid" refers to deoxyribonucleotides or ribonucleotides, and polymers thereof, in single or double stranded form and their complementary ones. The term encompasses nucleic acids containing known nucleotide analogs, or modified skeletal moieties or moieties, that are synthetic, of natural or non-natural origin, that have binding properties similar to the reference nucleic acid and that are metabolized in a manner similar to the reference nucleotides. Examples of such analogs include, without limitation, phosphorothioates, phosphoramidates, methyl phosphonates, chiral methylphosphonates, 2-O-methyl ribonucleotides, peptide nucleic acids (the

25 ANP). 25 ANP).

A menos que se indique otra cosa, una secuencia de ácido nucleico particular también abarca de forma implícita variantes modificadas de forma conservativa de la misma (por ejemplo, sustituciones de codones degenerados) y las secuencias complementarias, así como la secuencia indicada de forma explícita. En concreto, las sustituciones de codones degenerados puede conseguirse generando secuencias en las que la tercera posición de uno o más codones seleccionados (o todos) se sustituye con restos de bases mixtas y/o de desoxiinosina (Batzer et al., Nucleic Acid Res. 19: 5081 (1991); Ohtsuka et al., J. Biol. Chem. 260: 2605 -2608 (1985), Rossolini et al., Mol. Cell. Probes Unless otherwise indicated, a particular nucleic acid sequence also implicitly encompasses conservatively modified variants thereof (eg, degenerate codon substitutions) and complementary sequences, as well as the explicitly indicated sequence. Specifically, degenerate codon substitutions can be achieved by generating sequences in which the third position of one or more selected (or all) codons is substituted with residues of mixed bases and / or deoxyinosine (Batzer et al., Nucleic Acid Res. 19: 5081 (1991); Ohtsuka et al., J. Biol. Chem. 260: 2605-2608 (1985), Rossolini et al., Mol. Cell. Probes

8: 91-98 (1994)). La expresión ácido nucleico se utiliza indistintamente con un gen, ADNc, ARNm, oligonucleótido y polinucleótido. 8: 91-98 (1994)). The term nucleic acid is used interchangeably with a gene, cDNA, mRNA, oligonucleotide and polynucleotide.

35 Una secuencia de ácido nucleico particular también abarca de forma implícita “variantes de corte y empalme” y secuencias de ácido nucleico que codifican formas truncadas de una proteína. De forma similar, una proteína particular codificada por un ácido nucleico abarca de forma implícita cualquier proteína codificada por una variante de corte y empalme, o una forma truncada de un ácido nucleico. “Variantes de corte y empalme”, como sugiere el nombre, son productos del corte y empalme alternativo de un gen. Después de la transcripción, un transcrito de ácido nucleico inicial puede cortarse y empalmarse de forma que los productos de corte y empalme distintos (o alternos) del ácido nucleico codifican distintos polipéptidos. Los mecanismos para la producción de variantes de corte y empalme varían, pero incluyen el corte y empalme alterno de los exones. Los polipéptidos alternos obtenidos del mismo ácido nucleico por transcripción más allá del codón finalizador también están abarcados en esta A particular nucleic acid sequence also implicitly encompasses "splice variants" and nucleic acid sequences encoding truncated forms of a protein. Similarly, a particular protein encoded by a nucleic acid implicitly encompasses any protein encoded by a splice variant, or a truncated form of a nucleic acid. "Variants of splicing", as the name suggests, are products of the alternative splicing of a gene. After transcription, an initial nucleic acid transcript can be cut and spliced so that the different (or alternate) splicing products of the nucleic acid encode different polypeptides. The mechanisms for the production of splice variants vary, but include the alternate splicing of exons. Alternate polypeptides obtained from the same nucleic acid by transcription beyond the terminator codon are also encompassed in this

45 definición. Cualquiera de los productos de una reacción de corte y empalme, incluyendo las formas recombinantes de los productos de corte y empalme, están incluidos en esta definición. Los ácidos nucleicos pueden estar truncados en el extremo 5’ o en el extremo 3’. Los polipéptidos pueden estar truncados en el extremo N terminal o el extremo C terminal. Las versiones truncadas de secuencias de ácido nucleico o polipéptido pueden ser de origen natural o crearse de forma recombinante. 45 definition. Any of the products of a splicing reaction, including recombinant forms of splicing products, are included in this definition. Nucleic acids can be truncated at the 5 ’end or at the 3’ end. The polypeptides may be truncated at the N-terminus or the C-terminus. Truncated versions of nucleic acid or polypeptide sequences can be of natural origin or created recombinantly.

Los términos “polipéptido”, “péptido” y “proteína” se utilizan indistintamente en el presente documento para referirse a un polímero de restos de aminoácido. Los términos se aplican a polímeros de aminoácidos en los que uno o más restos de aminoácido son un mimético químico artificial de un correspondiente aminoácido de origen natural, así como a polímeros de aminoácidos de origen natural y polímeros de aminoácidos que no son de origen natural. The terms "polypeptide", "peptide" and "protein" are used interchangeably herein to refer to a polymer of amino acid residues. The terms apply to amino acid polymers in which one or more amino acid residues are an artificial chemical mimetic of a corresponding naturally occurring amino acid, as well as to naturally occurring amino acid polymers and non-naturally occurring amino acid polymers.

55 El término “aminoácido” se refiere a aminoácidos de origen natural o sintéticos, así como a análogos de aminoácido 55 The term "amino acid" refers to naturally occurring or synthetic amino acids, as well as amino acid analogues

o miméticos de aminoácido que actúan de una manera similar a los aminoácidos de origen natural. Los aminoácidos de origen natural son los que codifica el código genético, así como los aminoácidos que se modifican posteriormente, por ejemplo, hidroxiprolina, γ-carboxiglutamato y O-fosfoserina. Análogos de aminoácido se refiere a compuestos que tienen la misma estructura química básica que el aminoácido de origen natural, es decir, un carbono que está unido a un hidrógeno, un grupo carboxilo, un grupo amino y un grupo R, por ejemplo, homoserina, norleucina, sulfóxido de metionina, metil sulfonio de metionina. Tales análogos tienen grupos R modificados (por ejemplo, norleucina) o los esqueletos peptídicos modificados, pero conservan la misma estructura química básica que un aminoácido de origen natural. Miméticos de aminoácido se refiere a compuestos químicos que tienen una or amino acid mimetics that act in a manner similar to naturally occurring amino acids. Naturally occurring amino acids are those encoded by the genetic code, as well as amino acids that are subsequently modified, for example, hydroxyproline, γ-carboxyglutamate and O-phosphoserine. Amino acid analogs refers to compounds that have the same basic chemical structure as the naturally occurring amino acid, that is, a carbon that is attached to a hydrogen, a carboxyl group, an amino group and an R group, for example, homoserine, norleucine, methionine sulfoxide, methyl methionine sulphonium. Such analogs have modified R groups (eg, norleucine) or modified peptide skeletons, but retain the same basic chemical structure as a naturally occurring amino acid. Amino acid mimetics refers to chemical compounds that have a

65 estructura que es distinta de la estructura química general de un aminoácido, pero que actúa de una manera similar a un aminoácido de origen natural. A structure that is different from the general chemical structure of an amino acid, but acts in a manner similar to a naturally occurring amino acid.

Los aminoácidos pueden denominarse en el presente documento por sus símbolos de tres letras comúnmente conocidos o por los símbolos de una letra recomendados por la Comisión de Nomenclatura Bioquímica IUPAC-IUB. Asímismo, los nucleótidos pueden denominarse por sus códigos de letra única comúnmente aceptados. The amino acids may be referred to herein by their commonly known three-letter symbols or by the one-letter symbols recommended by the IUPAC-IUB Biochemical Nomenclature Commission. Likewise, nucleotides can be named by their commonly accepted single letter codes.

5 “Variantes modificadas de forma conservativa” se aplica a las secuencias de aminoácidos y de ácidos nucleicos. Con respecto a las secuencias de ácidos nucleico particulares, variantes modificadas de forma conservativa se refiere a los ácidos nucleicos que codifican secuencias de aminoácidos idénticas o esencialmente idénticas o, cuando el ácido nucleico no codifica una secuencia de aminoácidos, para secuencias esencialmente idénticas. Debido a la degeneración del código genético, un gran número de ácidos nucleicos funcionalmente idénticos codifican una dada proteína. Por ejemplo, todos los codones GCA, GCC, GCG y GCU codifican el aminoácido alanina. Por lo tanto, en cada posición en donde una alanina está especificada por un codón, el codón puede modificarse a cualquiera de los codones correspondientes descritos sin alterar el polipéptido codificado. Tales variaciones de ácido nucleico son “variaciones silenciosas”, que son una especie de variaciones modificadas de forma conservativa. En el presente documento, cada secuencia de ácido nucleico que codifica un polipéptido 5 "Conservatively modified variants" applies to the amino acid and nucleic acid sequences. With respect to particular nucleic acid sequences, conservatively modified variants refers to nucleic acids encoding identical or essentially identical amino acid sequences or, when the nucleic acid does not encode an amino acid sequence, for essentially identical sequences. Due to the degeneracy of the genetic code, a large number of functionally identical nucleic acids encode a given protein. For example, all codons GCA, GCC, GCG and GCU encode the amino acid alanine. Therefore, at each position where an alanine is specified by a codon, the codon can be modified to any of the corresponding codons described without altering the encoded polypeptide. Such variations of nucleic acid are "silent variations", which are a kind of conservatively modified variations. Here, each nucleic acid sequence encoding a polypeptide

15 también describe cada posible variación silenciosa del ácido nucleico. Un experto en la materia reconocerá que cada codón en un ácido nucleico (excepto AUG, que habitualmente es el único codón para la metionina, y TGG, que habitualmente es el único codón para el triptófano) puede modificarse para producir una molécula funcionalmente idéntica. Por consiguiente, cada variación silenciosa de un ácido nucleico que codifica un polipéptido está implícita en cada secuencia descrita, con respecto al producto de expresión pero no con respecto a las secuencias de sondas reales. 15 also describes each possible silent variation of the nucleic acid. One skilled in the art will recognize that each codon in a nucleic acid (except AUG, which is usually the only codon for methionine, and TGG, which is usually the only codon for tryptophan) can be modified to produce a functionally identical molecule. Therefore, each silent variation of a nucleic acid encoding a polypeptide is implicit in each sequence described, with respect to the expression product but not with respect to the actual probe sequences.

Como para las secuencias de aminoácidos, un experto en la materia reconocerá que las sustituciones, deleciones o adiciones individuales en una secuencia de ácido nucleico, péptido, polipéptido o proteína, que modifique, añada o delecione un aminoácido individual o un pequeño porcentaje de aminoácidos en la secuencia codificada, es una As for amino acid sequences, one skilled in the art will recognize that individual substitutions, deletions or additions in a nucleic acid, peptide, polypeptide or protein sequence, which modifies, adds or deletes an individual amino acid or a small percentage of amino acids in the encoded sequence is a

25 “variante modificada de forma conservativa” en donde la modificación da como resultado la sustitución de un aminoácido con un aminoácido similar desde el punto de vista química. Son bien conocidas en la técnica las tablas de sustituciones conservativas que proporcionan aminoácidos similares desde el punto de vista funcional. Tales variantes modificadas de forma conservativa se suman a, y no excluyen, variantes polimórficas, homólogos interespecie y alelos de la invención. "Conservatively modified variant" wherein the modification results in the substitution of an amino acid with a similar amino acid from the chemical point of view. Tables of conservative substitutions that provide similar amino acids from a functional point of view are well known in the art. Such conservatively modified variants add to, and do not exclude, polymorphic variants, interspecies homologues and alleles of the invention.

Los siguientes ocho grupos contienen cada uno aminoácidos que son sustituciones conservativas el uno para elotro: 1) Alanina (A), Glicina (G); 2) Ácido aspártico (D), Ácido glutámico (E); 3) Asparragina (N), Glutamina (Q); 4) Arginina (R), Lisina (K); 5) Isoleucina (I), Leucina (L), Metionina (M), Valina (V); 6) Fenilalanina (F), Tirosina (Y), Triptófano (W); 7) Serina (S), Treonina (T) y 8) Cisteína (C), Metionina (M). Véase, por ejemplo, Creighton, Proteins The following eight groups each contain amino acids that are conservative substitutions for each other: 1) Alanine (A), Glycine (G); 2) Aspartic acid (D), Glutamic acid (E); 3) Asparagine (N), Glutamine (Q); 4) Arginine (R), Lysine (K); 5) Isoleucine (I), Leucine (L), Methionine (M), Valine (V); 6) Phenylalanine (F), Tyrosine (Y), Tryptophan (W); 7) Serine (S), Threonine (T) and 8) Cysteine (C), Methionine (M). See, for example, Creighton, Proteins

35 (1984). 35 (1984).

Un “marcador” o una “fracción detectable” es una composición detectable por medios espectroscópicos, fotoquímicos, bioquímicos, inmunoquímicos, químicos u otros medios físicos. Por ejemplo, los marcadores útiles incluyen 32P, colorantes fluorescentes, reactivos electrodensos, enzimas (por ejemplo, como se utiliza habitualmente en un ELISA), biotina, digoxigenina o haptenos, y proteínas que pueden fabricarse para que sean detectables, por ejemplo, incorporando un radiomarcador en el péptido, o utilizarse para detectar anticuerpos reactivos de forma específica con el péptido. A "marker" or a "detectable fraction" is a composition detectable by spectroscopic, photochemical, biochemical, immunochemical, chemical or other physical means. For example, useful markers include 32P, fluorescent dyes, electrodensactive reagents, enzymes (for example, as commonly used in an ELISA), biotin, digoxigenin or haptens, and proteins that can be manufactured to be detectable, for example, by incorporating a radiolabel in the peptide, or used to detect antibodies specifically reactive with the peptide.

El término “recombinante” cuando se utiliza en referencia, por ejemplo, a una célula o a un ácido nucleico, proteína o The term "recombinant" when used in reference, for example, to a cell or to a nucleic acid, protein or

45 vector, indica que la célula, ácido nucleico, proteína o vector, se ha modificado mediante la introducción de un ácido nucleico heterólogo o proteína, o por la alteración de un ácido nucleico o proteína nativo, o que la célula se obtiene de una célula así modificada. Por lo tanto, por ejemplo, las células recombinantes expresan genes que no se encuentran dentro de la forma nativa (no recombinante) de la célula o expresan genes nativos que, de otro modo, se expresan de forma anómala, se subexpresan o no se expresan en absoluto. Vector, indicates that the cell, nucleic acid, protein or vector, has been modified by the introduction of a heterologous nucleic acid or protein, or by the alteration of a native nucleic acid or protein, or that the cell is obtained from a cell so modified. Therefore, for example, recombinant cells express genes that are not within the native (non-recombinant) form of the cell or express native genes that otherwise express themselves abnormally, are underexpressed or not expressed absolutely.

La frase “condiciones rigurosas de hibridación” se refiere a condiciones en las que una sonda hibridará con su subsecuencia diana, normalmente en una mezcla compleja de ácidos nucleicos, pero no con otras secuencias. Las condiciones rigurosas son dependientes de secuencia y serán distintas en circunstancias distintas. Las secuencias más largas hibridan de forma específica a temperaturas más altas. Una guía extensa para la hibridación de ácidos 55 nucleicos se encuentra en Tijssen, Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Probes, “Overview of principles of hybridization and the strategy of nucleic acid assays” (1993). En general, las condiciones rigurosas se seleccionan para que sean aproximadamente 5-10 ºC menores que el punto de fusión térmico (Tm) para la secuencia específica a una fuerza iónica definida pH. La Tm es la temperatura (en una fuerza iónica definida, pH y concentración de ácidos nucleicos) a la que el 50 % de las sondas complementarias con la diana hibridan con la secuencia diana en el equilibrio (dado que las secuencias diana están presentes en exceso, a la Tm, en el equilibrio el 50 % de las sondas están ocupadas). Las condiciones rigurosas también pueden lograrse con la adición de agentes desestabilizantes tales como formamida. Para la hibridación selectiva o específica, una señal positiva es al menos dos veces el fondo, preferentemente 10 veces la hibridación de fondo. Las condiciones de hibridación rigurosa ejemplares pueden ser las siguientes: formamida al 50 %, SSC 5x y SDS al 1 %, incubando a The phrase "stringent hybridization conditions" refers to conditions in which a probe will hybridize with its target sub-sequence, usually in a complex mixture of nucleic acids, but not with other sequences. Rigorous conditions are sequence dependent and will be different in different circumstances. Longer sequences specifically hybridize at higher temperatures. An extensive guide to hybridization of nucleic acids is found in Tijssen, Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Probes, “Overview of principles of hybridization and the strategy of nucleic acid assays” (1993). In general, the stringent conditions are selected to be approximately 5-10 ° C lower than the thermal melting point (Tm) for the specific sequence at a defined ionic strength pH. Tm is the temperature (at a defined ionic strength, pH and nucleic acid concentration) at which 50% of the complementary probes with the target hybridize with the target sequence in equilibrium (since the target sequences are present in excess , at Tm, in the balance 50% of the probes are occupied). Rigorous conditions can also be achieved with the addition of destabilizing agents such as formamide. For selective or specific hybridization, a positive signal is at least twice the background, preferably 10 times the background hybridization. Exemplary rigorous hybridization conditions may be as follows: 50% formamide, 5x SSC and 1% SDS, incubating at

65 42 ºC, o SSC 5x, SDS al 1 %, incubando a 65 ºC, con un lavado en SSC 0,2x y SDS al 0,1 % a 65 ºC. 65 42 ° C, or 5x SSC, 1% SDS, incubating at 65 ° C, with a wash in 0.2x SSC and 0.1% SDS at 65 ° C.

Los ácidos nucleicos que no hibridan entre sí en condiciones rigurosas son todavía sustancialmente idénticos si los polipéptidos que codifican son sustancialmente idénticos. Esto se produce, por ejemplo, cuando se crea una copia de un ácido nucleico utilizando la degeneración de codón máxima permitida por el código genético. En tales casos, los ácidos nucleicos normalmente hibridan en condiciones de hibridación moderadamente rigurosas. Las Nucleic acids that do not hybridize to each other under stringent conditions are still substantially identical if the polypeptides they encode are substantially identical. This occurs, for example, when a copy of a nucleic acid is created using the maximum codon degeneracy allowed by the genetic code. In such cases, nucleic acids normally hybridize under moderately stringent hybridization conditions. The

5 “condiciones de hibridación moderadamente rigurosas” ejemplares incluyen una hibridación en un tampón de formamida al 40 %, NaCl 1 M, SDS al 1 % a 37 ºC y un lavado en SSC 1X a 45 ºC. Una hibridación positiva es al menos dos veces el fondo. Los expertos en la materia reconocerán fácilmente que pueden utilizarse condiciones de hibridación y lavado alternativas para proporcionar condiciones de rigurosidad similar. Las directrices adicionales para determinar los parámetros de hibridación se proporcionan en numerosas referencias, por ejemplo, en Current Protocols in Molecular Biology, ed. Ausubel, et al., citado anteriormente. Exemplary "moderately stringent hybridization conditions" include hybridization in a 40% formamide buffer, 1M NaCl, 1% SDS at 37 ° C and a wash in 1X SSC at 45 ° C. A positive hybridization is at least twice the background. Those skilled in the art will readily recognize that alternative hybridization and washing conditions can be used to provide conditions of similar stringency. Additional guidelines for determining hybridization parameters are provided in numerous references, for example, in Current Protocols in Molecular Biology, ed. Ausubel, et al., Cited above.

Para la PCR, una temperatura de aproximadamente 36 ºC es típica para la amplificación con baja rigurosidad, aunque las temperaturas de apareamiento pueden variar entre aproximadamente 32 ºC y 48 ºC, dependiendo de la longitud del cebador. Para una amplificación por PCR de rigurosidad alta, es típica una temperatura de For PCR, a temperature of approximately 36 ° C is typical for amplification with low stringency, although the mating temperatures may vary between approximately 32 ° C and 48 ° C, depending on the length of the primer. For a PCR amplification of high stringency, a temperature of

15 aproximadamente 62 ºC, aunque las temperaturas de apareamiento de alta rigurosidad pueden variar de aproximadamente 50 ºC a aproximadamente 65 ºC, dependiendo de la longitud y especificidad del cebador. Las condiciones típicas de ciclo, tanto para las amplificaciones de alta como baja rigurosidad, incluyen una fase de desnaturalización de 90 ºC-95 ºC durante 30 s -2 min, una fase de apareamiento que dura 30 s -2 min y una fase de extensión de aproximadamente 72 ºC durante 1 -2 min. Los protocolos y directrices para las reacciones de amplificación de rigurosidad baja y alta se proporcionan, por ejemplo, en Innis et al. (1990) PCR Protocols, A Guide to Methods and Applications, Academic Press, Inc. N. Y. 15 about 62 ° C, although high stringent mating temperatures may vary from about 50 ° C to about 65 ° C, depending on the length and specificity of the primer. Typical cycle conditions, for both high and low stringency amplifications, include a denaturation phase of 90 ºC-95 ºC for 30 s -2 min, a mating phase that lasts 30 s -2 min and an extension phase of about 72 ° C for 1-2 min. Protocols and guidelines for amplification reactions of low and high stringency are provided, for example, in Innis et al. (1990) PCR Protocols, A Guide to Methods and Applications, Academic Press, Inc. N. Y.

“Anticuerpo” se refiere a un polipéptido que comprende una región marco conservada procedente de un gen de inmunoglobulina o fragmentos del mismo, que se une de forma específica y reconoce a un antígeno. Los genes de "Antibody" refers to a polypeptide comprising a conserved framework region from an immunoglobulin gene or fragments thereof, which specifically binds and recognizes an antigen. The genes of

25 inmunoglobulina identificados incluyen los genes de la región constante kappa, lambda, alfa, gamma, delta, épsilon y mu, así como la gran cantidad de genes de la región variable de inmunoglobulina. Las cadenas ligeras se clasifican ya sea como kappa o lambda. Las cadenas pesadas se clasifican como gamma, mu, alfa, delta o épsilon, que a su vez definen las clases de inmunoglobulina, IgG, IgM, IgA, IgD e IgE, respectivamente. Normalmente, la región de unión al antígeno de un anticuerpo será la más crítica en la especificidad y afinidad de unión. Los anticuerpos pueden ser policlonales o monoclonales, obtenerse de suero, un hibridoma o pueden clonarse de forma recombinante, y también pueden ser quiméricos, primatizados o humanizados. Immunoglobulins identified include the genes from the constant region kappa, lambda, alpha, gamma, delta, epsilon and mu, as well as the large number of genes from the variable region of immunoglobulin. Light chains are classified as either kappa or lambda. Heavy chains are classified as gamma, mu, alpha, delta or epsilon, which in turn define the classes of immunoglobulin, IgG, IgM, IgA, IgD and IgE, respectively. Normally, the antigen binding region of an antibody will be the most critical in binding specificity and affinity. The antibodies can be polyclonal or monoclonal, obtained from serum, a hybridoma or can be cloned recombinantly, and they can also be chimeric, primatized or humanized.

Una unidad estructural de inmunoglobulina (anticuerpo) ejemplar comprende un tetrámero. Cada tetrámero está compuesto de dos parejas idénticas de cadenas polipeptídicas, teniendo cada pareja una cadena “ligera” An exemplary immunoglobulin (antibody) structural unit comprises a tetramer. Each tetramer is composed of two identical pairs of polypeptide chains, each pair having a "light" chain

35 (aproximadamente 25 kDa) y una “pesada” (aproximadamente 50-70 kDa). El extremo N de cada cadena define una región variable de aproximadamente 100 a 110, o más, aminoácidos responsables principalmente del reconocimiento del antígeno. Las expresiones cadena ligera variable (VL) y cadena pesada variable (VH) se refieren a estas cadenas ligera y pesada respectivamente. 35 (approximately 25 kDa) and a "heavy" (approximately 50-70 kDa). The N-terminus of each chain defines a variable region of approximately 100 to 110, or more, amino acids primarily responsible for antigen recognition. The terms variable light chain (VL) and variable heavy chain (VH) refer to these light and heavy chains respectively.

Los anticuerpos existen, por ejemplo, como inmunoglobulinas intactas o como una serie de fragmentos bien caracterizados producidos mediante digestión con diversas peptidasas. Por lo tanto, por ejemplo, la pepsina digiere un anticuerpo por debajo de las uniones disulfuro en la región bisagra para producir F(ab)’2, un dímero de Fab que es él mismo una cadena ligera unida a VH-CH1 por un enlace disulfuro. El F(ab)’2 puede reducirse en condiciones suaves hasta romper el enlace disulfuro en la región bisagra, convirtiendo de este modo el dímero F(ab)’2 en un Antibodies exist, for example, as intact immunoglobulins or as a series of well characterized fragments produced by digestion with various peptidases. Therefore, for example, pepsin digests an antibody below the disulfide bonds in the hinge region to produce F (ab) '2, a Fab dimer that is itself a light chain attached to VH-CH1 by a bond disulfide F (ab) ’2 can be reduced under mild conditions to break the disulfide bond in the hinge region, thus converting the F (ab)’ 2 dimer into a

45 monómero Fab’. El monómero Fab’ es esencialmente el Fab con parte de la región bisagra (véase Fundamental Immunology (Paul Ed., 3ª ed., 1993). Aunque se definen varios fragmentos de anticuerpo en términos de la digestión de un anticuerpo intacto, un experto en la materia apreciará que tales fragmentos pueden sintetizarse de novo ya sea de forma química o utilizando la metodología de ADN recombinante. Por lo tanto, el término anticuerpo, como se usa en el presente documento, incluye también a los fragmentos de anticuerpo producidos por la modificación de anticuerpos completos o los sintetizados de novo utilizando las metodologías de ADN recombinante (por ejemplo, Fv monocatenario) o los identificados utilizando bibliotecas de presentación en fagos (véase, por ejemplo, McCafferty et al., Nature 348: 552-554 (1990)). 45 monomer Fab ’. The Fab 'monomer is essentially the Fab with part of the hinge region (see Fundamental Immunology (Paul Ed., 3rd ed., 1993). Although several antibody fragments are defined in terms of the digestion of an intact antibody, an expert in the matter will appreciate that such fragments can be synthesized de novo either chemically or using the recombinant DNA methodology.Therefore, the term antibody, as used herein, also includes antibody fragments produced by the modification of complete antibodies or synthesized de novo using recombinant DNA methodologies (eg, single chain Fv) or those identified using phage display libraries (see, for example, McCafferty et al., Nature 348: 552-554 (1990) ).

En una realización, el anticuerpo se conjuga a una fracción “efectora”. La fracción efectora puede ser un número In one embodiment, the antibody is conjugated to an "effector" fraction. The effector fraction can be a number

55 variado de moléculas, incluyendo fracciones de marcaje tales como marcadores radiactivos o marcadores fluorescentes, o puede ser una fracción terapéutica. En un aspecto, el anticuerpo modula la actividad de la proteína. A variety of molecules, including labeling fractions such as radioactive markers or fluorescent markers, or may be a therapeutic fraction. In one aspect, the antibody modulates the activity of the protein.

Los ácidos nucleicos de los genes expresados de forma diferencial de la presente invención o los polipéptidos que codifican, se refiere a todas las formas de ácidos nucleicos (por ejemplo, pre-ARNm, ARNm) o proteínas, sus variantes polimórficas, alelos, mutantes y homólogos interespecie que (según corresponda a ácido nucleico o proteína): (1) tengan una secuencia de aminoácidos que tenga más de aproximadamente el 60 % de identidad de secuencia de aminoácidos, el 65 %, 70 %, 75 %, 80 %, 85 %, 90 %, preferentemente el 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % o 99 % o más identidad de secuencia de aminoácidos, preferentemente a lo largo de una región de al menos aproximadamente 25, 50, 100, 200, 500, 1000 o más aminoácidos, con un polipéptido codificado 65 por un ácido nucleico al que se hace referencia o con una secuencia de aminoácidos descrita en el presente documento; (2) se unan de forma específica a anticuerpos, por ejemplo anticuerpos policlonales, generados frente a The nucleic acids of the differentially expressed genes of the present invention or the polypeptides encoding, refers to all forms of nucleic acids (eg, pre-mRNA, mRNA) or proteins, their polymorphic variants, alleles, mutants and interspecies homologs that (as appropriate to nucleic acid or protein): (1) have an amino acid sequence that has more than about 60% amino acid sequence identity, 65%, 70%, 75%, 80%, 85 %, 90%, preferably 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% or more amino acid sequence identity, preferably along a region of at less about 25, 50, 100, 200, 500, 1000 or more amino acids, with a polypeptide encoded by a nucleic acid referred to or with an amino acid sequence described herein; (2) specifically bind to antibodies, for example polyclonal antibodies, generated against

un inmunógeno que comprende una secuencia de aminoácidos a la que se hace referencia, a fragmentos inmunogénicos de la misma y variantes modificadas de forma conservativa de la misma; (3) hibridan de forma específica en condiciones rigurosas de hibridación con un ácido nucleico que codifica una secuencia de aminoácidos a la que se hace referencia y con las variantes modificadas de forma conservativa del mismo; (4) tienen una 5 secuencia de ácido nucleico que tiene más de aproximadamente el 95 %, preferentemente más de aproximadamente el 96 %, 97 %, 98 %, 99 % o más de identidad de secuencia de nucleótidos, preferentemente a lo largo de una región de al menos aproximadamente 25, 50, 100, 200, 500, 1000 o más nucleótidos, con una secuencia de ácido nucleico a la que se hace referencia. Una secuencia de polinucleótido o polipéptido procede normalmente de un mamífero, incluyendo, pero sin limitación, un primate, por ejemplo, un ser humano; roedor, por an immunogen comprising an amino acid sequence referred to, immunogenic fragments thereof and conservatively modified variants thereof; (3) specifically hybridize under stringent conditions of hybridization with a nucleic acid encoding an amino acid sequence referred to and with the conservatively modified variants thereof; (4) they have a nucleic acid sequence having more than about 95%, preferably more than about 96%, 97%, 98%, 99% or more nucleotide sequence identity, preferably along a region of at least about 25, 50, 100, 200, 500, 1000 or more nucleotides, with a nucleic acid sequence referred to. A polynucleotide or polypeptide sequence normally comes from a mammal, including, but not limited to, a primate, for example, a human being; rodent, for

10 ejemplo, rata, ratón, hámster; vaca, cerdo, caballo, oveja o cualquier mamífero. Los ácidos nucleicos y proteínas de la invención incluyen moléculas tanto de origen natural como recombinantes. Las formas truncadas y cortadas y empalmadas de forma alternativa de estos antígenos están incluidas en la definición. 10 example, rat, mouse, hamster; cow, pig, horse, sheep or any mammal. The nucleic acids and proteins of the invention include both naturally occurring and recombinant molecules. Truncated and cut and spliced forms of these antigens are included in the definition.

La frase “que se une de forma específica (o de forma selectiva)”, cuando se hace referencia a una proteína, ácido The phrase "that binds specifically (or selectively)", when referring to a protein, acidic

15 nucleico, anticuerpo o compuesto de molécula pequeña, se refiere a una reacción de unión que es determinativa de la presencia de la proteína o ácido nucleico, tal como los genes expresados de forma diferencial de la presente invención, a menudo en una población heterogénea de proteínas o ácidos nucleicos, u otros productos biológicos. En el caso de los anticuerpos, en las condiciones de inmunoensayo designadas, un anticuerpo especificado puede unirse a una proteína particular al menos dos veces el fondo y, de forma más típica, más de 10 a 100 veces el fondo. Nucleic, antibody or small molecule compound, refers to a binding reaction that is determinative of the presence of the protein or nucleic acid, such as the differentially expressed genes of the present invention, often in a heterogeneous population of proteins or nucleic acids, or other biological products. In the case of the antibodies, under the designated immunoassay conditions, a specified antibody can bind to a particular protein at least twice the background and, more typically, more than 10 to 100 times the background.

20 La unión específica a un anticuerpo en tales condiciones requiere un anticuerpo que se selecciona por su especificidad por una proteína particular. Por ejemplo, los anticuerpos policlonales pueden seleccionarse para obtener solo los anticuerpos policlonales que sean inmunorreactivos de forma específica con el antígeno seleccionado y no con otras proteínas. Esta selección puede lograrse sustrayendo los anticuerpos que reaccionan de forma cruzada con otras moléculas. Puede utilizarse una diversidad de formatos de inmunoensayo para The specific binding to an antibody under such conditions requires an antibody that is selected for its specificity for a particular protein. For example, polyclonal antibodies can be selected to obtain only polyclonal antibodies that are specifically immunoreactive with the selected antigen and not with other proteins. This selection can be achieved by subtracting antibodies that cross-react with other molecules. A variety of immunoassay formats can be used to

25 seleccionar anticuerpos inmunorreactivos de forma específica con una proteína particular. Por ejemplo, los inmunoensayos de ELISA en fase sólida se utilizan de forma rutinaria para seleccionar anticuerpos inmunorreactivos de forma específica con una proteína (véase, por ejemplo, Harlow & Lane, Antibodies, A Laboratory Manual (1988) para una descripción de los formatos de inmunoensayo y condiciones que pueden utilizarse para determinar la inmunorreactividad específica). 25 select immunoreactive antibodies specifically with a particular protein. For example, solid-phase ELISA immunoassays are routinely used to select immunoreactive antibodies specifically with a protein (see, for example, Harlow & Lane, Antibodies, A Laboratory Manual (1988) for a description of the formats of immunoassay and conditions that can be used to determine specific immunoreactivity).

30 La frase “efectos funcionales”, en el contexto de los ensayos para analizar compuestos que modulan una proteína marcadora, incluye la determinación de un parámetro que está de forma indirecta o directa bajo la influencia de un biomarcador de la invención, por ejemplo, uno químico o fenotípico. Por lo tanto, un efecto funcional incluye la actividad de unión a ligando, la activación o represión transcripcional, la capacidad de proliferar de las células, la The phrase "functional effects", in the context of tests to analyze compounds that modulate a marker protein, includes the determination of a parameter that is indirectly or directly under the influence of a biomarker of the invention, for example, one chemical or phenotypic Therefore, a functional effect includes ligand binding activity, transcriptional activation or repression, the ability to proliferate cells, the

35 capacidad de migrar, entre otros. “Efectos funcionales” incluye actividades in vitro, in vivo y ex vivo. 35 ability to migrate, among others. "Functional effects" includes in vitro, in vivo and ex vivo activities.

Por “determinar los efectos funcionales” se entiende ensayar un compuesto que aumenta o disminuye un parámetro que está de forma indirecta o directa bajo la influencia de un biomarcador de la invención, por ejemplo, medir los efectos físicos y químicos o fenotípicos. Tales efectos funcionales pueden medirse por cualquier medio conocido 40 para los expertos en la materia, por ejemplo, cambios en características espectroscópicas (por ejemplo, fluorescencia, absorbancia, índice de refracción); propiedades hidrodinámicas (por ejemplo, forma), cromatográficas By "determining functional effects" is meant to test a compound that increases or decreases a parameter that is indirectly or directly under the influence of a biomarker of the invention, for example, measuring physical and chemical or phenotypic effects. Such functional effects can be measured by any means known to those skilled in the art, for example, changes in spectroscopic characteristics (eg, fluorescence, absorbance, refractive index); hydrodynamic properties (eg shape), chromatographic

o de solubilidad de la proteína; ensayos de unión a ligando, por ejemplo, unión a anticuerpos; medición de marcadores inducibles o de la activación transcripcional del marcador; medición de los cambios de la actividad enzimática; la capacidad de aumentar o disminuir la proliferación celular, la apoptosis, la detención del ciclo celular, 45 medición de cambios en los marcadores de superficie celular. Los efectos funcionales pueden evaluarse mediante muchos medios conocidos para los expertos en la materia, por ejemplo, microscopía para medidas cuantitativas y cualitativas de modificaciones en las características morfológicas, medición de cambios en los niveles de ARN o proteína para otros genes expresados en tejido placentario, medición de la estabilidad del ARN, identificación de la expresión de un gen aguas abajo o indicador (CAT, luciferasa, β-gal, GFP y similares), por ejemplo, a través de or of protein solubility; ligand binding assays, for example, antibody binding; measurement of inducible markers or transcriptional activation of the marker; measurement of changes in enzyme activity; the ability to increase or decrease cell proliferation, apoptosis, cell cycle arrest, measurement of changes in cell surface markers. Functional effects can be evaluated by many means known to those skilled in the art, for example, microscopy for quantitative and qualitative measures of changes in morphological characteristics, measurement of changes in RNA or protein levels for other genes expressed in placental tissue, measurement of RNA stability, identification of the expression of a downstream gene or indicator (CAT, luciferase, β-gal, GFP and the like), for example, through

50 quimioluminiscencia, fluorescencia, reacciones colorimétricas, unión a anticuerpos, marcadores inducibles, etc. 50 chemiluminescence, fluorescence, colorimetric reactions, antibody binding, inducible markers, etc.

“Inhibidores”, “activadores” y “moduladores” de los marcadores se utilizan para referirse a moléculas activadoras, inhibidoras o moduladoras identificadas utilizando ensayos in vitro e in vivo de biomarcadores para el cáncer. Los inhibidores son compuestos que, por ejemplo, se unen, bloquean la actividad de forma parcial o total, disminuyen, 55 impiden, retrasan la activación, inactivan, desensibilizan o regulan de forma negativa la actividad o expresión de biomarcadores para el cáncer. “Activadores” son compuestos que aumentan, abren, activan, facilitan, potencian la activación, sensibilizan, agonizan o regulan de forma positiva la actividad de biomarcadores para el cáncer, por ejemplo, los agonistas. Los inhibidores, activadores o moduladores también incluyen versiones genéticamente modificadas de biomarcadores para el cáncer, por ejemplo, versiones con actividad modificada, así como ligandos "Inhibitors", "activators" and "modulators" of the markers are used to refer to activating, inhibiting or modulating molecules identified using in vitro and in vivo assays of biomarkers for cancer. Inhibitors are compounds that, for example, bind, block activity partially or totally, decrease, prevent, delay activation, inactivate, desensitize or negatively regulate the activity or expression of biomarkers for cancer. "Activators" are compounds that increase, open, activate, facilitate, enhance activation, sensitize, agonize or positively regulate the activity of biomarkers for cancer, for example, agonists. Inhibitors, activators or modulators also include genetically modified versions of biomarkers for cancer, for example, versions with modified activity, as well as ligands

60 de origen natural y sintético, antagonistas, agonistas, anticuerpos, péptidos, péptidos cíclicos, ácidos nucleicos, moléculas antisentido, ribozimas, moléculas de iARN y ARNip, moléculas orgánicas pequeñas y similares. Tales ensayos para inhibidores y activadores incluyen, por ejemplo, la expresión de biomarcadores para el cáncer in vitro, en células o extractos celulares, la aplicación de supuestos compuestos moduladores y, después, la determinación de los efectos funcionales sobre la actividad, como se describe anteriormente. 60 of natural and synthetic origin, antagonists, agonists, antibodies, peptides, cyclic peptides, nucleic acids, antisense molecules, ribozymes, iRNA and siRNA molecules, small organic molecules and the like. Such assays for inhibitors and activators include, for example, the expression of biomarkers for cancer in vitro, in cells or cell extracts, the application of so-called modulating compounds and, then, the determination of functional effects on activity, as described. previously.

Las muestras o ensayos que comprenden biomarcadores para el cáncer que se tratan con un posible activador, inhibidor o modulador se comparan con muestras de control sin el inhibidor, activador o modulador para examinar el grado de inhibición. A las muestras de control (no tratadas con inhibidores) se les asigna un valor relativo de actividad de proteína del 100 %. La inhibición de los biomarcadores para el cáncer se logra cuando el valor de Samples or assays comprising biomarkers for cancer that are treated with a possible activator, inhibitor or modulator are compared with control samples without the inhibitor, activator or modulator to examine the degree of inhibition. Control samples (not treated with inhibitors) are assigned a relative value of 100% protein activity. The inhibition of biomarkers for cancer is achieved when the value of

5 actividad con respecto al control es aproximadamente del 80 %, preferentemente del 50 %, más preferentemente del 25-0 %. La activación de los biomarcadores para el cáncer se logra cuando el valor de actividad con respecto control (no tratado con activadores) es del 110 %, más preferentemente del 150 %, más preferentemente del 200-500 % (es decir, dos a cinco veces mayor con respecto al control), más preferentemente del 1000-3000 % mayor. The activity with respect to the control is approximately 80%, preferably 50%, more preferably 25-0%. The activation of biomarkers for cancer is achieved when the activity value with respect to control (not treated with activators) is 110%, more preferably 150%, more preferably 200-500% (i.e., two to five times higher with respect to the control), more preferably 1000-3000% higher.

La expresión “compuesto de prueba” o “candidato farmacológico”, o “modulador”, o equivalentes gramaticales como se utiliza en el presente documento, describe cualquier molécula, ya sea de origen natural o sintética, por ejemplo, una proteína, oligopéptido (por ejemplo, de aproximadamente 5 a aproximadamente 25 aminoácidos de longitud, preferentemente de aproximadamente 10 a 20 o 12 a 18 aminoácidos de longitud, preferentemente de 12, 15 o 18 aminoácidos de longitud), molécula orgánica pequeña, polisacárido, péptido, péptido circular, lípido, ácido graso, The term "test compound" or "drug candidate," or "modulator," or grammatical equivalents as used herein, describes any molecule, whether of natural or synthetic origin, for example, a protein, oligopeptide (for example, about 5 to about 25 amino acids in length, preferably about 10 to 20 or 12 to 18 amino acids in length, preferably 12, 15 or 18 amino acids in length), small organic molecule, polysaccharide, peptide, circular peptide, lipid fatty acid

15 ARNip, polinucleótido, oligonucleótido, etc., a probar por la capacidad de modular de forma directa o indirecta los biomarcadores para el cáncer. El compuesto de prueba puede estar en forma de una biblioteca de compuestos de prueba, tal como una biblioteca combinatoria o aleatorizada que proporcione una variedad suficiente de diversidad. Los compuestos de prueba se unen, de forma opcional, a un compañero de fusión, por ejemplo, compuestos de direccionamiento, compuestos de rescate, compuestos de dimerización, compuestos estabilizadores, compuestos direccionables y otras fracciones funcionales. De forma convencional, se generan nuevas entidades químicas con propiedades útiles identificando un compuesto de prueba (llamado “compuesto de partida”) con alguna propiedad o actividad conveniente, por ejemplo, actividad inhibidora, creando variantes del compuesto de partida, y evaluando la propiedad y actividad de los compuestos variantes. A menudo se emplean para tal análisis métodos de selección de alto rendimiento (SAR). 15 siRNA, polynucleotide, oligonucleotide, etc., to be tested for the ability to directly or indirectly modulate biomarkers for cancer. The test compound may be in the form of a library of test compounds, such as a combinatorial or randomized library that provides a sufficient variety of diversity. Test compounds are optionally linked to a fusion partner, for example, targeting compounds, rescue compounds, dimerization compounds, stabilizing compounds, addressable compounds and other functional fractions. Conventionally, new chemical entities with useful properties are generated by identifying a test compound (called "starting compound") with some suitable property or activity, for example, inhibitory activity, creating variants of the starting compound, and evaluating the property and activity of the variant compounds. High performance selection (SAR) methods are often used for such analysis.

25 Una “molécula orgánica pequeña” se refiere a una molécula orgánica, ya sea de origen natural o sintética, que tiene un peso molecular de más de aproximadamente 50 daltons y menos de aproximadamente 2.500 daltons, preferentemente menos de aproximadamente 2.000 daltons, preferentemente entre aproximadamente 100 y aproximadamente 1000 daltons, más preferentemente entre aproximadamente 200 y aproximadamente 500 daltons. A "small organic molecule" refers to an organic molecule, whether of natural or synthetic origin, having a molecular weight of more than about 50 daltons and less than about 2,500 daltons, preferably less than about 2,000 daltons, preferably between about 100 and about 1000 daltons, more preferably between about 200 and about 500 daltons.

Métodos de pronóstico Forecast Methods

La presente invención proporciona métodos para predecir o proporcionar un pronóstico para el cáncer de pulmón detectando la expresión de un panel de marcadores expresados de forma diferencial en el cáncer. El panel incluye The present invention provides methods for predicting or providing a prognosis for lung cancer by detecting the expression of a panel of differentially expressed markers in cancer. The panel includes

35 los genes que codifican BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A. La predicción y el pronóstico implican determinar el nivel de un panel de polinucleótidos biomarcadores para el cáncer de pulmón o los correspondientes polipéptidos en un paciente o muestra de paciente, y comparar después el nivel con un valor de referencia o intervalo. Normalmente, el valor de referencia es representativo de los niveles del polinucleótido o ácido nucleico en una persona sana que no padece, o que está destinada a desarrollar, cáncer de pulmón, medido utilizando una muestra biológica tal como una biopsia de pulmón o una muestra de un fluido corporal. La variación de los niveles de un polinucleótido o los polipéptidos correspondientes de la invención con respecto al intervalo de referencia (ya sea hacia arriba o hacia abajo), indica que el paciente tiene un riesgo aumentado de mortalidad a largo plazo. The genes encoding BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A. Prediction and prognosis involve determining the level of a biomarker polynucleotide panel for lung cancer or the corresponding polypeptides in a patient or patient sample, and then comparing the level with a reference value or interval. Normally, the reference value is representative of the levels of the polynucleotide or nucleic acid in a healthy person who does not suffer from, or is destined to develop, lung cancer, measured using a biological sample such as a lung biopsy or a sample of a body fluid The variation of the levels of a polynucleotide or the corresponding polypeptides of the invention with respect to the reference range (either up or down), indicates that the patient has an increased risk of long-term mortality.

45 El algoritmo utilizado para calcular una puntuación de evaluación del riesgo en un método divulgado en el presente documento puede agrupar los valores del nivel de expresión de genes, y la puntuación del riesgo puede obtenerse de cualquier algoritmo conocido en la técnica. Los ejemplos proporcionados en el presente documento emplean algoritmos ejemplares que pueden utilizarse para desarrollar una evaluación del riesgo. Los algoritmos son conjuntos de reglas para describir la evaluación del riesgo de cáncer de pulmón utilizando la expresión del panel de genes descrito en el presente documento. El conjunto de reglas puede estar definido exclusivamente de forma algebraica pero también puede incluir puntos de decisión alternativos o múltiples que requieran un conocimiento específico del campo, la interpretación de expertos u otros indicadores clínicos. Se pueden desarrollar muchos algoritmos que pueden proporcionar distintas evaluaciones del riesgo utilizando perfiles de expresión del panel de genes descritos en el presente documento. Por ejemplo, las puntuaciones de riesgo de un individuo pueden The algorithm used to calculate a risk assessment score in a method disclosed herein can group the values of the level of gene expression, and the risk score can be obtained from any algorithm known in the art. The examples provided herein use exemplary algorithms that can be used to develop a risk assessment. The algorithms are sets of rules to describe the assessment of lung cancer risk using the expression of the gene panel described in this document. The set of rules can be defined exclusively in an algebraic way but can also include alternative or multiple decision points that require specific knowledge of the field, the interpretation of experts or other clinical indicators. Many algorithms can be developed that can provide different risk assessments using expression profiles from the gene panel described herein. For example, an individual's risk scores may

55 generarse utilizando el modelo de riesgos instantáneos proporcionales de Cox. También puede determinarse una categorización de pronóstico del individuo utilizando un modelo estadístico o un algoritmo de aprendizaje automático, que calcula la probabilidad de recurrencia basada en los perfiles de expresión génica del individuo. 55 generated using the Cox proportional instantaneous risk model. An individual prognostic categorization can also be determined using a statistical model or machine learning algorithm, which calculates the probability of recurrence based on the individual's gene expression profiles.

A base de la determinación de un riesgo, los individuos pueden distribuirse en grupos de riesgo (por ejemplo, terciles Based on the determination of a risk, individuals can be divided into risk groups (for example, tertiles

o cuartiles) a base de en un valor seleccionado de la puntuación de riesgo, en donde todos los individuos con valores en un dado intervalo pueden clasificarse como que pertenecen a un grupo de riesgo particular. Por lo tanto, los valores escogidos definirán grupos de riesgo de pacientes con, respectivamente, mayor o menor riesgo. Los grupos de riesgo pueden clasificarse adicionalmente en distintos intervalos de mortalidad, por ejemplo, en una mortalidad a 6 meses, a 1 año, a 2 años, a 3 años, a 4 años, a 5 años, a 10 años, a 25 años. Los grupos de riesgo or quartiles) based on a selected value of the risk score, where all individuals with values in a given range can be classified as belonging to a particular risk group. Therefore, the values chosen will define risk groups of patients with, respectively, greater or lesser risk. Risk groups can be further classified into different mortality intervals, for example, in a 6-month, 1-year, 2-year, 3-year, 4-year, 5-year, 10-year, 25-year-old mortality . Risk groups

65 pueden clasificarse adicionalmente en distintos intervalos de sucesos asociados con cáncer de pulmón, los que pueden incluir, pero sin limitación, probabilidad de metástasis, recurrencia, etc. 65 can be further classified into different intervals of events associated with lung cancer, which may include, but are not limited to, probability of metastasis, recurrence, etc.

En el presente documento se exponen diversas estrategias tecnológicas para la determinación de los niveles de expresión del panel de genes, incluyendo, pero sin limitación, RT-PCR, micromatrices, secuenciación de alto rendimiento, análisis en serie de la expresión génica (SAGE, acrónimo de serial analysis of gene expression)y Expresión Génica Digital (DGE, forma siglada de digital gene expression). El nivel de expresión de cada gen puede Various technological strategies for the determination of the expression levels of the gene panel, including, but not limited to, RT-PCR, microarrays, high performance sequencing, serial analysis of gene expression (SAGE, acronym) are presented herein. of serial analysis of gene expression) and Digital Gene Expression (DGE). The expression level of each gene can

5 determinarse en relación a diversas características de los productos de expresión del gen, incluyendo exones, intrones, epítopos de proteína y actividad de proteína. 5 be determined in relation to various characteristics of gene expression products, including exons, introns, protein epitopes and protein activity.

En una realización preferente, se utiliza PCR en tiempo real o de transcripción inversa cuantitativa (RTPCR) para examinar la expresión de los once marcadores del panel, utilizando ARN procedente de una muestra biológica, tal como un tejido tumoral. No se necesita microdisección. La extracción de ARN puede realizarse mediante cualquier método conocido para los expertos en la materia, por ejemplo, métodos que implican la digestión de tejido con proteinasa K y la precipitación de ácidos nucleicos basada en alcoholes, el tratamiento con ADNasa para digerir el ADN contaminante, la purificación de ARN utilizando la tecnología de membrana de gel de sílice, métodos que utilizan kits disponibles en el mercado tal como Trizol y RNeasy, o cualquier combinación de los mismos. La RT-PCR In a preferred embodiment, real-time PCR or quantitative reverse transcription (RTPCR) is used to examine the expression of the eleven panel markers, using RNA from a biological sample, such as a tumor tissue. No microdissection is necessary. RNA extraction can be performed by any method known to those skilled in the art, for example, methods that involve tissue digestion with proteinase K and precipitation of alcohol-based nucleic acids, treatment with DNase to digest the contaminating DNA, RNA purification using silica gel membrane technology, methods using commercially available kits such as Trizol and RNeasy, or any combination thereof. RT-PCR

15 en tiempo real puede realizarse por cualquier método conocido para los expertos en la materia, por ejemplo, PCR en tiempo real Taqman utilizando los ensayos de Applied Biosystem. La expresión génica se calcula con respecto al ARN de pulmón normal agrupado y la expresión se normaliza con respecto a genes constitutivos. Los expertos en la materia seleccionan cebadores de oligonucleótido adecuados. En una realización, el ensayo se utiliza para cánceres en estadio I, estadio II, estadio III o estadio IV. En una realización, la muestra de tejido procede de un tumor extirpado de forma quirúrgica. 15 in real time can be performed by any method known to those skilled in the art, for example, Taqman real-time PCR using Applied Biosystem assays. Gene expression is calculated with respect to clustered normal lung RNA and expression is normalized with respect to constitutive genes. Those skilled in the art select suitable oligonucleotide primers. In one embodiment, the assay is used for stage I, stage II, stage III or stage IV cancers. In one embodiment, the tissue sample comes from a tumor surgically removed.

En una realización, los biomarcadores de ARN se examinan utilizando moléculas de unión de ácido nucleico como sondas, oligonucleótidos, matrices de oligonucleótidos y cebadores, que detectan la expresión diferencial de ARN en muestras de pacientes. En una realización, se utiliza RT-PCR de acuerdo con métodos convencionales conocidos In one embodiment, RNA biomarkers are examined using nucleic acid binding molecules such as probes, oligonucleotides, oligonucleotide matrices and primers, which detect differential expression of RNA in patient samples. In one embodiment, RT-PCR is used according to known conventional methods.

25 en la técnica. En otra realización, para detectar ácidos nucleicos y variantes de los mismos pueden utilizarse ensayos de RT-PCR cuantitativos tales como los que utilizan los ensayos Taqman® disponibles de, por ejemplo, Applied Biosystems. En otras realizaciones, para detectar ácidos nucleicos pueden utilizarse micromatrices de ácidos nucleicos. También está incluido en el ámbito de la presente invención el análisis de los ácidos nucleicos puede conseguirse utilizando técnicas de rutina tales como análisis de Northern o cualquier otro método basado en hibridación con una secuencia de ácido nucleico que sea complementaria con una porción de la secuencia codificante del marcador (por ejemplo, hibridación por transferencia por ranuras). Los reactivos que se unen a biomarcadores de ácido nucleico seleccionados pueden prepararse de acuerdo con métodos conocidos para el experto en la materia o pueden adquirirse en el mercado. 25 in the art. In another embodiment, quantitative RT-PCR assays such as those using available Taqman® assays of, for example, Applied Biosystems, can be used to detect nucleic acids and variants thereof. In other embodiments, micromatrices of nucleic acids can be used to detect nucleic acids. Also included within the scope of the present invention is the analysis of nucleic acids can be achieved using routine techniques such as Northern analysis or any other method based on hybridization with a nucleic acid sequence that is complementary to a portion of the coding sequence. of the marker (for example, hybridization by slot transfer). Reagents that bind to selected nucleic acid biomarkers can be prepared according to methods known to the person skilled in the art or can be purchased commercially.

35 Las técnicas de amplificación por PCR aplicables se describen en, por ejemplo, Ausubel et al. e Innis et al., citado anteriormente. Los métodos generales de hibridación de ácidos nucleicos se describen en Anderson, “Nucleic Acid Hybridization”, BIOS Scientific Publishers, 1999. La amplificación o hibridación de una pluralidad de secuencias de ácidos nucleicos (por ejemplo, ADN genómico, ARNm o ADNc) puede también realizarse a partir de la secuencia de ARNm o ADNc dispuesta en una micromatriz. Los métodos de micromatriz se describen en general en Hardiman, “Microarrays Methods and Applications: Nuts & Bolts”, DNA Press, 2003; y Baldi et al., “DNA Microarrays and Gene Expression: From Experiments to Data Analysis and Modeling,” Cambridge University Press, 2002. 35 Applicable PCR amplification techniques are described in, for example, Ausubel et al. and Innis et al., cited above. General methods of nucleic acid hybridization are described in Anderson, "Nucleic Acid Hybridization", BIOS Scientific Publishers, 1999. Amplification or hybridization of a plurality of nucleic acid sequences (eg, genomic DNA, mRNA or cDNA) may also be made from the mRNA or cDNA sequence arranged in a microarray. Microarray methods are generally described in Hardiman, "Microarrays Methods and Applications: Nuts & Bolts", DNA Press, 2003; and Baldi et al., "DNA Microarrays and Gene Expression: From Experiments to Data Analysis and Modeling," Cambridge University Press, 2002.

El análisis de los marcadores de ácido nucleico puede realizarse utilizando técnicas conocidas en la técnica incluyendo, pero sin limitación, análisis de secuencia y análisis electroforético. Los ejemplos no limitativos de análisis 45 de secuencia incluyen la secuenciación de Maxam-Gilbert, la secuenciación de Sanger, la secuenciación de ADN capilar, la secuenciación por ciclo térmico (Sears et al., Biotechniques, 13: 626-633 (1992)), la secuenciación en fase sólida (Zimmerman et al., Methods Mol. Cell Biol., 3: 39-42 (1992)), la secuenciación con espectrometría de masas tal como la desorción e ionización por láser asistida por matriz-tiempo de vuelo-espectrometría de masas (MALDITOF/MS; Fu et al., Nat. Biotechnol., 16: 381-384 (1998)) y la secuenciación por hibridación. Chee et al., Science, The analysis of nucleic acid markers can be performed using techniques known in the art including, but not limited to, sequence analysis and electrophoretic analysis. Non-limiting examples of sequence analysis include Maxam-Gilbert sequencing, Sanger sequencing, capillary DNA sequencing, thermal cycle sequencing (Sears et al., Biotechniques, 13: 626-633 (1992)) , solid phase sequencing (Zimmerman et al., Methods Mol. Cell Biol., 3: 39-42 (1992)), mass spectrometry sequencing such as desorption and laser ionization assisted by matrix-time-of-flight - mass spectrometry (MALDITOF / MS; Fu et al., Nat. Biotechnol., 16: 381-384 (1998)) and hybridization sequencing. Chee et al., Science,

274: 610-614 (1996); Drmanac et al., Science, 260: 1649-1652 (1993); Drmanac et al., Nat. Biotechnol., 16: 54-58 (1998). Los ejemplos no limitativos de análisis electroforético incluyen electroforesis en gel plano, tal como electroforesis en gel de agarosa o poliacrilamida, electroforesis capilar y electroforesis en gel en gradiente desnaturalizante. 274: 610-614 (1996); Drmanac et al., Science, 260: 1649-1652 (1993); Drmanac et al., Nat. Biotechnol., 16: 54-58 (1998). Non-limiting examples of electrophoretic analysis include flat gel electrophoresis, such as agarose or polyacrylamide gel electrophoresis, capillary electrophoresis and denaturing gradient gel electrophoresis.

55 En otro aspecto, los reactivos de anticuerpos pueden utilizarse en ensayos para detectar los niveles de expresión de los biomarcadores proteicos de la invención en muestras de paciente, que utilizan cualquiera de una serie de inmunoensayos conocidos para los expertos en la materia. Las técnicas y protocolos de inmunoensayos se describen en general en Price y Newman, “Principles and Practice of Immunoassay”, 2ª edición, Grove's Dictionaries, 1997; y Gosling, “Immunoassays: A Practical Approach”, Oxford University Press, 2000. Puede utilizarse una diversidad de técnicas de inmunoensayo, incluyendo los inmunoensayos competitivos y no competitivos. Véase, por ejemplo, Self et al., Curr. Opin. Biotechnol., 7: 60-65 (1996). El término inmunoensayo abarca técnicas que incluyen, pero sin limitación, inmunoensayos enzimáticos (EIA) tales como la técnica de inmunoensayo multiplicado por enzimas (EMIT), el ensayo inmunoabsorbente ligado a enzimas (ELISA), el ELISA de captura con anticuerpo IgM (MAC ELISA) y el inmunoensayo enzimático de micropartículas (MEIA); los In another aspect, antibody reagents can be used in assays to detect the expression levels of the protein biomarkers of the invention in patient samples, which use any of a series of immunoassays known to those skilled in the art. Immunoassay techniques and protocols are generally described in Price and Newman, "Principles and Practice of Immunoassay", 2nd edition, Grove's Dictionaries, 1997; and Gosling, "Immunoassays: A Practical Approach," Oxford University Press, 2000. A variety of immunoassay techniques can be used, including competitive and non-competitive immunoassays. See, for example, Self et al., Curr. Opin. Biotechnol., 7: 60-65 (1996). The term "immunoassay" encompasses techniques that include, but are not limited to, enzyme immunoassays (EIA) such as the enzyme-multiplied immunoassay technique (EMIT), the enzyme-linked immunosorbent assay (ELISA), the IgM antibody-capture ELISA (MAC ELISA). ) and the enzymatic microparticle immunoassay (MEIA); the

65 inmunoensayos con electroforesis capilar (CEIA); radioinmunoensayos (RIA); ensayos inmunorradiométricos (IRMA); inmunoensayos de polarización fluorescente (FPIA) y ensayos de quimioluminiscencia (CL). Si se desea, tales 65 immunoassays with capillary electrophoresis (CEIA); radioimmunoassays (RIA); immunoradiometric assays (IRMA); fluorescent polarization immunoassays (FPIA) and chemiluminescence assays (CL). If desired, such

inmunoensayos pueden estar automatizados. Los inmunoensayos también pueden utilizarse de forma conjunta con inmunofluorescencia inducida por láser. Véase, por ejemplo, Schmalzing et al., Electrophoresis, 18: 2184-93 (1997); Bao, J. Chromatogr. B. Biomed. Sci., 699: 463-80 (1997). Los inmunoensayos con liposomas, tales como los inmunoensayos de inyección de flujo por liposomas y los inmunosensores de liposomas, también son adecuados Immunoassays can be automated. Immunoassays can also be used in conjunction with laser-induced immunofluorescence. See, for example, Schmalzing et al., Electrophoresis, 18: 2184-93 (1997); Bao, J. Chromatogr. B. Biomed. Sci., 699: 463-80 (1997). Immunoassays with liposomes, such as liposome flow injection immunoassays and liposome immunosensors, are also suitable.

5 para su uso en la presente invención. Véase, por ejemplo, Rongen et al., J. Immunol. Methods, 204: 105-133 (1997). Además, son adecuados para su uso en los métodos de la presente invención los ensayos de nefelometría, en los que la formación de los complejos de proteína/anticuerpo dan como resultado una dispersión de la luz aumentada que se convierte en una señal de frecuencia máxima como una función de la concentración del marcador. Los ensayos de nefelometría están disponibles en el mercado de Beckman Coulter (Brea, CA; Kit n.º 449430) y pueden realizarse utilizando un analizador nefelómetro de Behring (Fink et al., J. Clin. Chem. Clin. Biochem., 27: 261-276 (1989). 5 for use in the present invention. See, for example, Rongen et al., J. Immunol. Methods, 204: 105-133 (1997). In addition, nephelometry assays are suitable for use in the methods of the present invention, in which the formation of the protein / antibody complexes results in an increased light scattering that becomes a maximum frequency signal such as a function of marker concentration. Nephelometry assays are commercially available from Beckman Coulter (Brea, CA; Kit # 449430) and can be performed using a Behring nephelometer analyzer (Fink et al., J. Clin. Chem. Clin. Biochem., 27 : 261-276 (1989).

Los niveles de expresión de los genes pronósticos y/o predictivos pueden medirse en un tejido tumoral. Por ejemplo, el tejido tumoral se obtiene tras la extirpación o extirpación quirúrgica del tumor, o por biopsia del tumor. El nivel de Expression levels of prognostic and / or predictive genes can be measured in a tumor tissue. For example, tumor tissue is obtained after surgical removal or excision of the tumor, or by tumor biopsy. The level of

15 expresión de los genes pronósticos y/o predictivos también puede medirse en células tumorales recuperadas a partir de un sitio distante del tumor, por ejemplo células tumorales en circulación o un fluido corporal. Prognostic and / or predictive gene expression can also be measured in tumor cells recovered from a distant site of the tumor, for example circulating tumor cells or a body fluid.

En los ensayos descritos en el presente documento puede utilizarse una fracción detectable (detección directa o indirecta). Puede utilizarse una amplia diversidad de fracciones detectables, dependiendo la elección del marcador de la sensibilidad necesaria, la facilidad de conjugación con el anticuerpo, los requisitos de estabilidad y las disposiciones disponibles sobre instrumentación y evacuación. Las fracciones detectables adecuadas incluyen, pero sin limitación, radionúclidos, colorantes fluorescentes (por ejemplo, fluoresceína, isotiocianato de fluoresceína (FITC), Oregon Green™, rodamina, rojo Texas, isotiocianato de tetrarrodamina (TRITC), Cy3, Cy5, etc.), marcadores fluorescentes (por ejemplo, proteína verde fluorescente (GFP), ficoeritrina, etc.), compuestos fluorescentes In the assays described herein, a detectable fraction (direct or indirect detection) can be used. A wide variety of detectable fractions can be used, depending on the choice of the necessary sensitivity marker, the ease of conjugation with the antibody, the stability requirements and the available instrumentation and evacuation provisions. Suitable detectable fractions include, but are not limited to, radionuclides, fluorescent dyes (e.g., fluorescein, fluorescein isothiocyanate (FITC), Oregon Green ™, rhodamine, Texas red, tetrarrodamine isothiocyanate (TRITC), Cy3, Cy5, etc.) , fluorescent markers (eg, green fluorescent protein (GFP), phycoerythrin, etc.), fluorescent compounds

25 autoinactivados que se activan mediante proteasas asociadas a tumor, enzimas (por ejemplo, luciferasa, peroxidasa de rábano picante, fosfatasa alcalina, etc.), nanopartículas, biotina, digoxigenina, metales y similares. 25 auto-activates that are activated by tumor-associated proteases, enzymes (eg, luciferase, horseradish peroxidase, alkaline phosphatase, etc.), nanoparticles, biotin, digoxigenin, metals and the like.

Es adecuado para la detección sensible, no radiactiva de los niveles de proteínas un ensayo quimioluminiscente que utiliza un anticuerpo quimioluminiscente específico para el ácido nucleico. También es adecuado un anticuerpo marcado con fluorocromo. Los ejemplos de fluorocromos incluyen, pero sin limitación, DAPI, fluoresceína, Hoechst 33258, R-ficocianina, B-ficoeritrina, R-ficoeritrina, rodamina, Rojo Texas y lisamina. Los marcadores indirectos incluyen diversas enzimas bien conocidas en la técnica, tales como peroxidasa de rábano picante (HRP), fosfatasa alcalina (AP), β-galactosidasa, ureasa y similares. Puede utilizarse un sistema de detección por peroxidasa de rábano picante, por ejemplo, con el sustrato cromogénico tetrametilbenzidina (TMB), que produce un producto A chemiluminescent assay using a chemiluminescent antibody specific for nucleic acid is suitable for sensitive, non-radioactive detection of protein levels. Also suitable is a fluorochrome labeled antibody. Examples of fluorochromes include, but are not limited to, DAPI, fluorescein, Hoechst 33258, R-phycocyanin, B-phycoerythrin, R-phycoerythrin, rhodamine, Texas Red and lysamine. Indirect markers include various enzymes well known in the art, such as horseradish peroxidase (HRP), alkaline phosphatase (AP), β-galactosidase, urease and the like. A horseradish peroxidase detection system can be used, for example, with the tetramethylbenzidine (TMB) chromogenic substrate, which produces a product

35 soluble en presencia de peróxido de hidrógeno que es detectable a 450 nm. Puede utilizarse un sistema de detección de fosfatasa alcalina con el sustrato cromogénico p-nitrofenil fosfato, por ejemplo, que produce un producto soluble fácilmente detectable a 405 nm. De forma similar, puede utilizarse un sistema de detección de βgalactosidasa con el sustrato cromogénico o-nitrofenil-β-D-galactopiranósido (ONPG), que produce un producto soluble detectable a 410 nm. Puede utilizarse un sistema de detección de ureasa con un sustrato tal como urea-púrpura de bromocresol (Sigma Immunochemicals, St. Louis, MO). Soluble in the presence of hydrogen peroxide which is detectable at 450 nm. An alkaline phosphatase detection system with the chromogenic substrate p-nitrophenyl phosphate can be used, for example, which produces a soluble product easily detectable at 405 nm. Similarly, a βgalactosidase detection system can be used with the o-nitrophenyl-β-D-galactopyranoside chromogenic substrate (ONPG), which produces a soluble product detectable at 410 nm. A urease detection system with a substrate such as urea-bromocresol purple (Sigma Immunochemicals, St. Louis, MO) can be used.

Puede analizarse una señal procedente de un marcador directo o indirecto, por ejemplo, utilizando un espectrofotómetro para detectar color de un sustrato cromogénico; un contador de radiación para detectar radiación tal como un contador gamma para la detección de 125I o un fluorómetro para detectar fluorescencia en presencia de A signal from a direct or indirect marker can be analyzed, for example, using a spectrophotometer to detect color of a chromogenic substrate; a radiation meter to detect radiation such as a gamma counter for the detection of 125I or a fluorometer to detect fluorescence in the presence of

45 luz de una determinada longitud de onda. Para la detección de anticuerpos ligados a enzimas puede hacerse un análisis cuantitativo utilizando un espectrofotómetro tal como un lector de microplacas EMAX (Molecular Devices; Menlo Park, CA) en conformidad con las instrucciones del fabricante. Si se desea, los ensayos de la presente invención pueden automatizarse o realizarse de forma robótica, y puede detectarse de forma simultánea la señal procedente de múltiples muestras. 45 light of a certain wavelength. For the detection of enzyme-bound antibodies a quantitative analysis can be done using a spectrophotometer such as an EMAX microplate reader (Molecular Devices; Menlo Park, CA) in accordance with the manufacturer's instructions. If desired, the assays of the present invention can be automated or performed robotically, and the signal from multiple samples can be detected simultaneously.

Los anticuerpos pueden inmovilizarse en una diversidad de soportes sólidos, tal como partículas de una matriz magnética o cromatográfica, la superficie de una placa de ensayo (por ejemplo, pocillos de microtitulación), trozos de un material o membrana de sustrato sólido (por ejemplo, plástico, nylon, papel) y similar. Puede prepararse una tira de ensayo recubriendo el anticuerpo o una pluralidad de anticuerpos en una matriz sobre un soporte sólido. Esta tira The antibodies can be immobilized on a variety of solid supports, such as particles of a magnetic or chromatographic matrix, the surface of a test plate (for example, microtiter wells), pieces of a solid substrate material or membrane (for example, plastic, nylon, paper) and the like. A test strip can be prepared by coating the antibody or a plurality of antibodies in a matrix on a solid support. This strip

55 puede sumergirse después en la muestra de ensayo y procesarse rápidamente a través de etapas de lavado y detección, para generar una señal que se puede medir, tal como una mancha coloreada. 55 can then be immersed in the test sample and quickly processed through washing and detection steps, to generate a measurable signal, such as a colored spot.

Los formatos físicos útiles comprenden superficies que tienen una pluralidad de emplazamientos discretos y evaluables para la detección de una pluralidad de distintos marcadores. Tales formatos incluyen micromatrices y determinados dispositivos capilares. Véase, por ejemplo, Ng et al., J. Cell Mol. Med., 6: 329-340 (2002); la Patente de Estados Unidos n.º 6.019.944. En estas realizaciones, cada emplazamiento discreto de la superficie puede comprender anticuerpos para inmovilizar uno o más marcadores para la detección en cada emplazamiento. Las superficies pueden, de forma alternativa, comprender una o más partículas discretas (por ejemplo, micropartículas o nanopartículas) inmovilizadas en emplazamientos discretos de una superficie, en donde las micropartículas Useful physical formats comprise surfaces that have a plurality of discrete and evaluable locations for the detection of a plurality of different markers. Such formats include microarrays and certain capillary devices. See, for example, Ng et al., J. Cell Mol. Med., 6: 329-340 (2002); U.S. Patent No. 6,019,944. In these embodiments, each discrete surface site may comprise antibodies to immobilize one or more markers for detection at each site. The surfaces may, alternatively, comprise one or more discrete particles (eg, microparticles or nanoparticles) immobilized at discrete locations of a surface, where the microparticles

65 comprenden anticuerpos para inmovilizar uno o más marcadores para la detección. 65 comprise antibodies to immobilize one or more markers for detection.

El análisis puede llevarse a cabo en una diversidad de formatos físicos. Por ejemplo, podría utilizarse el uso de placas de microtitulación o de automatización para facilitar el procesamiento de un gran número de muestras de ensayo. Como alternativa, podrían desarrollarse formatos de muestra única para facilitar el diagnóstico o el pronóstico en el momento oportuno. The analysis can be carried out in a variety of physical formats. For example, the use of microtiter or automation plates could be used to facilitate the processing of a large number of test samples. Alternatively, single sample formats could be developed to facilitate diagnosis or prognosis at the appropriate time.

5 Como alternativa, los anticuerpos o las sondas de ácido nucleico de la invención pueden aplicarse a cortes de biopsias de pacientes inmovilizados sobre portaobjetos de microscopio. La tinción por anticuerpo o el patrón de hibridación in situ resultante puede visualizarse utilizando uno cualquiera de una diversidad de métodos microscópicos fluorescentes conocidos en la técnica. Alternatively, the antibodies or nucleic acid probes of the invention can be applied to biopsy sections of patients immobilized on microscope slides. Antibody staining or the resulting in situ hybridization pattern can be visualized using any one of a variety of microscopic fluorescent methods known in the art.

En otro formato, los diversos marcadores de la invención también proporcionan reactivos para la formación de imágenes in vivo tales como, por ejemplo, la formación de imágenes de reactivos marcados que detectan los ácidos nucleicos o proteínas codificadas de los biomarcadores de la invención. Para los fines de formación de imágenes in vivo, los reactivos que detectan la presencia de proteínas codificadas por biomarcadores para el cáncer, tales como In another format, the various markers of the invention also provide reagents for in vivo imaging such as, for example, imaging of labeled reagents that detect the nucleic acids or encoded proteins of the biomarkers of the invention. For imaging purposes in vivo, reagents that detect the presence of proteins encoded by biomarkers for cancer, such as

15 anticuerpos, pueden marcarse utilizando un marcador apropiado, tal como un marcador fluorescente. 15 antibodies can be labeled using an appropriate label, such as a fluorescent label.

El panel de 11 genes descrito en el presente documento (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A) proporciona un ensayo pronóstico más preciso para el cáncer de pulmón que otras combinaciones de genes conocidas actualmente en la técnica. El éxito de las distintas combinaciones de genes en la asignación de individuos a las categorías de riesgo alto o bajo puede compararse utilizando el área bajo la curva del análisis de la característica operativa del receptor (AUROC, forma siglada de area under the receiver operating characteristic). La AUROC es un estadístico sumatorio que captura la capacidad de distintos modelos de discriminar de forma precisa entre grupos de riesgo (en este caso, el riesgo de muerte dentro de los 5 años de la extirpación quirúrgica de un tumor de cáncer de pulmón). The 11 gene panel described herein (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A) provides a more accurate prognostic test for lung cancer than other known gene combinations Currently in the art. The success of the different combinations of genes in the assignment of individuals to the high or low risk categories can be compared using the area under the curve of the analysis of the receiver's operational characteristic (AUROC, acronym for the area under the receiver operating characteristic) . The AUROC is a summative statistic that captures the ability of different models to accurately discriminate between risk groups (in this case, the risk of death within 5 years of surgical removal of a lung cancer tumor).

25 El análisis AUROC puede realizarse utilizando diversos programas informáticos conocidos en la técnica, incluyendo, pero sin limitación, el paquete de programas informáticos de computación estadística R y el paquete de programas informáticos de computación STATA. Un experto en la materia reconocerá que distintos paquetes de programas informáticos de computación pueden producir distintos estadísticos c. Un estadístico c de AUROC mayor indica una firma génica pronóstica más precisa. The AUROC analysis can be performed using various computer programs known in the art, including, but not limited to, the statistical computing software package R and the STATA computer software package. One skilled in the art will recognize that different packages of computer software can produce different statistics c. A larger AUROC c statistic indicates a more accurate prognostic gene signature.

Los valores de expresión génica contribuyen de forma positiva a un riesgo de mortalidad del paciente (representado por una razón de riesgos instantáneos mayor de 1,0) o de forma negativa a un riesgo de mortalidad del paciente (representado por una razón de riesgos instantáneos menor de 1,0). Por lo tanto, cada gen puede ya sea aumentar Gene expression values contribute positively to a patient mortality risk (represented by an instantaneous risk ratio greater than 1.0) or negatively to a patient mortality risk (represented by a lower instantaneous risk ratio of 1.0). Therefore, each gene can either increase

35 el riesgo de mortalidad de un paciente o disminuir el riesgo de mortalidad de un paciente. Los genes de riesgo son genes para los que el aumento de la expresión está asociado con un riesgo mayor de muerte, mientras que los genes protectores son genes para los que un aumento de la expresión está asociado con un riesgo menor de muerte. En algunas realizaciones, BAG1, BRCA1, CDC6, CDK2AP1, FUT3, IL11 y RND3 del panel de once genes son genes de riesgo que indican una probabilidad aumentada de la mortalidad del sujeto, mientras que ERBB3, LCK, SH3BGR y WNT3A son genes protectores que indican una probabilidad disminuida de mortalidad del sujeto. 35 the risk of mortality of a patient or decrease the risk of mortality of a patient. Risk genes are genes for which increased expression is associated with a higher risk of death, while protective genes are genes for which increased expression is associated with a lower risk of death. In some embodiments, BAG1, BRCA1, CDC6, CDK2AP1, FUT3, IL11 and RND3 of the panel of eleven genes are risk genes that indicate an increased probability of subject mortality, while ERBB3, LCK, SH3BGR and WNT3A are protective genes that indicate a decreased probability of mortality of the subject.

En la determinación del estadístico c de AUROC, a los genes de riesgo se les asigna un valor positivo en el algoritmo de ensayo, de forma que sus valores de expresión conducen a un aumento de la puntuación del riesgo, lo que corresponde a riesgo mayor de muerte dentro de 5 años. A los genes protectores se les asigna un valor In the determination of the AUROC c statistic, risk genes are assigned a positive value in the test algorithm, so that their expression values lead to an increase in the risk score, which corresponds to higher risk of Death within 5 years. Protective genes are assigned a value

45 negativo en el algoritmo de ensayo, de forma que sus valores de expresión conducen a una disminución de la puntuación del riesgo, lo que corresponde a un riesgo menor de muerte dentro de 5 años. Adicionalmente, cada uno de los valores de expresión génica puede ponderarse para representar la contribución relativa de los genes al riesgo de mortalidad del paciente. Debe entenderse que coeficientes grandes representan genes que son muy importantes en la determinación del resultado del paciente, mientras que coeficientes más pequeños representan genes que contribuyen menos a la determinación del resultado del paciente. Los valores ponderados de la combinación de genes de riesgo y de protección en el panel de once genes descrito en el presente documento pueden utilizarse para calcular el estadístico c de AUROC. 45 negative in the test algorithm, so that its expression values lead to a decrease in the risk score, which corresponds to a lower risk of death within 5 years. Additionally, each gene expression value can be weighted to represent the relative contribution of genes to the risk of patient mortality. It should be understood that large coefficients represent genes that are very important in determining the patient's outcome, while smaller coefficients represent genes that contribute less to the determination of the patient's outcome. The weighted values of the combination of risk and protection genes in the eleven gene panel described herein can be used to calculate the AUROC c statistic.

Informes Reports

55 En otro aspecto, la invención presenta un informe que indica un pronóstico de un sujeto con cáncer. El informe puede, por ejemplo, estar en un formato electrónico o en papel. El informe puede incluir información básica del paciente, incluyendo un identificador de paciente (por ejemplo, el nombre del sujeto, el número de seguridad social, el número de seguro médico o un número generado de forma aleatoria), características físicas del sujeto (por ejemplo, edad, peso o sexo), el nombre del médico solicitante, la fecha en que se generó el pronóstico y la fecha de recolección de la muestra. El pronóstico informado puede estar relacionado con la probabilidad de supervivencia para un determinado período de tiempo, la probabilidad de respuesta a determinados tratamientos dentro de un determinado período de tiempo (por ejemplo, tratamientos quimioterapéuticos o quirúrgicos) y/o la probabilidad de recurrencia del cáncer. El pronóstico informado puede estar en forma de una probabilidad porcentual de In another aspect, the invention presents a report indicating a prognosis of a subject with cancer. The report may, for example, be in an electronic format or on paper. The report may include basic patient information, including a patient identifier (for example, the subject's name, social security number, medical insurance number or a randomly generated number), physical characteristics of the subject (for example , age, weight or sex), the name of the requesting physician, the date on which the prognosis was generated and the date of collection of the sample. The reported prognosis may be related to the probability of survival for a certain period of time, the probability of response to certain treatments within a certain period of time (for example, chemotherapeutic or surgical treatments) and / or the probability of cancer recurrence. . The reported prognosis may be in the form of a percentage probability of

65 supervivencia para un determinado período de tiempo, una probabilidad porcentual de respuesta favorable al tratamiento (la respuesta favorable puede definirse, por ejemplo, como contracción del tumor o enlentecimiento del 65 survival for a certain period of time, a percentage probability of favorable treatment response (the favorable response can be defined, for example, as tumor contraction or slowing of the

crecimiento tumoral) o la recurrencia durante un período de tiempo definido (por ejemplo, probabilidad del 20 % de supervivencia durante un período de cinco años). El pronóstico informado puede, como alternativa, estar en forma de una puntuación calculada. Una puntuación mayor o menor, por ejemplo, puede ser indicativa de un pronóstico favorable. En otra realización, el pronóstico informado puede ser una descripción general de la probabilidad de tumor growth) or recurrence over a defined period of time (for example, 20% chance of survival over a period of five years). The informed forecast may, alternatively, be in the form of a calculated score. A higher or lower score, for example, may be indicative of a favorable prognosis. In another embodiment, the reported prognosis may be a general description of the probability of

5 supervivencia, la respuesta al tratamiento o la recurrencia durante un período de tiempo (por ejemplo, muy probable, probable o improbable de sobrevivir durante cinco años). En otra realización, el pronóstico informado puede estar en forma de un gráfico. Además de los niveles de expresión génica, el pronóstico informado también puede tener en cuenta características adicionales del sujeto (por ejemplo, edad, estadio del cáncer, género, tratamiento anterior, estado físico, salud cardiovascular y salud mental). 5 survival, response to treatment or recurrence over a period of time (for example, very likely, likely or unlikely to survive for five years). In another embodiment, the reported forecast may be in the form of a graph. In addition to levels of gene expression, the reported prognosis may also take into account additional characteristics of the subject (for example, age, stage of cancer, gender, previous treatment, physical condition, cardiovascular health and mental health).

Además de un pronóstico, el informe puede incluir de forma optativa datos sin procesar referentes al nivel de expresión de BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A. In addition to a forecast, the report may optionally include raw data referring to the expression level of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A.

Composiciones, kits y sistemas integrados Compositions, kits and integrated systems

15 En el presente documento se describen composiciones, kits y sistemas integrados para la práctica de los ensayos descritos en el presente documento, que utilizan anticuerpos específicos para los polipéptidos o ácidos nucleicos específicos para los polinucleótidos de la invención. Integrated compositions, kits and systems are described herein for the practice of the assays described herein, which use specific antibodies to the specific polypeptides or nucleic acids for the polynucleotides of the invention.

Los kits para llevar a cabo los ensayos de diagnóstico de la invención normalmente incluyen una sonda que comprende un anticuerpo o secuencia de ácido nucleico que se une de forma específica a los polipéptidos o polinucleótidos de la invención, y un marcador para detectar la presencia de la sonda. Este kit puede incluir varios anticuerpos o secuencias de polinucleótido que codifican polipéptidos de la invención, por ejemplo, un cóctel de anticuerpos que reconocen las proteínas codificadas por los biomarcadores de la invención. The kits for carrying out the diagnostic assays of the invention usually include a probe comprising an antibody or nucleic acid sequence that specifically binds to the polypeptides or polynucleotides of the invention, and a marker for detecting the presence of the probe. This kit may include several antibodies or polynucleotide sequences encoding polypeptides of the invention, for example, a cocktail of antibodies that recognize proteins encoded by the biomarkers of the invention.

Planes de tratamiento Treatment plans

Después de un pronóstico que proporciona una evaluación de riesgo bajo, intermedio o alto de mortalidad a 5 años, puede idearse un método para determinar un plan de tratamiento. Por ejemplo, una vez que se ha determinado la clase de evaluación de riesgo, se puede desarrollar un plan de tratamiento específico para el grupo de riesgo. Por ejemplo, para un individuo que tiene un perfil de expresión de los 11 genes descritos en el presente documento indicativo de una evaluación de riesgo alto de mortalidad a 5 años, un profesional sanitario puede utilizar un tratamiento más agresivo. Para un individuo que tiene un perfil de expresión de los 11 genes descritos en el presente documento indicativo de una evaluación de riesgo bajo de mortalidad, un profesional sanitario puede After a prognosis that provides a low, intermediate or high risk assessment of 5-year mortality, a method for determining a treatment plan can be devised. For example, once the risk assessment class has been determined, a specific treatment plan for the risk group can be developed. For example, for an individual who has an expression profile of the 11 genes described in this document indicative of a high risk assessment of 5-year mortality, a healthcare professional may use a more aggressive treatment. For an individual who has an expression profile of the 11 genes described in this document indicative of a low mortality risk assessment, a healthcare professional may

35 utilizar un tratamiento menos agresivo. Para un individuo que tiene un perfil de expresión de los 11 genes descritos en el presente documento indicativo de una evaluación de riesgo intermedio de mortalidad, un profesional sanitario puede utilizar un tratamiento que no sea tan agresivo como el caso de una evaluación de riesgo alto, pero más agresivo que en el caso de una evaluación de riesgo bajo de mortalidad a 5 años. 35 use a less aggressive treatment. For an individual who has an expression profile of the 11 genes described in this document indicative of an intermediate risk assessment of mortality, a healthcare professional may use a treatment that is not as aggressive as the case of a high risk assessment, but more aggressive than in the case of a low risk assessment of mortality at 5 years.

Sistema implementado por ordenador Computer implemented system

La Figura 8 es un diagrama de bloques que ilustra un sistema de ordenador 100, sobre el que pueden implementarse las realizaciones de las presentes enseñanzas. En diversas realizaciones, el sistema de ordenador 100 puede incluir un bus 102 u otro mecanismo de comunicación para comunicar información, y un procesador 104 Figure 8 is a block diagram illustrating a computer system 100, on which the embodiments of the present teachings can be implemented. In various embodiments, the computer system 100 may include a bus 102 or other communication mechanism for communicating information, and a processor 104

45 acoplado con el bus 102 para procesar información. En diversas realizaciones, el sistema de ordenador 100 puede incluir también una memoria 106, que puede ser una memoria de acceso directo (RAM) u otro dispositivo de almacenamiento dinámico, acoplado al bus 102 para determinar los llamados de bases e instrucciones a ejecutar por el procesador 104. La memoria 106 también puede utilizarse para almacenar variables temporales u otra información intermedia durante la ejecución de las instrucciones a ejecutar por el procesador 104. En diversas realizaciones, el sistema de ordenador 100 puede incluir adicionalmente una memoria solo de lectura (ROM) 108 u otro dispositivo de almacenamiento estático acoplado al bus 102, para almacenar información estática e instrucciones para el procesador 104. Puede proporcionarse y acoplarse al bus 102 un dispositivo de almacenamiento 110, tal como un disco magnético o un disco óptico, para almacenar información e instrucciones. 45 coupled with bus 102 to process information. In various embodiments, the computer system 100 may also include a memory 106, which may be a direct access memory (RAM) or other dynamic storage device, coupled to the bus 102 to determine the base calls and instructions to be executed by the processor 104. Memory 106 can also be used to store temporary variables or other intermediate information during the execution of instructions to be executed by processor 104. In various embodiments, computer system 100 may additionally include a read-only memory (ROM). 108 or other static storage device coupled to bus 102, for storing static information and instructions for processor 104. A storage device 110, such as a magnetic disk or an optical disk, can be provided and coupled to bus 102 for storing information and instructions.

55 En diversas realizaciones, el sistema de ordenador 100 puede acoplarse a través del bus 102 a una pantalla 112, tal como un tubo de rayos catódicos (CRT) o pantalla de cristal líquido (LCD), para presentar información al usuario del ordenador. Puede acoplarse al bus 102 un dispositivo de entrada 114, que incluye claves alfanuméricas y otras, para comunicar información y selecciones de comando al procesador 104. Otro tipo de dispositivo de entrada para el usuario es un control de cursor 116, tal como un ratón, un ratón de bola o teclas para la dirección del cursor, para comunicar información de dirección y selección de comandos al procesador 104 y para controlar el movimiento del cursor en la pantalla 112. Este dispositivo de entrada normalmente tiene dos grados de libertad en dos ejes, un primer eje (es decir, x) y un segundo eje (es decir, y), que permite al dispositivo especificar posiciones en un plano. In various embodiments, the computer system 100 can be coupled via bus 102 to a screen 112, such as a cathode ray tube (CRT) or liquid crystal display (LCD), to present information to the user of the computer. An input device 114, which includes alphanumeric and other keys, can be coupled to the bus 102 to communicate information and command selections to the processor 104. Another type of input device for the user is a cursor control 116, such as a mouse, a ball mouse or keys for the direction of the cursor, to communicate address information and command selection to the processor 104 and to control the movement of the cursor on the screen 112. This input device normally has two degrees of freedom on two axes, a first axis (i.e., x) and a second axis (i.e., y), which allows the device to specify positions in a plane.

Un sistema de ordenador 100 puede realizar las presentes enseñanzas. De forma concordante con determinadas A computer system 100 can perform the present teachings. Concordantly with certain

65 implementaciones de las presentes enseñanzas, el sistema de ordenador 100 puede proporcionar resultados en respuesta al procesador 104, que ejecuta una o más secuencias de una o más instrucciones contenidas en la 65 implementations of the present teachings, computer system 100 may provide results in response to processor 104, which executes one or more sequences of one or more instructions contained in the

memoria 106. Tales instrucciones pueden leerse en la memoria 106 de otro medio leíble por ordenador, tal como un dispositivo de almacenamiento 110. La ejecución de las secuencias de instrucciones contenidas en la memoria 106 puede provocar que el procesador 104 realice los procedimientos descritos en el presente documento. De forma alternativa, puede utilizarse una circuitería cableada en lugar de, o en combinación con, las instrucciones del Memory 106. Such instructions can be read in the memory 106 of another computer readable medium, such as a storage device 110. The execution of the instruction sequences contained in the memory 106 may cause the processor 104 to perform the procedures described in the present document Alternatively, a wired circuitry may be used instead of, or in combination with, the instructions of the

5 software para implementar las presentes enseñanzas. Por lo tanto, las implementaciones de las presentes enseñanzas no se limitan a ninguna combinación específica de circuitería de hardware y software. 5 software to implement the present teachings. Therefore, the implementations of the present teachings are not limited to any specific combination of hardware and software circuitry.

Ejemplos Examples

10 Los siguientes ejemplos se ofrecen para ilustrar, pero no para limitar, la invención reivindicada. The following examples are offered to illustrate, but not to limit, the claimed invention.

Ejemplo 1: Ensayo pronóstico para determinar la puntuación de riesgo en pacientes con cáncer de pulmón no microcítico (CPNM) Example 1: Prognostic trial to determine the risk score in patients with non-small cell lung cancer (NSCLC)

15 Se desarrolló un ensayo pronóstico basado en los patrones de expresión de 426 pacientes que se habían sometido a la extirpación de un cáncer de pulmón no microcítico (CPNM) en estadio I-IV en la Universidad de California, San Francisco, para generar una puntuación de riesgo útil desde el punto de vista clínico. Se buscó un ensayo que tendiera a asignar una puntuación de riesgo mayor en promedio para los pacientes que habían sucumbido a su cáncer que para los que habían sobrevivido el período de seguimiento. Los pacientes cuya muestra recibió 15 A prognostic trial was developed based on the expression patterns of 426 patients who had undergone the removal of a non-small cell lung cancer (NSCLC) in stage I-IV at the University of California, San Francisco, to generate a score of useful risk from the clinical point of view. A trial was sought that tended to assign a higher average risk score for patients who had succumbed to their cancer than for those who had survived the follow-up period. Patients whose sample received

20 puntuaciones de riesgo más altas se considerarían en mayor riesgo de fallecimiento dentro de un período de 5 años después de la operación, mientras que los pacientes cuyas muestras recibieron una puntuación baja tendrían más probabilidades de haber sobrevivido durante este intervalo de tiempo después de sus operaciones. 20 higher risk scores would be considered at increased risk of death within a period of 5 years after the operation, while patients whose samples received a low score would be more likely to have survived during this time interval after their operations. .

Se extrajo ARN de las muestras de tejidos FFIP y se evaluaron los niveles de expresión para los genes diana RNA was extracted from the FFIP tissue samples and expression levels were evaluated for the target genes

25 relacionados con el pronóstico del paciente. Después, se desarrolló un ensayo pronóstico correlacionando los patrones de expresión de los 11 genes diana relacionados con el pronóstico del paciente (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR, WNT3A) con los resultados de supervivencia global a 5 años utilizando el modelo de riesgos instantáneos proporcionales de Cox. 337 pacientes tenían CPNM de células no escamosas. Una combinación de validación cruzada múltiple de 10 veces que maximiza el índice de concordancia 25 related to the patient's prognosis. Then, a prognostic trial was developed by correlating the expression patterns of the 11 target genes related to the patient's prognosis (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR, WNT3A) with the results of 5-year overall survival using Cox's proportional instantaneous risk model. 337 patients had non-squamous cell NSCLC. A 10-fold multiple cross validation combination that maximizes the concordance rate

30 de supervivencia, así como el modelo de riesgos instantáneos proporcionales de Cox penalizado con L2 produjeron coeficientes para cada uno de los 11 genes diana. Estos coeficientes penalizados con L2 se muestran en la Tabla 1. 30 survival, as well as the Cox proportional instantaneous risk model penalized with L2 produced coefficients for each of the 11 target genes. These coefficients penalized with L2 are shown in Table 1.

Tabla 1: Coeficientes para cada uno de los predictores de supervivencia marcadores Table 1: Coefficients for each of the marker survival predictors

Predictor Predictor
Coeficiente Coefficient

b_cotXbag b_cotXbag
-0,0023688 -0.0023688

b_cotXbrc b_cotXbrc
-0,1460735 -0.1460735

b_cotXcdc b_cotXcdc
-0,0833502 -0.0833502

b_cotXcdk b_cotXcdk
-0,1865318 -0.1865318

b_cotXerb b_cotXerb
0,0663762 0.0663762

b_cotXfut b_cotXfut
-0,0345802 -0.0345802

b_cotXil1 b_cotXil1
-0,0138303 -0.0138303

b_cotXlck b_cotXlck
0,2098769 0.2098769

b_cotXrnd b_cotXrnd
-0,0884906 -0.0884906

b_cotXsh3 b_cotXsh3
0,1982098 0.1982098

b_cotXwnt b_cotXwnt
0,1185592 0,1185592

b_cscXcdk b_cscXcdk
-0,2019083 -0,2019083

b_cscXerb b_cscXerb
0,2257878 0.2257878

b_cscXfut b_cscXfut
0,0264782 0,0264782

b_cscXlck b_cscXlck
0,2306624 0.2306624

35 Utilizando este modelo, se obtuvo una puntuación de riesgo para cada paciente insertando los niveles de expresión de cada uno de los 11 genes pronósticos en el siguiente algoritmo de puntuación de riesgo. Las puntuaciones de riesgo se muestran en la Tabla 2. Esta puntuación de riesgo es una puntuación de riesgo continuo, con un intervalo entre 1 y 100 en la cohorte de desarrollo del algoritmo de la UCSF. Una puntuación de riesgo creciente se 35 Using this model, a risk score was obtained for each patient by inserting the expression levels of each of the 11 prognostic genes in the following risk scoring algorithm. The risk scores are shown in Table 2. This risk score is a continuous risk score, with an interval between 1 and 100 in the UCSF algorithm development cohort. An increasing risk score is

40 correlaciona con cambios crecientes de la mortalidad dentro de los 5 años desde la fecha de la extirpación del tumor. La razón de riesgos instantáneos de la puntuación de riesgo continuo se muestra en la Tabla 3. La RRI de la puntuación de riesgo como una variable continua es 1,184, que corresponde a un aumento del 18 % en el riesgo de muerte dentro de 5 años desde la extirpación quirúrgica para cada punto de aumento en la puntuación de riesgo (IC del 95 %: 1,123 a 1,248, p <0,0005). 40 correlates with increasing changes in mortality within 5 years from the date of tumor removal. The ratio of instantaneous risks of the continuous risk score is shown in Table 3. The RRI of the risk score as a continuous variable is 1,184, which corresponds to an 18% increase in the risk of death within 5 years from surgical removal for each point of increase in the risk score (95% CI: 1,123 to 1,248, p <0.0005).

Tabla 2: Puntación de riesgo Table 2: Risk score

Puntuación de riesgo = e^( Risk score = e ^ (

-0,0023688*cot*ddct BAG1-1 + -0.0023688 * cot * ddct BAG1-1 +

-0,1460735*cot*ddct BRCA1-1 + -0.1460735 * cot * ddct BRCA1-1 +

-0,0833502*cot*ddct CDC6-3 + -0.0833502 * cot * ddct CDC6-3 +

-0,1865318*cot*ddct CDK2AP1-2 + -0.1865318 * cot * ddct CDK2AP1-2 +

0,0663762*cot*ddct ERBB3-1 + 0.0663762 * cot * ddct ERBB3-1 +

-0,0345802*cot*ddct FUT3-1 + -0.0345802 * cot * ddct FUT3-1 +

-0,0138303*cot*ddct IL11-1 + -0.0138303 * cot * ddct IL11-1 +

0,2098769*cot*ddct LCK-3 + 0.2098769 * cot * ddct LCK-3 +

-0,0884906*cot*ddct RND3-3 + -0.0884906 * cot * ddct RND3-3 +

0,1982098*cot*ddct SH3BGR-6 + 0.1982098 * cot * ddct SH3BGR-6 +

0,1185592*cot*ddct WNT3A-1 + 0,1185592 * cot * ddct WNT3A-1 +

-0,2019083*csc*ddct CDK2AP1-2 + -0.2019083 * csc * ddct CDK2AP1-2 +

0,2257878*csc*ddct ERBB3-1 + 0.2257878 * csc * ddct ERBB3-1 +

0,0264782*csc*ddct FUT3-1 + 0.0264782 * csc * ddct FUT3-1 +

0,2306624*csc*ddct LCK3) 0.2306624 * csc * ddct LCK3)

Tabla 3: Razón de riesgos instantáneos de la puntuación de riesgo continua Table 3: Reason for instantaneous risks of the continuous risk score

Regresión de Cox – método Breslow para empates Cox Regression - Breslow method for draws

N.º de sujetos = 426 No. of subjects = 426
Número de obs. = 426 Number of obs. = 426

N.º de fallos = 187 No. of failures = 187

Tiempo en riesgo = 17366,98426 Time at risk = 17366,98426

LR chi2(1) = 28,10 LR chi2 (1) = 28.10

Log de probabilidad = -1058,448 Log of probability = -1058,448
Prob > chi2 = 0,0000 Prob> chi2 = 0.0000

t t
Razón de riesgos inst. Err. Típ. z P> [z] [Intervalo de conf. del 95 %] Risk reason inst. Err. Typ. z P> [z] [Conf. 95%]

puntuación punctuation
1,183853 ,0319197 6,26 0,000 1,122916 1,248097 1,183853, 0319197 6.26 0.000 1.122916 1.248097

5 Los grupos de riesgo también se desarrollaron a bases de estas puntuaciones de riesgo, colocando a los pacientes en distintas categorías de riesgo de acuerdo con su puntuación de riesgo. Por ejemplo, se obtuvieron los puntos de corte por tercil colocando a pacientes en los grupos de “riesgo bajo”, “riesgo intermedio” o “riesgo alto” a base de sus puntuaciones de riesgo. Para la cohorte del desarrollo del algoritmo de la UCSF de 426 pacientes, estos puntos de corte de tercil en los 337 pacientes con CPNM no escamoso fueron de 2,7440550 para el punto de corte para riesgo 5 The risk groups were also developed based on these risk scores, placing patients in different risk categories according to their risk score. For example, cut-off points were obtained by tertile by placing patients in the "low risk", "intermediate risk" or "high risk" groups based on their risk scores. For the cohort of the development of the UCSF algorithm of 426 patients, these tertile cut-off points in the 337 patients with non-squamous NSCLC were 2.7440550 for the risk cut-off point

10 bajo y de 3,8221440 para el punto de corte para el riesgo alto. 10 low and 3,8221440 for the cut-off point for high risk.

Para evaluar la precisión de estas asignaciones de grupo de riesgo, se generaron curvas de supervivencia de Kaplan-Meier para los grupos de riesgo. Los resultados de la supervivencia de Kaplan-Meier de estos grupos de riesgo se muestran en la Figura 3 y las Tablas 4-9. To assess the accuracy of these risk group assignments, Kaplan-Meier survival curves were generated for the risk groups. The results of Kaplan-Meier survival of these risk groups are shown in Figure 3 and Tables 4-9.

Tabla 4: Tendencia de la prueba de rango logarítmico para los pacientes de riesgo bajo, intermedio y alto agrupados por puntación de riesgo en toda la cohorte de desarrollo del algoritmo de la UCSF de 426. Table 4: Trend of the logarithmic range test for low, intermediate and high risk patients grouped by risk score in the entire development cohort of the UCSF algorithm of 426.

Inic. Función Error Start Error function

Tiempo Total Fallo de supervivencia Típ. [Int. de Conf. del 95 %] Total Time Survival Failure Typ. [Int. of 95% Conf.]

tercil de riesgo=0 risk tertile = 0

0 0 0 1,0000 . . 0 0 0 1,0000. .

12 138 5 0,9648 0,0155 0,9175 0,9852 12 138 5 0.9648 0.0155 0.9175 0.9852

24 125 13 0,8732 0,0279 0,8064 0,9182 24 125 13 0.8732 0.0279 0.8064 0.9182

36 111 4 0,8448 0,0304 0,7740 0,8950 36 111 4 0.8448 0.0304 0.7740 0.8950

48 87 10 0,7629 0,0369 0,6810 0,8264 48 87 10 0.7629 0.0369 0.6810 0.8264

60 72 3 0,7338 0,0391 0,6480 0,8019 60 72 3 0.7338 0.0391 0.6480 0.8019

tercil de riesgo=1 risk tertile = 1

0 0 0 1,0000 . . 0 0 0 1,0000. .

12 140 5 0,9653 0,0153 0,9186 0,9854 12 140 5 0.9653 0.0153 0.9186 0.9854

24 116 23 0,8055 0,0330 0,7309 0,8614 24 116 23 0.8055 0.0330 0.7309 0.8614

36 101 9 0,7417 0,0366 0,6617 0,8056 36 101 9 0.7417 0.0366 0.6617 0.8056

48 70 13 0,6356 0,0417 0,5478 0,7108 48 70 13 0.6356 0.0417 0.5478 0.7108

60 50 7 0,5673 0,0445 0,4754 0,6490 60 50 7 0.5673 0.0445 0.4754 0.6490

tercil de riesgo=2 risk tertile = 2

0 0 0 1,0000 . . 0 0 0 1,0000. .

12 104 37 0,7357 0,0373 0,6543 0,8008 12 104 37 0.7357 0.0373 0.6543 0.8008

24 73 31 0,5143 0,0422 0,4287 0,5933 24 73 31 0.5143 0.0422 0.4287 0.5933

36 52 16 0,3966 0,0416 0,3150 0,4769 36 52 16 0.3966 0.0416 0.3150 0.4769

48 44 3 0,3722 0,0414 0,2917 0,4526 48 44 3 0.3722 0.0414 0.2917 0.4526

60 28 8 0,2956 0,0409 0,2182 0,3769 60 28 8 0.2956 0.0409 0.2182 0.3769

Nota: La función de supervivencia se calcula sobre los datos completos y se evalúa en los momentos indicados; no se calcula a partir de los agregados que se muestran a la izquierda. Note: The survival function is calculated on the complete data and is evaluated at the indicated times; It is not calculated from the aggregates shown on the left.

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

Sucesos Sucesos Events Events

tercil de riesgo risk tertile
observados esperados observed expected

0 0
35 72,61 35 72.61

1 one
57 67,92 57 67.92

2 2
95 46,47 95 46.47

Total Total
187 187,00 187 187.00

chi2(2) = 72,61 chi2 (2) = 72.61

Pr>chi2 = 0,0000 Pr> chi2 = 0.0000

Prueba para la tendencia de las funciones de supervivencia Test for the trend of survival functions

chi2(1) = 64,88 chi2 (1) = 64.88

Pr>chi2 = 0,0000 Pr> chi2 = 0.0000

Tabla 5: Tendencia de la prueba de rango logarítmico para pacientes de riesgo bajo, intermedio y alto agrupados por puntuación de riesgo en los 278 pacientes con adenocarcinoma en la cohorte de desarrollo de algoritmo de la UCSF. Table 5: Trend of the logarithmic range test for low, intermediate and high risk patients grouped by risk score in the 278 patients with adenocarcinoma in the UCSF algorithm development cohort.

Inic. Función Error Start Error function

Tiempo Total Fallo de supervivencia Típ. [Int. de Conf. del 95 %) Total Time Survival Failure Typ. [Int. of 95% Conf.)

tercil de riesgo=0 risk tertile = 0

0 0 0 1,0000 . . . 0 0 0 1,0000. . .

12 99 1 0,9899 0,0100 0,9305 0,9986 12 99 1 0.9899 0.0100 0.9305 0.9986

24 92 7 0,9192 0,0274 0,8449 0,9587 24 92 7 0.9192 0.0274 0.8449 0.9587

36 81 3 0,8884 0,0317 0,8075 0,9366 36 81 3 0.8884 0.0317 0.8075 0.9366

48 61 7 0,8042 0,0418 0,7063 0,8724 48 61 7 0.8042 0.0418 0.7063 0.8724

60 52 1 0,7890 0,0437 0,6877 0,8608 60 52 1 0.7890 0.0437 0.6877 0.8608

tercil de riesgo=1 risk tertile = 1

0 0 0 1,0000 . . . 0 0 0 1,0000. . .

12 95 1 0,9895 0,0105 0,9276 0,9985 12 95 1 0.9895 0.0105 0.9276 0.9985

24 79 15 0,8314 0,0384 0,7397 0,8931 24 79 15 0.8314 0.0384 0.7397 0.8931

36 70 7 0,7562 0,0442 0,6563 0,8308 36 70 7 0.7562 0.0442 0.6563 0.8308

48 46 7 0,6649 0,0508 0,5549 0,7537 48 46 7 0.6649 0.0508 0.5549 0.7537

60 33 5 0,5841 0,0561 0,4662 0,6846 60 33 5 0.5841 0.0561 0.4662 0.6846

tercil de riesgo=2 risk tertile = 2

0 0 0 1,0000 . . 0 0 0 1,0000. .

12 66 19 0,7738 0,0456 0,6686 0,8493 12 66 19 0.7738 0.0456 0.6686 0.8493

24 45 21 0,5238 0,0545 0,4122 0,6239 24 45 21 0.5238 0.0545 0.4122 0.6239

36 30 11 0,3867 0,0538 0,2820 0,4900 36 30 11 0.3867 0.0538 0.2820 0.4900

48 26 1 0,3728 0,0536 0,2691 0,4764 48 26 1 0.3728 0.0536 0.2691 0.4764

tercil de riesgo=2 risk tertile = 2

60 15 4 0,3052 0,0537 0,2045 0,4117 60 15 4 0.3052 0.0537 0.2045 0.4117

Nota: La función de supervivencia se calcula sobre los datos completos y se evalúa en los momentos indicados; no se calcula a partir de los agregados que se muestran a la izquierda. Note: The survival function is calculated on the complete data and is evaluated at the indicated times; It is not calculated from the aggregates shown on the left.

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

Sucesos Sucesos Events Events

tercil de riesgo risk tertile
observados esperados observed expected

0 0
19 45,88 19 45.88

1 one
35 39,78 35 39.78

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

2 2
56 24,34 56 24.34

Total Total
110 110,00 110 110.00

chi2(2) = 58,13 chi2 (2) = 58.13

Pr>chi2 = 0,0000 Pr> chi2 = 0.0000

Prueba para la tendencia de las funciones de supervivencia Test for the trend of survival functions

chi2(1) = 52,45 chi2 (1) = 52.45

Pr>chi2 = 0,0000 Pr> chi2 = 0.0000

Tabla 6: Tendencia de la prueba de rango logarítmico para pacientes de riesgo bajo, intermedio y alto agrupados por puntuación de riesgo en los 89 pacientes con carcinoma escamoso en la cohorte de desarrollo de algoritmo de la UCSF Table 6: Trend of the logarithmic range test for low, intermediate and high risk patients grouped by risk score in the 89 patients with squamous carcinoma in the algorithm development cohort of the UCSF

Inic. Función Error Start Error function

Tiempo Total Fallo de supervivencia Típ. [Int. de Conf. del 95 %] Total Time Survival Failure Typ. [Int. of 95% Conf.]

tercil de riesgo=0 risk tertile = 0

0 0 0 1,0000 0 0 0 1,0000

12 28 3 0,9000 0,0548 0,7212 0,9666 12 28 3 0.9000 0.0548 0.7212 0.9666

24 23 5 0,7333 0,0807 0,5369 0,8567 24 23 5 0.7333 0.0807 0.5369 0.8567

36 22 0 0,7333 0,0807 0,5369 0,8567 36 22 0 0.7333 0.0807 0.5369 0.8567

48 19 2 0,6600 0,0877 0,4593 0,8010 48 19 2 0.6600 0.0877 0.4593 0.8010

60 13 2 0,5844 0,0926 0,3838 0,7398 60 13 2 0.5844 0.0926 0.3838 0.7398

tercil de riesgo=1 risk tertile = 1

0 0 0 1,0000 . 0 0 0 1,0000.

12 28 3 0,9000 0,0548 0,7212 0,9666 12 28 3 0.9000 0.0548 0.7212 0.9666

24 22 6 0,7000 0,0837 0,5026 0,8312 24 22 6 0.7000 0.0837 0.5026 0.8312

36 18 2 0,6296 0,0889 0,4311 0,7754 36 18 2 0.6296 0.0889 0.4311 0.7754

48 14 4 0,4815 0,0939 0,2914 0,6484 48 14 4 0.4815 0.0939 0.2914 0.6484

60 10 1 0,4444 0,0937 0,2593 0,6144 60 10 1 0.4444 0.0937 0.2593 0.6144

tercil de riesgo=2 risk tertile = 2

0 0 0 1,0000 . . . 0 0 0 1,0000. . .

12 20 10 0,6552 0,0883 0,4541 0,7973 12 20 10 0.6552 0.0883 0.4541 0.7973

24 14 6 0,4483 0,0923 0,2652 0,6157 24 14 6 0.4483 0.0923 0.2652 0.6157

36 11 2 0,3793 0,0901 0,2087 0,5490 36 11 2 0,3793 0.0901 0.2087 0.5490

48 10 0 0,3793 0,0901 0,2087 0,5490 48 10 0 0.3793 0.0901 0.2087 0.5490

60 7 2 0,2950 0,0876 0,1400 0,4687 60 7 2 0.2950 0.0876 0.1400 0.4687

Nota: La función de supervivencia se calcula sobre los datos completos y se evalúa en los momentos indicados; no se calcula a partir de los agregados que se muestran a la izquierda. Note: The survival function is calculated on the complete data and is evaluated at the indicated times; It is not calculated from the aggregates shown on the left.

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

Sucesos Sucesos Events Events

tercil de riesgo risk tertile
observados esperados observed expected

0 0
12 18.64 12 18.64

1 one
16 17.14 16 17.14

2 2
20 12.22 20 12.22

Total Total
48 48,00 48 48.00

chi2(2) = 7,46 chi2 (2) = 7.46

Pr>chi2 = 0,0240 Pr> chi2 = 0.0240

Prueba para la tendencia de las funciones de supervivencia Test for the trend of survival functions

chi2(1) = 6,99 chi2 (1) = 6.99

Pr>chi2 = 0,0082 Pr> chi2 = 0.0082

Tabla 7: Tendencia de la prueba de rango logarítmico para pacientes de riesgo bajo, intermedio y alto agrupados por puntuación de riesgo en los 267 pacientes con CPNM en estadio I en la cohorte de desarrollo de algoritmo de la UCSF. Table 7: Trend of the logarithmic range test for low, intermediate and high risk patients grouped by risk score in the 267 patients with stage I NSCLC in the UCSF algorithm development cohort.

Inic. Función Error Start Error function

Tiempo Total Fallo de supervivencia Típ. [Int. de Conf. del 95 %] Total Time Survival Failure Typ. [Int. of 95% Conf.]

tercil de riesgo=0 risk tertile = 0

0 0 0 1.0000 . 0 0 0 1.0000.

12 98 5 0,9510 0,0214 0,8862 0,9793 12 98 5 0.9510 0.0214 0.8862 0.9793

24 90 8 0,8725 0,0330 0,7907 0,9239 24 90 8 0.8725 0.0330 0.7907 0.9239

36 81 1 0,8627 0,0341 0,7793 0,9163 36 81 1 0.8627 0.0341 0.7793 0.9163

48 66 6 0,7959 0,0409 0,7011 0,8635 48 66 6 0.7959 0.0409 0.7011 0.8635

60 54 1 0,7821 0,0425 0,6846 0,8527 60 54 1 0.7821 0.0425 0.6846 0.8527

tercil de riesgo=1 1 risk tertile = 1 1

0 0 0 1,0000 . . . 0 0 0 1,0000. . .

12 94 4 0,9588 0,0202 0,8939 0,9843 12 94 4 0.9588 0.0202 0.8939 0.9843

24 78 15 0,8040 0,0403 0,7101 0,8702 24 78 15 0.8040 0.0403 0.7101 0.8702

36 70 5 0,7512 0,0441 0,6521 0,8258 36 70 5 0.7512 0.0441 0.6521 0.8258

48 50 8 0,6565 0,0497 0,5495 0,7440 48 50 8 0.6565 0.0497 0.5495 0.7440

60 32 7 0,5559 0,0548 0,4421 0,6554 60 32 7 0.5559 0.0548 0.4421 0.6554

tercil de riesgo-2 risk tertile-2

0 0 0 1,0000 . . 0 0 0 1,0000. .

12 55 14 0,7941 0,0490 0,6773 0,8725 12 55 14 0.7941 0.0490 0.6773 0.8725

24 43 12 0,6176 0,0589 0,4915 0,7212 24 43 12 0.6176 0.0589 0.4915 0.7212

36 31 8 0,4924 0,0615 0,3676 0,6057 36 31 8 0.4924 0.0615 0.3676 0.6057

48 28 1 0,4760 0,0616 0,3518 0,5901 48 28 1 0.4760 0.0616 0.3518 0.5901

60 15 7 0,3367 0,0625 0,2185 0,4588 60 15 7 0.3367 0.0625 0.2185 0.4588

Nota: La función de supervivencia se calcula sobre los datos completos y se evalúa en los momentos indicados; no se calcula a partir de los agregados que se muestran a la izquierda. Note: The survival function is calculated on the complete data and is evaluated at the indicated times; It is not calculated from the aggregates shown on the left.

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

Sucesos Sucesos Events Events

tercil de riesgo risk tertile
observados esperados observed expected

0 0
21 43,59 21 43.59

1 one
39 37,53 39 37.53

2 2
42 20,88 42 20.88

Total Total
102 102,00 102 102.00

chi2(2) = 33,33 chi2 (2) = 33.33

Pr>chi2 = 0,0000 Pr> chi2 = 0.0000

Prueba para la tendencia de las funciones de supervivencia Test for the trend of survival functions

chi2(1) = 32,36 chi2 (1) = 32.36

Pr>chi2 = 0,0000 Pr> chi2 = 0.0000

Tabla 8: Tendencia de la prueba de rango logarítmico para pacientes de riesgo bajo, intermedio y alto agrupados por puntuación de riesgo en los 71 pacientes con CPNM en estadio II en la cohorte de desarrollo de algoritmo de la UCSF. Table 8: Trend of the logarithmic range test for low, intermediate and high risk patients grouped by risk score in the 71 patients with stage II NSCLC in the UCSF algorithm development cohort.

Inic. Función Error Start Error function

Tiempo Total Fallo de supervivencia Típ. [Int. de Conf. del 95 %] Total Time Survival Failure Typ. [Int. of 95% Conf.]

tercil de riesgo=0 risk tertile = 0

0 0 0 1,0000 0 0 0 1,0000

12 0 0 1,0000 12 0 0 1,0000

24 13 2 0,8571 0,0935 0,5394 0,9622 24 13 2 0.8571 0.0935 0.5394 0.9622

36 13 0 0,8571 0,0935 0,5394 0,9622 36 13 0 0.8571 0.0935 0.5394 0.9622

48 9 1 0,7619 0,1224 0,4209 0,9181 48 9 1 0.7619 0.1224 0.4209 0.9181

60 8 0 0,7619 0,1224 0,4209 0,9181 60 8 0 0.7619 0.1224 0.4209 0.9181

tercil de riesgo=1 risk tertile = 1

0 0 0 1,0000 0 0 0 1,0000

12 0 0 1,0000 . . . 12 0 0 1,0000. . .

24 19 4 0,8182 0,0822 0,5853 0,9276 24 19 4 0.8182 0.0822 0.5853 0.9276

36 17 2 0,7273 0,0950 0,4910 0,8671 36 17 2 0.7273 0.0950 0.4910 0.8671

48 12 4 0,5455 0,1062 0,3207 0,7239 48 12 4 0.5455 0.1062 0.3207 0.7239

60 10 0 0,5455 0,1062 0,3207 0,7239 60 10 0 0.5455 0.1062 0.3207 0.7239

tercil de riesgo=2 risk tertile = 2

0 0 0 1,0000 . 0 0 0 1,0000.

12 28 8 0,7714 0,0710 0,5946 0,8785 12 28 8 0.7714 0.0710 0.5946 0.8785

24 17 11 0,4571 0,0842 0,2890 0,6105 24 17 11 0.4571 0.0842 0.2890 0.6105

36 13 4 0,3429 0,0802 0,1934 0,4979 36 13 4 0.3429 0.0802 0.1934 0.4979

48 11 1 0,3117 0,0788 0,1682 0,4666 48 11 1 0.3117 0.0788 0.1682 0.4666

60 7 1 0,2771 0,0772 0,1402 0,4324 60 7 1 0.2771 0.0772 0.1402 0.4324

Nota: La función de supervivencia se calcula sobre los datos completos y se evalúa en los momentos indicados; no se calcula a partir de los agregados que se muestran a la izquierda. Note: The survival function is calculated on the complete data and is evaluated at the indicated times; It is not calculated from the aggregates shown on the left.

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

Sucesos Sucesos Events Events

Tercil de riesgo Risk Tertile
observados esperados observed expected

0 0
3 9,24 3 9.24

1 one
10 14,10 10 14.10

2 2
25 14,66 25 14.66

Total Total
38 38,00 38 38.00

chi2(2) = 12,89 chi2 (2) = 12.89

Pr>chi2 = 0,0016 Pr> chi2 = 0.0016

Prueba para la tendencia de las funciones de supervivencia Test for the trend of survival functions

chi2(1) = 12,04 chi2 (1) = 12.04

Pr>chi2 = 0,0005 Pr> chi2 = 0.0005

Tabla 9: Tendencia de la prueba de rango logarítmico para pacientes de riesgo bajo, intermedio y alto agrupados por puntuación de riesgo en los 69 pacientes con CPNM en estadio III en la cohorte de desarrollo de algoritmo de la UCSF. Table 9: Trend of the logarithmic range test for low, intermediate and high risk patients grouped by risk score in the 69 patients with stage III NSCLC in the UCSF algorithm development cohort.

Inic. Función Error Start Error function

Tiempo Total Fallo de supervivencia Típ. [Int. de Conf. del 95 %] Total Time Survival Failure Typ. [Int. of 95% Conf.]

tercil de riesgo=0 risk tertile = 0

0 0 0 1,0000 0 0 0 1,0000

12 0 0 1,0000 . . 12 0 0 1,0000. .

24 19 2 0,9000 0,0671 0,6560 0,9740 24 19 2 0.9000 0.0671 0.6560 0.9740

36 15 2 0,8000 0,0894 0,5511 0,9198 36 15 2 0.8000 0.0894 0.5511 0.9198

48 12 1 0,7333 0,1039 0,4680 0,8810 48 12 1 0.7333 0.1039 0.4680 0.8810

60 8 2 0,5926 0,1230 0,3204 0,7862 60 8 2 0.5926 0.1230 0.3204 0.7862

tercil de riesgo=1 risk tertile = 1

0 0 0 1,0000 0 0 0 1,0000

12 22 1 0,9545 0,0444 0,7187 0,9935 12 22 1 0.9545 0.0444 0.7187 0.9935

24 18 4 0,7727 0,0893 0,5374 0,8985 24 18 4 0.7727 0.0893 0.5374 0.8985

36 13 2 0,6818 0,0993 0,4462 0,8338 36 13 2 0.6818 0.0993 0.4462 0.8338

48 8 1 0,6198 0,1079 0,3768 0,7911 48 8 1 0.6198 0.1079 0.3768 0.7911

60 7 0 0,6198 0,1079 0,3768 0,7911 60 7 0 0.6198 0.1079 0.3768 0.7911

tercil de riesgo=2 risk tertile = 2

0 0 0 1,0000 . . . 0 0 0 1,0000. . .

12 17 11 0,5926 0,0946 0,3863 0,7499 12 17 11 0.5926 0.0946 0.3863 0.7499

24 13 4 0,4444 0,0956 0,2556 0,6175 24 13 4 0.4444 0.0956 0.2556 0.6175

36 8 4 0,2963 0,0879 0,1406 0,4703 36 8 4 0.2963 0.0879 0.1406 0.4703

48 5 1 0,2469 0,0860 0,1024 0,4238 48 5 1 0.2469 0.0860 0.1024 0.4238

60 4 0 0,2469 0,0860 0,1024 0,4238 60 4 0 0.2469 0.0860 0.1024 0.4238

Nota: La función de supervivencia se calcula sobre los datos completos y se evalúa en los momentos indicados; no se calcula a partir de los agregados que se muestran a la izquierda. Note: The survival function is calculated on the complete data and is evaluated at the indicated times; It is not calculated from the aggregates shown on the left.

Prueba de rango logarítmico para la igualdad de funciones de supervivencia Logarithmic range test for equal survival functions

Sucesos Sucesos Events Events

tercil de riesgo risk tertile
observados esperados observed expected

0 0
7 12.78 7 12.78

1 one
8 12.66 8 12.66

2 2
20 9.56 20 9.56

Total Total
35 35,00 35 35.00

chi2(2) = 16,03 chi2 (2) = 16.03

Pr>chi2 = 0,0003 Pr> chi2 = 0.0003

Prueba para la tendencia de las funciones de supervivencia Test for the trend of survival functions

chi2(1) = 12,16 chi2 (1) = 12.16

Pr>chi2 = 0,0005 Pr> chi2 = 0.0005

Ejemplo 2: Ensayo de 11 genes para predecir la supervivencia en el cáncer de pulmón no microcítico no escamoso extirpado Example 2: Test of 11 genes to predict survival in non-squamous non-small cell lung cancer removed

5 Se desarrolló un ensayo de 14 genes que utiliza un análisis por PCR cuantitativa de tejidos fijados en formalina incluidos en parafina (FFIP) con una cohorte de 361 pacientes con CPNM no escamoso extraído en la Universidad de California, San Francisco (UCSF). Este ensayo incluyó once biomarcadores (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A) y tres genes constitutivos (ESD, TBP, YAP1). 5 A 14-gene trial was developed using a quantitative PCR analysis of paraffin-fixed formalin-fixed tissues (FFIP) with a cohort of 361 patients with non-squamous NSCLC extracted at the University of California, San Francisco (UCSF). This trial included eleven biomarkers (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A) and three constitutive genes (ESD, TBP, YAP1).

10 Este ensayo, desarrollado y llevado a cabo en un laboratorio independiente certificado por Clinical Laboratory Improvement Amendments (Enmiendas de Mejora de Laboratorios Clínicos) (CLIA) fue validado después por la Kaiser Permanente Division of Research (División de Investigación de Kaiser Permanente ) (KPDOR) con un estudio con ocultación diseñado en una cohorte de 433 pacientes con CPNM no escamoso en estadio I extirpado en los hospitales del sistema de Kaiser Permanente Northern California (CA, EE.UU.). La KPDOR comparó de forma 10 This trial, developed and carried out in an independent laboratory certified by Clinical Laboratory Improvement Amendments (CLIA) was later validated by the Kaiser Permanente Division of Research (KPDOR ) with a study with concealment designed in a cohort of 433 patients with stage I non-squamous NSCLC removed in the hospitals of the Kaiser Permanente Northern California system (CA, USA). The KPDOR compared in a way

15 independiente los resultados del ensayo con los resultados reales de los pacientes. También se realizó una validación a gran escala independiente e internacional de este ensayo de pronóstico molecular en una cohorte de 1006 pacientes chinos que se habían sometido a la extirpación de un CPNM de fase temprana en una de las varias instituciones que participan en el China Clinical Trials Consortium (CCTC) (Consorcio de Ensayos Clínicos de China). 15 independent trial results with actual patient results. An independent and international large-scale validation of this molecular prognostic trial was also performed in a cohort of 1006 Chinese patients who had undergone the removal of an early stage NSCLC in one of several institutions participating in the China Clinical Trials Consortium (CCTC) (China Clinical Trials Consortium).

20 Los pacientes eran elegibles para entrar en el estudio como parte de la cohorte de entrenamiento si se habían sometido a una extirpación quirúrgica de un CPNM no escamoso en la UCSF con intención curativa, entre el 1 de enero de 1997 y el 31 de diciembre de 2007. 20 Patients were eligible to enter the study as part of the training cohort if they had undergone a surgical removal of a non-squamous NSCLC in the UCSF with curative intent, between January 1, 1997 and December 31, 2007

25 Los pacientes eran aptos para ser incluidos en la cohorte de validación de Kaiser Permanente si se habían sometido a la extirpación completa de un CPNM no escamoso en estadio I de la American Joint Commission on Cancer (Comisión Conjunta Americana sobre Cáncer) por una estadificación clínica y patológica en una instalación de Kaiser Permanente del Norte de California entre el 1 de enero de 1998 y el 31 de diciembre de 2005. 25 Patients were eligible to be included in the Kaiser Permanente validation cohort if they had undergone the complete removal of a stage I non-squamous NSCLC from the American Joint Commission on Cancer for a clinical staging and pathological in a Kaiser Permanente facility in Northern California between January 1, 1998 and December 31, 2005.

30 Los pacientes eran aptos para ser incluidos en la cohorte de validación del CCTC si se habían sometido a un intento de extirpación curativa de un CPNM no escamoso en estadio I-III de la American Joint Commission on Cancer, en el First Affiliated Hospital of Guangzhou Medical College (Guangdong, China), Sun Yat-sen University Cancer Center en Guangzhou (Guangdong, China) o el Shanghai Pulmonary Hospital (Shanghai, China) entre el 1 de enero de 2000 y el 31 de diciembre de 2008. 30 Patients were eligible to be included in the CCTC validation cohort if they had undergone an attempt to curatively remove a non-squamous NSCLC in stage I-III of the American Joint Commission on Cancer, at the First Affiliated Hospital of Guangzhou Medical College (Guangdong, China), Sun Yat-sen University Cancer Center in Guangzhou (Guangdong, China) or Shanghai Pulmonary Hospital (Shanghai, China) between January 1, 2000 and December 31, 2008.

Los criterios de exclusión para los pacientes en ya sea la cohorte de entrenamiento o la de validación eran los siguientes: bloques de tejido ausentes o inadecuados (es decir, un tumor que ocupa <25 % del área de superficie tisular), fallecimiento dentro de los 30 días desde la extirpación, tratamiento preoperatorio con quimioterapia (solo cohortes de validación), márgenes positivos en el análisis de anatomía patológica (solo cohortes de validación) y un 5 segundo cáncer (excluyendo los carcinomas cutáneos de células basales y escamosas) diagnosticado dentro de los 3 años desde el diagnóstico de cáncer de pulmón (solo cohorte de validación del CCTC). La información sobre las variables clínicas, el seguimiento y la causa de fallecimiento se obtuvieron a partir de una revisión de las historias clínicas. El estado vital y la fecha de fallecimiento se establecieron mediante la revisión de las historias clínicas y se verificaron por fuentes que incluían el Kaiser Permanente Northern California Cancer Registry, California Death Exclusion criteria for patients in either the training cohort or the validation cohort were the following: absent or inadequate tissue blocks (i.e., a tumor that occupies <25% of the tissue surface area), death within 30 days after removal, preoperative treatment with chemotherapy (only validation cohorts), positive margins in the pathology analysis (only validation cohorts) and a 5 second cancer (excluding basal and squamous cell carcinomas) diagnosed within 3 years since the diagnosis of lung cancer (only CCTC validation cohort). Information on clinical variables, follow-up and cause of death were obtained from a review of medical records. Vital status and date of death were established by reviewing medical records and verified by sources that included the Kaiser Permanente Northern California Cancer Registry, California Death

10 Records, Social Security Death Master File y el contacto directo con el paciente o su familia. 10 Records, Social Security Death Master File and direct contact with the patient or his family.

Preparación y análisis de las muestras Sample preparation and analysis

Se utilizaron seis cortes de FFIP de 10 micrómetros por muestra. Las muestras se limpiaron de parafina mediante el Six 10-micrometer FFIP cuts per sample were used. The samples were cleaned of paraffin by

15 uso de xileno y después se incubaron con proteinasa K (Kit de Purificación de ARN MasterPure, Epicentre, Madison, WI) a 65 ºC durante 2 horas. La precipitación de proteínas y la precipitación de ácidos nucleicos basada en alcoholes se realizaron utilizando el kit de purificación de ARN MasterPure (Epicentre, Madison, WI). Los extractos de ARN se trataron con ADNasa y se purificaron utilizando columnas de centrifugación de membrana de gel de sílice (Kit RNEeasy Micro, Qiagen, Valencia, CA). Use xylene and then incubate with proteinase K (MasterPure RNA Purification Kit, Epicenter, Madison, WI) at 65 ° C for 2 hours. Protein precipitation and alcohol-based nucleic acid precipitation were performed using the MasterPure RNA purification kit (Epicenter, Madison, WI). RNA extracts were treated with DNase and purified using silica gel membrane centrifugal columns (Kit RNEeasy Micro, Qiagen, Valencia, CA).

20 Para controlar la degradación del ARN que pudiera producirse en las muestras de FFIP, se midió la cantidad y calidad del ARN utilizando un espectrofotómetro Nanodrop (Thermo Scientific, Wilmington, DE). El ARN extraído se sometió a transcripción inversa (Kit iScript Select cDNA Synthesis, BioRad Laboratories, Hercules, CA) utilizando cebadores específicos de gen. Los cebadores específicos de gen eran versiones truncadas en 9-13 meros de los 20 To control the degradation of the RNA that could occur in the FFIP samples, the quantity and quality of the RNA was measured using a Nanodrop spectrophotometer (Thermo Scientific, Wilmington, DE). The extracted RNA was subjected to reverse transcription (Kit iScript Select cDNA Synthesis, BioRad Laboratories, Hercules, CA) using gene specific primers. The gene-specific primers were truncated versions in 9-13 numbers of the

25 cebadores de PCRq inversos optimizados para una temperatura de apareamiento de 42 ºC. El ADNc se sometió a 10 ciclos de preamplificación (Mezcla Maestra TaqMan PreAmp, Applied Biosystems, Carlsbad, CA) antes de la PCRq. 25 reverse PCRq primers optimized for a pairing temperature of 42 ° C. The cDNA was subjected to 10 preamp cycles (TaqMan PreAmp Master Mix, Applied Biosystems, Carlsbad, CA) before the PCRq.

Se utilizaron ensayos de PCR cuantitativa TaqMan (BioSearch Technologies, Novato, CA) diseñados a petición del TaqMan quantitative PCR assays (BioSearch Technologies, Novato, CA) designed at the request of the

30 cliente para su uso con el ARN extraído de los tejidos FFIP para cuantificar la expresión de ARN utilizando química FAST en un Sistema de PCR en tiempo real 7900HT Fast (Applied Biosystems, Carlsbad, CA). Se diseñaron ensayos de PCR cuantitativa TaqMan específicos para FFIP para tener como objetivo amplicones de 65-85 pares de bases que traspasaban los límites exón-exón, que evitaban las estructuras de molde y las homologías cruzadas (Beacon Designer 5.0, Premier Biosoft, Palo Alto, CA). Todas las secuencias de los cebadores se sometieron a 30 client for use with RNA extracted from FFIP tissues to quantify RNA expression using FAST chemistry in a 7900HT Fast real-time PCR System (Applied Biosystems, Carlsbad, CA). Specific TaqMan PCR assays designed for FFIP were designed to target amplicons of 65-85 base pairs that crossed the exon-exon boundaries, which avoided mold structures and cross homologies (Beacon Designer 5.0, Premier Biosoft, Palo Alto , CA). All primer sequences were subjected to

35 búsqueda por BLAST frente al genoma humano (NCBI ref_assembly 37.1) para asegurar la especificidad de diana. Los cebadores sintetizados se analizaron para la concentración óptima de los cebadores y la disociación de producto individual utilizando curvas de fusión por verde SYBR. 35 BLAST search against the human genome (NCBI ref_assembly 37.1) to ensure target specificity. The synthesized primers were analyzed for the optimal concentration of the primers and the dissociation of individual product using SYBR green melting curves.

Todas las mediciones de la expresión de ARN se normalizaron con respecto a ARN disponible en el mercado All measurements of RNA expression were normalized with respect to commercially available RNA

40 extraído de muestras de pulmón normal congeladas agrupadas (Laboratorios Clontech, Mountain View, CA) y la expresión relativa para cada gen diana se calculó utilizando el método de CT comparativo. El valor promedio de CT de los tres genes constitutivos ESD, TBP e YAP1 se utilizó para normalizar la expresión génica y calcular los valores de delta CT. 40 extracted from clustered frozen normal lung samples (Clontech Laboratories, Mountain View, CA) and the relative expression for each target gene was calculated using the comparative CT method. The average CT value of the three constitutive genes ESD, TBP and YAP1 was used to normalize gene expression and calculate CT delta values.

45 Desarrollo de un algoritmo de pronóstico 45 Development of a forecasting algorithm

Se evaluaron en la cohorte de entrenamiento de la UCSF once genes diana relacionados con cáncer (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A) y tres genes de referencia (ESD, TBP y YAP1). Véase la Figura 4. Eleven cancer-related target genes (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A) and three reference genes (ESD, TBP and YAP1) were evaluated in the UCSF training cohort. ). See Figure 4.

50 El modelo de riesgos instantáneos proporcionales de Cox penalizado con L2 (paquete R glmnet vl.5.3) fue la herramienta analítica principal utilizada para desarrollar los coeficientes en el algoritmo pronóstico, utilizando los valores de expresión relativos de los once genes diana en la cohorte de FFIP de la UCSF. La cantidad de penalización L2 aplicada se determinó utilizando una validación cruzada de 10 veces. Se generó una puntuación de 50 The Cox proportional instantaneous risk model penalized with L2 (package R glmnet vl.5.3) was the main analytical tool used to develop the coefficients in the prognostic algorithm, using the relative expression values of the eleven target genes in the cohort of FFIP of the UCSF. The amount of L2 penalty applied was determined using a 10-fold cross validation. A score of

55 riesgo continuo para cada sujeto, a base de los coeficientes del modelo. Se utilizó un modelo de riesgo lineal convencional en el que cada nivel de expresión génica relativo (delta-delta CT) se multiplicó por su coeficiente; estos productos se sumaron después, dando como resultado una puntuación de riesgo única sin procesar. 55 continuous risk for each subject, based on the model coefficients. A conventional linear risk model was used in which each level of relative gene expression (delta-delta CT) was multiplied by its coefficient; These products were added later, resulting in a single unprocessed risk score.

Puntuación de Riesgo Sin Procesar = delta-delta CT BAG1 * coeficiente de modelo BAG1 + delta-delta CT BRCA1 * Unprocessed Risk Score = delta-delta CT BAG1 * model coefficient BAG1 + delta-delta CT BRCA1 *

60 coeficiente de modelo BRCA1 + delta-delta CT CDC6 * coeficiente de modelo CDC6 + delta-delta CT CDK2AP1 * coeficiente de modelo CDK2AP1 + delta-delta CT ERBB3 * coeficiente de modelo ERBB3 + delta-delta CT FUT3 * coeficiente de modelo FUT3+ delta-delta CT IL11 * coeficiente de modelo IL11 + delta-delta CTLCK * coeficiente de modelo LCK + deltadelta CT RND3 * coeficiente de modelo RND3 + delta-delta CT SH3BGR * coeficiente de modelo SH3BGR + delta-delta CT WNT3A *coeficientede modelo WNT3A. 60 model coefficient BRCA1 + delta-delta CT CDC6 * model coefficient CDC6 + delta-delta CT CDK2AP1 * model coefficient CDK2AP1 + delta-delta CT ERBB3 * model coefficient ERBB3 + delta-delta CT FUT3 * model coefficient FUT3 + delta -delta CT IL11 * model coefficient IL11 + delta-delta CTLCK * model coefficient LCK + deltadelta CT RND3 * model coefficient RND3 + delta-delta CT SH3BGR * model coefficient SH3BGR + delta-delta CT WNT3A * model coefficient WNT3A.

Después, la puntuación de riesgo sin procesar se ajustó a escala utilizando una función lineal basada en las puntuaciones de riesgo sin procesar mínima y máxima, produciendo una única puntuación de riesgo integrada que estaba incluida en una escala de 1-100. Then, the unprocessed risk score was adjusted to scale using a linear function based on the minimum and maximum unprocessed risk scores, producing a single integrated risk score that was included in a 1-100 scale.

5 Puntuación de Riesgo = 39,39747*Puntuación de Riesgo Sin Procesar – 16,94965 + 1 5 Risk Score = 39,39747 * Unprocessed Risk Score - 16,94965 + 1

Las puntuaciones de riesgo pronosticadas resultantes se dividieron en los percentiles 33º y 67º para generar grupos de riesgo bajo, intermedio y alto. En la Tabla 10 a continuación se proporciona una tabla completa de los coeficientes del algoritmo, los coeficientes de ajuste de escala y los valores de los puntos de corte de las categorías The resulting predicted risk scores were divided into the 33rd and 67th percentiles to generate low, intermediate and high risk groups. Table 10 below provides a complete table of the algorithm coefficients, the scale adjustment coefficients and the values of the cut-off points of the categories

10 de riesgo. 10 risk.

Tabla 10: Resumen de los coeficientes del algoritmo, coeficientes de ajuste de escala y los valores de los puntos de corte de las categorías de riesgo obtenidos de la cohorte de entrenamiento de la UCSF Table 10: Summary of the algorithm coefficients, scale adjustment coefficients and cut-off point values of the risk categories obtained from the UCSF training cohort

Valor Value

Coeficientes de los genes Gene coefficients

BAG1 -0,0023688 BAG1 -0.0023688

BRCA1 -0,1460735 BRCA1 -0.1460735

CDC6 -0,0833502 CDC6 -0.0833502

CDK2AP1 -0,1865318 CDK2AP1 -0.1865318

ERBB3 0,0663762 ERBB3 0.0663762

FUT3 -0,0345802 FUT3 -0.0345802

IL11 -0,0138303 IL11 -0.0138303

LCK 0,2098769 LCK 0.2098769

RND3 -0,0884906 RND3 -0.0884906

SH3RGR 0,1982098 SH3RGR 0.1982098

WTN3A 0,1185592 WTN3A 0,1185592

Coeficientes de ajuste de escala Coefficients of scale adjustment

Pendiente 39,39747 Pending 39,39747

Intersección -16,94965 Intersection -16,94965

Valores de puntos de corte de las categorías de riesgo Cut-off values of risk categories

Punto de corte de bajo-intermedio 23,81960 Low-intermediate cut-off point 23,81960

Punto de corte de intermedio-alto 36,87494 Intermediate-high cut point 36.87494

15 Se generaron las puntuaciones de riesgo y las categorías de riesgo se asignaron utilizando los mismos coeficientes génicos, los coeficientes de ajuste de escala y los valores de los puntos de corte en las cohortes de validación. Dado que los límites de la escala de puntuación de riesgo eran 1 y 100, a base del intervalo de la cohorte de entrenamiento de la UCSF, cualquier puntuación de riesgo de menos de 1 se asignó a una puntuación de riesgo de 15 Risk scores were generated and risk categories were assigned using the same gene coefficients, scale adjustment coefficients and cut-off point values in the validation cohorts. Since the limits of the risk score scale were 1 and 100, based on the UCSF training cohort interval, any risk score of less than 1 was assigned to a risk score of

20 1 mientras que cualquier puntuación de riesgo mayor de 100 se asignó a la puntuación de riesgo de 100. 20 1 while any risk score greater than 100 was assigned to the risk score of 100.

Robustez y validación del ensayo Robustness and validation of the test

El ensayo molecular se desarrolló, se especificó de forma completa y se validó de forma analítica en un laboratorio The molecular assay was developed, fully specified and validated analytically in a laboratory

25 certificado por el CLIA antes del inicio del estudio de validación clínica con ocultación. La concentración por nanodrop y los valores de los puntos de corte de pureza para el ARN se determinaron de forma empírica evaluando más de 400 muestras cuyos valores de expresión de genes constitutivos sin procesar promedio estaban incluidos dentro de un intervalo de CT sin procesar preespecificado. La concentración, la proporción 260/280 y los puntos de corte de la proporción 260/230 se determinaron eliminando el 2,5 % más bajo para cada parámetro individual 25 certified by the CLIA before the start of the clinical validation study with concealment. The concentration per nanodrop and the values of the purity cut-off points for the RNA were determined empirically by evaluating more than 400 samples whose average unprocessed constitutive gene expression values were included within a range of pre-specified unprocessed CT. The concentration, the 260/280 ratio and the cutoff points of the 260/230 ratio were determined by eliminating the lowest 2.5% for each individual parameter

30 clasificado de menor a mayor y luego tomando la siguiente medida más alta como el número de punto de corte aceptable. Además, se calculó para cada muestra el CT del gen constitutivo sin procesar promedio. Solo se incluyeron en el estudio las muestras cuyos valores de expresión sin procesar promedio de los genes constitutivos estaban incluidos dentro de un intervalo preespecificado. Para obtener este intervalo, se estudió la expresión de 442 muestras de cáncer de pulmón FFIP obtenidas de la UCSF. El valor de CT del gen constitutivo promedio para estas 30 ranked from lowest to highest and then taking the next highest measure as the acceptable cut-off number. In addition, the CT of the average unprocessed constitutive gene was calculated for each sample. Only samples whose average unprocessed expression values of the constitutive genes were included within a prespecified range were included in the study. To obtain this interval, the expression of 442 FFIP lung cancer samples obtained from the UCSF was studied. The CT value of the average constitutive gene for these

35 muestras varió entre 17,79-37,76, con un valor medio de 23,94 y una desviación típica de 2,66. El intervalo preespecificado se determinó teniendo en cuenta el CT medio del gen constitutivo más o menos tres desviaciones típicas. 35 samples varied between 17.79-37.76, with an average value of 23.94 and a standard deviation of 2.66. The prespecified range was determined taking into account the mean CT of the constitutive gene plus or minus three typical deviations.

Cada placa de PCR se procesó con un control positivo (ARN extraído de muestras de pulmón normal congeladas y agrupadas, disponible en el mercado (Laboratorios Clontech, Mountain View, CA) así como con un control negativo (sin molde). Cada muestra se procesó con un ensayo TaqMan diseñado para detectar contaminación genómica. El análisis repetido en distintos días y en distintos cortes del ensayo de pronóstico molecular de las muestras FFIP del Each PCR plate was processed with a positive control (RNA extracted from frozen and pooled normal lung samples, commercially available (Clontech Laboratories, Mountain View, CA) as well as with a negative control (without mold). Each sample was processed with a TaqMan assay designed to detect genomic contamination. Repeated analysis on different days and in different cuts of the molecular prognostic test of FFIP samples of the

5 mismo tumor demostró una alta reproducibilidad de la puntuación de riesgo, con una desviación típica promedio de 2,18 unidades (intervalo entre 0,83-4,62) en una escala de 100 unidades. The same tumor showed a high reproducibility of the risk score, with an average standard deviation of 2.18 units (range between 0.83-4.62) on a scale of 100 units.

Los criterios de inclusión de más de 25% de tumor se obtuvieron empíricamente por categorización de muestras en un 25-50 % de tumor, 50-75 % de tumor y > 75 % de tumor. La razón de riesgos instantáneos del grupo de riesgo 10 alto en comparación con el grupo de riesgo bajo para cada una de estas categorías porcentuales se muestra a continuación en la Tabla 1. The inclusion criteria of more than 25% of tumor were obtained empirically by categorizing samples in 25-50% of tumor, 50-75% of tumor and> 75% of tumor. The ratio of instantaneous risks of the high risk group 10 compared to the low risk group for each of these percentage categories is shown in Table 1 below.

Tabla 11: Razón de riesgos instantáneos de la categoría de riesgo alto por tumor porcentual Table 11: Reason for instantaneous risks of the high risk category per percentage tumor

Tumor Porcentual RRI de categoría de riesgo§ IC del 95 % valor p RRI percentage tumor of risk category § 95% CI p-value

25-50 % 2,39 1,65-3,47 <0,0001 25-50% 2.39 1.65-3.47 <0.0001

50-75 % 2,31 1,57-3,28 <0,0001 50-75% 2.31 1.57-3.28 <0.0001

>75 % 2,40 1,52-3,79 <0,0001 §Modelado como una variable continua > 75% 2.40 1.52-3.79 <0.0001 §Model as a continuous variable

Análisis estadístico Statistic analysis

La supervivencia global desde el momento de la extirpación se eligió como el criterio de valoración principal. Un criterio de valoración secundario en la cohorte de validación de Kaiser fue la mortalidad específica por cáncer de The overall survival from the moment of excision was chosen as the main assessment criterion. A secondary assessment criterion in the Kaiser validation cohort was cancer-specific mortality of

20 pulmón. El predictor principal evaluado fue la categoría de riesgo asignada por el ensayo molecular. Se compararon con el resultado otras covariables importantes, incluyendo la edad, sexo, antecedentes como fumador, histopatología, tamaño tumoral y fase de la enfermedad, mediante el uso de un modelo de riesgos instantáneos proporcionales de Cox de una variable o de múltiples variables. Se realizaron pruebas de razón de verosimilitudes de Wald y anidadas para el modelado de una variable y de múltiples variables, respectivamente, para evaluar la 20 lung The main predictor evaluated was the risk category assigned by the molecular test. Other important covariates, including age, sex, history as a smoker, histopathology, tumor size and stage of the disease, were compared with the result using a model of instantaneous Cox proportional hazards of one variable or multiple variables. Wald and nested likelihood ratio tests were performed for modeling of one variable and multiple variables, respectively, to assess the

25 significación estadística. Las pruebas de proporción de probabilidad anidadas son más apropiadas para los modelos de multiples variables debido a que examinan si la adición de una nueva variable, tal como la prueba molecular, ofrece una mejora en el ajuste por encima de las variables clínicas convencionales tales como la edad, sexo y tamaño tumoral. Se utilizaron un análisis estratificado de Kaplan-Meier con un conjunto de datos con censura por la derecha y la prueba de rango logarítmico para la tendencia para evaluar la asociación entre la categoría de riesgo y 25 statistical significance. Nested probability ratio tests are more appropriate for multi-variable models because they examine whether the addition of a new variable, such as molecular testing, offers an improvement in fit over conventional clinical variables such as Age, sex and tumor size. A stratified Kaplan-Meier analysis with a data set with right-hand censorship and the logarithmic range test were used for the trend to assess the association between the risk category and

30 los criterios de valoración principal y secundario. Para todos los análisis estadísticos, se consideró como estadísticamente significativo un α de dos colas preespecificado de 0,05. El área bajo la curva del análisis de la característica operativa del receptor dependiente del tiempo (AUROC) se calculó con el paquete survcomp (versión 1.1.6) en R; las diferencias en las AUROC se analizaron mediante el modelo de riesgos instantáneos proporcionales de Cox de múltiples variables y se compararon mediante el uso de las AUROC integradas con la prueba de la suma 30 the main and secondary assessment criteria. For all statistical analyzes, a prespecified two-tailed α of 0.05 was considered statistically significant. The area under the curve of the analysis of the operational characteristic of the time-dependent receiver (AUROC) was calculated with the survcomp package (version 1.1.6) in R; Differences in AUROCs were analyzed using the Cox proportional instantaneous risk model of multiple variables and compared by using the integrated AUROCs with the sum test.

35 de rangos de Wilcoxon. 35 of Wilcoxon ranges.

Se realizó un cálculo de la potencia de las cohortes de entrenamiento de la UCSF y de validación de Kaiser Permanente utilizando las siguientes suposiciones: β de 0,9, desviación típica de la población de categoría de riesgo de 0,8, una razón de riesgos instantáneos de 1,5 para el grupo de riesgo alto, probabilidad de retirada de 0,2 y A calculation of the power of the UCSF training cohorts and of Kaiser Permanente validation was performed using the following assumptions: β of 0.9, standard deviation of the risk category population of 0.8, a risk ratio 1.5 snapshots for the high risk group, 0.2 withdrawal probability and

40 probabilidades de sucesos de 0,4 (cohorte de entrenamiento de la UCSF en estadio I-III) y 0,3 (cohorte de validación de Kaiser en estadio I). El cálculo de la potencia dio como resultado un tamaño de muestra estimado de 313 y 417 pacientes para las cohortes de UCSF y Kaiser Permanente respectivamente. Como la proporción de la extracción de ARN satisfactoria no se conocía antes del inicio del estudio, se asumió una tasa de fallo del 10 %, lo que produjo un tamaño de muestra final de 344 pacientes para la cohorte de entrenamiento de la UCSF. 40 event probabilities of 0.4 (UCSF training cohort in stage I-III) and 0.3 (Kaiser validation cohort in stage I). The power calculation resulted in an estimated sample size of 313 and 417 patients for the UCSF and Kaiser Permanente cohorts respectively. As the proportion of satisfactory RNA extraction was not known before the start of the study, a failure rate of 10% was assumed, resulting in a final sample size of 344 patients for the UCSF training cohort.

45 Los análisis se realizaron con los lenguajes de programación R29 (versión 2.12.2 para Macintosh) y Stata/MP (versión 11). 45 The analyzes were performed with the programming languages R29 (version 2.12.2 for Macintosh) and Stata / MP (version 11).

Resultados Results

50 Se identificó un total de 399 pacientes que se habían sometido a extirpación de un CPNM no escamoso en la UCSF durante el período de estudio; de estos, 361 cumplían los criterios de inclusión en la cohorte de entrenamiento. 460 pacientes de Kaiser del Norte de California se habían sometido a la extirpación de un CPNM no escamoso en fase, de quienes 433 cumplían los criterios de inclusión en la cohorte de validación independiente. Se identificaron 1006 50 A total of 399 patients who had undergone excision of a non-squamous NSCLC in the UCSF during the study period were identified; of these, 361 met the inclusion criteria in the training cohort. 460 Kaiser patients from Northern California had undergone the removal of a non-squamous NSCLC in phase, of whom 433 met the criteria for inclusion in the independent validation cohort. 1006 were identified

55 pacientes en las instituciones del CCTC que cumplían los criterios de inclusión en ese estudio de validación. Las características clínicas y patológicas relevantes de estos pacientes se muestran a continuación en la Tabla 12. La tasa de extracción de ARN satisfactoria fue alta en las tres cohortes. 55 patients in the CCTC institutions that met the inclusion criteria in that validation study. The relevant clinical and pathological characteristics of these patients are shown below in Table 12. The satisfactory RNA extraction rate was high in the three cohorts.

Tabla 12: Características clínicas y patológicas de los pacientes Table 12: Clinical and pathological characteristics of the patients

Cohorte de Cohorte de Cohorte de validación del entrenamiento de la validación de Kaiser CCTC UCSF Kaiser CCTC UCSF Validation Training Validation Cohort Validation Cohort Cohort

Bloques FFIP disponibles 361 433 1006 Recuperación de ARN satisfactoria 337 (93 %) 420 (97 %) 967 (96 %) Edad en el momento de la extirpación 67,4 (11) 66,6 (9) 58,3 (11) Available FFIP blocks 361 433 1006 Successful RNA recovery 337 (93%) 420 (97%) 967 (96%) Age at the time of removal 67.4 (11) 66.6 (9) 58.3 (11)

(años, media [DT]) Sexo (femenino) 200 (59 %) 229 (55 %) 366 (38 %) (years, average [DT]) Sex (female) 200 (59%) 229 (55%) 366 (38%)

Antecedentes como fumador Background as a smoker

Sí 224 (66 %) 355 (85 %) 492 (49 %) Yes 224 (66%) 355 (85%) 492 (49%)

No 57(17 %) 36 (9 %) 403(40 %) No 57 (17%) 36 (9%) 403 (40%)

Desconocido 56 (17 %) 29:(7 %) 72 (7 %) Seguimiento de los supervivientes 64,0 (45,6-88,9) 106,0 (88,0-125,0) 53-4 (37,4-68,0) (meses; mediana [amplitud intercuartílica]) Muertes a los 5 años desde la 139 (41 %) 179 (43 %) 406 (42 %) extirpación Histopatología Unknown 56 (17%) 29: (7%) 72 (7%) Survival follow-up 64.0 (45.6-88.9) 106.0 (88.0-125.0) 53-4 (37.4-68.0) (months; medium [amplitude interquartile]) Deaths at 5 years from 139 (41%) 179 (43%) 406 (42%) removal Histopathology

Adenocarcinoma 278 (83 %) 325 (77 %) 881 (88 %) Adenocarcinoma 278 (83%) 325 (77%) 881 (88%)

Células grandes 17 (5 %) 15 (4 %) 17 (2 %) Large cells 17 (5%) 15 (4%) 17 (2%)

Mixto 10 (3 %) 15 (4%) 46(5%) Mixed 10 (3%) 15 (4%) 46 (5%)

CPNM (si no se especifica otra cosa) 32 (10 %) 65 (16 %) 23 (2 %) NSCLC (if not otherwise specified) 32 (10%) 65 (16%) 23 (2%)

Estadio Stadium

I 223 (66 %) 420 (100 %) 471 (47 %) Ia 152 (45 %) 285 (68 %) 239 (24 %) Ib 71 (21 %) 135 (32 %) 232 (23 %) I 223 (66%) 420 (100%) 471 (47%) Ia 152 (45%) 285 (68%) 239 (24%) Ib 71 (21%) 135 (32%) 232 (23%)

II 41(12 %) 0 222 (22 %) IIa 14(4%) 0 69 (7 %) IIb 27(8%) 0 153(15 %) II 41 (12%) 0 222 (22%) IIa 14 (4%) 0 69 (7%) IIb 27 (8%) 0 153 (15%)

III 58(17 %) 0 266 (26 %) IIIa* 32 (10 %) 0 247 (25 %) IIIb 26 (8%) 0 19 (2%) IV 9 (3 %)0 0 Indeterminado 6 (2 %) 0 8 (1 %) Los datos son n (%), a menos que se establezca otra cosa. CCTC= China Clinical Trails Consortium. FFIP= fijado en formalina, incluido en parafina. CPNM= cáncer de pulmón microcítico. UCSF= Universtiy of California, San Francisco. III 58 (17%) 0 266 (26%) IIIa * 32 (10%) 0 247 (25%) IIIb 26 (8%) 0 19 (2%) IV 9 (3%) 0 0 Indeterminate 6 (2% ) 0 8 (1%) The data is n (%), unless otherwise stated. CCTC = China Clinical Trails Consortium. FFIP = fixed in formalin, included in paraffin. NSCLC = small cell lung cancer. UCSF = University of California, San Francisco.

Durante la rigurosa validación técnica y el establecimiento del ensayo, el análisis de expresión génica candidato y la 5 comparación con los resultados de los pacientes mostraron ser similares en los grupos de bloques de tejido en los que el tumor ocupaba ya sea 25-50 %, 50-75 % o más del 75 % del área de superficie tisular. During the rigorous technical validation and trial establishment, the candidate gene expression analysis and the comparison with the results of the patients showed to be similar in the groups of tissue blocks in which the tumor occupied either 25-50%, 50-75% or more than 75% of the tissue surface area.

Se calcularon las puntuaciones de riesgo individuales para cada paciente en la cohorte de entrenamiento de la UCSF. Las puntuaciones de riesgo más altas estaban asociadas de forma positiva con una probabilidad aumentada Individual risk scores were calculated for each patient in the UCSF training cohort. Higher risk scores were positively associated with an increased probability.

10 de mortalidad a los 5 años. Con referencia a las Figuras 5A y 5B, debería entenderse que una razón de riesgos instantáneos mayor a 1 implica que más pacientes en el grupo de riesgo alto están muriendo en cualquier momento en comparación con el grupo de riesgo bajo, mientras que una proporción de riesgos instantáneos menor a 1 significa que están muriendo en cualquier momento menos pacientes en el grupo de riesgo alto en comparación con el grupo de riesgo bajo. 10 mortality at 5 years. With reference to Figures 5A and 5B, it should be understood that an instantaneous risk ratio greater than 1 implies that more patients in the high-risk group are dying at any time compared to the low-risk group, while a proportion of risks Snapshots less than 1 means that fewer patients in the high-risk group are dying at any time compared to the low-risk group.

15 Para identificar mejor a los pacientes en el riesgo más alto o el más bajo, se obtuvieron valores de corte que definen los grupos de riesgo bajo, riesgo intermedio y riesgo alto dividiendo en terciles las puntuaciones de riesgo de la cohorte de entrenamiento. Con referencia otra vez a las Figuras 5A y 5B, se observó un riesgo más alto de mortalidad con cada aumento en la categoría de riesgo en casi cada subgrupo de la cohorte de entrenamiento de la 15 To better identify patients at the highest or lowest risk, cut-off values were obtained that define the low-risk, intermediate-risk and high-risk groups by dividing the risk scores of the training cohort into tertiles. With reference again to Figures 5A and 5B, a higher mortality risk was observed with each increase in the risk category in almost every subgroup of the training cohort of the

UCSF y la correlación de la puntuación de riesgo con el resultado clínico fue muy similar en las muestras con 2550 %, 50-75 % y >75 % de área de superficie tumoral. UCSF and the correlation of the risk score with the clinical outcome were very similar in the samples with 2550%, 50-75% and> 75% of tumor surface area.

Después de que el ensayo se especificara de forma completa, el laboratorio certificado por el CLIA realizó la After the test was fully specified, the CLIA certified laboratory performed the

5 validación técnica. El KPDOR y el CCTC realizaron después validaciones con ocultación independientes del ensayo validado de forma técnica El KPDOR envió las muestras al laboratorio certificado por el CLIA para el análisis con ocultación y la asignación a la categoría de riesgo, y la realización del ensayo. Por el contrario, con la razón empírica 5 technical validation. The KPDOR and the CCTC then carried out independent concealment validations of the validated test in a technical way. The KPDOR sent the samples to the CLIA-certified laboratory for analysis with concealment and assignment to the risk category, and the performance of the test. On the contrary, with the empirical reason

(1:1:1) de pacientes de riesgo bajo, riesgo intermedio y riesgo alto en la cohorte de entrenamiento, se identificó una mayor proporción de pacientes de riesgo alto en la cohorte de validación de Kaiser Permanente. (1: 1: 1) of patients with low risk, intermediate risk and high risk in the training cohort, a higher proportion of high risk patients were identified in the validation cohort of Kaiser Permanente.

10 Este hallazgo podría atribuirse a la supervivencia global a 5 años más baja de la cohorte de validación de Kaiser en estadio I (56,4 %) en comparación con la cohorte de entrenamiento de la UCSF en estadio I (61,9 %). En la cohorte de validación de Kaiser Permanente, el análisis de supervivencia de Kaplan-Meier mostró una supervivencia a 5 años del 71,4 % (CI del 95 % 60,5-80,0) en el grupo de riesgo bajo, del 58,3 % (48,9-66,6) en el grupo de riesgo 10 This finding could be attributed to the overall 5-year overall survival of the Kaiser stage I validation cohort (56.4%) compared to the UCSF stage I training cohort (61.9%). In the Kaiser Permanente validation cohort, the Kaplan-Meier survival analysis showed a 5-year survival of 71.4% (95% CI 60.5-80.0) in the low-risk group of 58 , 3% (48.9-66.6) in the risk group

15 intermedio y del 49,2 % (42,2-55,8) en el grupo de riesgo alto. Un análisis de sensibilidad que excluía a los 18 pacientes de la cohorte de validación de Kaiser Permanente que recibieron quimioterapia adyuvante proporcionó resultados de supervivencia a 5 años que eran muy similares: el 70,0 % (58,7-78,8) en el grupo de riesgo bajo, el 58,2 % (48,5-66,7) en el grupo de riesgo intermedio y el 48,9 % (41,7-55,6) en el grupo de riesgo alto (ptend = 0,0006), La supervivencia específica para cáncer de pulmón a 5 años fue del 84,6 % (74,4-91,0) en el grupo de 15 intermediate and 49.2% (42.2-55.8) in the high risk group. A sensitivity analysis that excluded the 18 patients from the Kaiser Permanente validation cohort who received adjuvant chemotherapy provided 5-year survival results that were very similar: 70.0% (58.7-78.8) in the low risk group, 58.2% (48.5-66.7) in the intermediate risk group and 48.9% (41.7-55.6) in the high risk group (ptend = 0 , 0006), Specific survival for 5-year lung cancer was 84.6% (74.4-91.0) in the group of

20 riesgo bajo, del 70,3 % (60,6-78,0) en el grupo de riesgo intermedio y del 63,3 % (55,8-69,8) en el grupo de riesgo alto. También se realizó un análisis de supervivencia de Kaplan-Meier para los pacientes con enfermedad en estadio I en la cohorte de validación de Kaiser que no tenían un criterio de la National Comprehensive Cancer Network (NCCN) de riesgo alto. Este grupo incluía a todos los pacientes con enfermedad en estadio IA y un subgrupo de pacientes con enfermedad de estadio IB. La supervivencia global a 5 años para los pacientes en este subgrupo (con 20 low risk, 70.3% (60.6-78.0) in the intermediate risk group and 63.3% (55.8-69.8) in the high risk group. A Kaplan-Meier survival analysis was also performed for patients with stage I disease in the Kaiser validation cohort who did not have a high risk National Comprehensive Cancer Network (NCCN) criteria. This group included all patients with stage IA disease and a subgroup of patients with stage IB disease. 5-year overall survival for patients in this subgroup (with

25 la estadificación del riesgo según los resultados del ensayo molecular) fue del 72,7 % (61,3-81,3) en el grupo de riesgo bajo, del 59,0 % (48,9-67,8) en el grupo de riesgo intermedio y del 50,4 % (42,0-58,3) en el grupo de riesgo alto. 25 the staging of the risk according to the results of the molecular test) was 72.7% (61.3-81.3) in the low risk group, 59.0% (48.9-67.8) in the intermediate risk group and 50.4% (42.0-58.3) in the high risk group.

Con referencia a la Figura 6A, la supervivencia mediana se observó como de 113 meses en el grupo de riesgo bajo, With reference to Figure 6A, median survival was observed as 113 months in the low risk group,

30 de 91 meses en el grupo de riesgo intermedio y de 59 meses en el grupo de riesgo alto. Con referencia a la Figura 6B, no se observó que en algún grupo de riesgo se alcanzara la supervivencia mediana específica para cáncer de pulmón. La tasa de incidencia de mortalidad fue de 2,7 cada 100 personas-años en el grupo de riesgo bajo, 5,0 cada 100 personas-años en el grupo de riesgo intermedio y 6,6 cada 100 personas-años en el grupo de riesgo alto. Con referencia a la Figura 6C, la supervivencia mediana fue de 113 meses en el grupo de riesgo bajo, de 88 meses en el 30 of 91 months in the intermediate risk group and 59 months in the high risk group. With reference to Figure 6B, it was not observed that in any risk group the median survival specific to lung cancer was achieved. The mortality incidence rate was 2.7 per 100 person-years in the low risk group, 5.0 per 100 person-years in the intermediate risk group and 6.6 per 100 person-years in the group of high risk. With reference to Figure 6C, the median survival was 113 months in the low risk group, 88 months in the

35 grupo de riesgo intermedio y de 70 meses en el grupo de riesgo alto. 35 intermediate risk group and 70 months in the high risk group.

En la cohorte de validación de Kaiser Permanente, la categoría de riesgo (alto), la edad y el sexo eran predictores estadísticamente significativos de mortalidad en un análisis de una variable, como se observa a continuación en la Tabla 13. In the Kaiser Permanente validation cohort, the risk category (high), age and sex were statistically significant predictors of mortality in an analysis of a variable, as shown in Table 13 below.

40 Tabla 13: Modelo de riesgos instantáneos proporcionales de Cox para la mortalidad global a 5 años en la cohorte de validación de Kaiser Permanente 40 Table 13: Cox proportional instantaneous risk model for 5-year overall mortality in the Kaiser Permanente validation cohort

Análisis de una variable Análisis de múltiples variables Razón de riesgos Valor p de Razón de riesgos Valor p de la prueba instantáneos (IC la prueba instantáneos (IC de razón de del 95 %) de Wald del 95 %) verosimilitudes Categoría del riesgo* Analysis of a variable Analysis of multiple variables Risk ratio P-value of Risk ratio P-value of the instantaneous test (instantaneous CI test (95% CI) Wald 95%) likelihoods Risk category *

Riesgo alto 2,16 (1,39-3,36) 0,0007 2,04 (1,28-3,26) 0,0016 High risk 2.16 (1.39-3.36) 0.0007 2.04 (1.28-3.26) 0.0016

Riesgo intermedio 1,60 (0,98-2,60) 0,0610 1,66 (1,00-2,74) 0,00436 Intermediate risk 1.60 (0.98-2.60) 0.0610 1.66 (1.00-2.74) 0.00436

Edad >65 años 1,55 (1,14-2,10) 0,0054 1,66 (1,21-2,29) 0,0016 Age> 65 years 1.55 (1.14-2.10) 0.0054 1.66 (1.21-2.29) 0.0016

Sexo (femenino) 0,55 (0,41-0,74) 0,0001 0,67 (0,49-0,92) 0,0123 Sex (female) 0.55 (0.41-0.74) 0.0001 0.67 (0.49-0.92) 0.0123

Nunca fumador 0-,59 (0,32-1,09) 0,0917 0,83 (0,44-1,55) 0,5438 Never smoker 0-, 59 (0.32-1.09) 0.0917 0.83 (0.44-1.55) 0.5438

Carcinoma de células grandes Large cell carcinoma
0-96 (0,42-2,17) 0,9139 0,64 (0,26-1,59) 0,3038 0-96 (0.42-2.17) 0.9139 0.64 (0.26-1.59) 0.3038

Mixto Mixed
0,98 {0,43-2,22) 0,9615 0,85 (0,37-1,95) 0,6932 0.98 {0.43-2.22) 0.9615 0.85 (0.37-1.95) 0.6932

CPNM (si no se especifica otra cosa) CPNM (if not specified otherwise)
1,13 (0,89-1,93) 0,1659 1,18 (0,79-1,75) 0,4320 1.13 (0.89-1.93) 0.1659 1.18 (0.79-1.75) 0.4320

Tamaño tumoral > 4 cm Tumor size> 4 cm
1,42 (0,97-2,07) 0,0697 1,10 (0,73-1,66) 0,6435 1.42 (0.97-2.07) 0.0697 1.10 (0.73-1.66) 0.6435

CPNM = cáncer de pulmón no microcítico. *Comparado con el grupo de bajo riesgo. †Comparado con adenocarcinoma. NSCLC = non-small cell lung cancer. * Compared to the low risk group. † Compared with adenocarcinoma.

El análisis de múltiples variables (ajustando para edad, sexo, antecedentes como fumador, histopatología y tamaño tumoral > 4 cm) mostró que ambos agrupamientos de riesgo alto y riesgo intermedio así como la edad y el sexo fueron predictores estadísticamente significativos de mortalidad, como se observa a continuación en la Tabla 14. The analysis of multiple variables (adjusting for age, sex, history as a smoker, histopathology and tumor size> 4 cm) showed that both groups of high risk and intermediate risk as well as age and sex were statistically significant predictors of mortality, as see below in Table 14.


Tabla 14: Modelo de riesgos instantáneos proporcionales de Cox de múltiples variables para la mortalidad global a 5 años en la cohorte de validación de Kaiser Permanente excluyendo la prueba molecular

Table 14: Cox proportional instantaneous risk model of multiple variables for 5-year overall mortality in the Kaiser Permanente validation cohort excluding molecular test

RRI RRI
IC del 95 % Valor p de la prueba RV 95% CI P value of the RV test

Edad>65 Age> 65
1,59 1,26-2,20 0,0036 1.59 1.26-2.20 0.0036

Sexo femenino Female sex
0,65 0,47-0,89 0,0064 0.65 0.47-0.89 0.0064

Nunca fumador Never smoker
0,74 0,40-1,38 0,3294 0.74 0.40-1.38 0,3294

Histopatología§ Histopathology§

Carcinoma de células grandes Large cell carcinoma
0,76 0,31-1,87 0,5346 0.76 0.31-1.87 0.5346

Mixto Mixed
1,00 0,44-2,27 0,9933 1.00 0.44-2.27 0.9933

CPNM si no se especifica otra cosa CPNM if nothing else is specified
1,26 0,85-1,88 0,2555 1.26 0.85-1.88 0.2555

Tamaño tumoral > 4 cm Tumor size> 4 cm
1,21 0,81-1,80 0,3608 1.21 0.81-1.80 0.3608

§Comparado con adenocarcinoma § Compared with adenocarcinoma

En la cohorte del CCTC, la mortalidad a 5 años después de la extirpación completa de un CPNM no escamoso por In the CCTC cohort, 5-year mortality after complete removal of a non-squamous NSCLC due to

10 grupo de riesgo (definido de acuerdo con los resultados del ensayo molecular) fue la siguiente: el 74,1 % (66,0-80,6) en el grupo de riesgo bajo, el 57,4 % (48,3-65,5) en el grupo de riesgo intermedio y el 44,6 % (40,2-48,9) en el grupo de riesgo alto, como se observa en la Figura 7. 10 risk group (defined according to the results of the molecular test) was as follows: 74.1% (66.0-80.6) in the low risk group, 57.4% (48.3- 65.5) in the intermediate risk group and 44.6% (40.2-48.9) in the high risk group, as shown in Figure 7.

La supervivencia mediante fue de 101,1 meses en el grupo de riesgo bajo, de 77,2 en los grupos de riesgo Survival was 101.1 months in the low risk group, 77.2 months in the risk groups.

15 intermedio y de 43,1 meses en el grupo de riesgo alto. Se sugiere una mejora con el uso del ensayo pronóstico de 14 genes en comparación con el uso de la estadificación tradicional por la separación estadísticamente significativa de las curvas de supervivencia de Kaplan-Meier para la supervivencia global a 5 años entre los pacientes de riesgo bajo, riesgo intermedio y riesgo alto en el análisis de subgrupo de pacientes con enfermedad de distinto estadio (véase la Figura 7): enfermedad en estadio I (riesgo bajo = 83,0 % [73,8-89,1], riesgo intermedio = 67,7 % [54,815 intermediate and 43.1 months in the high risk group. An improvement is suggested with the use of the 14-gene prognostic trial compared to the use of traditional staging by the statistically significant separation of Kaplan-Meier survival curves for 5-year overall survival among low-risk patients, intermediate risk and high risk in the subgroup analysis of patients with different stage disease (see Figure 7): stage I disease (low risk = 83.0% [73.8-89.1], intermediate risk = 67 , 7% [54.8

20 77,7]; riesgo alto = 64,6 % [57,9-70,5]), enfermedad en estadio II (riesgo bajo = 54,2 % [30,1-73,2]; riesgo intermedio = 45,8 % [26,2-63,4]; riesgo alto = 38,1 % [29,4-46,8]) y enfermedad en estadio III (riesgo bajo = 53,3 % [32,6-70,3]; riesgo intermedio = 43,3 % [27,2-58,5]; riesgo alto = 24,0 % [17,5-30,9]). El modelado de riesgos instantáneos proporcionales de Cox de una variable indicó que el sexo (masculino), los antecedentes como fumador, la histopatología de células grandes y mixtas y el estadio de la enfermedad tenían todos un efecto negativo en la 20 77.7]; high risk = 64.6% [57.9-70.5]), stage II disease (low risk = 54.2% [30.1-73.2]; intermediate risk = 45.8% [26, 2-63.4]; high risk = 38.1% [29.4-46.8]) and stage III disease (low risk = 53.3% [32.6-70.3]; intermediate risk = 43.3% [27.2-58.5]; high risk = 24.0% [17.5-30.9]). Cox proportional instantaneous risk modeling of one variable indicated that sex (male), history as a smoker, histopathology of large and mixed cells and the stage of the disease all had a negative effect on

25 supervivencia en la cohorte del CCTC, como se observa a continuación en la Tabla 15. 25 survival in the CCTC cohort, as seen in Table 15 below.

Tabla 15: Modelo de riesgos instantáneos proporcionales de Cox para la mortalidad global a 5 años en la cohorte de validación del China Clinical Trials Consortium Table 15: Cox proportional instantaneous risk model for 5-year overall mortality in the validation cohort of the China Clinical Trials Consortium

Análisis de una variable Análisis de múltiples variables Razón de riesgos Valor p de Razón de riesgos Valor p de la prueba instantáneos (IC del la prueba instantáneos (IC del de Wald Analysis of a variable Analysis of multiple variables Risk ratio P-value of Risk ratio Instant p-value of the test (instantaneous test IC (Wald's IC

95%) deWald 95%) Categoría del riesgo* Riesgo alto 3,07 (2,21-4,25) 0,0001 2,37 (1,63-3,43) <0,0001 95%) of Wald 95%) Risk Category * High risk 3.07 (2.21-4.25) 0.0001 2.37 (1.63-3.43) <0.0001

Riesgo intermedio 1,87 (1,26-2,77) 0,0019 1,60(1,03-2,49) 0,0354 Intermediate risk 1.87 (1.26-2.77) 0.0019 1.60 (1.03-2.49) 0.0354

Edad >65 años 1,11(0,90-1,37) 0,3337 1,19 (0,94-1,49) 0,1493 Age> 65 years 1.11 (0.90-1.37) 0.3337 1.19 (0.94-1.49) 0.1493

Sexo (femenino) 0,78 (0,63-0,95) 0,0150 0,93 (0,70-1,23) 0,6057 Sex (female) 0.78 (0.63-0.95) 0.0150 0.93 (0.70-1.23) 0.6057

Nunca fumador 0,70 (0,56-0,86) 0,0009 0,84 (0,64-1,10) 0,1986 Never smoker 0.70 (0.56-0.86) 0.0009 0.84 (0.64-1.10) 0.1986

Histopatología† Carcinoma de células Histopathology † Cell carcinoma

2,12 (1,09-4,11) 0,0259 1,68 (0,83-3,41) 0,1831 2.12 (1.09-4.11) 0.0259 1.68 (0.83-3.41) 0.1831

grandes Mixto 1,67 (1,12-2,48) 0,0118 1,07 (0,69-1,64) 0,7714 CPNM (si no se especifica Large Mixed 1.67 (1.12-2.48) 0.0118 1.07 (0.69-1.64) 0.7714 NSCLC (if not specified

0,89 (0,44-1,80) 0,7528 0,77 (0,36-1,63) 0,4759 0.89 (0.44-1.80) 0.7528 0.77 (0.36-1.63) 0.4759

otra cosa) Estadio‡ 1,44 (1,35-1,53) <0,0001 1,43 (1,33-1,53) <0,0001 otherwise) Stadium ‡ 1.44 (1.35-1.53) <0.0001 1.43 (1.33-1.53) <0.0001

Sin embargo no se observó que alguno de estos factores tuviese un efecto tan grande sobre la supervivencia como la designación en la categoría de riesgo alto de acuerdo con el ensayo molecular. El análisis de múltiples variables mostró que la designación de riesgo alto y riesgo intermedio siguió siendo un predictor estadísticamente significativo de la supervivencia incluso después del ajuste para la edad, sexo, antecedentes como fumador, histopatología y estadio de la enfermedad. Véanse a continuación las Tablas 16-18. However, it was not observed that any of these factors had such a large effect on survival as the designation in the high risk category according to the molecular assay. The analysis of multiple variables showed that the designation of high risk and intermediate risk remained a statistically significant predictor of survival even after adjustment for age, sex, history as a smoker, histopathology and disease stage. See Tables 16-18 below.

Tabla 16: Tabulación de los factores de riesgo por categoría de riesgo en la cohorte de validación de Kaiser Permanente Table 16: Tabulation of risk factors by risk category in the Kaiser Permanente validation cohort

Riesgo Bajo Riesgo Intermedio Riesgo Alto Valor P Low Risk Intermediate Risk High Risk P Value

Número de pacientes 85 119 216 Edad en el momento de la Number of patients 85 119 216 Age at the time of

66,6 (9,8)§ 67,1 (8,9)§ 66,2 (9,3)§ 0,7114* 66.6 (9.8) § 67.1 (8.9) § 66.2 (9.3) § 0.7114 *

extirpación Sexo Masculino 28 (32,9) 51 (42,9) 112 (51,9) 0,0098 Femenino 57 (67,1) 68 (57,1) 104 (48,1) Antecedentes como fumador Sí 68 (180,0) 100 (84,0) 187 (86,6) 0,1096 No 12 (14,1) 10 (8,4) 14 (6,5) Histopatología Adenocarcinoma 77 (90,6) 95 (79,8) 153 (70,8) 0,0070 Excision Sex Male 28 (32.9) 51 (42.9) 112 (51.9) 0.0098 Female 57 (67.1) 68 (57.1) 104 (48.1) Background as a smoker Yes 68 (180 , 0) 100 (84.0) 187 (86.6) 0.1096 No 12 (14.1) 10 (8.4) 14 (6.5) Histopathology Adenocarcinoma 77 (90.6) 95 (79.8 ) 153 (70.8) 0.0070

Células grandes 0 2 (1,7) 13 (6,0) Mixto 2 (2,4) 3 (2,5) 10 (4,6) CPNM si no se especifica Large cells 0 2 (1.7) 13 (6.0) Mixed 2 (2.4) 3 (2.5) 10 (4.6) NSCLC if not specified

6 (7,1) 19 (16,0) 40 (18,5) 6 (7.1) 19 (16.0) 40 (18.5)

otra cosa Tamaño Tumoral (cm) 2,3 (1,4)§ 2,6 (1,6)§ 3,4 (1,8)§ <0,0001* Estadio 1a 70 (82,4) 95 (79,8) 120 (55,6) <0,0001 1b 15 (17,6) 24 (20,2) 96 (44,4) otherwise Tumor Size (cm) 2.3 (1.4) § 2.6 (1.6) § 3.4 (1.8) § <0.0001 * Stage 1a 70 (82.4) 95 (79 , 8) 120 (55.6) <0.0001 1b 15 (17.6) 24 (20.2) 96 (44.4)

Los números entre paréntesis representan el porcentaje de pacientes en cada categoría de riesgo excepto en donde se indique. §Media de la cohorte (desviación típica) *Prueba de ANOVA The numbers in brackets represent the percentage of patients in each risk category except where be indicated. § Cohort average (standard deviation) * ANOVA test

Tabla 17: Modelo de riesgos instantáneos proporcionales de Cox de múltiples variables para la mortalidad global a 5 años en la cohorte de validación del China Clinical Trials Consortium excluyendo la prueba molecular Table 17: Cox proportional instantaneous risk model of multiple variables for 5-year overall mortality in the validation cohort of the China Clinical Trials Consortium excluding molecular test

Valor p de la P value of the

RRI CI del95% 95% CI RRI

prueba de RV RV test

Edad >65 1,18 0,94-1,49 0,1532 Sexo femenino 0,93 0,70-1,22 0,5917 Nunca fumador 0,74 0,56-0,97 0,0260 Histopatología§ Age> 65 1.18 0.94-1.49 0.1532 Female sex 0.93 0.70-1.22 0.5917 Never smoker 0.74 0.56-0.97 0.0260 Histopathology§

Carcinoma de células grandes 1,79 0,89-3,63 0,1374 Mixto 1,15 0,75-1,77 0,5221 CPNM si no se especifica otra cosa 0,77 0,36-1,63 0,4707 Large cell carcinoma 1.79 0.89-3.63 0.1374 Mixed 1.15 0.75-1.77 0.5221 NSCLC if not otherwise specified 0.77 0.36-1.63 0, 4707

Fase§§ 1,48 1,38-1,58 <0,0001 §Comparado con Adenocarcinoma §§Modelado como una variable continua Phase §§ 1.48 1.38-1.58 <0.0001 § Compared with Adenocarcinoma § § Modeled as a continuous variable

Tabla 18: Tabulación de los factores de riesgo por categoría de riesgo en la cohorte de validación del China Clinical Trials Consortium Table 18: Tabulation of risk factors by risk category in the validation cohort of the China Clinical Trials Consortium

Riesgo bajo Riesgo intermedio Riesgo alto Valor P Low risk Intermediate risk High risk P Value

Número de Pacientes 193 172 602 Edad en el momento de la Number of Patients 193 172 602 Age at the time of

57,6 (11,4)§ 58,5 (10,7)§ 58,5 (10,6)§ 0,5529* 57.6 (11.4) § 58.5 (10.7) § 58.5 (10.6) § 0.5529 *

extirpación Sexo Masculino 98 (50,8) 86 (50,0) 417 (69,3) <0,0001 Femenino 95 (49,2) 86 (50,0) 185 (30,7) Historial como Fumador Sí 70 (38,3) 68 (43,9) 354 (63,6) <0,0001 No 113 (61,7) 87 (56,1) 203 (36,4) Histopatología Adenocarcinoma 186 (96,4) 159 (92,4) 536 (89,0) 0,0032 Excision Male Sex 98 (50.8) 86 (50.0) 417 (69.3) <0.0001 Female 95 (49.2) 86 (50.0) 185 (30.7) Smoking History Yes 70 ( 38.3) 68 (43.9) 354 (63.6) <0.0001 No 113 (61.7) 87 (56.1) 203 (36.4) Histopathology Adenocarcinoma 186 (96.4) 159 (92 , 4) 536 (89.0) 0.0032

Células Grandes 0 4 (2,3) 13 (2,2) Mixto 4 (2,1) 3 (1,7) 43 (7,1) CPNM si no se Large Cells 0 4 (2,3) 13 (2,2) Mixed 4 (2.1) 3 (1.7) 43 (7.1) NSCLC if I don't know

3 (1,6) 6 (3,5) 10 (1,7) 3 (1.6) 6 (3.5) 10 (1.7)

especifica otra cosa Tamaño tumoral (cm) 2,8 (1,4)§ 3,4 (1,7)§ 4,3 (4,1)§ <0,0001* Estadio I 130 (68,4) 95 (55,6) 246 (41,1) II 34 (17,9) 32 (18,7) 156 (26,1) <0,0001 III 26 (13,7) 44 (25,7) 196 (32,8) otherwise specify Tumor size (cm) 2.8 (1.4) § 3.4 (1.7) § 4.3 (4.1) § <0.0001 * Stage I 130 (68.4) 95 ( 55.6) 246 (41.1) II 34 (17.9) 32 (18.7) 156 (26.1) <0.0001 III 26 (13.7) 44 (25.7) 196 (32, 8)

Los números entre paréntesis representan el porcentaje de pacientes en cada categoría de riesgo excepto en donde se indique. §Media de la cohorte (desviación típica) *Prueba de ANOVA The numbers in brackets represent the percentage of patients in each risk category except in Where indicated. § Cohort average (standard deviation) * ANOVA test

Además del análisis de múltiples variables, se realizó un análisis AUROC dependiente del tiempo para probar si el In addition to the analysis of multiple variables, a time-dependent AUROC analysis was performed to test whether the

5 ensayo molecular proporciona información pronóstica más útil que solo la estadificación convencional. La AUROC es una medida de la discriminación de un test pronóstico y coincide con el estadístico c. Se han utilizado los criterios de la NCCN, que identifican tales pacientes como en estadio IB más al menos uno de los siguientes factores de riesgo: tumores poco diferenciados, invasión vascular, extirpación en cuña, márgenes mínimos, tumores mayores de 4 cm de diámetro, implicación de la pleura visceral y estado desconocido de ganglios linfáticos. En la cohorte de 5 molecular assay provides more useful prognostic information than just conventional staging. The AUROC is a measure of the discrimination of a prognostic test and coincides with the statistic c. The NCCN criteria have been used, which identify such patients as stage IB plus at least one of the following risk factors: poorly differentiated tumors, vascular invasion, wedge removal, minimum margins, tumors larger than 4 cm in diameter, involvement of the visceral pleura and unknown state of lymph nodes. In the cohort of

10 validación de Kaiser Permanente la suma del ensayo molecular proporcionó una mejor discriminación del riesgo que solo los criterios de riesgo del NCCN, demostrado por una AUROC más grande (estadístico c de 0,60 frente a 0,54; p <0,0001). No estaban disponibles los datos completos para todos los criterios para el estadio I de riesgo alto de la NCCN en los pacientes de la cohorte del CCTC. Por lo tanto, el análisis AUROC en esta cohorte se centró en 471 pacientes con enfermedad en estadio I; la adición del ensayo molecular a solo la estadificación convencional 10 validation of Kaiser Permanente the sum of the molecular test provided better risk discrimination than only the NCCN risk criteria, demonstrated by a larger AUROC (statistical c of 0.60 versus 0.54; p <0.0001) . Complete data for all criteria for NCCN high-risk stage I were not available in patients in the CCTC cohort. Therefore, the AUROC analysis in this cohort focused on 471 patients with stage I disease; the addition of the molecular assay to just conventional staging

15 aumentó, de forma similar, la AUROC para este grupo, de forma coherente con una mejor discriminación en la predicción del riesgo por la suma del ensayo molecular (estadístico c de 0,61 frente a 0,56; p <0,0001). 15 similarly increased the AUROC for this group, in a manner consistent with better discrimination in the prediction of risk by the sum of the molecular test (statistic c of 0.61 versus 0.56; p <0.0001) .

Discusión Discussion

20 Se observó que el ensayo basado en PCR cuantitativa utilizado en el presente Ejemplo identifica de forma fiable a pacientes con CPNM no escamoso de estadio temprano en riesgo alto de mortalidad tras la extirpación quirúrgica, discriminando tales pacientes con mayor precisión que el uso del criterio del NCCN solo. Este ejemplo demuestra la implementación de una plataforma con extracción de ARN interpretable a partir de tejido incluido en parafina fijado con formalina, la realización del ensayo en uno de los estudios en un laboratorio que era independiente del 20 It was observed that the quantitative PCR-based trial used in the present Example reliably identifies patients with early-stage non-squamous NSCLC at high risk of mortality after surgical excision, discriminating such patients more accurately than using the criteria of NCCN alone. This example demonstrates the implementation of a platform with interpretable RNA extraction from tissue included in formalin-fixed paraffin, performing the test in one of the studies in a laboratory that was independent of

25 laboratorio en el que se desarrolló el ensayo, los tamaños muy grandes de las cohortes de validación independientes y la disparidad potencialmente grande entre los acervos genéticos de una de las cohortes de validación y los de la cohorte de entrenamiento original utilizada para el desarrollo del ensayo. 25 laboratory in which the trial was conducted, the very large sizes of the independent validation cohorts and the potentially large disparity between the genetic collections of one of the validation cohorts and those of the original training cohort used for the development of the trial .

El ensayo molecular utilizado en el presente Ejemplo proporciona una prueba más precisa para la definición de The molecular assay used in the present Example provides a more accurate test for the definition of

30 subconjuntos de pacientes con CPNM no escamoso y resultados estadísticamente heterogéneos. Este ensayo se validó de forma independiente en una cohorte americana extrahospitalaria grande para mejorar la estratificación del riesgo en pacientes con enfermedad en estadio I. A la vista de la gran magnitud de la crisis de la sanidad pública debida al cáncer de pulmón en la China, la validación adicional de este ensayo molecular en una gran población de chinos aumenta adicionalmente su posible efecto. Este ensayo proporciona una diferenciación pronóstica de 30 subsets of patients with non-squamous NSCLC and statistically heterogeneous results. This trial was independently validated in a large extrahospital American cohort to improve risk stratification in patients with stage I disease. In view of the great magnitude of the public health crisis due to lung cancer in China, The additional validation of this molecular test in a large population of Chinese further increases its possible effect. This trial provides a prognostic differentiation of

pacientes con enfermedad en fase temprana y podría ser útil en la identificación de la aplicación más apropiada de las directrices de tratamiento para mejorar los resultados clínicos. Patients with early stage disease and could be useful in identifying the most appropriate application of treatment guidelines to improve clinical outcomes.

Ejemplo 3: Comparación de la AUROC para el ensayo de 11 genes frente a otros ensayos con distintas 5 combinaciones génicas Example 3: Comparison of the AUROC for the 11 gene assay against other assays with different 5 gene combinations

El presente ejemplo predice el éxito del ensayo de 11 genes en comparación con otras combinaciones de genes en la asignación de pacientes a las categorías de riesgo alto o bajo utilizando el área bajo la curva del análisis de la característica operativa del receptor (AUROC). The present example predicts the success of the 11 gene assay compared to other combinations of genes in the assignment of patients to high or low risk categories using the area under the curve of the analysis of the recipient's operational characteristic (AUROC).

10 El análisis AUROC se realizó en muestras de ARN extraídas de 337 pacientes con cáncer de pulmón en estadio I-IV. Como se observa a continuación en la Tabla 19, se observó que el ensayo de 11 genes es superior a las otras combinaciones de genes probadas en el presente ejemplo, como se refleja por un estadístico de c de AUROC mayor. 10 AUROC analysis was performed on RNA samples taken from 337 patients with stage I-IV lung cancer. As noted in Table 19 below, it was observed that the 11 gene assay is superior to the other combinations of genes tested in the present example, as reflected by a larger AUROC c statistic.

15 Tabla 19: Valores de AUROC 15 Table 19: AUROC values

Conjunto de genes Gene set
AUROC AUROC

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR WNT3A BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR WNT3A
0,7215 0.7215

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 IL11 LCK BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 IL11 LCK
0,6321 0.6321

BAG1 BRCA1 CDC6 RND3 BAG1 BRCA1 CDC6 RND3
0,5889 0.5889

BAG1 BRCA1 CDC6 FUT3 IL11 RND3 SH3BGR BAG1 BRCA1 CDC6 FUT3 IL11 RND3 SH3BGR
0,6438 0.6438

BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 RND3 SH3BGR BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 RND3 SH3BGR
0,6466 0.6466

BAG1 BRCA1 CDC6 CDK2AP1 EMX2 FUT3 IL11 LCK RND3 SH3BGR SIX3 BAG1 BRCA1 CDC6 CDK2AP1 EMX2 FUT3 IL11 LCK RND3 SH3BGR SIX3
0,6758 0.6758

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 IL11 RND3 SH3BGR BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 IL11 RND3 SH3BGR
0,6489 0.6489

BAG1 BRCA1 CDC6 CDK2AP1 EMX2 FUT3 IL11 RND3 SH3BGR SIX3 WNT3A BAG1 BRCA1 CDC6 CDK2AP1 EMX2 FUT3 IL11 RND3 SH3BGR SIX3 WNT3A
0,6829 0.6829

BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 LCKRND3 SIX3 BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 LCKRND3 SIX3
0,6658 0.6658

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3
0,6382 0.6382

BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 LCKRND3 SH3BGR BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 LCKRND3 SH3BGR
0,6767 0.6767

BAG1 BRCA1 CDC6 BAG1 BRCA1 CDC6
0,6280 0.6280

BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 RND3 BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 RND3
0,6321 0.6321

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 SH3BGR BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 SH3BGR
0,6531 0.6531

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR
0,6815 0.6815

BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 WNT3A BAG1 BRCA1 CDC6 CDK2AP1 FUT3 IL11 WNT3A
0,6735 0.6735

BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 LCKRND3 SH3BGR SIX3 WNT3A BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 LCKRND3 SH3BGR SIX3 WNT3A
0,6413 0.6413

CDK2AP1 FUT3 IL11 RND3 CDK2AP1 FUT3 IL11 RND3
0,6276 0.6276

BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 LCKRND3 SH3BGR SIX3 BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 LCKRND3 SH3BGR SIX3
0,6823 0.6823

FUT3 IL11 RND3 FUT3 IL11 RND3
0,5883 0.5883

BAG1 CDC6 FUT3 IL11 WNT3A BAG1 CDC6 FUT3 IL11 WNT3A
0,6770 0.6770

BAG1 BRCA1 CDC6 FUT3 RND3 BAG1 BRCA1 CDC6 FUT3 RND3
0,6298 0.6298

BAG1 BRCA1 CDC6 FUT3 IL11 RND3 SH3BGR BAG1 BRCA1 CDC6 FUT3 IL11 RND3 SH3BGR
0,6438 0.6438

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 IL11 RND3 BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 IL11 RND3
0,6321 0.6321

BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 RND3 SH3BGR SIX3 WNT3A BAG1 BRCA1 CDC6 CDK2AP1 EMX2 ERBB3 FUT3 IL11 RND3 SH3BGR SIX3 WNT3A
0,6841 0.6841

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 WNT3A BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 WNT3A
0,6704 0.6704

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 SH3BGR WNT3A BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 RND3 SH3BGR WNT3A
0,6842 0.6842

ERBB3 LCK RND3 WNT3A ERBB3 LCK RND3 WNT3A
0,6861 0.6861

ERBB3 LCK RND3 ERBB3 LCK RND3
0,5821 0.5821

BAG1 CDC6 FUT3 IL11 RND3 BAG1 CDC6 FUT3 IL11 RND3
0,6379 0.6379

Selección de la propiedad de riesgo génico Selection of the gene risk property

Se analizó el ensayo de 11 genes para determinar qué genes conferían riesgo y qué genes conferían protección utilizando el modelo de riesgos instantáneos proporcionales de Cox. Estas determinaciones se enumeran para cada gen en la Tabla 20. The 11 gene assay was analyzed to determine which genes conferred risk and which genes conferred protection using Cox's proportional instantaneous risk model. These determinations are listed for each gene in Table 20.


Tabla 20: Propiedad de riesgo de los genes del ensayo de 11 genes

Table 20: Risk property of the 11 gene test genes

Gen Gen
Razón de riesgos instantáneos Propiedad Reason for instant risks Property

BAG1 BAG1
1,002 Riesgo 1,002 Risk

BRCA1 BRCA1
1,157 Riesgo 1,157 Risk

CDC6 CDC6
1,087 Riesgo 1,087 Risk

CDK2AP1 CDK2AP1
1,205 Riesgo 1,205 Risk

ERBB3 ERBB3
0,936 Protección 0.936 Protection

FUT3 FUT3
1,035 Riesgo 1,035 Risk

IL11 IL11
1,014 Riesgo 1,014 Risk

LCK LCK
0,811 Protección 0.811 Protection

RND3 RND3
1,093 Riesgo 1,093 Risk

SH3BGR SH3BGR
0,820 Protección 0.820 Protection

WNT3A WNT3A
0,888 Protección 0.888 Protection

10 Selección del coeficiente de los genes 10 Selection of the gene coefficient

Los valores de expresión de los 11 Genes (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A) pueden combinarse en número infinito de formas para proporcionar un número único que sea representativo del riesgo de mortalidad del paciente. Cada uno de los valores de la expresión de los genes se The expression values of the 11 Genes (BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A) can be combined in an infinite number of ways to provide a unique number that is representative of the risk of mortality of the patient. Each of the expression values of the genes is

15 ponderaron (como se representa mediante un coeficiente) para representar la contribución relativa del gen a un riesgo de mortalidad del paciente. Los coeficientes para cada uno de los genes del ensayo de 11 genes se enumeran a continuación en la Tabla 21. 15 weighted (as represented by a coefficient) to represent the relative contribution of the gene to a patient mortality risk. The coefficients for each of the 11 gene test genes are listed below in Table 21.

Tabla 21: Coeficientes para los genes en el ensayo de 11 genes 20 Table 21: Coefficients for genes in the 11 gene assay 20

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR WNT3A BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR WNT3A
-0,0024 -0,1461 -0,0834 -0,1865 0,0664 -0,0346 -0,0138 0,2099 -0,0885 0,1982 0,1186 Riesgo Riesgo Riesgo Riesgo Protección Riesgo Riesgo Protección Riesgo Protección Protección 0,7215 -0.0024 -0.1461 -0.0834 -0.1865 0.0664 -0.0346 -0.0138 0.2099 -0.0885 0.1982 0.1186 Risk Risk Risk Risk Protection Risk Risk Protection Risk Protection Protection 0.7215

Análisis AUROC AUROC analysis

Se midió la AUROC de la puntuación de riesgo para el ensayo de 11 genes en una cohorte de muestras de ensayo The AUROC of the risk score for the test of 11 genes in a cohort of test samples was measured

25 procedentes de 337 pacientes que se habían sometido a extirpación de cáncer de pulmón, midiendo sus puntuaciones de riesgo y comparando la asignación de riesgo con los resultados reales de la supervivencia a 5 años de los pacientes. El estadístico c de AUROC, que utilizó los coeficientes de la Tabla 21 anterior, fue de 0,7215. A base del análisis AUROC, se observó que el ensayo de 11 genes supera a otros modelos (enumerados con sus estadísticos c de AUROC a continuación en las Tablas 22-31), en los cuales se utilizaron distintos coeficientes para 25 from 337 patients who had undergone lung cancer excision, measuring their risk scores and comparing the risk allocation with the actual 5-year survival results of the patients. The AUROC c statistic, which used the coefficients in Table 21 above, was 0.7215. Based on the AUROC analysis, it was observed that the 11 gene assay outperforms other models (listed with their AUROC c statistics below in Tables 22-31), in which different coefficients were used for

30 ponderar las contribuciones de los 11 genes. 30 weigh the contributions of the 11 genes.


Tabla 22: Modelo alternativo n.º 1

Table 22: Alternative Model No. 1

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,4806 Riesgo 0,6755 -0.4806 Risk 0.6755

BRCA1 BRCA1
-0,2392 Riesgo -0.2392 Risk

CDC6 CDC6
-0,4906 Riesgo -0.4906 Risk

CDK2AP1 CDK2AP1
-0,0386 Riesgo -0.0386 Risk

ERBB3 ERBB3
0,4989 Protección 0.4989 Protection

FUT3 FUT3
-0,3274 Riesgo -0.3274 Risk

IL11 IL11
-0,2656 Riesgo -0.2656 Risk

LCK LCK
0,4071 Protección 0.4071 Protection

RND3 RND3
-0,2710 Riesgo -0.2710 Risk

SH3BGR SH3BGR
0,1232 Protección 0.1232 Protection

WNT3A WNT3A
0,3385 Protección 0.3385 Protection

Tabla 23: Modelo n.º 2 Table 23: Model No. 2

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,0718 Riesgo 0,6715 -0.0718 Risk 0.6715

BRCA1 BRCA1
-0,1588 Riesgo -0.1588 Risk

CDC6 CDC6
-0,4781 Riesgo -0.4781 Risk

CDK2AP1 CDK2AP1
-0,1202 Riesgo -0,1202 Risk

ERBB3 ERBB3
0,2770 Protección 0.2770 Protection

FUT3 FUT3
-0,2002 Riesgo -0,2002 Risk

IL11 IL11
-0,2237 Riesgo -0.2237 Risk

LCK LCK
0,2451 Protección 0.2451 Protection

RND3 RND3
-0,4197 Riesgo -0.4197 Risk

SH3BGR SH3BGR
0,1902 Protección 0,1902 Protection

WNT3A WNT3A
0,2869 Protección 0.2869 Protection


Tabla 24: Modelo n.º 3

Table 24: Model # 3

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,1630 Riesgo 0,6751 -0.1630 Risk 0.6751

BRCA1 BRCA1
-0,0783 Riesgo -0.0783 Risk

CDC6 CDC6
-0,4656 Riesgo -0.4656 Risk

CDK2AP1 CDK2AP1
-0,2018 Riesgo -0,2018 Risk

ERBB3 ERBB3
0,0551 Protección 0.0551 Protection

FUT3 FUT3
-0,0729 Riesgo -0.0729 Risk

IL11 IL11
-0,1818 Riesgo -0.1818 Risk

LCK LCK
0,0832 Protección 0.0832 Protection

RND3 RND3
-0,0685 Riesgo -0.0685 Risk

SH3BGR SH3BGR
0,2572 Protección 0.2572 Protection

WNT3A WNT3A
0,2354 Protección 0.2354 Protection


Tabla 25: Modelo n.º 4

Table 25: Model No. 4

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,4308 Riesgo 0,6385 -0.4308 Risk 0.6385

BRCA1 BRCA1
-0,1066 Riesgo -0.1066 Risk

CDC6 CDC6
-0,2033 Riesgo -0,2033 Risk

CDK2AP1 CDK2AP1
-0,1515 Riesgo -0.1515 Risk

ERBB3 ERBB3
0,2706 Protección 0.2706 Protection

FUT3 FUT3
-0,4905 Riesgo -0.4905 Risk

IL11 IL11
-0,4776 Riesgo -0.4776 Risk

LCK LCK
0,1602 Protección 0,1602 Protection

RND3 RND3
-0,2419 Riesgo -0.2419 Risk

SH3BGR SH3BGR
0,4835 Protección 0.4835 Protection

WNT3A WNT3A
0,2145 Protección 0.2145 Protection

Tabla 26: Modelo n.º 5 Table 26: Model No. 5

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,0220 Riesgo 0,6419 -0.0220 Risk 0.6419

BRCA1 BRCA1
-0,0262 Riesgo -0.0262 Risk

CDC6 CDC6
-0,1908 Riesgo -0.1908 Risk

CDK2AP1 CDK2AP1
-0,2331 Riesgo -0.2331 Risk

ERBB3 ERBB3
0,0487 Protección 0.0487 Protection

FUT3 FUT3
-0,3632 Riesgo -0.3632 Risk

IL11 IL11
-0,4358 Riesgo -0.4358 Risk

LCK LCK
0,4983 Protección 0.4983 Protection

RND3 RND3
-0,3906 Riesgo -0.3906 Risk

SH3BGR SH3BGR
0,0506 Protección 0.0506 Protection

WNT3A WNT3A
0,1630 Protección 0.1630 Protection


Tabla 27: Modelo n.º 6

Table 27: Model No. 6

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,0690 Riesgo 0,6652 -0.0690 Risk 0.6652

BRCA1 BRCA1
-0,0436 Riesgo -0.0436 Risk

CDC6 CDC6
-0,1157 Riesgo -0,1157 Risk

CDK2AP1 CDK2AP1
-0,2227 Riesgo -0.2227 Risk

ERBB3 ERBB3
0,2175 Protección 0.2175 Protection

FUT3 FUT3
-0,0998 Riesgo -0.0998 Risk

IL11 IL11
-0,1845 Riesgo -0.1845 Risk

LCK LCK
0,0266 Protección 0.0266 Protection

RND3 RND3
-0,2833 Riesgo -0.2833 Risk

SH3BGR SH3BGR
0,4528 Protección 0.4528 Protection

WNT3A WNT3A
0,3538 Protección 0.3538 Protection


Tabla 28: Modelo n.º 7

Table 28: Model No. 7

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,1602 Riesgo 0,6787 -0,1602 Risk 0.6787

BRCA1 BRCA1
-0,4631 Riesgo -0.4631 Risk

CDC6 CDC6
-0,1032 Riesgo -0.1032 Risk

CDK2AP1 CDK2AP1
-0,3042 Riesgo -0,3042 Risk

ERBB3 ERBB3
0,4957 Protección 0.4957 Protection

FUT3 FUT3
-0,4726 Riesgo -0.4726 Risk

IL11 IL11
-0,1426 Riesgo -0.1426 Risk

LCK LCK
0,3646 Protección 0.3646 Protection

RND3 RND3
-0,4320 Riesgo -0.4320 Risk

SH3BGR SH3BGR
0,0198 Protección 0.0198 Protection

WNT3A WNT3A
0,3023 Protección 0.3023 Protection

Tabla 29: Modelo n.º 8 Table 29: Model No. 8

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,2513 Riesgo 0,6882 -0.2513 Risk 0.6888

BRCA1 BRCA1
-0,3827 Riesgo -0.3827 Risk

CDC6 CDC6
-0,0907 Riesgo -0.0907 Risk

CDK2AP1 CDK2AP1
-0,3858 Riesgo -0.3858 Risk

ERBB3 ERBB3
0,2738 Protección 0.2738 Protection

FUT3 FUT3
-0,3453 Riesgo -0.3453 Risk

IL11 IL11
-0,1007 Riesgo -0,1007 Risk

LCK LCK
0,2027 Protección 0.2027 Protection

RND3 RND3
-0,0808 Riesgo -0.0808 Risk

SH3BGR SH3BGR
0,0869 Protección 0.0869 Protection

WNT3A WNT3A
0,2507 Protección 0.2507 Protection


Tabla 30: Modelo n.º 9

Table 30: Model No. 9

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BAG1
-0,3425 Riesgo 0,6717 -0.3425 Risk 0.6717

BRCA1 BRCA1
-0,3023 Riesgo -0.3023 Risk

CDC6 CDC6
-0,0782 Riesgo -0.0782 Risk

CDK2AP1 CDK2AP1
-0,4674 Riesgo -0.4674 Risk

ERBB3 ERBB3
0,0519 Protección 0.0519 Protection

FUT3 FUT3
-0,2181 Riesgo -0.2181 Risk

IL11 IL11
-0,0588 Riesgo -0.0588 Risk

LCK LCK
0,0407 Protección 0.0407 Protection

RND3 RND3
-0,2296 Riesgo -0.2296 Risk

SH3BGR SH3BGR
0,1539 Protección 0.1539 Protection

WNT3A WNT3A
0,1992 Protección 0.1992 Protection


Tabla 31: Modelo n.º 10

Table 31: Model No. 10

Gen Gen
Coeficiente Propiedad AUROC de la puntuación de riesgo Coefficient Property AUROC of the risk score

BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR WNT3A BAG1 BRCA1 CDC6 CDK2AP1 ERBB3 FUT3 IL11 LCK RND3 SH3BGR WNT3A
-0,4336 -0,2218 -0,0657 -0,0490 0,3301 -0,0909 -0,0169 0,3788 -0,3783 0,2209 0,1477 0,3686239 Riesgo Riesgo Riesgo Protección Riesgo Riesgo Protección Riesgo Protección Protección 0,6797 -0.4336 -0.2218 -0.0657 -0.0490 0.3301 -0.0909 -0.0169 0.3788 -0.3783 0.2209 0.1477 0,3686239 Risk Risk Risk Protection Risk Risk Protection Risk Risk Protection Protection 0.6797

Claims (6)

REIVINDICACIONES 1. Un método para proporcionar un pronóstico para el cáncer de pulmón no microcítico (CPNM) en un sujeto, 1. A method of providing a prognosis for non-small cell lung cancer (NSCLC) in a subject, comprendiendo el método las etapas de: 5 the method comprising the steps of: 5
(a) (to)
poner en contacto una muestra biológica del sujeto con reactivos que se unen de forma específica a cada miembro de un panel de biomarcadores que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A; y contacting a biological sample of the subject with reagents that specifically bind each member of a biomarker panel consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A; Y
(b) (b)
determinar una puntuación de riesgo del sujeto basada en los niveles de ácido nucleico de expresión de los determine a subject risk score based on the expression nucleic acid levels of the
10 biomarcadores en la muestra o determinar si los biomarcadores se expresan de forma diferencial o no a nivel de ácido nucleico en la muestra; y 10 biomarkers in the sample or determine whether biomarkers are differentially expressed or not at the level of nucleic acid in the sample; Y (c) proporcionar un pronóstico para el CPNM basado en la puntuación de riesgo del sujeto o en la expresión diferencial. (c) provide a prognosis for NSCLC based on the subject's risk score or differential expression. 15 2. Un método de determinación de un plan de tratamiento para un sujeto, comprendiendo el método las etapas de: 15 2. A method of determining a treatment plan for a subject, the method comprising the steps of: (a) poner en contacto una muestra biológica del sujeto con reactivos que se unen de forma específica a cada miembro de un panel de biomarcadores que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A; (a) contacting a biological sample of the subject with reagents that specifically bind each member of a biomarker panel consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A; 20 (b) determinar si los marcadores se expresan de forma diferencial o no a nivel de ácido nucleico en la muestra; 20 (b) determine whether the markers are expressed differentially or not at the level of nucleic acid in the sample;
(c)(C)
proporcionar un pronóstico para el CPNM;  provide a forecast for the NSCLC;
(d) (d)
determinar una evaluación de riesgo para la mortalidad a 5 años basada en el pronóstico para el CPNM; y determine a risk assessment for 5-year mortality based on the prognosis for NSCLC; Y
(e) (and)
idear un plan de tratamiento basado en la evaluación de riesgo. devise a treatment plan based on risk assessment.
25 3. El método de la reivindicación 1, en el que la expresión aumentada de BAG1, BRCA1, CDC6, CDK2AP1, FUT3, IL11 o RND3 contribuye a una puntuación de riesgo aumentada, y en el que la expresión aumentada de ERBB3, LCK, SH3BGR o WNT3A contribuye a una puntuación de riesgo disminuida, en el que una puntuación de riesgo aumentada indica un riesgo aumentado de mortalidad a largo plazo del sujeto. The method of claim 1, wherein the increased expression of BAG1, BRCA1, CDC6, CDK2AP1, FUT3, IL11 or RND3 contributes to an increased risk score, and wherein the increased expression of ERBB3, LCK, SH3BGR or WNT3A contributes to a decreased risk score, in which an increased risk score indicates an increased risk of long-term mortality of the subject.
30 4. El método de una cualquiera de las reivindicaciones 1 a 3, en el que el método comprende adicionalmente normalizar los niveles de expresión de los biomarcadores con respecto a genes constitutivos seleccionados del grupo que consiste en ESD, TBP, YAP1 y cualquier combinación de los mismos, y, de forma opcional, los niveles de expresión de los biomarcadores se normalizan frente al valor de CT promedio de los genes constitutivos. The method of any one of claims 1 to 3, wherein the method further comprises normalizing the expression levels of the biomarkers with respect to constitutive genes selected from the group consisting of ESD, TBP, YAP1 and any combination of the same, and, optionally, the levels of expression of the biomarkers are normalized against the average CT value of the constitutive genes.
35 5. El método de una cualquiera de las reivindicaciones 1 a 4, en el que los reactivos son ácidos nucleicos, oligonucleótidos o conjuntos de cebadores de PCR. The method of any one of claims 1 to 4, wherein the reagents are nucleic acids, oligonucleotides or sets of PCR primers.
6. El método de una cualquiera de las reivindicaciones 1 a 5, en el que el CPNM es CPNM no escamoso. 6. The method of any one of claims 1 to 5, wherein the NSCLC is non-squamous NSCLC.
40 7. El método de la reivindicación 6, en el que: The method of claim 6, wherein:
(a)(to)
el CPNM no escamoso es de estadio I;  the non-squamous NSCLC is stage I;
(b)(b)
el CPNM no escamoso es de estadio II;  non-squamous NSCLC is stage II;
(c)(C)
el CPNM no escamoso es de estadio III; o 45 (d) el CPNM no escamoso es de estadio IV.  the non-squamous NSCLC is stage III; or 45 (d) the non-squamous NSCLC is stage IV.
8. El método de una cualquiera de las reivindicaciones 1 a 7, en el que la muestra es de un tumor extirpado de forma quirúrgica, de tejido pulmonar o una biopsia de tumor pulmonar. 8. The method of any one of claims 1 to 7, wherein the sample is from a surgically removed tumor, from lung tissue or a lung tumor biopsy.
50 9. El método de una cualquiera de las reivindicaciones 1 a 8, en el que el pronóstico proporciona una evaluación de riesgo y opcionalmente la evaluación de riesgo es para una mortalidad a 5 años. The method of any one of claims 1 to 8, wherein the prognosis provides a risk assessment and optionally the risk assessment is for a 5-year mortality.
10. El método de la reivindicación 9, en el que el pronóstico proporciona: 10. The method of claim 9, wherein the forecast provides: 55 a) una evaluación de riesgo alto para la mortalidad a 5 años; b) una evaluación de riesgo intermedio para la mortalidad a 5 años; o c) una evaluación de riesgo bajo para la mortalidad a 5 años. 55 a) a high risk assessment for 5-year mortality; b) an intermediate risk assessment for 5-year mortality; or c) a low risk assessment for 5-year mortality. 11. Un kit que comprende reactivos que se unen de forma específica a cada miembro de un panel de biomarcadores 11. A kit comprising reagents that specifically bind each member of a biomarker panel 60 que consiste en BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR y WNT3A, en el que los reactivos son conjuntos de cebadores de PCR. 60 consisting of BAG1, BRCA1, CDC6, CDK2AP1, ERBB3, FUT3, IL11, LCK, RND3, SH3BGR and WNT3A, in which the reagents are sets of PCR primers. 12. Uso del kit de la reivindicación 11 en el método de una cualquiera de las reivindicaciones 1-10. 12. Use of the kit of claim 11 in the method of any one of claims 1-10.
Nombre del gen Cromosoma Secuencia de referencia Emplazamiento de la proteína Funciones y rutas biológicas relevantes Papel del algoritmo Gene name Chromosome Reference sequence Protein site Functions and relevant biological routes Role of the algorithm
BAG1 BAG1
Atanogen asociado con BCL2 9p12 NM_004323 Citoplasma Apoptosis, señalización ligada al receptor de superficie celular Pronóstico Atanogen associated with BCL2 9p12 NM_004323 Cytoplasm Apoptosis, cell surface receptor linked signaling Forecast
BRCA1 BRCA1
Cáncer de mama 1, inicio temprano 17q21-q24 NM_007294 Núcleo Inducción de apoptosis; ubiquitinación de proteínas; regulación de los puntos de control de daño de ADN de la transición G2/N; regulación de la reparación de ADN Pronóstico Breast cancer 1, early onset 17q21-q24 NM_007294 Nucleus Induction of apoptosis; protein ubiquitination; regulation of the DNA damage control points of the G2 / N transition; DNA repair regulation Forecast
CDC6 CDC6
Homólogo de ciclo de división celular 6 17q21.3 NM_001254 Núcleo Regulación de la transcripción implicada en la fase G1/S del ciclo celular mitótico; regulación de la proliferación celular Pronóstico Cell division cycle counterpart 6 17q21.3 NM_001254 Nucleus Regulation of transcription involved in the G1 / S phase of the mitotic cell cycle; regulation of cell proliferation Forecast
CDK2AP1 CDK2AP1
Proteína 1 asociada a a la quinasa dependiente de ciclina 2 12q24 NM_004642 Núcleo Regulación de la fase S del ciclo celular mitótico; replicación de ADN dependiente de ADN Pronóstico Protein 1 associated with cyclin-dependent kinase 2 12q24 NM_004642 Nucleus Regulation of the S phase of the mitotic cell cycle; DNA dependent DNA replication Forecast
ERBB3 ERBB3
Homólogo 3 del oncogén vírico de leucemia eritroblástica V-erb-b2 12q13 NM_001982 Membrana citplasmática Regulación de la adhesión celular; señalización del receptor de la proteína tirosina quinasa transmembrana, regulación de la cascada de fosfoinositida-3-quinasa; regulación de la proliferación celular Pronóstico Homologous 3 of the viral oncogene of erythroblastic leukemia V-erb-b2 12q13 NM_001982 Cytoplasmic membrane Regulation of cell adhesion; transmembrane tyrosine kinase protein receptor signaling, phosphoinositide-3-kinase cascade regulation; regulation of cell proliferation Forecast
FUT3 FUT3
Fucosiltransferasa 3 19q13.3 NM_000149 Citoplasma Metabolismo de hidratos de carbono; glucosilación de aminoácidos proteicos Pronóstico Fucosyltransferase 3 19q13.3 NM_000149 Cytoplasm Carbohydrate metabolism; glycosylation of protein amino acids Forecast
IL11 IL11
Interleucina 11 19q13.3-q13.4 NM_000641 Extracelular Regulación de la proliferación celular; diferenciación de linfocitos B; diferenciación de megacariocitos, regulación de la fosforilación de peptidil serina; regulación de la cascada MAPKKK Pronóstico Interleukin 11 19q13.3-q13.4 NM_000641 Extracellular Regulation of cell proliferation; B lymphocyte differentiation; megakaryocyte differentiation, phosphorylation regulation of peptidyl serine; MAPKKK waterfall regulation Forecast
LCK LCK
Proteína tirosina quinasa específica de linfocitos 1q34.3 NM_001042771 Citoplasma Inducción de apoptosis; activación de la actividad caspasa; regulación de la señalización del receptor de linfocitos T; migración de leucocitos Pronóstico Lymphocyte-specific tyrosine kinase protein 1q34.3 NM_001042771 Cytoplasm Induction of apoptosis; activation of caspase activity; regulation of T cell receptor signaling; leukocyte migration Forecast
RND3 RND3
GTPasa 3 de la familia Rho 2q23.3 NM_005168 Citoplasma Adhesión celular; transducción de señal mediada por GTPasa pequeña; organización del citoesqueleto de actina Pronóstico GTPase 3 of the Rho family 2q23.3 NM_005168 Cytoplasm Cell adhesion; Small GTPase-mediated signal transduction; organization of the actin cytoskeleton Forecast
SH3BGR SH3BGR
Proteína rica en ácido glutámico de unión al dominio SH3 21q22.3 NM_007341 Citoplasma Ensamblaje de complejos proteicos Pronóstico Protein rich in glutamic acid binding to the SH3 domain 21q22.3 NM_007341 Cytoplasm Assembly of protein complexes Forecast
WNT3A WNT3A
Familia de sitio de integración de MMTV de tipo Wingless, miembro 3A 1q42 NM_033131 Extracelular Señalización del receptor canónico Wnt; desarrollo de organismos multicelulares; regulación de la proliferación y diferenciación celulares; regulación de la translocación nuclear de la proteína catenina Pronóstico Wingless type MMTV integration site family, member 3A 1q42 NM_033131 Extracellular Wnt canonical receiver signaling; development of multicellular organisms; regulation of cell proliferation and differentiation; regulation of nuclear translocation of catenin protein Forecast
ESD ESD
Esterasa D 13q14.1-q14.2 NM_001984 Citoplasma Reciclado de ácidos siálicos; hidrólisis de serina Referencia Esterase D 13q14.1-q14.2 NM_001984 Cytoplasm Recycling sialic acids; serine hydrolysis Reference
TBP TBP
Proteína de unión a la caja TATA 6q27 NM_003194 Núcleo Inicio de la transcripción a partir del promotor de la ARN polimerasa II; elongación de ARN a partir de promotor de la ARN polimerasa II; transcripción a partir de promotor del ARN polimerasa III Referencia TATA box binding protein 6q27 NM_003194 Nucleus Start of transcription from the RNA polymerase II promoter; RNA elongation from RNA polymerase II promoter; transcription from RNA polymerase III promoter Reference
YAP1 YAP1
Proteína asociada a Yes 1 11q13 NM_006106 Núcleo Cascada de señalización de hippo; regulación de la transcripción; inhibición por contacto Referencia Protein associated with Yes 1 11q13 NM_006106 Nucleus Hippo signaling waterfall; transcription regulation; contact inhibition Reference
Figura 4  Figure 4
ES12807429.1T 2011-07-01 2012-06-29 Multigenic prognosis test for lung cancer Active ES2658921T3 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201161504063P 2011-07-01 2011-07-01
US201161504063P 2011-07-01
US201161504193P 2011-07-02 2011-07-02
US201161504193P 2011-07-02
PCT/US2012/045139 WO2013006503A1 (en) 2011-07-01 2012-06-29 Multigene prognostic assay for lung cancer

Publications (1)

Publication Number Publication Date
ES2658921T3 true ES2658921T3 (en) 2018-03-12

Family

ID=47437384

Family Applications (1)

Application Number Title Priority Date Filing Date
ES12807429.1T Active ES2658921T3 (en) 2011-07-01 2012-06-29 Multigenic prognosis test for lung cancer

Country Status (9)

Country Link
US (1) US9476098B2 (en)
EP (1) EP2726635B1 (en)
CN (1) CN103998622A (en)
AU (1) AU2012279173B2 (en)
DK (1) DK2726635T3 (en)
ES (1) ES2658921T3 (en)
HU (1) HUE036585T2 (en)
PL (1) PL2726635T3 (en)
WO (1) WO2013006503A1 (en)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103998622A (en) 2011-07-01 2014-08-20 加利福尼亚大学董事会 Multigene prognostic assay for lung cancer
EP2726609A4 (en) * 2011-07-01 2015-03-04 Pinpoint Genomics Inc Method for extracting rna from fixed embedded tissue
US20160019337A1 (en) * 2013-03-15 2016-01-21 Htg Molecular Diagnostics, Inc. Subtyping lung cancers
US9526611B2 (en) 2013-10-29 2016-12-27 Tendyne Holdings, Inc. Apparatus and methods for delivery of transcatheter prosthetic valves
CN105985422A (en) * 2015-01-30 2016-10-05 天津奥维亚生物技术有限公司 Human SH3BGR polypeptide and preparation method for antibody thereof
EP3695810B1 (en) 2015-04-16 2022-05-18 Tendyne Holdings, Inc. Apparatus for retrieval of transcatheter prosthetic valves
CN105929164B (en) * 2016-06-30 2018-06-26 四川大学华西医院 A kind of screening lung cancer kit
CN105954517B (en) * 2016-06-30 2018-09-18 四川大学华西医院 A kind of screening lung cancer kit
CN106119405B (en) * 2016-08-31 2019-11-12 广州万德基因医学科技有限公司 A kind of prognostic markers object of lung cancer, the method and application for using label prediction lung cancer for prognosis
BR112021012073A2 (en) * 2018-12-21 2021-10-19 Biomark Cancer Systems Inc. BIOMARKER PANEL, AND, USE OF THE BIOMARKER PANEL
CN109859801B (en) * 2019-02-14 2023-09-19 辽宁省肿瘤医院 Model for predicting lung squamous carcinoma prognosis by using seven genes as biomarkers and establishing method
US11648110B2 (en) 2019-12-05 2023-05-16 Tendyne Holdings, Inc. Braided anchor for mitral valve
US11648114B2 (en) 2019-12-20 2023-05-16 Tendyne Holdings, Inc. Distally loaded sheath and loading funnel
US11951002B2 (en) 2020-03-30 2024-04-09 Tendyne Holdings, Inc. Apparatus and methods for valve and tether fixation
CN111564177B (en) * 2020-05-22 2023-03-31 四川大学华西医院 Construction method of early non-small cell lung cancer recurrence model based on DNA methylation
CN112037863B (en) * 2020-08-26 2022-06-21 南京医科大学 Early NSCLC prognosis prediction system
CN114438188A (en) * 2021-11-29 2022-05-06 中国辐射防护研究院 Use of hypermethylated CDK2AP1 gene as molecular marker for alpha radiation damage prediction

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6019944A (en) 1992-05-21 2000-02-01 Biosite Diagnostics, Inc. Diagnostic devices and apparatus for the controlled movement of reagents without membranes
US7955800B2 (en) * 2002-06-25 2011-06-07 Advpharma Inc. Metastasis-associated gene profiling for identification of tumor tissue, subtyping, and prediction of prognosis of patients
US20100240035A1 (en) * 2007-06-01 2010-09-23 The Regents Of The University Of California Multigene prognostic assay for lung cancer
CN103237901B (en) * 2010-03-01 2016-08-03 卡里斯生命科学瑞士控股有限责任公司 For treating the biomarker of diagnosis
CN103998622A (en) 2011-07-01 2014-08-20 加利福尼亚大学董事会 Multigene prognostic assay for lung cancer

Also Published As

Publication number Publication date
AU2012279173A1 (en) 2013-05-09
DK2726635T3 (en) 2018-02-12
US20130059747A1 (en) 2013-03-07
EP2726635A1 (en) 2014-05-07
CN103998622A (en) 2014-08-20
HUE036585T2 (en) 2018-07-30
EP2726635A4 (en) 2015-02-18
AU2012279173B2 (en) 2016-06-16
WO2013006503A1 (en) 2013-01-10
PL2726635T3 (en) 2018-04-30
US9476098B2 (en) 2016-10-25
EP2726635B1 (en) 2017-11-08

Similar Documents

Publication Publication Date Title
ES2658921T3 (en) Multigenic prognosis test for lung cancer
JP5988934B2 (en) Multigene prognostic assay for lung cancer
ES2581841T3 (en) Markers for gastric cancer detection
ES2481672T3 (en) Markers for gastric cancer detection
JP5439494B2 (en) Identification of signature genes associated with hepatocellular carcinoma
ES2424329T3 (en) Molecular diagnosis and classification of malignant melanoma
US20080280302A1 (en) Multigene diagnostic assay for malignant thyroid neoplasm
US20160090638A1 (en) Methods of prognostically classifying and treating glandular cancers
TW201343920A (en) Molecular markers for prognostically predicting prostate cancer, method and kit thereof
CA2628390A1 (en) Molecular profiling of cancer
BRPI0707642A2 (en) Urine Gene Expression Rates for Cancer Detection
CN102428184A (en) Marker for prognosis of liver cancer
Zhang et al. A prospective multicentre phase III validation study of AZGP1 as a biomarker in localized prostate cancer
CN109402252A (en) Acute myeloid leukemia risk assessment gene marker and its application
CN113774140A (en) Product for predicting sensitivity of colorectal cancer to oxaliplatin treatment
JP7150018B2 (en) Novel CIP2A variants and uses thereof
US8257716B2 (en) Anti-PDEF antibodies and uses thereof
CN113817829A (en) Use of biomarkers for the preparation of a product for predicting the sensitivity of colorectal cancer to treatment with oxaliplatin
KR101994790B1 (en) Composition for diagnosing cancer
US20150011411A1 (en) Biomarkers of cancer
CN113817830A (en) Method for predicting the sensitivity of colorectal cancer to treatment with oxaliplatin
CN113684278A (en) Biomarker for predicting sensitivity of colorectal cancer to treatment with oxaliplatin and application thereof
CN113846165A (en) Application of biomarker in prediction of sensitivity of colorectal cancer to oxaliplatin treatment
CN113667755A (en) Oxaliplatin-related biomarkers