WO2014163444A1 - 국소 진행형 위암에 대한 예후 예측 시스템 - Google Patents

국소 진행형 위암에 대한 예후 예측 시스템 Download PDF

Info

Publication number
WO2014163444A1
WO2014163444A1 PCT/KR2014/002958 KR2014002958W WO2014163444A1 WO 2014163444 A1 WO2014163444 A1 WO 2014163444A1 KR 2014002958 W KR2014002958 W KR 2014002958W WO 2014163444 A1 WO2014163444 A1 WO 2014163444A1
Authority
WO
WIPO (PCT)
Prior art keywords
gastric cancer
expression
gene
value
prognostic
Prior art date
Application number
PCT/KR2014/002958
Other languages
English (en)
French (fr)
Inventor
허용민
노성훈
정재호
서진석
박은성
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to JP2016506252A priority Critical patent/JP6280206B2/ja
Priority to CN201480024658.4A priority patent/CN105431737B/zh
Priority to US14/782,515 priority patent/US20160063179A1/en
Priority to EP14779566.0A priority patent/EP2982985B1/en
Publication of WO2014163444A1 publication Critical patent/WO2014163444A1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6834Enzymatic or biochemical coupling of nucleic acids to a solid phase
    • C12Q1/6837Enzymatic or biochemical coupling of nucleic acids to a solid phase using probe arrays or probe chips
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57446Specifically defined cancers of stomach or intestine
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Definitions

  • the present invention relates to a novel prognostic prediction system capable of predicting prognosis of locally advanced gastric cancer through comparative gene expression analysis.
  • Gastric adeno-carcinoma is the second leading cause of death in 700,349 people in 2000, the fourth most commonly diagnosed cancer in the world. It is considered a single heterogeneous disease with several epidemiological and histopathological features. Gastric cancer treatment is primarily based on clinical parameters such as tumor, node, metastasis staging, which determines whether the patient should be treated with surgery alone or with surgery and chemotherapy. Gastric cancer, unlike breast cancer and colon cancer, clearly varies from stage 1 to stage 4 according to the TNM staging system. In other words, the 5-year survival rate is greater than 90% in the first stage, and less than 20% in the fourth stage.
  • the prognostic predictive power of the TNM staging system is very good [Ref., 7th edition of the AJCC cancer staging Manual: stomach. Ann Surg Oncol 2010; 17: 3077-3079.
  • gastric cancer is often divided into Early Gastric Cancer, Locally Advanced Gastric Cancer, Locally Advanced Invasive Gastric Cancer, and Metastatic Gastric Cancer. .
  • lymph node metastasis Tumor infiltration and depth of lymph node metastasis are two major prognostic factors in gastric cancer. More than 50% of gastric cancer patients have lymph node metastases at diagnosis, and less than 30% have a poor prognosis with 5 year survival. Therefore, accurate classification of lymph node metastasis from gastric cancer patients is of fundamental importance for subsequent treatment decisions following radical gastrectomy.
  • lymph node status alone does not explain the heterogeneity of postoperative prognostic outcomes and the task of chemotherapy agents. Even patients with the same stage, including the same lymph node stage, do not have the same prognostic outcome. Thus, clear biological differences between tumors that are responsible for inherent clinical heterogeneity are the most important steps in developing new therapeutic strategies for gastric cancer.
  • gastric cancer is a heterogeneous disease with differences in epidemiology and histopathology.
  • the prognostic outcome of gastric cancer is primarily influenced by the stage, although there are many other prognostic factors, including gastric cancer subtypes such as diffuse and intestinal types.
  • gastric cancer subtypes such as diffuse and intestinal types.
  • gastric cancer subtypes such as diffuse and intestinal types.
  • the identification of genetic features that contribute to differences in prognostic outcomes within the same stage is very important in selecting treatment options for patients.
  • most of the genetic features already developed have not been used in the clinic because of the lack of reproducibility and the lack of information available for the selection of treatment options.
  • prognostic predictive factors Another important factor that bothers the introduction of these prognosis is that none of these prognosis can control the staging in defining the prognostic outcomes of gastric cancer patients. Therefore, the introduction of prognostic predictive factors is inevitably necessary in patients of the same stage.
  • the object of the present invention is to identify important biological features that influence the clinical outcome of gastric cancer patients in locally advanced gastric cancer, especially in N0 regional lymph node metastasis, and to establish a new prognosis based on gene expression risk score (Rsk Score, RS). To provide a prediction system.
  • the present invention provides a GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38 Determining the expression level of RNA transcripts of PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 and RRM1; And calculating a risk score (RS) and an RS percentage (RS (%)) of the biological sample based on the expression level of the RNA transcript determined in the step, and determining the prognosis according
  • the invention also relates to GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, in a biological sample comprising cancer cells obtained from a subject.
  • CRYAB TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLR Measuring the expression level of RNA transcripts of IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 and RRM1; And determining that increased expression of the transcript is an increase in the likelihood of a positive clinical outcome, the method of predicting prognosis in a subject diagnosed with gastric cancer.
  • the prognostic method may be to predict the clinical outcome after resection by surgery of T1NO, T2N0, T3N0 or T4N0 stage advanced gastric cancer in TNM staging.
  • the present invention also provides a computer-readable recording medium recording a program for performing prognostic prediction of gastric cancer, comprising: GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1 , CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2CM HMMR Determining the expression level of RNA transcripts of SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 and RRM1; And calculating a risk score (RS) and an RS percentage (RS (%)) of the sample based on the expression level of the
  • the recording medium may predict clinical results after resection by surgical treatment of T1NO, T2N0, T3N0, or T4N0 stage advanced gastric cancer in TNM staging.
  • the RS and RS (%) can be calculated according to the following equations (1) and (2):
  • RS (%) 100 ⁇ (RS of biological sample-RS minimum of population) / (RS maximum of population-RS minimum of population)
  • HR n represents a hazard ratio of the nth RNA transcript, and when HR n is less than 1, it is converted to -1 / HR n and used.
  • normLogTransValue n is a value related to the expression of RNA transcripts, and this value is a value that is scaled around the median of the entire value of the gene.
  • the population refers to a certain number of populations with T1NO, T2N0, T3N0, or T4N0 regionally advanced gastric cancer with no lymph node metastasis in the TNM staging, where a certain number is sufficient to yield the highest and lowest RS. Is an arbitrary integer.
  • the present invention creates a predictive model in terms of overall survival rate of stage N0 gastric cancer patients in the TNM stage, and then determines the expression level of RNA transcripts that affects statistically significant survival, thereby creating a risk rating system to calculate prognostic indicator values. In this way, the clinical outcome after resection by gastric cancer surgery can be predicted.
  • the present invention enables the analysis of the gene group according to the biological function of gastric cancer itself by using a gene aggregation system according to the biological function of the gene.
  • Figures 1a-d show the prognostic results of two major clusters made by unsupervised hierarchical clustering analysis using probes after dispersion filtration, and a) shows the number of probes used in unsupervised hierarchical clustering analysis after dispersion filtration and clustering analysis.
  • M2_3 is a cluster resulting from the selection of probes with at least three samples showing at least two times higher or lower expression relative to the mean value followed by dispersion filtration.
  • b) is the distribution of patient samples of the two main clusters after dispersion filtration. In the log rank test, we comment on the good and bad prognosis and clustering analysis of the samples of the two main classes.
  • c) shows Kaplan Meier Plot of M2_5 cluster patients. P-values were obtained after log rank test.
  • d) shows Kaplan Meier Plot of M3_3 cluster patients. P-values were obtained after log rank test.
  • Figure 2 shows two major representative clusters made according to unsupervised hierarchical clustering analysis after dispersion filtration.
  • the clustering analysis for M2_5 was made of 1556 probes filtered after filtering probes with at least 5 samples showing more than twofold increase or decrease relative to the mean value.
  • Clustering analysis for M3_3 was made with 706 probes filtered after filtering probes with at least three samples showing an increase or decrease more than three times the mean value.
  • Figure 3 shows the genetic and biological characteristics showing significant differences in comparison of the two main classes after unsupervised clustering analysis, A) is statistically significant in comparison of the two main classes made by the clustering analysis of M2_5 (p ⁇ 0.001 And a heat map of conditional clustering using probes showing a 2-fold difference, 554 probes). B) shows a heat map of conditional clustering using probes showing statistical significance (p ⁇ 0.001 and 2 fold differences, 453 probes) in a comparison of the two main classes made by clustering analysis of M3_3.
  • 5A-F show the expression of genes showing a significant increase in GSEA results (p ⁇ 0.001), with the heat map showing the average expression level of each taxon of M2_5.
  • 6A-F show the expression of genes showing significant increase in GSEA results (p ⁇ 0.001), with heat maps showing the average expression level of each taxon of M3_3.
  • Figure 7a-i shows the prognostic prediction of NO gastric cancer patients according to the classification of M3_3.
  • the probes differ significantly in the comparison of the two classes defined by the M3_3 cluster (p ⁇ 0.001).
  • Three different prediction algorithms CCP, LDA, and NC) were used for this analysis. Single residual cross validation was used to estimate the prediction error of each model. Prognostic differences were estimated using log rank test.
  • A-C described in FIGS. 7A-I show the Kaplan Meier Plot of the predicted results of Training data (YUSH data).
  • D-F) shows the Kaplan Meier Plot of the predicted results of the MDACC data.
  • G-I) represents the Kaplan Meier Plot of the predicted results of total sample data (YUSH data and MDACC data).
  • FIGS. 8A-I show the prognosis prediction of NO gastric cancer patients according to M2_5 taxon. Probes are significantly different (p ⁇ 0.001) in the comparison of the two classes defined by the M2_5 cluster. Three different prediction algorithms (CCP, LDA, and NC) were used for this analysis. Single residual cross validation was used to estimate the prediction error of each model. Prognostic differences were estimated using log rank test.
  • A-C described in FIGS. 8A-I show the Kaplan Meier Plot of the predicted results of Training data (YUSH data).
  • D-F) shows the Kaplan Meier Plot of the predicted results of the validation data (MDACC data).
  • G-I) represents the Kaplan Meier Plot of the predicted results of total sample data (YUSH data and MDACC data).
  • Figures 9a-b show the effect of functional gene classification predetermined by CGAP in the prognostic outcome of NO gastric cancer patients, and A) described in Figures 9a-b are functionally sorted by CGAP in YUSH, MDACC and the total data set.
  • the prognostic result of the gene Unsupervised hierarchical clustering analysis was performed using the genes in functional gene classification of CGAP. The prognostic differences of the major clusters were compared according to the log rank test. The p-value of the log rank test was changed to the log p-value and represented by a bar graph.
  • B) is a biological feature that represents the difference of major clusters in each functional gene classification. GSEA was performed and the statistical significance of GSEA was expressed in logarithmic p-values.
  • FIGS. 10A-C illustrate the formation of a percentage of risk rating system.
  • A) described in FIGS. 10A-C shows a heat map of mortality defined by predictive models and functional gene classification of CGAP. All samples were annotated with mortality for each taxa defined by taxon or cluster, and an unsupervised clustering analysis was performed to check the effect of each taxonomy of patient distribution and functional biology on prognostic results.
  • B) is the percentage of each patient's risk score in the total sample data set.
  • C) is the percentage of each patient's risk score in the YUSH sample data set.
  • D) is the percentage of each patient's risk score in the MDACC sample data set.
  • E-G represents Kaplan Meier Plot of three different risk groups (High, Intermediate and Low Risk Group) defined as% risk scores from three different data sets (YUSH, MDACC and total sample data sets). The significance of the prognostic differences between the three different risk groups was defined according to the log rank test.
  • the analysis identified two other biological features (cytoproliferation and immune response) that are primarily responsible for the prognostic differences in patients with NO stage gastric cancer, and these two biological features were associated with the functional gene classification of taxa or CGAP based on variance filtration. Regardless, it's generally preserved. Validation of these taxa, which represent the biological characteristics of cell proliferation and immunoactivation, was performed on an independent data set and showed a similar prognosis result as the Training data set in the log rank test. As a result of experiment of corrected prognostic ratio by single residual cross-validation method, it ranged from 85% to 96% according to the type of classification group and prognostic prediction algorithm.
  • CTLA-4 is an important immune-checkpoint receptor and downregulates the magnitude of T cell activation.
  • CTLA-4 antibodies have been approved by the US FDA for immunotherapy and clinical studies with antagonistic CTLA4 antibodies have demonstrated survival advantages in patients with advanced melanoma.
  • antagonistic CTLA4 antibodies into the treatment of gastric cancer patients may be another therapeutic option for patients with poor prognostic outcomes in early NO patients.
  • the genetic features identified in the present invention can serve as a guide for selecting the correct patient for the treatment option.
  • the inventors have demonstrated that two other biological features, consisting primarily of cell proliferation and immune response, are the major biological features that contribute to the prognostic outcome of patients with NO stage gastric cancer. Based on these findings, we propose that the introduction of immunotherapies in gastric cancer patients and the basis of genetic characteristics in order to obtain the maximum benefit for immunotherapy in selecting patients for these treatments.
  • the present invention provides a biological sample comprising cancer cells obtained from a subject.
  • RS risk score
  • RS percentage RS (%)
  • the method for predicting prognosis according to the present invention is a group of functionally classified genes found in the Cancer Genome Anatomy Project (CGAP) among genes related to immunoactivation and cell proliferation, two main biological characteristics that govern the clinical outcome of gastric cancer patients.
  • CGAP Cancer Genome Anatomy Project
  • genes having statistical significance (p ⁇ 0.001) in Cox regression analysis were selected as gene targets related to prognosis, and the risk ratios of the genes were multiplied by the expression values of the genes.
  • the prognosis may be predicted in a subject diagnosed as gastric cancer by classifying a high risk group in the case of 25% or more and less than 50% and a low risk group in the case of less than 25%.
  • the RS and RS (%) can be calculated according to the following equations (1) and (2):
  • RS (%) 100 ⁇ (RS of biological sample-RS minimum of population) / (RS maximum of population-RS minimum of population)
  • HR n represents a hazard ratio of the nth RNA transcript, and when HR n is less than 1, it is converted to -1 / HR n and used.
  • normLogTransValue n is a value related to the expression of RNA transcripts, and this value is a value that is scaled around the median of the entire value of the gene.
  • the population refers to a certain number of populations with T1NO, T2N0, T3N0, or T4N0 regionally advanced gastric cancer with no lymph node metastasis in the TNM staging, where a certain number is sufficient to yield the highest and lowest RS. Is an arbitrary integer.
  • the number of the population is not particularly limited, and in one embodiment, 158 T1NO, T2N0, T3N0, T3N0, or T4N0 stages of advanced gastric cancer tissue without lymph node metastasis were used as TNM staging.
  • the term Hazard Ratio refers to a coefficient that reflects the contribution to cancer progression, recurrence, or therapy response.
  • the risk factor can be derived by various statistical techniques.
  • the risk factor, HR value can be determined in various statistical models, for example in a multivariate Cox proportional risk regression.
  • the HR value when the HR value is greater than or equal to 1, the HR value may be used as it is, and when the HR value is less than 1, ⁇ 1 / HR may be used.
  • the expression value of the RNA transcript means a value related to the expression of an individual gene, ie, an RNA transcript.
  • the value can be determined using a variety of known statistical means.
  • the expression value may be a value after quantile normalization after transforming p value measured by Cox regression to a log2 function value.
  • the expression value used in Equation 1 was used to change the scale around the intermediate value for the entire value of the gene.
  • the RS can be determined as follows:
  • RS -GART ⁇ 3.584 + PTN ⁇ 3.631-PCNA ⁇ 2.7027 + GLI3 ⁇ 4.073 + SMARCD3 ⁇ 2.266-SULT1A3 ⁇ 3.278 + ILK ⁇ 2.251-FUCA1 ⁇ 2.80899 + PKD1 ⁇ 2.827-TOP2A ⁇ 1.7668 + ABL1 ⁇ 2.784-CKS2 ⁇ 1.9685 + FZD1 ⁇ 4.302-TIAL1 ⁇ 4.2553 + SGCD ⁇ 2.494-PIGF ⁇ 2.6525-CCNB1 ⁇ 2.4272-CSK ⁇ 3.2573 + CRYAB ⁇ 1.524 + TPM1 ⁇ 2.975-RFC4 ⁇ 2.817 + GUCY1B3 ⁇ 2.801-TYMS ⁇ 2.0617-FEN1 ⁇ 2.3148 + GNAI ⁇ 2.758 + CSRP1 ⁇ 1.642-UNG ⁇ 2.695 + AXL ⁇ 2.0
  • RS calculated according to Equation 1 may be represented by RS (%) according to Equation 2.
  • a sample with the above RS (%) of 50% or more in terms of overall survival (OS) is at high risk, more than 25% and less than 50% medium risk, 25 Less than% is classified as low risk.
  • the high risk group is considered to have a bad prognosis and the low risk group is a good prognosis.
  • the high-risk group with a sample with an RS (%) value of at least 50% has a low overall survival rate for a period of at least 3 years, at least 6 years, and at least 10 years. This means that overall survival is high for at least 10 years.
  • good prognosis can be expressed as an increase in the likelihood of a positive clinical outcome of a clinical outcome
  • a bad prognosis can be expressed as a decrease in the likelihood of a positive clinical outcome of a clinical outcome.
  • the method may be useful for predicting clinical outcome after surgery for surgical treatment of stage N0 gastric cancer patients in a TNM stage, such as stage T0N0, T2N0, T3N0 or T4N0 stage advanced gastric cancer.
  • the genes used in the prognostic prediction method of the present invention can be divided into a set of genes involved in immune response and cell proliferation, and statistically significant expression increases in a good prognosis group.
  • Gene sets involved in immune response GART, PTN, SULT1A3, FUCA1, PKD1, ABL1, TIAL1, SGCD, PIGF, CSK, CRYAB, TPM1, GUCY1B3, GNAI1, CSRP1, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, CD38, GLRB, IFNAR2, HSPA2, CLN3, BUB1, ATF4, and RRM1
  • Gene sets involved in the immune response are mainly antigen processing and presentation (MHC pathway) and IFN gamma signaling pathways, in addition to Th1 / Th2 differentiation (TH1TH2 pathway), CTL mediated immune response to target cells (CTL pathway), NO2-dependent IL12 pathway (NO2IL12 pathway) in NK cells, Tob's role in T cell activation (TOB1 pathway), IL12 and Stat4-dependent signaling pathways (IL12 pathway) and Th cytotoxic cell surface molecules (T cytotoxic pathway in Th1 development) Related to).
  • MHC pathway antigen processing and presentation
  • IFN gamma signaling pathways in addition to Th1 / Th2 differentiation
  • CTL pathway CTL mediated immune response to target cells
  • NO2IL12 pathway NO2-dependent IL12 pathway
  • TOB1 pathway Tob's role in T cell activation
  • IL12 and Stat4-dependent signaling pathways IL12 pathway
  • Th cytotoxic cell surface molecules T cytotoxic pathway in Th1 development
  • the gene set involved in cell proliferation / DNA repair is responsible for the role of BRCA1, BRCA2 and ATR in cancer susceptibility (ATR BRCA pathway), cdc25 and chk1 regulatory pathways, cyclin and cell cycle regulation (in response to DNA damage (cdc25 pathway)).
  • Cell cycle pathway cyclin E disruption pathway (FBW7 pathway), cell cycle: G1 / S checkpoint (G1 pathway), cell cycle: G2 / M checkpoint (G2 pathway), CDK regulation (MCM pathway), cell cycle progression P27 phosphorylation regulation (P27 pathway), Sonic Hedgehog (SHH) receptor Ptc1 (PTC1 pathway), which regulates cell cycle, RB tumor suppressor / checkpoint signaling (RB pathway), and E2F1 disruption pathway in response to DNA damage (SKP2 E2F pathway).
  • the invention also relates to a biological sample comprising cancer cells obtained from a subject.
  • the increase in expression of the transcript provides a method of predicting prognosis in a subject diagnosed as gastric cancer, comprising determining an increase in the likelihood of a positive clinical outcome.
  • the method may be an array based method.
  • the expression level may be one that is normalized to the expression level of one or more RNA transcripts.
  • the clinical result may be expressed in terms of overall survival (OS).
  • OS overall survival
  • the method can predict the prognosis by measuring the expression level of the entire RNA transcript and analyzing the increase in expression to determine the increase or decrease in the likelihood of a positive clinical outcome.
  • the method may be useful for predicting clinical outcome after surgical resection of T1NO, T2N0, T3N0, or T4N0 locally advanced gastric cancer without lymph node metastasis in TNM staging.
  • the invention also relates to a nucleic acid sample obtained from a patient.
  • the risk score (RS) and the RS percentage (RS (%)) of the sample are calculated based on the expression level of the RNA determined in the step, and the ratio of the RS (%) in terms of overall survival (OS) is calculated.
  • a computer-readable recording medium that records a program that causes a computer to perform the steps of classifying a high risk patient when the setpoint range is greater than 50%, a middle risk patient who is greater than 25% to less than 50%, and a low risk patient who is less than 25%.
  • the recording medium may provide a medium useful for predicting clinical outcomes after surgical resection of T1NO, T2N0, T3N0 or T4N0 locally advanced gastric cancer without lymph node metastasis in TNM staging.
  • the RS and RS (%) can be calculated according to Equations 1 and 2 above.
  • the recording medium is regarded as a high risk group when the set value range of RS (%) is 50% or more in terms of overall survival (OS), a medium risk group when more than 25% to less than 50%, and a low risk group when less than 25%. can do.
  • a high risk group with a sample with an RS (%) value of 50% or more is considered to have a low overall survival rate for a period of more than 3 years, 6 years, or 10 years, and a low risk group of less than 25% is more than 3 years, 6 years.
  • the term, good prognosis can be expressed as an increase in the likelihood of a positive clinical outcome of a clinical outcome, and a bad prognosis can be expressed as a decrease in the likelihood of a positive clinical outcome of a clinical outcome.
  • microarray refers to the orderly placement of hybridizable array components, preferably polynucleotide probes, on a substrate.
  • polynucleotide generally refers to any polyribonucleotide or polydeoxyribonucleotide, and may be, for example, modified or non-modified RNA or DNA. As used herein, "polynucleotide” specifically includes cDNA.
  • oligonucleotide refers to a relatively short polynucleotide, including, but not limited to, one-stranded deoxyribonucleotides, one- or two-stranded ribonucleotides, RNA: DNA hybrids and two-stranded DNA. Oligonucleotides, such as single-stranded DNA probe oligonucleotides, are often synthesized by chemical methods using, for example, commercially available automated oligonucleotide synthesizers. However, oligonucleotides can be prepared by a variety of other methods, including in vitro recombinant DNA-mediated techniques, and by expression of DNA in cells and organisms.
  • differentiated gene refers to a gene that is activated at a higher or lower level among subjects with cancer, such as gastric cancer, as compared to the expression of normal or control subjects. It also includes genes that are activated at higher or lower levels in different stages of the same disease. Genes that are differentially expressed may be activated or inhibited at the nucleic acid level or the protein level, or subjected to other splicing resulting in different polypeptide products. Such differences can be demonstrated, for example, by changes in the mRNA level, surface expression, secretion or other distribution of the polypeptide.
  • differentiated gene expression means at least about 1.5 times, at least about 4 times, at least about 6 times, between the expression of a given gene in normal and diseased subjects or in various stages of diseased subjects, It is considered to exist when there is a difference of about 10 times or more.
  • standardized with respect to a gene transcript or gene expression product refers to the level of the transcript or gene expression product relative to the average level of the transcript / product of the reference gene set, wherein the reference genes are throughout the patient, tissue or treatment. Selected based on their minimal variation (“housekeeping genes”), or reference genes refer to all of the tested genes. In the latter case, generally referred to as “global normalization", it is important that the total number of genes tested is relatively large, preferably greater than 50. Specifically, the term 'standardized' with respect to RNA transcripts refers to the level of transcription relative to the average of the levels of transcription of a set of reference genes.
  • expression threshold and “defined expression threshold” are used interchangeably and above this level refer to the level of the gene or gene product at which the gene or gene product is used as a predictive marker for patient response. Thresholds are typically defined experimentally from clinical studies. The expression threshold may be selected with maximum sensitivity, or maximum selectivity (eg to select only responders for one drug), or with minimal error.
  • gene amplification refers to the process by which multiple copies of a gene or gene fragment are formed in a particular cell or cell line. Replicated regions (extension of amplified DNA) are often referred to as "amplicons”. Often, the amount of mRNA produced, ie gene expression, also increases in proportion to the number of copies made of a particular gene.
  • prognosis is used herein to refer to the prediction of the likelihood of death from cancer or progression of neoplastic disease such as gastric cancer (including relapse, metastatic spread and drug resistance).
  • prediction is used herein to refer to the likelihood that a patient will survive for a certain period of time without cancer recurrence after surgical removal of the primary tumor. Such prediction can be used clinically to determine treatment by selecting the most appropriate treatment technique for any particular patient. Such prediction is a valuable means in predicting whether a patient is likely to respond favorably to a treatment regimen, for example a surgical procedure, or whether the patient can be prolonged survival after the end of the surgery.
  • prognostic indicator can be used interchangeably with "risk score.”
  • the present invention can be carried out using conventional techniques of molecular biology (including recombination techniques), microbiology, cell biology and biochemistry.
  • Gene expression profile creation methods include methods based on hybridization analysis of polynucleotides, methods based on sequencing of polynucleotides, and proteomics based methods.
  • methods for quantification of mRNA expression include northern blotting and in situ hybridization; RNAse protection assay; And PCR-based methods such as reverse transcription polymerase chain reaction (RT-PCR) and the like.
  • RT-PCR reverse transcription polymerase chain reaction
  • antibodies can be used that can recognize two specific strands, including two strands of DNA, two strands of RNA, and two strands of DNA-RNA hybrids or two strands of DNA-protein.
  • Representative methods in sequencing-based gene expression analysis include gene expression analysis by Serial Analysis of Gene Expression (SAGE) and massively parallel signature sequencing (MPSS).
  • SAGE Serial Analysis of Gene Expression
  • MPSS massively parallel signature sequencing
  • the expression profile of cancer-related genes in fresh or paraffin embedded tumor tissues can be measured.
  • the sequence of interest including cDNA and oligonucleotides
  • the arranged sequences are then hybridized with specific DNA probes from the cell or tissue of interest.
  • the source of mRNA is typically total RNA isolated from human tumors or tumor cell lines, and corresponding normal tissues or cell lines.
  • RNA can be isolated from various major tumors or tumor cell lines.
  • Microarray technology provides amplified arrays of PCR amplified inserts of cDNA clones on a substrate. Preferably, 10,000 or more nucleotide sequences are added to the substrate.
  • Microarrayed genes immobilized on microchips with 10,000 elements each are suitable for hybridization under stringent conditions.
  • Fluorescently labeled cDNA probes can be generated through incorporation of fluorescent nucleotides by reverse transcription of RNA extracted from tissue of interest. Labeled cDNA probes applied to the chip hybridize with specificity to each spot of DNA on the array. After stringent washing to remove non-specifically bound probes, the chip is scanned by in-focus laser microscopy or by another detection method, such as a CCD camera. Quantification of hybridization of each arranged element allows for evaluation of the corresponding mRNA excess. For dual color fluorescence, separately labeled cDNA probes generated from two RNA sources hybridize to each pair in the array.
  • Miniaturization scale hybridization provides convenient and rapid evaluation of expression patterns for large numbers of genes. This method has been shown to have the sensitivity needed to detect rare transcripts (which are expressed in a few copies per cell) and to reproducibly detect at least approximately two-fold differences in expression.
  • Microarray analysis can be performed by commercially available equipment according to the manufacturer's protocol, for example using Affymetrix GenChip technology or Insight's microarray technology.
  • An important aspect of the present invention is the use of the measured expression of specific genes by gastric cancer tissue to provide prognostic information. For this purpose, it is essential to correct (standardize) the amount of RNA tested, variations in RNA quality used, and differences in other factors, such as machine and operator differences. Therefore, assays typically measure and incorporate the use of reference RNA, including those transcribed from known housekeeping genes such as GAPD and ACTB. Accurate methods for standardizing gene expression data are provided in "User Bulletin # 2" for the ABI PRISM 7700 Sequence Detection System (Applied Biosystems; 1997). Alternatively, normalization can be based on the mean or median signal (Ct) of the assayed genes or all of their many subsets (full normalization approach). In the studies described in the Examples below, a so-called central standardization strategy was used, which used a subset of screened genes selected based on lack of correlation with clinical outcome for standardization.
  • training set refers to a subject sample from which a statistically significant RNA transcript has been extracted in prognosis.
  • Validation set or "Test set” means a set that tests the accuracy with which the extracted variable can actually determine the good and bad prognosis. The reason for using this method is not only to be able to effectively predict prognosis in a specific sample group but also to determine that it is effective in an independent sample.
  • the operation that distinguishes cancer prognosis methods against the likelihood of recurring gastric cancer is characterized by 1) the unique set of test mRNAs (or corresponding gene expression products) used to determine recurrence, and 2) the specific data used to combine expression data. Weights, and 3) thresholds used to divide patients into groups with different levels of risk, such as low, medium, and high risk groups. This operation yields a numerical risk score (RS) and RS (%).
  • RS numerical risk score
  • the test requires laboratory assays to determine the levels of specified mRNAs or expression products thereof, but is fixed or paraffin embedded tumor biopsies that are either fresh or frozen tissue or already collected and stored from patients. Test specimens are available in very small quantities. Thus, the test can be non-invasive. It is also compatible with several different methods of tumor tissue harvested, for example, via core biopsy or microneedle aspiration. According to this method, the cancer risk score (RS) is
  • (f) is determined by summing the values for each subset multiplied by the coefficients to obtain a risk score (RS) and an RS (%), where the contribution of each subset that does not show a linear correlation with cancer recurrence is Only included above a certain threshold value,
  • Increased expression of the specified genes gives a negative value to subsets that reduce the risk of cancer recurrence and positive expression to the subsets where expression of the specified genes increases the risk of cancer recurrence.
  • RS and RS (%) are
  • RS (%) 100 ⁇ (RS of biological sample-RS minimum of population) / (RS maximum of population-RS minimum of population)
  • HR n represents a hazard ratio of the nth RNA transcript, and when HR n is less than 1, it is converted to -1 / HR n and used.
  • normLogTransValue n is a value related to the expression of RNA transcripts, and this value is a value that is scaled around the median of the entire value of the gene.
  • the population refers to a certain number of populations with T1NO, T2N0, T3N0, or T4N0 regionally advanced gastric cancer with no lymph node metastasis in the TNM staging, where a certain number is sufficient to yield the highest and lowest RS. Is an arbitrary integer.
  • the RS (%) value is 50% or more, it is a bad prognosis, and if it is less than 25%, it is judged as a good prognosis.
  • YUSH, n 78
  • All samples were collected after receiving detailed informed consent from the patients, and the study was approved by the Investigation Ethics Committee of Yonsei University Severance Hospital.
  • Clinical data was obtained retrospectively. Overall survival was defined as the time from surgery to death, and data were considered censored when the patient was alive at the last contact.
  • the YUSH data was used to identify the biological characteristics that are primarily responsible for the prognostic outcomes and to develop prognostic prediction models using it as a training data set.
  • the gene expression profile made in the MD Anderson Cancer Center was used in the present invention. Tumor samples and clinical data were obtained from patients with gastric adenocarcinoma who underwent gastrectomy for primary treatment at Yonsei University Severance Hospital, Korea University Guro Hospital, and Kosin University School of Medicine from 1999 to 2006. All samples were collected after receiving detailed informed consent from the patients, and the study was approved by the Investigational Ethics Committee of the MD Anderson Cancer Center.
  • microarray data was normalized according to the quartile standardization method in the linear model for the microarray data (LIMMA) package in the R language environment (Bolstad BM, 2003).
  • Primary microarray data is available from the NCBI gene expression omnibus (GEO) public database (microarray platform GEO0000, microarray data GEO0000).
  • GEO NCBI gene expression omnibus
  • Experiments and analysis of 80 samples in the MDACC data set were performed by the Department of Systems Biology at the MD Anders Cancer Center in the same process as was performed in the YUSH data set.
  • Primary microarray data for the MDACC data set is available in the NCBI gene expression omnibus (GEO) public database (microarray platform GEO0000, microarray data GEO0000).
  • Cluster analysis was performed with clusters and treeviews (http://rana.lbl.gov/EigenSoftware.htm). Log base 2 transformed data for cluster analysis described the median for each gene expression value. To make genes with different expression levels between patients, continuous gene filtration was made while changing the filtering criteria. The unsupervised clustering analysis was performed after continuous dispersion filtration, and the prognostic differences between the two classes consisting of two main clusters were tested according to the log rank test and Kaplan Meier Plot.
  • LOOCV Leave-one-out cross-validation
  • the Kaplan Meier Plot and log rank test were used to assess the prognostic differences in the group of patients.
  • the risk rating system was created using genes annotated in CGAP and has a significant prognostic value in Cox-Regression analysis (p ⁇ 0.001).
  • the risk score was created by multiplying the median of expression values by the hazard ratio (HR) and summing the values. If the HR value is less than 1, it was converted to -1 / HR.
  • the percentage risk score was calculated according to the following equation:
  • RS (%) 100 ⁇ (RS of sample-RS minimum of population) / (RS maximum of population-RS minimum of population)
  • Samples with at least 50% RS (%) were classified as high risk, and samples with at least 25% RS percentage and less than 50% RS (%) were classified as medium risk. Finally, samples with less than 25% RS (%) were classified as low risk.
  • Continuous dispersion filtration changing the filtering criteria resulted in 15 clusters with two distinct key clusters.
  • many genes range from 5612 probes to 701 probes, and in the log rank test, the p-value increases or decreases by up to 0.291 (M2_1: more than twofold compared to the median) according to the dispersion filtration criteria.
  • 11 clusters generated two main classes that showed statistically significant prognostic differences in log rank test in unsupervised hierachical clustering analysis (FIG. 1A and Table 1).
  • FIG. 3A shows a heat map of conditional clustering analysis with probes showing a two-fold difference with statistical significance (p ⁇ 0.001) in comparison of two classes of M2_5.
  • Many genes involved in the immune response IFNG, GZMA, GZMB, CD8A, STAT1, JAK2, HLADPA1 showed very high expression in the response group.
  • FIG. 3B shows a heat map of conditional clustering analysis with probes showing more than threefold differences with statistical significance (p ⁇ 0.001) in comparison of two classes of M3_3.
  • chk1 regulatory pathway, cyclin and cell cycle regulation (cell cycle pathway), cyclin E disruption pathway (FBW7 pathway), cell cycle: G1 / S checkpoint (G1 pathway), cell cycle: G2 / M checkpoint (G2 pathway), RB tumor suppressor / checkpoint signaling in response to CDK regulation (MCM pathway), p27 phosphorylation during cell cycle (P27 pathway), Sonic Hedgehog (SHH) receptor Ptc1 (PTC1 pathway), and DNA damage Delivery (RB pathway), and E2F1 disruption pathway (SKP2 E2F pathway) (FIG. 4B, p 0.00001).
  • CCP Compound Covariate Prediction
  • LDA Linear Discriminant Analysis
  • NC Nearest Centroid
  • MDACC data sets were used for validation of taxa.
  • the predictive results of the MDACC test dataset patients (80 patients) showed a pattern similar to the Training YUSH data set in the prognostic results.
  • the group classified as a poor prognosis group had a mortality rate of 30% for CCP (15 of 50 patients died), 30.6% mortality for LDA (15 of 49 patients died), NC Had a poor prognosis result with 28.6% mortality (14 of 49 patients died) (FIGS. 7D-F).
  • Gene annotation from CGAP in NIH is mainly characterized by functional gene classification that affects tumorigenesis, tumor progression, and cancer metastasis.
  • prognostic characterization based on these functional gene classifications is quite beneficial when these approaches represent key biological features that are primarily responsible for the prognosis of any stage of cancer.
  • the combined patients dataset showed significant significance in most functional gene classifications except apoptosis and development (FIG. 9A).
  • the mortality rate for the high risk patients was extremely high, showing 61.9% in the total sample, with two dataset patients showing quite similar clinical outcomes (YUSH: 54.5% mortality, MDACC: 70% mortality).
  • YUSH data patients Seventy patients were assigned a medium risk group (risk scores of 25% or more and less than 50%) and mortality for the medium risk group was 20%.
  • the clinical results for the YUSH data set were slightly worse than the MDACC data patients showing 25% mortality for YUSH patients, while the 16% mortality for MDACC data patients.
  • a total of 67 patients were designated as low risk and had a mortality rate of 7.45% in the total sample data.
  • YUSH data patients showed a mortality rate of 5.7%, showing a slightly better prognosis compared to MDACC data patients with 9% mortality (FIGS. 10B-D).
  • the present invention can be used as a diagnostic kit in the field of predicting gastric cancer recurrence prognosis.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • General Engineering & Computer Science (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 국소 진행형 위암의 예후 예측이 가능한 신규한 예후 예측 시스템에 관한 것으로, 보다 상세하게는, 유전자 집합 발현 비교 분석법을 통해 위암의 수술에 의한 절제 후 임상 결과를 예측할 수 있다.

Description

국소 진행형 위암에 대한 예후 예측 시스템
본 발명은 유전자 발현 비교 분석법을 통해 국소 진행형 위암의 예후 예측이 가능한 신규한 예후 예측 시스템에 관한 것이다.
위선암(Gastric adeno-carcinoma)은 2000년 700,349명의 사망에서 두 번째 원인으로, 세계에서 가장 일반적으로 진단된 네 번째 암이다. 몇 가지 역학적 및 조직병리학적 특징들을 갖는 단일 이질적 질환으로 간주하고 있다. 위암 치료는 주로 환자를 수술 만으로 또는 수술과 화학요법으로 치료하여야 하는지를 결정하는 TNM(tumor, node, metastasis) 병기결정 같은 임상적 파라미터에 근거한다. 위암은 유방암과 대장암 등과 달리 TNM 병기 시스템에 따라서 1기에서 4기까지 명확하게 차이가 난다. 즉, 1기의 경우에는 5년 생존율이 90% 이상이며, 4기의 경우에는 20% 이하로 큰 차이를 보인다. 그러므로 TNM 병기 시스템의 예후 예측력이 매우 뛰어남을 알 수 있다[참고문헌, 7th edition of the AJCC cancer staging Manual: stomach. Ann Surg Oncol 2010;17:3077-3079]. 상기 병기 시스템에 기반을 두어 위암은 흔히 조기 위암(Early Gastric Cancer), 국소진행형(Locally Advanced Gastric Cancer), 국소 침윤형(Locally Advanced Invasive Gastric Cancer) 및 전이 위암(Metastatic Gastric Cancer) 등으로 나눌 수 있다.
비록 수술이 실시 가능한 위암의 주요 치료이긴 하나, 진행성인 경우 재발률이 높다. 재발을 예방하고, 위암 환자들의 예후를 개선하기 위해 화학요법과 화학-방사선요법을 포함한 집학적 치료가 도입되었다. 그러나, 이들 치료 방법이 환자들에서 일반적인 임상 결과를 개선하기는 하나 종양의 임상병리학적 이질성과, 같은 병기에 있는 환자들의 다른 결과는 어쥬번트 화학요법의 임무를 예측하는데 한계가 있어 개별 환자들에 대한 최적 접근이 부족한 상태이다.
종양침윤 및 림프절 전이의 깊이는 위암에서 2개의 주요 예후 인자이다. 위암 환자의 50% 이상이 진단 시 림프절 전이를 수반하고 있으며, 30% 미만이 5년 생존율을 갖는 나쁜 예후를 나타냈다. 따라서, 위암 환자로부터 림프절 전이의 정확한 분류는 근치 위 절제술 후 뒤이은 치료 결정에 근본적으로 중요하다. 그러나, 림프절 상태만으로는 수술 후 예후 결과의 이질성 및 화학요법 약제의 임무를 설명하지 못한다. 심지어 같은 림프절 병기를 포함하는 같은 병기를 갖는 환자들도 같은 예후 결과를 나타내지는 않는다. 따라서, 고유의 임상적 이질성에 원인이 있는 종양들 간의 명확한 생물학적 차이가 위암의 새로운 치료 전략 개발을 위한 가장 중요한 단계이다.
위암 환자들의 예후 결과에 영향을 주는 생물학적 특징들에 대한 이해는 위암이 역학 및 조직병리학에서 차이를 갖는 이질적 질환이기 때문에 꽤 어렵다. 위암의 예후 결과는 비록 확산 타입 및 장내 타입 같이 위암 아류형을 포함하여 많은 다른 예후 인자들이 있긴 하나 주로 병기에 의해 영향을 받는다. 그러나, 같은 병기라 하더라도 이질적인 예후 결과를 가지며, 이들 이질성의 대부분이 완전히 설명되지는 않는다. 같은 병기 내에서 예후 결과의 차이에 원인이 있는 유전적 특징들의 동정은 환자들의 치료 방안을 선택하는데 매우 중요하다. 그러나, 이미 개발된 유전적 특징들 대부분은 재현가능성의 부족과 치료 방안의 선택에 이용될 수 있는 정보의 부족으로 인해 임상에서 이용되지 못했다. 이들 예후의 도입을 괴롭히는 다른 중요한 인자들은 이들 예후들 중 어느 것도 위암 환자들의 예후 결과를 정의함에 있어서 병기를 통제할 수 있는 것이 없다는 것이다. 따라서, 같은 병기의 환자들에서 예후 예측 인자의 도입이 필연적으로 필요하다.
본 발명의 목적은 국소 진행형 위암, 특히 N0 병기(N0 regional lymph node metastasis)에서 위암 환자들의 임상 결과에 영향을 주는 중요한 생물학적 특징들을 규명하고, 유전자 발현 위험도 점수(Rsk Score, RS)에 기초한 새로운 예후 예측 시스템을 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서 GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및 상기 단계에서 결정된 RNA 전사체의 발현도에 기초하여 상기 생물학적 샘플의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 상기 RS(%)에 따라 예후를 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.
본 발명은 또한 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서 GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현 수준을 측정하는 단계; 및 상기 전사체의 발현 증가는 긍정적인 임상 결과 가능성의 증가로 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.
상기 예후 예측 방법은 TNM 병기 분류에서 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것일 수 있다.
본 발명은 또한 위암의 예후 예측을 실행하는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체에 있어서, 환자로부터 얻은 핵산 시료에서 GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및 상기 단계에서 결정된 RNA의 발현도에 기초하여 상기 시료의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군 환자, 25% 이상 내지 50% 미만인 경우 중간 위험군 환자, 25% 미만인 경우 저 위험군 환자로 분류하는 단계를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체를 제공한다.
상기 기록 매체는 TNM 병기 분류에서 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것일 수 있다.
상기 RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산할 수 있다:
[수학식 1]
RS=HR1*normLogTransValue1 + HR2*normLogTransValue2 + ... + HRn* normLogTransValuen
[수학식 2]
RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)
상기 식에서,
HRn는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HRn이 1 미만인 경우 -1/HRn로 변환하여 사용하며,
normLogTransValuen는 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,
상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
본 발명은 TNM 병기 중 N0기 위암 환자군에 대한 전체 생존율 측면에서 예측 모델을 만든 후 통계적으로 유의한 생존에 영향을 미치는 RNA 전사체의 발현도를 결정하여 이로부터 위험도 평점 시스템을 만들어 예후 지표 값을 산출하는 방식으로 위암 수술에 의한 절제 후 임상 결과를 예측할 수 있다.
또한, 본 발명은 유전자의 생물학적 기능에 따른 유전자 집합 시스템을 이용함으로써 위암 자체의 생물학적 기능에 따른 유전자군의 분석이 가능하다.
도 1a-d는 분산 여과 후 프로브를 사용한 unsupervised hierarchical clustering analysis 에 의해 만든 2개의 주요 클러스터들의 예후 결과를 나타낸 것으로, a)는 분산 여과 후 unsupervised hierarchical clustering analysis 에 사용된 프로브의 수와 클러스터링 분석에서 생긴 2개의 주요 클래스를 사용한 log rank test 분석에서의 예후 p-값이다. 각 클러스터들은 필터링 기준에 기초하여 명명하였다. M 이후 첫 번째 숫자는 각 프로브의 평균값에 대한 폴드(fold) 차이를 표시한 것이고, 두 번째 숫자는 첫 번째 숫자에서 표시된 폴드 차이와 비교하여 높거나 낮은 발현을 보여주는 프로브의 수를 표시한 것이다. 예를 들어, M2_3는 평균값에 대해 2배 이상의 높거나 낮은 발현을 보여주는 적어도 3개의 샘플을 갖는 프로브를 선택하여 분산 여과 후 그 프로브를 사용하여 생긴 클러스터이다. b)는 분산 여과 후 2개의 주요 클러스터들의 환자 샘플의 분포이다. log rank test에서 좋은 예후 군과 나쁜 예후 군에 대해 주석을 단 후 2개의 주요 클래스의 샘플의 클러스터링 분석이다. c)는 M2_5 클러스터 환자들의 Kaplan Meier Plot을 나타낸 것이다. P-값은 log rank test 후 얻은 것이다. d)는 M3_3 클러스터 환자들의 Kaplan Meier Plot을 나타낸 것이다. P-값은 log rank test 후 얻은 것이다.
도 2는 분산 여과 후 unsupervised hierarchical clustering analysis 에 따라 만든 2개의 주요 대표 클러스터를 나타낸 것이다. M2_5에 대한 클러스터링 분석은 평균값에 대해 2배 이상의 증가 또는 감소를 보여주는 적어도 5개의 샘플을 갖는 프로브를 필터링한 후 여과된 1556개의 프로브로 만든 것이다. M3_3 에 대한 클러스터링 분석은 평균값에 대해 3배 이상의 증가 또는 감소를 보여주는 적어도 3개의 샘플을 갖는 프로브를 필터링한 후 여과된 706개의 프로브로 만든 것이다.
도 3은 unsupervised clustering analysis 후 2개의 주요 클래스의 비교 시 유의적인 차이를 보여주는 유전자 및 생물학적 특징을 나타낸 것으로, A)는 M2_5의 클러스터링 분석에 의해 만든 2개의 주요 클래스의 비교에서 통계적 유의(p<0.001 및 2배 차이, 554개의 프로브)를 보여주는 프로브를 사용한 조건부 클러스터링의 히트맵을 나타낸 것이다. B)는 M3_3의 클러스터링 분석에 의해 만든 2개의 주요 클래스의 비교에서 통계적 유의(p<0.001 및 2배 차이, 453개의 프로브)를 보여주는 프로브를 사용한 조건부 클러스터링의 히트맵을 나타낸 것이다.
도 4a-b는 Biocarta 경로 데이터 베이스에서 M2_5의 2개의 주요 분류군의 GSEA 결과(A)와, M3_3 의 2개의 주요 분류군의 GSEA 결과(B)를 나타낸 것이다.
도 5a-f는 GSEA 결과에서(p<0.001) 유의적인 증가를 보여주는 유전자들의 발현을 나타낸 것으로, 히트맵은 M2_5의 각 분류군의 평균 발현 수준을 나타낸다.
도 6a-f는 GSEA 결과에서(p<0.001) 유의적인 증가를 보여주는 유전자들의 발현을 나타낸 것으로, 히트맵은 M3_3의 각 분류군의 평균 발현 수준을 나타낸다.
도 7a-i는 M3_3의 분류군에 따른 NO 위암 환자들의 예후 예측을 나타낸 것이다. 프로브들은 M3_3 클러스터에 의해 정의된 2개의 클래스의 비교에서 유의적으로 다르다(p<0.001). 이 분석을 위해 3개의 다른 예측 알고리즘(CCP, LDA, 및 NC)을 사용하였다. 각 모형의 예측 오류를 추정하기 위해 단일잔류 교차검증을 사용하였다. 예후적 차이는 log rank test을 사용하여 추정하였다. 도 7a-i에 기재된 A-C)는 Training data (YUSH 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. D-F)는 검증 데이터(MDACC data)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. G-I)는 총 샘플 데이터(YUSH 데이터 및 MDACC 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다.
도 8a-i는 M2_5의 분류군에 따른 NO 위암 환자들의 예후 예측을 나타낸 것이다. 프로브들은 M2_5 클러스터에 의해 정의된 2개의 클래스의 비교에서 유의적으로 다르다(p<0.001). 이 분석을 위해 3개의 다른 예측 알고리즘(CCP, LDA, 및 NC)을 사용하였다. 각 모형의 예측 오류를 추정하기 위해 단일잔류 교차검증을 사용하였다. 예후적 차이는 log rank test을 사용하여 추정하였다. 도 8a-i에 기재된 A-C)는 Training data(YUSH 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. D-F)는 Validation data(MDACC data)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다. G-I)는 총 샘플 데이터(YUSH 데이터 및 MDACC 데이터)의 예측된 결과의 Kaplan Meier Plot을 나타낸 것이다.
도 9a-b는 NO 위암 환자들의 예후 결과에서 CGAP에 의해 미리 정해진 기능적 유전자 분류의 영향을 나타낸 것으로, 도 9a-b에 기재된 A)는 YUSH, MDACC 및 총 데이터 세트에서 CGAP에 의해 기능적으로 분류된 유전자의 예후 결과이다. unsupervised hierarchical clustering analysis 은 CGAP의 기능적 유전자 분류에서 그 유전자들을 이용하여 수행하였다. 주요 클러스터들의 예후적 차이는 log rank test에 따라 비교하였다. log rank test의 p-값은 로그 p-값으로 변화시켰고, 막대 그래프로 나타내었다. B)는 각 기능적 유전자 분류에서 주요 클러스터들의 차이를 나타내는 생물학적 특징이다. GSEA를 수행하고, GSEA의 통계적 유의를 로그 p-값으로 나타내었다.
도 10a-c는 위험도 평점 시스템의 백분율의 형성을 나타낸 것이다. 도 10a-c에 기재된 A)는 예측 모형과 CGAP의 기능적 유전자 분류에 의해 정의된 사망률의 히트맵을 나타낸 것이다. 모든 샘플은 분류군 또는 클러스터에 의해 정의된 각 분류군의 사망률로 주석을 달고, 예후 결과에서 환자 분포와 기능적 생물학의 각 분류의 영향을 체크하기 위해 unsupervised clustering analysis을 수행하였다. B)는 총 샘플 데이터 세트에서 각 환자들의 위험도 점수의 백분율이다. C)는 YUSH 샘플 데이터 세트에서 각 환자들의 위험도 점수의 백분율이다. D)는 MDACC 샘플 데이터 세트에서 각 환자들의 위험도 점수의 백분율이다. E-G)는 3개의 다른 데이터 세트(YUSH, MDACC 및 총 샘플 데이터 세트)에서 % 위험도 점수로 정의된 3개의 다른 위험 군(High, Intermediate and Low Risk Group)의 Kaplan Meier Plot을 나타낸 것이다. 3개의 다른 위험 군 간의 예후적 차이의 유의성은 log rank test에 따라 정의하였다.
이하 본 발명의 구성을 구체적으로 설명한다.
본 발명자들은 림프절 전이가 없는 상대적으로 초기 병기에서 위암 환자들의 예후적 차이에 원인이 있는 주요 생물학적 특징을 정의하기 위해 림프절 전이가 없는 환자들로부터 전체 게놈 유전자 발현 프로파일을 만들었다. 이를 위해, 필터링 기준을 바꿔주면서 연속 분산 여과 후 unsupervised hierarchical clustering analysis 방법을 적용하였다. 예후 결과는 클러스터링 분석에 따라 정의된 2개의 주요 분류군에 대해 log rank test을 사용하여 추정하였다. 각 암 환자들의 전체 생물학적 특징들을 나타내는 유전자들을 이용한 자율 분석이기 때문에, 각각 다른 예후 군을 나타내는 생물학적 특징들은 예후적 차이에 원인이 있는 주요 생물학적 특징일 것이며, 치료 방안의 개발을 위한 잠재적 표적으로 이용될 수 있다.
분석 결과 NO 병기 위암 환자들의 예후적 차이에 주로 원인이 있는 2개의 다른 생물학적 특징들(세포증식 및 면역반응)이 동정 되었고, 이들 2개의 생물학적 특징들은 분산 여과에 기초한 분류군 또는 CGAP의 기능적 유전자 분류와 상관없이 일반적으로 꽤 보존되어 있다. 세포증식 및 면역활성화의 생물학적 특징들을 나타내는 이들 분류군의 검증은 독립 데이터 세트에서 수행하였으며, log rank test에서 Training data set와 유사한 예후 결과를 나타냈다. 단일잔류 교차검증법으로 정정예후비를 실험한 결과 분류군의 타입과 예후 예측 알고리즘에 따라 85 내지 96%의 범위를 나타냈다. 좋은 예후 군에서 세포증식 관련 유전자들의 발현이 증가한 결과는 정상세포와 비교하여 대부분의 암세포에서 더 높은 증식율을 가지고 있기 때문에 예상치 못한 결과였다. 그러나, 초기 위암의 세포증식은 진행형 병기의 위암보다 훨씬 더 강력하여 세포 특징이 줄기세포 특징의 획득 및 전이 잠재력이 변화하는 중일 것으로 추측된다. 높은 세포증식율을 갖는 환자들의 좋은 예후 결과를 설명할 수 있는 다른 요인으로 화학요법 약제의 책임을 들 수 있다. 화학요법 약제 치료를 받은 환자들에서 세포증식 특징의 높은 발현을 갖는 환자들은 예상했던 대로 좋은 반응을 나타냈다. 그러나, 화학요법 약제 치료를 받지 않은 환자들은 그들이 화학요법 약제 치료를 받은 환자들과 유사한 세포증식 특징의 높은 발현을 가질 때에만 좋은 예후 결과를 나타냈기 때문에 MDACC 검증 데이터 세트의 예후 결과는 이러한 생각을 뒷받침하지는 못한다. 따라서, 높은 증식 특징 발현을 갖는 좋은 예후 결과에 대한 이유는 화학요법 약제의 감수성뿐만 아니라 높은 세포증식 생물학을 반영하는 생리적 차이에 있다.
림프절 침윤이 없는 위암 환자들의 좋은 예후에 대한 면역활성화 특징의 영향에 대한 발견은 면역활성화 특히 암 환자 치료에서 CTL의 활성화 상태의 중요한 역할을 입증한 것이다. 면역반응의 유의적인 역할은 위암에서 다운스트림 비-감시림프절 전이와 관련된 감시림프절에서 높은 Foxp3 양성 조절 T-세포 밀도를 제공하는 위암에서 이미 보고된바 있다. 종양 진행 조절에서 면역활성화의 중요한 역할은 몇몇 논문에서 보고된바 있고, 일반적으로 많은 암종에서 다른 치료 방안으로서 받아들여지고 있다. 치사량의 방사선 조사와 백신처리에 의한 활성 면역치료, GMCSF를 분비하도록 제작된 자가 종양세포 및 세포독성 T 림프구-결합 항원-4(CTLA-4)의 항체 차단은 종양 신생혈관형성을 표적화하여 종양 맥관 구조를 붕괴시켰다. 면역 내성 특히 종양 항원에 특이적인 T 세포에 대한 주요 메커니즘으로서 종양 포획(co-opt) 특정 면역 체크포인트 경로는 이미 알려져 있다. T 세포 반응의 극적인 확대 및 품질은 T 세포 수용체에 의한 항원 인지를 통해 개시되며, 공동-자극 및 억제 신호 간의 균형에 의해 조절된다. 공동-조절 수용체의 작용제 및 억제신호의 길항제 둘 다 항원 특이 T 세포 반응을 증폭시키고, 면역 체크포인트의 차단은 사람 암 치료 시 항-종양 면역 반응의 잠재력을 보여준다. 특히, CTLA-4는 중요한 면역-체크포인트 수용체이며, T 세포 활성화의 크기를 하향조절한다. CTLA-4 항체는 면역치료제로 미국 FDA에서 승인을 받았고, 길항적 CTLA4 항체를 이용한 임상 연구들은 진행성 흑색종 환자들에서 생존 장점을 입증하였다. 따라서, 길항적 CTLA4 항체를 위암 환자 치료에 도입하는 것은 초기 NO 환자들에서 나쁜 예후 결과를 갖는 환자들을 위한 다른 치료 방안일 수 있다. 본 발명에서 밝힌 유전적 특징들은 치료 방안을 위한 올바른 환자를 선택하기 위한 가이드 역할을 할 수 있다.
본 발명자들은 주로 세포증식과 관련된 특징과 면역반응과 관련된 특징으로 구성된 2개의 다른 생물학적 특징들이 NO 병기 위암 환자들의 예후 결과에 원인이 있는 주요 생물학적 특징임을 입증하였다. 이들 발견에 기초하여, 본 발명자들은 위암 환자에서 면역치료의 도입과 이들 치료를 위한 환자 선택 시 면역치료를 위한 최대 이점을 얻기 위해서는 유전적 특징에 기초하여야 함을 제안한다.
따라서, 본 발명은 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서
GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및
상기 단계에서 결정된 RNA 전사체의 발현도에 기초하여 상기 생물학적 샘플의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 상기 RS(%)에 따라 예후를 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.
본 발명에 따른 예후를 예측하는 방법은 위암 환자들의 임상 결과를 지배하는 2가지 주용 생물학적 특징인 면역활성화 및 세포증식에 관련된 유전자들 중 CGAP(Cancer Genome Anatomy Project)에서 발견되는 기능적으로 분류된 유전자군(functional categorized gene group)에서 콕스 회귀 분석에서 통계적 유의(p<0.001)를 갖는 유전자를 예후와 관련된 유전자 대상으로 선정하고, 상기 유전자들의 위험 계수(hazard ratio)를 유전자의 발현 값에 곱하여 하기 수학식 1 및 2에 따라 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 구한 후 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)가 50% 이상을 갖는 샘플을 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 분류함으로써 위암으로 진단된 대상에서 예후를 예측할 수 있는 것을 특징으로 한다.
상기 RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산할 수 있다:
[수학식 1]
RS=HR1*normLogTransValue1 + HR2*normLogTransValue2 + ... + HRn* normLogTransValuen
[수학식 2]
RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)
상기 식에서,
HRn는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HRn이 1 미만인 경우 -1/HRn로 변환하여 사용하며,
normLogTransValuen는 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,
상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
상기 모집단의 수는 특별히 제한하지는 않으며, 일 구체예에서는 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암 조직 158개를 모집단으로 사용하였다.
상기 식에서, 용어, 위험 계수(Hazard Ratio: HR)란 암의 진행, 재발, 또는 요법 반응에 대한 기여도를 반영하는 계수를 의미한다. 위험 계수는 다양한 통계적 기법에 의하여 도출될 수 있다. 상기 위험 계수, HR 값은 다양한 통계적 모델에서 결정할 수 있으며, 예컨대, 다변량 콕스 비례 위험 회귀 분석에서 결정할 수 있다. 일 구체예에서, HR 값을 RS 수식에 사용함에 있어서, HR 값이 1보다 크거나 같을 경우 HR 값을 그대로 사용하고, HR 값이 1 보다 작을 경우 -1/HR 값을 사용할 수 있다.
또한, 상기 식에서, 용어, RNA 전사체의 발현 값이란 개별유전자, 즉 RNA 전사체의 발현과 관련된 값을 의미한다. 상기 값은 공지된 다양한 통계적 수단을 사용하여 결정할 수 있다. 예를 들어 발현 값은 콕스 회귀 분석에 의해 측정된 p 값을 log2 함수값으로 변형 후 사분위수 표준화(quantile normalization) 후의 값을 사용할 수 있다. 상기 수학식 1에서 사용된 발현 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값을 사용하였다.
일 구체예에 따르면, RS는 다음과 같이 결정할 수 있다:
RS=-GART×3.584 + PTN×3.631 - PCNA×2.7027 + GLI3×4.073 + SMARCD3×2.266 - SULT1A3×3.278 + ILK×2.251 - FUCA1×2.80899 + PKD1×2.827 - TOP2A×1.7668 + ABL1×2.784 - CKS2×1.9685 + FZD1×4.302 - TIAL1×4.2553 + SGCD×2.494 - PIGF×2.6525 - CCNB1×2.4272 - CSK ×3.2573 + CRYAB×1.524 + TPM1×2.975 - RFC4×2.817 + GUCY1B3×2.801 - TYMS×2.0617 - FEN1×2.3148 + GNAI1×2.758 + CSRP1×1.642 - UNG×2.695 + AXL×2.018 + MAP1×B1.705 + VCL×2.478 + ITGA5×1.642 - LIG1×2.841 - HPRT1×2.95 - GRB2×3.636 - HMMR×1.98 - MCM4×2.02 + SRF×2.287 + DMPK×1.925 - ACP5×2.551 - CD38×2.16 - PRIM1×3.003 - CCNF×2.024 + GLRB×2.138 - IFNAR2×3.717 + HSPA2×1.734 - CLN3×2.445 - BUB1×1.74 + CALM1×2.839 - CDC2×1.562 + ATF4×5.677 - RRM1×3.717
상기 수학식 1에 따라 계산된 RS는 상기 수학식 2에 따라 RS(%)로 나타낼 수 있다.
위에서 결정된 값을 모집단에서 해당하는 순위로 변환하여 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)가 50% 이상을 갖는 샘플을 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 분류한다. 고 위험군은 나쁜 예후를, 저 위험군은 좋은 예후인 것으로 판단할 수 있다. 즉, RS(%) 값이 50% 이상을 갖는 샘플을 고 위험군은 3년 이상, 6년 이상, 10년 이상의 기간 동안 전체 생존율이 낮음을 의미하고, 25% 미만인 저 위험군은 3년 이상, 6년 이상, 10년 이상 동안 전체 생존율이 높음을 의미한다. 상기 용어, 좋은 예후는 임상 결과의 긍정적 임상 결과 가능성의 증가로 표현될 수 있고, 나쁜 예후는 임상 결과의 긍정적 임상 결과 가능성의 감소로 표현될 수 있다.
상기 방법은 TNM 병기 중 N0기 위암 환자군, 예컨대, T1N0기, T2N0기, T3N0기 또는T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는데 유용할 수 있다.
본 발명의 예후 예측 방법에 사용된 상기 유전자들은 면역반응과 세포증식에 관여하는 유전자 세트로 나눌 수 있고, 좋은 예후 군에서는 통계적으로 유의하게 발현이 증가한다.
면역반응에 관여하는 유전자 세트: GART, PTN, SULT1A3, FUCA1, PKD1, ABL1, TIAL1, SGCD, PIGF, CSK, CRYAB, TPM1, GUCY1B3, GNAI1, CSRP1, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, CD38, GLRB, IFNAR2, HSPA2, CLN3, BUB1, ATF4 및 RRM1
세포증식/DNA 복구에 관여하는 유전자 세트: PCNA, GLI3, SMARCD3, ILK, TOP2A, CKS2, FZD1, CCNB1, RFC4, TYMS, FEN1, UNG, MCM4, SRF, DMPK, ACP5, PRIM1, CCNF, CALM1 및 CDC2
상기 면역반응에 관여하는 유전자 세트는 주로 항원 프로세싱과 제시(MHC 경로) 및 IFN 감마 신호전달경로와, 이외에, Th1/Th2 분화(TH1TH2 경로), 표적세포에 대한 CTL 매개 면역 반응(CTL 경로), NK 세포에서 NO2 의존성 IL12 경로(NO2IL12 경로), T 세포 활성화에서 Tob의 역할(TOB1 경로), Th1 발달 시 IL12 및 Stat4 의존적 신호전달경로(IL12 경로) 및 T 세포독성 세포 표면 분자(T 세포독성경로)와 관련이 있다.
상기 세포증식/DNA 복구에 관여하는 유전자 세트는 암 감수성(ATR BRCA 경로)에서 BRCA1, BRCA2 및 ATR의 역할, DNA 손상(cdc25 경로)에 대한 반응에서 cdc25 및 chk1 조절 경로, 사이클린 및 세포주기조절(세포주기 경로), 사이클린 E 파괴 경로(FBW7 경로), 세포주기:G1/S 체크포인트(G1 경로), 세포주기:G2/M 체크포인트(G2 경로), CDK 조절(MCM 경로), 세포주기 진행 중 p27 인산화 조절(P27 경로), 세포주기를 조절하는 Sonic Hedgehog(SHH) 수용체 Ptc1(PTC1 경로), DNA 손상에 대한 반응에서 RB 종양억제자/체크포인트 신호전달(RB 경로), 및 E2F1 파괴경로(SKP2 E2F 경로)와 관련이 있다.
본 발명은 또한 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서
GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현 수준을 측정하는 단계; 및
상기 전사체의 발현 증가는 긍정적인 임상 결과 가능성의 증가로 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법을 제공한다.
상기 방법은 어레이 기반 방법일 수 있다.
상기 발현 수준이 하나 이상의 RNA 전사체의 발현 수준에 대해 표준화되는 것일 수 있다.
상기 임상 결과가 전체 생존율(Overall Survival, OS) 측면에서 표현되는 것일 수 있다.
상기 방법은 RNA 전사체 전체의 발현 수준을 측정하고 발현 증가를 분석하여 긍정적인 임상 결과 가능성의 증가 또는 감소를 판단하여 예후를 예측할 수 있다.
상기 방법은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는데 유용할 수 있다.
본 발명은 또한 환자로부터 얻은 핵산 시료에서
GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및
상기 단계에서 결정된 RNA의 발현도에 기초하여 상기 시료의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군 환자, 25% 이상 내지 50% 미만인 경우 중간 위험군 환자, 25% 미만인 경우 저 위험군 환자로 분류하는 단계를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체를 제공한다.
상기 기록 매체는 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는데 유용한 매체를 제공할 수 있다.
상기 RS 및 RS(%)는 상기 수학식 1 및 2에 따라 계산할 수 있다.
상기 기록 매체는 전체 생존율(Overall Survival, OS) 측면에서 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 판단할 수 있다. 즉, RS(%) 값이 50% 이상을 갖는 샘플을 고 위험군은 3년 이상, 6년 이상, 10년 이상의 기간 동안 전체 생존율이 낮다고 판단하고, 25% 미만인 저 위험군은 3년 이상, 6년 이상, 10년 이상 동안 전체 생존율이 높다고 판단한다. 상기 용어, 좋은 예후는 임상 결과의 긍정적 임상 결과 가능성의 증가로 표현될 수 있고, 나쁜 예후는 임상 결과의 긍정적 임상 결과 가능성의 감소로 표현될 수 있다.
달리 정의되지 않는다면, 본원에 사용된 기술 및 과학 용어들은 당업자 수준에서 일반적으로 이해하는 바와 같은 의미가 있다. 본 발명은 어떤 방식으로든 설명된 방법 및 재료로 제한되지 않는다. 본 발명의 목적상, 하기 용어들이 아래에서 정의된다.
용어, "마이크로어레이(microarray)"는 기질 상의 혼성화가능한 어레이 구성 요소, 바람직하게는 폴리뉴클레오티드 프로브의 규칙적인 배치를 말한다.
용어, "폴리뉴클레오티드"는 일반적으로 임의의 폴리리보뉴클레오티드 또는 폴리데옥시리보뉴클레오티드를 말하고, 예컨대 변형 또는 비-변형 RNA 또는 DNA일 수 있다. 본 명세서에서, "폴리뉴클레오티드"는 구체적으로 cDNA를 포함한다.
용어, "올리고뉴클레오티드"는 비제한적으로 한-가닥 데옥시리보뉴클레오티드, 한- 또는 두-가닥 리보뉴클레오티드, RNA:DNA 하이브리드 및 두-가닥 DNA를 포함하는, 비교적 짧은 폴리뉴클레오티드를 말한다. 올리고뉴클레오티드, 예를 들면 한-가닥 DNA 프로브 올리고뉴클레오티드는 종종 예를 들면 상업적으로 입수가능한 자동화 올리고뉴클레오티드 합성기를 사용하는 화학적 방법에 의해 합성된다. 그러나, 올리고뉴클레오티드는 시험관내 재조합 DNA-매개 기술을 포함하는 각종 다른 방법들에 의해 및 세포 및 유기체 중에서의 DNA 발현에 의해 제조될 수 있다.
용어, "차등적으로 발현된 유전자" 또는 "차등적인 유전자 발현"은 정상 또는 대조용 대상체의 발현에 비하여 위암과 같은 암을 앓는 대상체 중에서 더 높거나 낮은 수준으로 활성화되는 유전자를 말한다. 또한, 동일한 질병의 다른 병기에서 더 높거나 낮은 수준으로 활성화되는 유전자를 포함한다. 차등적으로 발현되는 유전자는 핵산 수준 또는 단백질 수준에서 활성화 또는 억제되거나, 다른 스플라이싱을 받아 상이한 폴리펩타이드 산물을 야기하는 경우일 수 있다. 이러한 차이는 예를 들면 폴리펩타이드의 mRNA 수준, 표면 발현, 분비 또는 다른 분배에 있어서의 변화에 의해 입증될 수 있다. 본 발명의 목적상, "차등적인 유전자 발현"은 정상 및 질병에 걸린 대상체에서 또는 질병에 걸린 대상체의 다양한 병기에서 주어진 유전자의 발현 사이에 약 1.5배 이상, 약 4배 이상, 약 6배 이상, 약 10배 이상의 차이가 있을 때 존재하는 것으로 간주 된다.
유전자 전사체 또는 유전자 발현 생성물에 관한 용어 "표준화된"은 기준 유전자 세트의 전사체/생성물의 평균 수준에 대한 전사체 또는 유전자 발현 생성물의 수준을 말하는데, 여기서 레퍼런스 유전자들은 환자, 조직 또는 치료에 걸쳐 이들의 최소한의 변동에 기준하여 선택되거나 ("하우스키핑 유전자(housekeeping genes)"), 또는 레퍼런스 유전자는 시험된 유전자들 전체를 말한다. 후자의 경우, 일반적으로 "전체 표준화(global normalization)"로 언급되는데, 시험된 유전자들의 총 수가 비교적 큰, 바람직하게는 50 초과인 것이 중요하다. 구체적으로, RNA 전사체에 관한 용어 '표준화된'은 기준 유전자 세트의 전사 수준의 평균에 대한 전사 수준을 말한다.
용어, "발현 역치" 및 "정의된 발현 역치"는 혼용하여 사용하며, 이 수준 이상에서는 유전자 또는 유전자 생성물이 환자 반응에 대한 예측 마커로서 사용되는 해당 유전자 또는 유전자 생성물의 수준을 말한다. 역치는 대표적으로 임상적 연구로부터 실험적으로 정의된다. 발현 역치는 최대 민감성, 또는 최대 선택성(예를 들면 한 약물에 대한 반응자들만을 선택하도록), 또는 최소 오차로 선택될 수 있다.
용어, "유전자 증폭"은 특정 세포 또는 세포주에서 유전자 또는 유전자 단편의 다수개의 복사물이 형성되는 과정을 말한다. 복제된 영역 (증폭된 DNA의 신장)은 종종 "암플리콘"으로 언급된다. 종종, 생산된 mRNA의 양, 즉 유전자 발현도는 또한 특정 유전자의 만들어진 복제 수에 비례하여 증가한다.
본 명세서에서, "예후"는 본원에서 암에 의한 사망 또는 위암과 같은 신생물성 질환의 진행(재발, 전이성 확산 및 내약물성 포함)의 가능성의 예측을 말하는데 사용된다. 용어 "예측"은 본원에서 환자가 주요 종양의 수술 제거 후에 암 재발 없이 특정 기간 동안 살아남게 될 가능성을 말하는데 사용된다. 이러한 예측은 임의의 특정 환자에 대하여 가장 적절한 치료 기법을 선택함으로써 치료를 결정하는데 임상적으로 사용될 수 있다. 이러한 예측은 환자가 치료 섭생, 예를 들면 수술 시술에 대하여 유리하게 반응하기 쉬운지, 또는 수술 종료 후에 환자의 장기간 생존이 가능한지를 예측하는데 있어서 귀중한 수단이 된다. 용어 "예후 지표" 는 "위험도 점수"와 혼용되어 사용할 수 있다.
달리 지시하지 않는 한, 분자 생물학(재조합 기술 포함), 미생물학, 세포 생물학 및 생화학의 종래 기술을 사용하여 본 발명을 수행할 수 있다.
1. 유전자 발현 프로파일 작성(Profiling)
유전자 발현 프로파일 작성 방법은 폴리뉴클레오티드의 혼성화 분석에 기초한 방법, 폴리뉴클레오티드의 서열화에 기초한 방법, 및 프로테오믹스 기재 방법을 포함한다. 예를 들어 mRNA 발현의 정량화를 위한 방법은 노던 블랏팅(northern blotting) 및 인 시츄 혼성화(in situ hybridization); RNAse 보호 검정시험; 및 PCR-기재 방법, 예를 들면 역 전사 폴리머라제 연쇄 반응(RT-PCR) 등을 포함한다. 또는, DNA 두 가닥, RNA 두 가닥, 및 DNA-RNA 하이브리드 두 가닥 또는 DNA-단백질 두 가닥을 포함하는 특정 두 가닥을 인식할 수 있는 항체들이 사용될 수 있다. 서열화-기재 유전자 발현 분석에서 대표적인 방법은 유전자 발현의 연속 분석(Serial Analysis of Gene Expression, SAGE) 및 대량적으로 평행한 시그너쳐 서열화(massively parallel signature sequencing, MPSS)에 의한 유전자 발현 분석을 포함한다.
2. 마이크로어레이
신선한 또는 파라핀에 매립된 종양 조직에서 암 관련 유전자의 발현 프로파일을 측정할 수 있다. 이 방법에서는, 관심을 갖는 서열(cDNA 및 올리고뉴클레오티드 포함)을 마이크로칩 기판상에 플레이팅 또는 배열시킨다. 배열된 서열들을 이어서 관심을 갖는 세포 또는 조직으로부터의 특정 DNA 프로브와 혼성화시킨다. RT-PCR 방법에서와 마찬가지로, mRNA의 공급원은 전형적으로 사람 종양 또는 종양 세포주, 및 대응하는 정상 조직 또는 세포주로부터 단리된 총 RNA이다. 따라서 RNA는 각종 주요 종양 또는 종양 세포주로부터 단리될 수 있다. 마이크로어레이 기술은 cDNA 클론의 PCR 증폭된 삽입물을 치밀한 어레이로 기판상에 제공한다. 바람직하게는, 10,000 이상의 뉴클레오티드 서열들을 기판에 가한다. 10,000 엘레멘트 각각으로 마이크로칩 상에 고정화된 미세배열된 유전자들이 엄격한 조건 하에서의 혼성화에 적합하다. 형광적으로 표지된 cDNA 프로브들이 관심을 갖는 조직으로부터 추출된 RNA의 역 전사에 의해 형광 뉴클레오티드의 혼입을 통해 생성될 수 있다. 칩에 가해진 표지된 cDNA 프로브는 어레이 상의 DNA 각 스팟에 특이성을 갖게 혼성화된다. 비-특이적으로 결합된 프로브들을 제거하기 위한 엄격한 세척 후, 칩을 동일초점 레이저 현미경에 의해 또는 다른 검출 방법, 예를 들면 CCD 카메라에 의해 주사한다. 각 배열된 엘레멘트의 혼성화에 대한 정량화는 대응하는 mRNA 과다의 평가를 가능하게 한다. 이중 색 형광의 경우, 2개의 RNA 공급원으로부터 생성된 별도로 표지된 cDNA 프로브가 어레이에 각 쌍 별로 혼성화된다. 따라서 각 명시된 유전자에 대응하는 2개의 공급원으로부터의 전사체의 상대적 과다가 동시에 결정된다. 소형화 규모의 혼성화가 많은 수의 유전자들에 대한 발현 패턴의 편리하고 신속한 평가를 제공한다. 이러한 방법은 희귀한 전사체(이것은 세포 당 소수개의 복사물로 발현됨)을 검출하는데 및 발현도에 있어서 적어도 대략 2배 차이로 재현 가능하게 검출하는데 필요한 민감성을 갖는 것으로 나타났다. 마이크로어레이 분석은 상업적으로 입수 가능한 장비에 의해 제조업체의 프로토콜에 따라, 예를 들면 아피매트릭스 겐칩(Affymetrix GenChip) 기술 또는 인사이트(Incyte's) 마이크로어레이 기술을 사용하여 수행될 수 있다.
3. mRNA 단리, 정제 및 증폭의 일반적인 설명
파라핀에 매립된 조직을 사용하여 유전자 발현 프로파일을 작성하는 기술은 상술한 바와 같다. 최종적으로 얻은 데이터를 분석하여 관찰된 종양 샘플에서 확인된 특징적인 유전자 발현 패턴에 기초하여 환자에게 이용할 수 있는 최상의 치료 선택사항(들)을 판별해낸다.
본 발명의 중요한 면은 위암 조직에 의한 특정 유전자의 측정된 발현을 사용하여 예후 정보를 제공하는 것이다. 이러한 목적을 위해, 검정시험된 RNA의 양, 사용된 RNA 품질에 있어서의 변동, 및 다른 인자, 예를 들면 기계 및 작업자 차이에 있어서의 차이에 대해 보정하는(표준화) 것이 필수적이다. 그러므로, 검정시험은 전형적으로 GAPD 및 ACTB와 같은 공지된 하우스키핑 유전자로부터 전사된 것들을 포함하는, 기준 RNA의 사용을 측정하여 혼입시킨다. 유전자 발현 데이터를 표준화하기 위한 정확한 방법은 문헌 ["User Bulletin #2" for the ABI PRISM 7700 Sequence Detection System (Applied Biosystems; 1997)]에 제공된다. 다르게는, 표준화는 검정시험된 유전자들 또는 이들의 많은 서브세트 전부의 평균 또는 중간 신호(Ct)를 기준으로 할 수 있다 (전체 표준화 접근법). 하기 실시예에 설명된 연구에서는, 소위 중심 표준화 전략을 사용하였는데, 이것은 표준화를 위해 임상적 성과와의 상관성 부족에 기초하여 선택된 스크리닝된 유전자의 서브세트를 이용하였다.
용어, "트레이닝 세트(Training set)"라 함은 예후에 통계적으로 유의한 RNA 전사체를 추출한 대상 샘플을 의미한다.
용어, "검증 세트(Validation set)" 또는 "테스트 세트(Test set)"라 함은 상기 추출된 변수가 실제로 예후의 좋고 나쁨을 판단할 수 있는 정확도를 테스트하는 세트를 의미한다. 이러한 방법을 사용하는 이유는 특정 샘플 군에서만 효과적으로 예후 판단 능력이 있는 것이 아니라 독립적 샘플에서도 효능이 있는 것을 판단하기 위해서이다.
4. 재발에 대한 위험도 점수 및 이들의 응용
위암 재발의 가능성에 대한 암 예후 방법을 구분 짓는 연산의 특징은 1) 재발 가능성을 측정하는데 사용된 독특한 시험 mRNAs 세트(또는 대응하는 유전자 발현 생성물), 2) 발현 데이터를 식으로 합치는데 사용된 특정 가중치, 및 3) 환자들을 상이한 수준의 위험을 갖는 군, 예를 들면 저, 중간 및 고 위험 군으로 나누는데 사용된 역치를 포함한다. 이 연산은 수치적인 위험도 점수(RS) 및 RS(%)를 산출해낸다.
시험은 명시된 mRNA 또는 이들의 발현 생성물의 수준을 측정하기 위한 실험실 검정시험을 필요로 하지만, 신선한 조직이거나 또는 냉동된 조직, 또는 이미 반드시 환자들로부터 수집되어 보관되어 있는 고정되어 파라핀에 매립된 종양 생검 시험편을 매우 소량으로 이용할 수 있다. 따라서, 시험은 비침입성일 수 있다. 예를 들면 코어 생검 또는 미세침 흡인을 통해 수확된 종양 조직의 몇 가지 상이한 방법들과 상용성이기도 하다. 이 방법에 따르면, 암 위험도 점수(RS)는
(a) 상기 대상체로부터 얻은 암 세포를 포함하는 생물학적 샘플로 유전자 또는 단백질 발현 프로파일을 작성하고;
(b) 다수개의 개별 유전자의 발현도 즉, mRNA 수준을 정량화하여 각 유전자에 대한 발현 값을 정하고;
(c) 각각 암-관련 생물학적 함수에 의해 및(또는) 동시발현에 의해 연결된 유전자들에 대한 발현 값을 포함하는, 유전자 발현 값들의 서브세트를 생성시키고;
(d) 한 서브세트 내의 각 유전자의 발현도에 상기 서브세트 내에서의 그의 암 재발 반응에 대한 상대적 기여도를 반영하는 계수를 곱하고 곱한 값을 더하여 상기 서브세트에 대한 값을 산출하고;
(e) 각 서브세트의 그 값에 그의 암 재발 반응에 대한 기여도를 반영하는 계수를 곱하고;
(f) 상기 계수를 곱한 각 서브세트에 대한 값들의 합을 구하여 위험도 점수(RS) 및 RS(%)를 얻음으로써 결정되는데, 여기서, 암 재발과 선형 상관관계를 보이지 않는 각 서브세트의 기여도는 단지 소정의 역치 값 이상에서만 포함되고,
명시된 유전자의 증가된 발현이 암 재발 위험을 감소시키는 서브세트에는 음의 값을 부여하고, 명시된 유전자의 발현이 암 재발 위험을 증가시키는 서브세트에는 양의 값을 부여한다.
구체적인 실시태양에서, RS 및 RS(%)는
(a) GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 측정하고,
(b) 하기 수학식 1 및 2에 의해 위험도 점수(RS) 및 RS(%)를 계산함으로써 결정된다:
[수학식 1]
RS=HR1*normLogTransValue1 + HR2*normLogTransValue2 + ... + HRn* normLogTransValuen
[수학식 2]
RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)
상기 식에서,
HRn는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HRn이 1 미만인 경우 -1/HRn로 변환하여 사용하며,
normLogTransValuen는 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,
상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
여기서, RS(%) 값이 50% 이상이면 나쁜 예후이고, 25% 미만이면 좋은 예후인 것으로 판단한다.
이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.
<제조예> 예후 예측 대상 선정 및 실험설계
예후 예측 대상 선정을 위해, 1999년 내지 2006년까지 연세대학교 세브란스 병원에서 일차 치료로 위 절제술을 받은 위선암 환자들(YUSH, n=78)에서 종양 표본 및 임상 데이터를 얻었다. 모든 샘플들은 환자로부터 상세하게 기재된 동의서를 받은 후 수집하였고, 연구는 연세대학교 세브란스 병원의 조사윤리위원회의 승인을 받았다. 임상 데이터는 소급하여 얻었다. 전체생존기간은 수술부터 사망에 이르는 시간으로 정하였고, 데이터는 환자가 마지막 접촉 시 살아있을 때 검열을 받은 것으로 간주하였다. YUSH 데이터는 예후 결과에 주로 원인이 있는 생물학적 특징을 규명하고, 트레이닝 데이터 세트(Training data set)로 그것을 이용하여 예후 예측 모델을 개발하는데 사용하였다.
예후 예측 모델 및 위험도 평점 시스템의 검증을 위해, 본 발명에서는 MD 앤더슨 암센터에서 만든 유전자 발현 프로파일을 사용하였다. 종양 표본 및 임상 데이터는 1999년에서 2006년까지 연세대학교 세브란스 병원, 고려대학교 구로병원 및 고신대학교 의과대학에서 일차 치료로 위 절제술을 받은 위선암 환자들로부터 얻었다. 모든 샘플들은 환자로부터 상세하게 기재된 동의서를 받은 후 수집하였고, 연구는 MD 앤더스 암센터의 조사윤리위원회의 승인을 받았다.
(유전자 발현 데이터)
YUSH 데이터 세트에서 78개의 샘플들에 대한 실험 및 분석은 연세대학교 세브란스 병원에서 수행하였다. 유전자 발현 프로파일은 48803개의 유전자 특징을 포함하는 Illumina human bead arrays(HumanHT-12, v3.0, Illumina, San Diego, CA)와 표지된 cRNAs를 혼성화시켜 만들었다. 총 RNA는 mirVanaTM RNA 분리 표지화 키트(Ambion, Inc.)를 사용하여 신선한 냉동 조직에서 추출하였다. 제조업체(Illumina)의 설명서에 따라 500ng의 총 RNA를 표지화 및 혼성화를 위해 사용하였다. 상기 비드 칩은 Illumina BeadArray Scanner로 스캐닝한 후 마이크로어레이 데이터는 R 언어 환경(Bolstad BM, 2003)에서 마이크로어레이 데이터(LIMMA) 패키지를 위한 선형모형에서 사분위수 표준화 방법에 따라 표준화하였다. 일차 마이크로어레이 데이터는 NCBI 유전자 발현 옴니버스(GEO) 공개 데이터베이스(microarray platform GEO0000, microarray data GEO0000)에서 이용할 수 있다. MDACC 데이터 세트에서 80개 샘플에 대한 실험 및 분석은 YUSH 데이터 세트에서 수행된 것과 같은 과정으로 MD 앤더스 암센터의 시스템 생물학부에서 수행하였다. MDACC 데이터 세트에 대한 일차 마이크로어레이 데이터는 NCBI 유전자 발현 옴니버스(GEO) 공개 데이터베이스(microarray platform GEO0000, microarray data GEO0000)에서 이용할 수 있다.
(마이크로어레이 데이터 분석)
클러스터 분석은 클러스터 및 트리뷰(http://rana.lbl.gov/EigenSoftware.htm)로 수행하였다. 클러스터 분석을 위해 로그 베이스 2 변환된 데이터는 각 유전자 발현 값에 대해 중간값을 기재하였다. 환자들 사이에 다른 발현 수준을 갖는 유전자들을 만들기 위해, 필터링 기준을 바꾸면서 연속 유전자 여과를 만들었다. unsupervised clustering analysis 은 연속 분산 여과 후 수행하였고, 2개의 주요 클러스터로 구성된 2개의 클래스의 예후적 차이는 log rank test 및 Kaplan Meier Plot 에 따라 시험하였다.
마이크로어레이 데이터 세트 분석을 위해 BRB ArrayTools Version 4.1 (http://linus.nic.nih.gov./BRB-ArrayTools.html)를 사용하였다. 주요 데이터 분석 전 및 사분위수 표준화 후에 데이터 세트에 대해 로그 베이스 2 변환을 적용하였다. 비교된 2개의 클래스 간에 유의적으로 다르게 발현된 유전자들을 동정하기 위해 2개 샘플의 t-테스트를 적용하였다. 주요 생물학적 기능 및 유전적 경로를 특성 규명하기 위해, Biocarta 데이터베이스에서 나열된 281개의 경로에 대해 GSEA(gene set enrichment analysis )를 수행하였다.
예후 예측 모형을 만들기 위해, YUSH 데이터를 트레이닝 세트로, MDACC 데이터 세트를 검증 세트로 사용하였다. 독립적인 환자 데이터 세트의 클래스를 예측하기 위해, 이미 개발된 3개의 다른 예측 알고리즘 기반 예측 모드(Linear Discriminant Analysis(LDA), Compound Covariate Predictor(CCP) 및 Nearest Centroid(NC))를 적용하였다. 2개의 샘플 테스트에 의해 평가될 때와 같이 상기 모형을 0.001 유의 수준에서 유전자들 사이에서 차등적으로 발현되는 것에 결합시켰다. 각 모형의 예측 오류를 추정하기 위해 단일잔류 교차검증(Leave-one-out cross-validation, LOOCV)을 사용하였다. 단일잔류 교차검증 트레이닝 세트를 위해, 유전자 선별을 포함하여 전체 모형-빌딩 프로세스를 반복하였다. 또한, 교차검증 오류율 추정치(cross-validated error rate estimate)가 유의적으로 1 미만인 것이 임의 예측으로부터 기대될 수 있는지를 평가하였다. 예측 모형의 예후력을 평가하기 위해 예측 모형을 위한 검증 데이터 세트를 사용하였고, Kaplan Meier Plot 및 log rank test을 사용하여 그 결과를 평가하였다.
분류된 환자 군의 예후 차이를 평가하기 위해 Kaplan Meier Plot 및 log rank test을 사용하였다.
공변량으로서 독립 예후 인자 관련 생존과, 유전자 특징, 종양 병기 및 병리학적 특징을 평가하기 위해 다변량 콕스 비례 위험 회귀 분석을 사용하였다.
(예후 위험도 평점 시스템의 개발)
종양발생 및 전이에 주로 원인이 있는 유전자들에 기초한 위험도 평점 시스템을 만들기 위해, CGAP에서 주석이 달린 유전자들로부터 기능적으로 분류된 유전자들의 예후적 영향을 수행하였다. 위험도 평점 시스템은 CGAP에서 주석이 달린 유전자들을 이용하여 만들었고, 콕스-회귀 분석(p<0.001)에서 유의적인 예후 값을 갖는다. 위험도 점수는 발현 값의 중간값에 위험 계수(hazard ratio, HR)를 곱하고, 그 값을 총 합하여 만들었다. HR 값이 1 미만인 경우 -1/HR로 변환하였다. 위험도 점수의 백분율(percentile risk score)은 다음 식에 따라 계산하였다:
RS(%)=100×(샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)
50% 이상의 RS(%)을 갖는 샘플은 고 위험군으로 분류하고, 25% 이상의 RS 백분율 및 50% 미만의 RS(%)을 갖는 샘플은 중간 위험군으로 분류하였다. 마지막으로 25% 미만의 RS(%)을 갖는 샘플은 저 위험군으로 분류하였다.
<실시예 1> NO 위암 환자들의 유전자 발현 프로파일 조사
필터링 기준을 바꾸면서 하는 연속 분산 여과는 독특한 2가지 주요 클러스터들을 갖는 15개 클러스터를 발생하였다. 분산 여과한 후 다수의 유전자는 5612개의 프로브에서 701개의 프로브에 이르기까지 다양하며, log rank test에서 p-값은 분산 여과 기준에 따라 최대 0.291(M2_1: 중간값과 비교하여 2배 이상의 증가 또는 감소를 나타내는 프로브들을 적어도 1개 갖는 유전자를 선택하여 분산 여과한 후 5612개의 프로브를 갖는 클러스터)에서 최소 0.0181(M3_3: 중간값과 비교하여 3배 이상의 증가 또는 감소를 나타내는 프로브들을 적어도 3개 갖는 유전자를 선택하여 분산 여과한 후 706개의 프로브를 갖는 클러스터)까지 다양하였다. 15개의 클러스터 중에서, 11개의 클러스터들은 unsupervised hierachical clustering analysis에서 log rank test에서 통계적으로 유의적인 예후적 차이를 나타내는 2가지 주요 클래스를 발생하였다(도 1a 및 표 1).
표 1
Figure PCTKR2014002958-appb-T000001
예후 결과에서 통계적 유의를 나타내는 11개의 클러스터를 사용하여 환자 샘플 패턴 분석을 수행한 결과, unsupervised clustering analysis에 따라 발생한 2개의 클래스의 구성은 필터링 기준에 상관없이 꽤 유사한 패턴을 나타냈고, 샘플 구성의 2개의 다른 패턴들을 보여주며, 심지어 각 클래스의 하나 또는 2개의 샘플들은 필터링 기준에 따른 분류에서 차이를 나타냈다(도 1b). 따라서, 샘플 구성의 2개의 다른 패턴을 나타내는 2개의 클러스터를 선택하였다(도 2).
M2_5(중간값과 비교하여 2배 이상의 증가 또는 감소를 나타내는 프로브들을 적어도 5개 갖는 유전자를 선택하여 분산 여과한 후 1556개의 프로브를 갖는 클러스터)의 좋은 예후 군은 단지 1명의 사망 환자를 갖지만(4% 사망률), 나쁜 예후 군은 15명의 사망 환자(28% 사망률)(log rank test p=0.0279, 도 1c)를 갖는다. M3_3의 좋은 예후 군은 단지 2명의 사망 환자(6% 사망률)를 갖지만, 나쁜 예후 군은 14명의 사망 환자(29.8% 사망률)를 갖는다(log rank test p=0.0181, 도 1d).
<실시예 2> 2개의 주요 클러스터들의 생물학적 특징
예후 결과에서 이러한 차이를 나타내는 2개의 클래스의 주요 유전적 특징을 정의하기 위해, 2개의 샘플에 대한 t-테스트를 수행하였다. unsupervised clustering analysis 후 M2_5의 2개의 주요 클러스터를 나타내는 2개의 클래스의 비교는 2886개의 유의적으로 다른 프로브를 생성했다(p<0.001).
도 3A는 M2_5의 2개의 클래스의 비교에서 통계적 유의(p<0.001)를 갖는 2배 이상의 차이를 보여주는 프로브를 이용한 조건부 클러스터링 분석의 히트맵을 나타낸 것이다. 면역 반응에 관련된 많은 유전자들(IFNG, GZMA, GZMB, CD8A, STAT1, JAK2, HLADPA1)이 좋은 반응 군에서 발현이 매우 증가하였다.
Biocarta 경로 데이터베이스에서 이들 2개의 클래스의 GSEA를 수행하였을 때, 가장 유의적으로 향상된 경로는 통계적 유의(p=0.00001)를 갖는 항원 프로세싱 및 제시(Antigen Processing and presentation)(MHC 경로)와 IFN 감마 신호전달경로(IFNG 경로)였다. 이들 2개의 주요 신호전달경로를 제외하고, Th1/Th2 분화(TH1TH2 경로), 표적세포에 대한 CTL 매개 면역 반응(CTL 경로), NK 세포에서 NO2 의존성 IL12 경로(NO2IL12 경로), T 세포 활성화에서 Tob의 역할(TOB1 경로), Th1 발달 시 IL12 및 Stat4 의존적 신호전달경로(IL12 경로) 및 T 세포독성 세포 표면 분자(T 세포독성경로)는 면역반응에 관련된 신호전달경로이며, Biocarta 경로 데이터베이스의 GSEA에서 유의적으로 향상되어 있다(도 4A). 유의적으로 향상된 각 경로의 유전자 성분들은 좋은 예후 군에서 면역 활성화와 관련된 유전자들의 일방향성 활성화를 나타냈다(도 5a-f).
unsupervised clustering analysis 후 M3_3의 2개의 주요 클러스터를 나타내는 2개의 클래스의 비교는 2680개의 유의적으로 다른 프로브를 생성하였다(p<0.001).
도 3B는 M3_3의 2개의 클래스의 비교에서 통계적 유의(p<0.001)를 갖는 3배 이상의 차이를 보여주는 프로브를 이용한 조건부 클러스터링 분석의 히트맵을 나타낸 것이다. 세포증식(CCNE1, CCNA2, CDCA5, AURKA, E2F7, CDC25A)에 관련된 유전자들과 DNA 복구에 관련된 유전자(TOP2A)가 좋은 반응 군에서 발현이 매우 증가하였다.
Biocarta 경로 데이터베이스에서 이들 2개의 클래스의 GSEA를 수행한 결과, 가장 유의적으로 향상된 경로는 암 감수성(ATR BRCA 경로)에서 BRCA1, BRCA2 및 ATR의 역할, DNA 손상(cdc25 경로)에 대한 반응에서 cdc25 및 chk1 조절 경로, 사이클린 및 세포주기조절(세포주기 경로), 사이클린 E 파괴 경로(FBW7 경로), 세포주기:G1/S 체크포인트(G1 경로), 세포주기:G2/M 체크포인트(G2 경로), CDK 조절(MCM 경로), 세포주기 진행 중 p27 인산화 조절(P27 경로), 세포주기를 조절하는 Sonic Hedgehog(SHH) 수용체 Ptc1(PTC1 경로), DNA 손상에 대한 반응에서 RB 종양억제자/체크포인트 신호전달(RB 경로), 및 E2F1 파괴경로(SKP2 E2F 경로)이다(도 4B, p=0.00001).
유의적으로 향상된 각 경로의 유전자 성분들은 좋은 예후 군에서 세포 증식과 관련된 유전자들의 일방향성 활성화를 나타냈다(도 6a-f).
<실시예 3> 예후 예측 모형의 생성
예후 예측 모형을 만들기 위해, 3개의 다른 예후 예측 알고리즘, 즉, Compound Covariate Prediction (CCP), Linear Discriminant Analysis (LDA), Nearest Centroid(NC)를 사용하였다. 분류군 예측을 위해 0.001 유의 수준에서 2개의 클래스 사이에 유의적으로 다른 유전자들을 사용하였고, 단일잔류 교차검증법을 사용하여 정정예측비를 계산하였다.
M3_3 분류군에 대한 Training data set (YUSH 데이터 세트)에서 2개의 예측된 군 사이의 예후적 차이는 통계적으로 유의하였고(log rank test, CCP: p=0.00933, LDA: p=0.0137 및 NC: p=0.00217), M3_3의 분류군을 위한 정정예측비는 85% 내지 92% (CCP:86%, LDA:85% 및 NC:92%)까지 다양하였다(도 7A-C).
MDACC 데이터 세트는 분류군의 검증을 위해 사용하였다. MDACC 테스트 데이터 세트 환자들(80명의 환자)의 예측 결과는 예후 결과에서 Training YUSH data set와 유사한 패턴을 나타내었다. 예후적 차이는 통계적으로 유의하였고(log rank test, CCP: p=0.00645, LDA: p=0.00372 및 NC: p=0.0247), 좋은 예후로 분류된 군은 CCP의 경우 3.3% 사망률(30명의 환자 중 1명의 환자가 사망함), LDA의 경우 3.2% 사망률(31명의 환자 중 2명의 환자가 사망함), NC의 경우 6.45% 사망률(31명의 환자 중 2명의 환자가 사망함)을 갖는 좋은 예후 결과를 나타냈다. 또한, 나쁜 예후 군으로 분류된 군은 CCP의 경우 30%의 사망률(50명의 환자 중 15명의 환자가 사망함), LDA의 경우 30.6% 사망률(49명의 환자 중 15명의 환자가 사망함), NC의 경우 28.6% 사망률(49명의 환자 중 14명의 환자가 사망함)을 갖는 나쁜 예후 결과를 나타냈다(도 7D-F).
총 샘플의 예측된 결과는 log rank test의 p-값이 CCP 및 LDA의 경우 0.000111를, NC의 경우 0.000012를 가지면서 3개의 다른 알고리즘 모두에 대해 2개의 주요 클래스 간의 꽤 강력한 예후적 차이를 나타냈다(도 7G-I).
비록 정정분류비(correct classification rate)는 M3_3 분류군(CCP 92%, LDA 90% 및 NC 95%) 보다 훨씬 더 높았으나 M2_5에 대한 테스트 데이터 세트에서 예측된 결과는 통계적으로 유의하지 않았다(log rank test, CCP: p=0.0948, LDA: p=0.056 및 NC: p=0.06)(도 8A-C).
MDACC 테스트 데이터 세트 환자들의 예측된 결과는 보다 강력한 통계적 유의를 갖는 예후 결과에서 Training YUSH data set와 유사한 패턴을 보여주고 있다. 예후적 차이는 통계적으로 유의하고(log rank test, CCP: p=0.0155, LDA: p=0.0155 및 NC: p=0.0214), 좋은 예후로 분류된 군은 CCP, LDA, 및 NC의 경우 3.8% 사망률(26명의 환자 중 1명의 환자가 사망함)을 갖는 좋은 예후 결과를 보여주고 있다. 또한, 나쁜 예후 군으로 분류된 군은 CCP, LDA 및 NC의 경우 27.8% 사망률(54명의 환자 중 15명의 환자가 사망함)을 갖는 나쁜 예후 결과를 보였다(도 8D-F). 총 샘플의 예측된 결과는 log rank test에서 p-값이 CCP의 경우 0.00377, LDA의 경우, 0.00203, NC의 경우 0.00284를 가지면서 3개의 다른 알고리즘 모두에서 꽤 강력한 예후 결과를 나타냈다(도 8G-I).
<실시예 4> NO 위암 환자의 예후에 영향을 주는 CGAP로부터 기능적 유전자 분류
NIH에서 CGAP로부터 유전자 주석은 주로 종양생성, 종양진행 및 암 전이에 영향을 주는 기능적 유전자 분류를 특징으로 하고 있다. 따라서, 이들 기능적 유전자 분류에 기초한 예후 특성규명은 이들 접근법이 암의 어떤 병기의 예후에 주로 원인이 되는 주요 생물학적 특징들을 나타낼 때 꽤 유익하다. 따라서, 본 발명자들은 YUSH (n=78) 및 MDACC (n=80) 및 합친 총 환자들 데이터 세트(n=158)로부터 2개의 데이터 세트로부터 각 유전자 분류의 영향을 시험하였다.
기능적 유전자 분류를 가지고 실시한 unsupervised hierachical clustering analysis 에 의해 생성된 주요 클러스터의 예후 결과는 2개의 다른 데이터 세트 사이에 다양하였다. 신생혈관생성은 YUSH 데이터로부터 CGAP에서 통계적 유의를 나타내는(log rank test p=0.0215) 유일한 기능적 분류인 반면, MDACC 데이터 세트는 신생혈관생성(p=0.0337), DNA 손상(p=0.0188), DNA 복제(p=0.0402), 전이(p=0.0235), 신호전달(p=0.0176) 및 전사인자(p=0.0000706)에서 통계적 유의를 나타냈다. 합친 환자들 데이터 세트는 세포사멸 및 발생을 제외하고는 대부분 기능적 유전자 분류에서 유의를 나타냈다(도 9A).
총 샘플의 기능적 유전자 분류의 프로브를 사용하여 unsupervised hierachical clustering analysis 에 의해 정의된 2개의 클래스에 대해 Biocarta 경로 데이터 베이스의 GSEA를 수행한 결과, 기능적 유전자 분류는 유의적으로 다른 유전자 세트 분류의 2가지 다른 패턴을 나타냈다. 대부분의 세포증식에 관련된 유전자 세트(DNA 복제의 CDK 조절, E2F1 파괴경로, 세포주기: G1/S 체크 포인트, 세포주기: G2/M 체크 포인트, DNA 손상에 대한 반응에서 CDC25 및 chk1 조절 경로)는 DNA 복제, DNA 손상, 유전자 조절, 대사 및 전사인자의 기능적 유전자 분류의 프로브에 의해 만들어진 2개의 클래스의 비교에서 유의적으로 향상되었다. 전이, 면역, 신생혈관생성, 세포 신호전달, 신호전달 및 세포주기의 기능적 유전자 분류는 면역반응(T 세포 활성화에서 Tob의 역할, TCR 활성화, T 세포 수용체 및 CD3 복합체의 개시에서 Lck 및 Fyn 티로신 키나아제, T 헬퍼 세포 표면 분자, NK 세포 및 B 세포 수용체 복합체에서 NO2 의존적 IL12 경로), 특히 T 세포 관련 면역 반응에 관련된 유전자 세트에서 가장 유의적인 차이를 나타냈다. M2_5 및 M3_3 클러스터를 사용하여 만든 2개의 클래스의 예후적 차이에 영향을 주는 생물학적 특징들에 원인이 되는 2가지 주요 생물학적 특징을 상기시킨다(도 9B).
<실시예 5> 예후 위험도 평점 시스템의 생성
unsupervised clustering analysis 후 각 클래스에서 만든 사망률과 2개의 분류군 M3_3 및 M2_5의 예측된 결과로 환자들을 배열하였을 때, 어떤 환자들은 분류군 및 기능적 유전자 분류에서 정의된 클러스터의 타입에 따라 다른 클래스로 분류됨을 발견하였다. 따라서, 특징 또는 분류군의 특정 타입에 기초한 분류 및 예후 예측은 비록 정의된 클래스가 log rank test의 예후 비교에서 통계적 유의를 나타낸다 하더라도 완전히 예후 결과를 나타내는 것은 아니었다(도 10A). 주로 위암 환자의 복잡한 생물학적 특징들 때문이며, 위암 환자들의 예후 결과에 영향을 주는 생물학적 또는 생리학적 특징들의 모든 측면을 고려하는 것이 중요함을 암시한다.
따라서, 다음으로 각 기능적 유전자 분류의 예후 결과의 차이에 원인이 되는 주요 생물학적 특징들을 반영하기 위해 기능적 유전자 분류에서 예후적 차이에 원인이 되는 유전자들을 조사하였다. 콕스 회귀 분석에서 통계적 유의(p<0.001)를 갖는 51개의 유전자를 선별하고, 예후 위험도 평점 시스템의 백분율을 만드는데 사용하였다(표 2). 예후 프로브는 CGAP에서 주석이 달린 프로브들로부터 콕스회귀분석(p<0.001)에 따라 선택되었다.
표 2
Figure PCTKR2014002958-appb-T000002
총 환자들(n=158)에서 21명의 환자들은 50% 이상의 위험도 점수를 보여주는 위험도 평점 시스템의 백분율에 기초하여 고 위험군으로 지정하였다. 고 위험군 환자들에 대한 사망률은 총 샘플에서 61.9%를 보여주어 극히 높았고, 2개의 데이터 세트 환자들은 꽤 유사한 임상 결과를 나타냈다(YUSH: 54.5% 사망률, MDACC: 70% 사망률).
70명의 환자들을 중간 위험군(25% 이상 내지 50% 미만의 위험도 점수)으로 지정하였고, 중간 위험군에 대한 사망률은 20%였다. YUSH 데이터 세트에 대한 임상 결과는 YUSH 환자들에 대한 25%의 사망률을 보여주는 MDACC 데이터 환자들보다 약간 더 나쁜 반면, MDACC 데이터 환자들에 대해서는 16%의 사망률을 보여주었다. 총 67명의 환자들은 저 위험군으로 지정하였고, 총 샘플 데이터에서 7.45%의 사망률을 나타냈다. YUSH 데이터 환자들은 9%의 사망률을 갖는 MDACC 데이터 환자들과 비교하여 약간 더 좋은 예후를 보여주는 5.7%의 사망률을 보여주었다(도 10B-D).
예후적 차이는 명백하게 3개의 다른 위험군은 총 데이터 세트에서 log rank test에서 p-값이 1.36 e-07으로 매우 강력한 통계적 유의를 나타냈다. YUSH 데이터 세트는 log rank test에서 p-값이 0.00254를 나타냈고, MDACC 데이터 세트는 log rank test에서 p-값이 1.11e-05를 나타냈다(도 10E-F).
본 발명은 위암 재발 예후 예측 분야에서 진단 키트로 사용할 수 있다.

Claims (11)

  1. 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서
    GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및
    상기 단계에서 결정된 RNA 전사체의 발현도에 기초하여 상기 생물학적 샘플의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 상기 RS(%)에 따라 예후를 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법.
  2. 제1항에 있어서,
    RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산하는 방법:
    [수학식 1]
    RS=HR1*normLogTransValue1 + HR2*normLogTransValue2 + ... + HRn* normLogTransValuen
    [수학식 2]
    RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)
    상기 식에서,
    HRn는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HRn이 1 미만인 경우 -1/HRn로 변환하여 사용하며,
    normLogTransValuen는 n번째 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,
    상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
  3. 제1항에 있어서,
    상기 방법이 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것인 방법.
  4. 제1항에 있어서,
    상기 방법은 전체 생존율(Overall Survival, OS) 측면에서 생물학적 샘플의 RS(%)가 50% 이상을 갖는 경우 고 위험군, 25% 이상 내지 50% 미만인 경우 중간 위험군, 25% 미만인 경우 저 위험군으로 판단하는 것인 방법.
  5. 대상으로부터 얻은 암세포를 포함하는 생물학적 샘플에서
    GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현 수준을 측정하는 단계; 및
    상기 전사체의 발현 증가는 긍정적인 임상 결과 가능성의 증가로 판단하는 단계를 포함하는, 위암으로 진단된 대상에서 예후를 예측하는 방법.
  6. 제5항에 있어서,
    상기 방법이 어레이 기반 방법인 방법.
  7. 제5항에 있어서,
    상기 임상 결과가 전체 생존율(Overall Survival, OS) 측면에서 표현되는 것인 방법.
  8. 제5항에 있어서,
    상기 방법이 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것인 방법.
  9. 위암의 예후 예측을 실행하는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체에 있어서, 환자로부터 얻은 핵산 시료에서
    GART, PTN, PCNA, GLI3, SMARCD3, SULT1A3, ILK, FUCA1, PKD1, TOP2A, ABL1, CKS2, FZD1, TIAL1, SGCD, PIGF, CCNB1, CSK, CRYAB, TPM1, RFC4, GUCY1B3, TYMS, FEN1, GNAI1, CSRP1, UNG, AXL, MAP1B, VCL, ITGA5, LIG1, HPRT1, GRB2, HMMR, MCM4, SRF, DMPK, ACP5, CD38, PRIM1, CCNF, GLRB, IFNAR2, HSPA2, CLN3, BUB1, CALM1, CDC2, ATF4 및 RRM1의 RNA 전사체의 발현도를 결정하는 단계; 및
    상기 단계에서 결정된 RNA의 발현도에 기초하여 상기 시료의 위험도 점수(RS, Risk Score) 및 RS 백분율(RS(%))을 계산하고, 전체 생존율(Overall Survival, OS) 측면에서 상기 RS(%)의 설정치 범위가 50% 이상을 갖는 경우 고 위험군 환자, 25% 이상 내지 50% 미만인 경우 중간 위험군 환자, 25% 미만인 경우 저 위험군 환자로 분류하는 단계를 컴퓨터에 실행시키는 프로그램을 기록한 컴퓨터로 판독가능한 기록 매체.
  10. 제9항에 있어서,
    상기 RS 및 RS(%)은 하기 수학식 1 및 2에 따라 계산하는 것인 기록 매체:
    [수학식 1]
    RS=HR1*normLogTransValue1 + HR2*normLogTransValue2 + ... + HRn* normLogTransValuen
    [수학식 2]
    RS(%)=100×(생물학적 샘플의 RS - 모집단의 RS 최소값)/(모집단의 RS 최고값 - 모집단의 RS 최소값)
    상기 식에서,
    HRn는 n번째 RNA 전사체의 위험 계수(hazard ratio)를 나타내고, 상기 HRn이 1 미만인 경우 -1/HRn로 변환하여 사용하며,
    normLogTransValuen는 RNA 전사체의 발현과 관련된 값이고, 이 값은 해당 유전자의 전체 값을 대상으로 하여 중간값을 중심으로 스케일을 변화시킨 값이며,
    상기 모집단은 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암을 갖는 일정 수의 집단을 의미하고, 일정 수는 RS 최고값과 최소값을 산출할 수 있는 정도의 임의의 정수이다.
  11. 제9항에 있어서,
    상기 기록 매체는 TNM 병기 분류에서 림프절 전이가 없는 T1NO기, T2N0기, T3N0기 또는 T4N0기 국소진행형 위암의 수술에 의한 절제 후 임상 결과를 예측하는 것인 기록 매체.
PCT/KR2014/002958 2013-04-05 2014-04-07 국소 진행형 위암에 대한 예후 예측 시스템 WO2014163444A1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016506252A JP6280206B2 (ja) 2013-04-05 2014-04-07 局所進行性胃癌に対する予後予測システム
CN201480024658.4A CN105431737B (zh) 2013-04-05 2014-04-07 用于预测局部晚期胃癌预后的系统
US14/782,515 US20160063179A1 (en) 2013-04-05 2014-04-07 System for predicting prognosis of locally advanced gastric cancer
EP14779566.0A EP2982985B1 (en) 2013-04-05 2014-04-07 System for predicting prognosis of locally advanced gastric cancer

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130037334A KR101504817B1 (ko) 2013-04-05 2013-04-05 국소 진행형 위암에 대한 예후 예측 시스템
KR10-2013-0037334 2013-04-05

Publications (1)

Publication Number Publication Date
WO2014163444A1 true WO2014163444A1 (ko) 2014-10-09

Family

ID=51658660

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/002958 WO2014163444A1 (ko) 2013-04-05 2014-04-07 국소 진행형 위암에 대한 예후 예측 시스템

Country Status (6)

Country Link
US (1) US20160063179A1 (ko)
EP (1) EP2982985B1 (ko)
JP (1) JP6280206B2 (ko)
KR (1) KR101504817B1 (ko)
CN (1) CN105431737B (ko)
WO (1) WO2014163444A1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016181979A1 (ja) * 2015-05-13 2016-11-17 国立大学法人名古屋大学 Syt7・mfsd4・etnk2発現量による胃癌肝転移の検査方法、検査キット、分子標的治療薬スクリーニング方法、医薬組成物
WO2017215230A1 (zh) * 2016-06-15 2017-12-21 南京卡迪睿伯生物技术有限公司 一组胃癌基因的应用
WO2020115730A1 (en) * 2018-12-06 2020-06-11 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Integrated system and method for personalized stratification and prediction of neurodegenerative disease

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874647B (zh) * 2017-01-06 2019-03-22 吴安华 一种脑胶质母细胞瘤患者生存期预测系统
KR101966642B1 (ko) 2017-03-14 2019-04-09 (주) 노보믹스 진행성 위암 환자의 수술 후 예후 또는 항암제 적합성 예측 시스템
CN106841619A (zh) * 2017-03-17 2017-06-13 中国科学院上海高等研究院 三种蛋白质用作鉴定淋巴结转移胃癌的分子标记的应用
US11195601B2 (en) 2017-05-31 2021-12-07 International Business Machines Corporation Constructing prediction targets from a clinically-defined hierarchy
CN109652548B (zh) * 2019-01-21 2022-08-05 首都医科大学附属北京朝阳医院 circ-CCNB1作为胃癌和结直肠癌诊断生物标志物和治疗靶点的应用
EP4134453A1 (en) * 2020-04-08 2023-02-15 Gencurix Inc. Composition for diagnosing colorectal cancer, rectal cancer, or colorectal adenoma using cpg methylation change of glrb gene, and use thereof
CN113053456B (zh) * 2021-03-23 2023-04-04 广州医科大学附属第二医院 Aml患者免疫分型系统、aml患者预后评分模型及其构建方法
KR20220148615A (ko) * 2021-04-29 2022-11-07 연세대학교 산학협력단 위암의 예후 예측 방법
CN113462773A (zh) * 2021-05-19 2021-10-01 山东大学 一种预测胃癌患者生存风险、免疫治疗响应和细胞焦亡诱导剂适用性的标志物及其应用
WO2023085716A1 (ko) * 2021-11-09 2023-05-19 연세대학교 산학협력단 난치성 분자아형 암 치료 표적으로서 고atp친화성 단백질 및 이의 억제제

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003065035A1 (en) * 2002-02-01 2003-08-07 Mtm Molecular Tools In Medicine Method for monitoring and prognosis of disease course of gastrointestinal tumors
US20100184046A1 (en) * 2008-11-12 2010-07-22 Caris Mpi, Inc. Methods and systems of using exosomes for determining phenotypes
JP2010539973A (ja) * 2007-10-05 2010-12-24 パシフィック エッジ バイオテクノロジー リミティド 胃腸癌での増殖の徴候及び予後
JP2011500071A (ja) * 2007-10-30 2011-01-06 ユニヴェルシテ リブル ドゥ ブリュッセル 遺伝子に基づくアルゴリズム的ガン予後及び患者の臨床結果
KR20120065959A (ko) * 2010-12-13 2012-06-21 사회복지법인 삼성생명공익재단 위암의 예후 예측용 마커 및 이를 이용하는 위암의 예후 예측 방법

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001126A1 (en) * 2003-06-12 2005-01-06 Korea Research Institute Of Bioscience And Biotechnology Detection kit for gastric cancer and metastatic gastric cancer
WO2008063521A2 (en) * 2006-11-13 2008-05-29 The General Hospital Corporation Gene-based clinical scoring system
CN1973778A (zh) * 2006-12-08 2007-06-06 南京大学 胃癌术后严重并发症风险度的预测方法
CA2742324A1 (en) * 2008-10-30 2010-06-03 Caris Life Sciences Luxembourg Holdings, S.A.R.L. Methods for assessing rna patterns
WO2010064702A1 (ja) * 2008-12-05 2010-06-10 国立大学法人 東京大学 癌の予後を予測するためのバイオマーカー

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003065035A1 (en) * 2002-02-01 2003-08-07 Mtm Molecular Tools In Medicine Method for monitoring and prognosis of disease course of gastrointestinal tumors
JP2010539973A (ja) * 2007-10-05 2010-12-24 パシフィック エッジ バイオテクノロジー リミティド 胃腸癌での増殖の徴候及び予後
JP2011500071A (ja) * 2007-10-30 2011-01-06 ユニヴェルシテ リブル ドゥ ブリュッセル 遺伝子に基づくアルゴリズム的ガン予後及び患者の臨床結果
US20100184046A1 (en) * 2008-11-12 2010-07-22 Caris Mpi, Inc. Methods and systems of using exosomes for determining phenotypes
KR20120065959A (ko) * 2010-12-13 2012-06-21 사회복지법인 삼성생명공익재단 위암의 예후 예측용 마커 및 이를 이용하는 위암의 예후 예측 방법

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Ann Surg Oncol", vol. 17, 2010, article "AJCC cancer staging Manual: stomach", pages: 3077 - 3079
"User Bulletin #2'' for the ABI PRISM 7700 Sequence Detection System", 1997, APPLIED BIOSYSTEMS
See also references of EP2982985A4

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016181979A1 (ja) * 2015-05-13 2016-11-17 国立大学法人名古屋大学 Syt7・mfsd4・etnk2発現量による胃癌肝転移の検査方法、検査キット、分子標的治療薬スクリーニング方法、医薬組成物
WO2017215230A1 (zh) * 2016-06-15 2017-12-21 南京卡迪睿伯生物技术有限公司 一组胃癌基因的应用
WO2020115730A1 (en) * 2018-12-06 2020-06-11 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Integrated system and method for personalized stratification and prediction of neurodegenerative disease
US11915833B2 (en) 2018-12-06 2024-02-27 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Integrated system and method for personalized stratification and prediction of neurodegenerative disease

Also Published As

Publication number Publication date
EP2982985B1 (en) 2018-09-05
CN105431737A (zh) 2016-03-23
EP2982985A4 (en) 2016-11-09
US20160063179A1 (en) 2016-03-03
JP2016516421A (ja) 2016-06-09
KR101504817B1 (ko) 2015-03-24
CN105431737B (zh) 2017-11-24
EP2982985A1 (en) 2016-02-10
KR20140121522A (ko) 2014-10-16
JP6280206B2 (ja) 2018-02-14

Similar Documents

Publication Publication Date Title
WO2014163444A1 (ko) 국소 진행형 위암에 대한 예후 예측 시스템
Schuetz et al. Progression-specific genes identified by expression profiling of matched ductal carcinomas in situ and invasive breast tumors, combining laser capture microdissection and oligonucleotide microarray analysis
Talantov et al. Novel genes associated with malignant melanoma but not benign melanocytic lesions
Chevillard et al. Gene expression profiling of differentiated thyroid neoplasms: diagnostic and clinical implications
WO2018199589A1 (ko) 위암의 생물학적 특성에 기반한 군 구분 및 예후 예측 시스템
Michiels et al. Genes differentially expressed in medulloblastoma and fetal brain
US20120245235A1 (en) Classification of cancers
Kwon et al. Prognosis of stage III colorectal carcinomas with FOLFOX adjuvant chemotherapy can be predicted by molecular subtype
US20110166028A1 (en) Methods for predicting treatment response based on the expression profiles of biomarker genes in notch mediated cancers
Gyvyte et al. MiRNA profiling of gastrointestinal stromal tumors by next-generation sequencing
WO2002059271A2 (en) Gene expression profiles in breast tissue
JP2009544583A (ja) Tak1阻害剤を用いた癌の治療方法
CA2504403A1 (en) Prognostic for hematological malignancy
WO2013147330A1 (ko) 국소 진행형 위암에 대한 예후 예측 시스템
Heller et al. Molecular signatures of basal cell carcinoma susceptibility and pathogenesis: a genomic approach
Chen et al. Super‐enhancer–associated long noncoding RNA RP11‐569A11. 1 inhibited cell progression and metastasis by regulating IFIT2 in colorectal cancer
Rao et al. cDNA microarray profiles of canine mammary tumour cell lines reveal deregulated pathways pertaining to their phenotype
US20180051346A1 (en) Methods and means for subtyping invasive lobular breast cancer
JP4370409B2 (ja) がんの予後予測方法
CA2603898A1 (en) Laser microdissection and microarray analysis of breast tumors reveal estrogen receptor related genes and pathways
KR20030078801A (ko) 결장직장암의 검사방법
KR20030078802A (ko) 결장직장암의 검사방법
WO2010076887A1 (en) Predictive biomarkers useful for cancer therapy mediated by a wee1 inhibitor
US20120157342A1 (en) Predictive biomarkers useful for cancer therapy mediated by a wee1 inhibitor
US20100015620A1 (en) Cancer-linked genes as biomarkers to monitor response to impdh inhibitors

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201480024658.4

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14779566

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016506252

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 14782515

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 2014779566

Country of ref document: EP