WO2014171778A1 - 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도 - Google Patents

조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도 Download PDF

Info

Publication number
WO2014171778A1
WO2014171778A1 PCT/KR2014/003384 KR2014003384W WO2014171778A1 WO 2014171778 A1 WO2014171778 A1 WO 2014171778A1 KR 2014003384 W KR2014003384 W KR 2014003384W WO 2014171778 A1 WO2014171778 A1 WO 2014171778A1
Authority
WO
WIPO (PCT)
Prior art keywords
breast cancer
gene
prognosis
genes
sample
Prior art date
Application number
PCT/KR2014/003384
Other languages
English (en)
French (fr)
Other versions
WO2014171778A8 (ko
Inventor
신영기
최윤라
김영덕
오은설
최준영
조상래
Original Assignee
주식회사 젠큐릭스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 젠큐릭스 filed Critical 주식회사 젠큐릭스
Priority to SG11201508544VA priority Critical patent/SG11201508544VA/en
Priority to CN201480034674.1A priority patent/CN105339797B/zh
Priority to EP14785227.1A priority patent/EP2988131A4/en
Priority to JP2016508874A priority patent/JP2016516426A/ja
Publication of WO2014171778A1 publication Critical patent/WO2014171778A1/ko
Priority to US14/886,948 priority patent/US20160102359A1/en
Publication of WO2014171778A8 publication Critical patent/WO2014171778A8/ko
Priority to US16/155,220 priority patent/US10655187B2/en

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/5308Immunoassay; Biospecific binding assay; Materials therefor for analytes not provided for elsewhere, e.g. nucleic acids, uric acid, worms, mites
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Definitions

  • the present invention relates to a gene for predicting early breast cancer prognosis and its use. More specifically, to provide information necessary for predicting the prognosis of breast cancer patients, TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in , subfamily 3, member A2) or HLA-DPA1 (major histocompatibility complex, class II, DP alpha 1) for breast cancer prognostic predictive diagnostic genetic markers and uses thereof.
  • TRBC1 T cell receptor beta constant 1
  • BTN3A2 butyrophi 1 in , subfamily 3, member A2
  • HLA-DPA1 major histocompatibility complex, class II, DP alpha 1
  • microarrays have been used to characterize cancer cells from a macroscopic perspective based on information on the expression patterns of tens of thousands of genes or the increase or decrease of the number of genes. Analyzing this genome-level information is a very technological way to understand organic and complex life phenomena, and will become more active in the future. Especially in complex diseases such as cancer, analysis of a few specific genes is likely to produce narrow results, and it is important to capture large behavioral patterns of cancer development and development. Seats are a must. As such, most of the genome information that is the basis for cancer research is generated using genomic chips such as microarrays.
  • microarrays to obtain information on the expression levels of tens of thousands of genes in breast cancer at once, researches are being actively conducted to classify breast cancers at the molecular level and to elucidate the mechanisms for their development and development. have. Predicting the prognosis of early breast cancer patients is important in the clinic, and the discovery of genes for predicting prognosis using microarrays has already begun in the early 2000s. Although research using microarrays is expensive, expression profiles for a significant number of breast cancer tissues have been produced and disclosed to the researchers. In 2002, 70 prognostic genes were discovered by analyzing the survival information of 78 early breast cancer tissues and patients tracked for 10 years. Since then, a dozen prognostic genes have been published.
  • tnammaprint (Agendia) and Oncotype DXCgenomic health, which are currently used in the clinic, but are often used as a reference for prognosis (van de Vijver, M. J. , et al. , A gene-expression signature as a predictor of survival in breast cancer.
  • van de Vijver, M. J. , et al. A gene-expression signature as a predictor of survival in breast cancer.
  • N Engl J Med 347 (25): 1999-2009 (2002); Paik, S., et al. , A mult igene assay to predict recurrence of tamoxi fen-treated, node-negat ive breast cancer.
  • N Engl J Med 351 (27): 2817-2826 (2004).
  • the present inventors have made a thorough research to develop a genetic diagnosis system capable of diagnosing prognosis and anticancer treatment for early breast cancer patients using FFPE samples of tissues containing cancer cells of patients. Collect and analyze the obtained microarray data and clinical information to discover genes related to prognostic prediction, select genes and sets of them suitable for application to discovered gene-enhanced FFPE samples, and confirm their usefulness. It was. It is therefore an object of the present invention to provide genetic markers and their use for prognostic prediction of breast cancer patients.
  • Another object of the present invention is to provide a new method for prognostic prediction of breast cancer patients.
  • Another object of the present invention is to calculate the breast cancer prognostic predictive value, including the steps of separating the mRNA from the patient's sample, measuring the gene expression level, standardization and calculation of the prediction in order to provide information necessary for the prognostic prediction diagnosis of breast cancer patients To provide a way.
  • the present invention provides a genetic marker for the prognostic prediction of breast cancer patients and the use thereof.
  • the present invention provides a new method for prognostic prediction of breast cancer patients.
  • the present invention provides a kit for predicting prognosis of breast cancer patients.
  • the present invention provides a step for the separation of mRNA from the patient's sample, measuring the gene expression level, standardization and calculation of the predictive value in order to provide the information necessary for the prognostic prediction diagnosis of breast cancer patients It provides a method for calculating a breast cancer prognostic predictive value.
  • the present invention is a TBC receptor (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) and HLA-DPA1 (major histocompatibility complex, class II, DP It is a primer pair for any one gene selected from the group consisting of alpha 1), the primer pair provides a primer pair characterized in that the target gene can be amplified by PCR amplification.
  • the present invention is a primer pair for any one gene selected from the group consisting of TRBCl, BTN3A2 and HLA-DPA1, the primer pair can amplify the target gene by PCR amplification
  • the present invention provides a use of a primer pair for the preparation of an agent for predicting the prognosis of breast cancer. Unless otherwise defined, all technical and scientific terms used herein have the same meaning as commonly understood by one of ordinary skill in the art.
  • the following reference provides one of the skills having a general definition of several terms used in the specification of the present invention: Singleton et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BI0L0TY (2ded.l994); THE CAMBRIDGE DICTIONARY OF SCIENCE AND TECHNOLOGY (Walkered., 1988); And Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY.
  • the present invention provides genetic markers and their use for prognostic prediction of breast cancer patients.
  • the present invention relates to T cell receptor beta constant 1 (TRBCl), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) or HLA-DPA1 (major histocompatibility complex, genetic markers of class II, DP alpha 1).
  • TRBCl T cell receptor beta constant 1
  • BTN3A2 butyrophi 1 in, subfamily 3, member A2
  • HLA-DPA1 major histocompatibility complex, genetic markers of class II, DP alpha 1).
  • the present invention (a) separating the mRNA from the sample, (b) TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophilin, subfamily 3, member A2) and HLA-DPAl (major histocompatibility complex, class II, DP alpha 1) measuring the mRNA expression level of at least one gene selected from the group consisting of (c) normalizing the mRNA expression level of the gene and (d) overexpression of the gene has a good breast cancer prognosis It provides a breast cancer prognostic method comprising the step of determining that.
  • Functioning as a genetic marker in the present invention may be TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophilin, subfamily 3, member A2) or HLA-DPAl (major histocompatibility com lex, class II, DP alpha 1). They can each be independently selected or used in the prognostic prediction diagnosis of early breast cancer by a combination of two genes or a combination of three genes.
  • Each gene may be a sequence of each gene known in the art or a sequence of synonyms of each gene, preferably a sequence of each gene derived from human, more preferably TRBC1 is Genbank Accession No.
  • BTN3A2 is the Genbank Accession No. ⁇ _007047.3
  • HLA-DPAl is Genbank Accession No. It may be a sequence described in X_001242524.1, NM_001242525.1, _033554.3. Synonyms and sequences for each gene can be retrieved from Genbank or Swissprot.
  • Breast cancer in the present invention may be invasive breast cancer, or stage I, stage II or III breast cancer.
  • the breast cancer of the present invention may be Estrogen receptor positive (ER +).
  • prognosis refers to the prospect of the future symptoms or course determined by the diagnosis of the disease.
  • the prognosis typically refers to the survival or survival of the cancer within a certain period of time after the onset or surgical procedure.
  • the prediction of prognosis is a very important clinical task as it provides clues to the future direction of breast cancer treatment, particularly whether chemotherapy is given to patients with early breast cancer.
  • Prognosis predictions include the patient's response to the disease treatment and the prediction of the course of treatment.
  • the sample may be breast cancer tissue of a breast cancer patient.
  • the breast cancer may also contain some normal cells, preferably a formalin-fixed paraffin-embedded (FFPE) sample of breast cancer tissue, including cancer cells of the patient.
  • FFPE formalin-fixed paraffin-embedded
  • Detection of predictive diagnostic markers for breast cancer prognosis of the present invention can be performed through a hook of polymerase chain reaction (PCR) for a gene of interest.
  • Detection of the gene of interest of the present invention is preferably detection of the amount of expression of the gene of interest, more preferably quantitative detection of the expression of the gene of interest.
  • mRNA separation in sample tissue and cDNA synthesis in mRNA may be required.
  • a method for RNA separation in a sample known in the art preferably the sample is an FFPE sample, so may be a method for separating mRNA suitable for FFPE samples.
  • cDNA synthesis results can be used cDNA synthesis methods known in the art consisting of mRNA as a template.
  • the detection of the predictive diagnostic marker for breast cancer prognosis is quantitative detection of mRNA expression in an FFPE sample, and thus may be detection by mRNA separation method and RT-qPCR (reverse transcriptation quantitative polymerase chain reaction) method for the FFPE sample.
  • the detection may be a measure of mRNA expression level.
  • the measurement of expression levels can be performed according to methods known in the art, but can be measured by an optical quantitative analysis system using probes labeled with reporter fluorescent dyes and / or quencher fluorescent dyes.
  • the measurements can be made by commercially available equipment such as ABI PRISM 7700 TM Sequence Detection System TM, Roche Molecular Biochemicals Light Cycler and accompanying software. Such accumulated data can be expressed as measured values or threshold cycles (Ct or Cp).
  • the threshold cycle is when the measured fluorescence value is recorded as statistically significant for the first time, which is inversely proportional to the initial value present as a template for the PCR reaction. Indicates that more detection objects exist.
  • the present invention is a primer pair for any one gene selected from the group consisting of TRBCl, BTN3A2 and HLA-DPA1, the primer pair is an active ingredient for a primer pair characterized in that the target gene can be amplified by PCR amplification Including Provides a composition for predicting breast cancer prognosis.
  • the term "primer” refers to a lygonucleotide, the conditions under which the synthesis of a primer extension product complementary to the nucleic acid chain (template) is induced, i.e. the presence of a polymer such as nucleotide and DNA polymerase, And at the appropriate temperature and pH conditions can serve as a starting point for the synthesis.
  • the primer is dioxyribonucleotide and single chain.
  • Primers used in the present invention may include naturally occurring dNMPs (ie, dAMP, dGMP, dCMP and dTMP), modified nucleotides or non-natural nucleotides.
  • the primer may also comprise ribonucleotides.
  • the primer of the present invention may be an extension primer annealed to the target nucleic acid to form a sequence complementary to the target nucleic acid by the template-dependent nucleic acid polymerase, which extends to the position where the immobilized probe is annealed. Occupies the annealed area.
  • the extension primer used in the present invention includes a localized nucleotide sequence complementary to the first position of the target nucleic acid.
  • the term "complementary" means that the primer or probe is sufficiently complementary to selectively hybridize to the target nucleic acid sequence under certain annealing or localization conditions, and is substantially complementary and completely complementary. It has the meaning encompassing all that is perfectly complementary, and preferably means completely complementary ..
  • the term "substantially complementary sequence” as used in connection with the primer sequence is completely consistent. In addition to the sequence to be annealed to a specific sequence within the range that can be included as a primer, the meaning is included in the sequence that is partially mismatched with the sequence to be compared.
  • primer molecules generally require lower temperatures in order to form a more complex stable complex with the template.
  • annealing or “priming” means that the lipoic deoxynucleotide or nucleic acid is apposed to the template nucleic acid, which juxtapositions the polymerase nucleotides to complement the template nucleic acid or a portion thereof. To form nucleic acid molecules.
  • the sequence of the primer does not need to have a sequence that is completely complementary to some sequences of the template, and is sufficient as long as it has sufficient complementarity within a range that can be hybridized with the template to perform a primer-specific function. Therefore, the primer of the present invention does not need to have a sequence that is perfectly complementary to the above-described nucleotide sequence as a template, and it is sufficient to have sufficient complementarity within a range capable of being a primer and acting on this gene sequence.
  • the design of such primers can be easily performed by those skilled in the art with reference to the above-described nucleotide sequence, for example, by using a primer design program (eg, PRIMER 3 program).
  • the present invention provides a breast cancer prognostic predictive diagnostic kit comprising the primer pair of the present invention.
  • the kits of the present invention utilize tools and / or procedures known in the art for PCR reactions, RNA isolation from samples and synthesis of cDNAs, in addition to primer pairs capable of amplification by TRBC1, BTN3A2 and / or HLA-DPA1 PCR. It may further comprise.
  • the kit of the present invention may further include a tube, a well plate, and instructions describing how to use the same, as necessary, for mixing the respective components.
  • the present invention provides a method of calculating a breast cancer prognostic predictive value from a sample of a patient, in order to provide the information necessary for predicting the prognosis of a breast cancer patient.
  • the expression level of the detection target in the present invention may vary in overall gene expression level or expression level depending on the target patient or sample, standardization is required.
  • Normalization is achieved through a difference from the expression level or expression level of a gene that may indicate a difference in basal expression level or expression level, preferably CTBP1 (C-terminal- expression levels of one to five genes (or ascites) in binding protein 1), TBP (TATA ⁇ binding protein), hydroxyme th 1 bi 1 ane synthase (HMBS), CUL1 (cull in 1) and UBQLN1 (Ubiquilin-1) Can be carried out by measuring the average of these expressions when the gene of?
  • CTBP1 C-terminal- expression levels of one to five genes (or ascites) in binding protein 1
  • TBP TATA ⁇ binding protein
  • HMBS hydroxyme th 1 bi 1 ane synthase
  • CUL1 cull in 1
  • UBQLN1 Ubiquilin-1
  • the present invention is a primer pair for any one gene selected from the group consisting of TRBCl, BTN3A2 and HLA-DPA1, the primer pair using a primer pair characterized in that the target gene can be amplified by PCR amplification
  • the primer pair By measuring the mRNA expression level of the selected gene from a sample of a breast cancer patient provides a method for predicting breast cancer prognosis.
  • the present invention provides a primer pair for any one gene selected from the group consisting of TRBCl, BTN3A2 and HLA-DPA1, wherein the primer pair is capable of amplifying a target gene by PCR amplification.
  • the present invention is a primer pair for any one gene selected from the group consisting of TRBCl, BTN3A2 and HLA-DPA1, the primer pair is a breast cancer prognosis of the primer pair characterized in that the amplification of the target gene by PCR amplification
  • the primer pair is a breast cancer prognosis of the primer pair characterized in that the amplification of the target gene by PCR amplification
  • amplification of the target gene by PCR amplification Provided are uses for the preparation of predictive formulations.
  • the present invention provides a genetic marker for prognostic prediction of early breast cancer. All. Gene markers of the present invention can be used for the purpose of presenting clues on the direction of future breast cancer treatment, including the determination of the need for anti-cancer treatment because it is possible to diagnose the prognosis and prediction of breast cancer patients.
  • La is a schematic diagram showing a standardization process by curation and pre-processing of microarray data of breast cancer tissue.
  • FIG. Lb is a diagram illustrating a process of discovering a prognostic predictor gene from a discovery data set.
  • 9a divides the prognostic predictive index into four prognostic groups by dividing the prognosis index of all patients using the prognostic model (freezing sample) and sees whether the observed survival probability of each prognostic group is well separated. The observed survival probability was also compared with the predicted survival probability.
  • 9b compares the observed survival probability of all patients with the predicted survival probability using the prognostic model.
  • 9c is the most influential p. After dividing the total patients into four groups for mean, we compared the observed survival probability of each group with the predicted survival probability using this prognostic model (freezing sample).
  • Figure 9d shows how well the observed survival and the predicted survival probability match the 5-year survival rates.
  • 10a is a verification result for the discrimination
  • 10b is a verification result for the calibration for the entire observed time
  • 10c is the result of a calibration for a 5-year survival.
  • 11a is the verification result for the discrimination and lib is the verification result for the calibration of the entire observed time. 11c is the test result for calibration for 5-year survival.
  • FIG. 6 shows the results of correlation measurements between FFPE samples (Siemens, vertical axis) / frozen samples (frozen, horizontal axis) for the selected p-gene, and the names and correlation values (cor) of the genes are as described.
  • Embodiments of the present specification are disclosed in Korean Patent Publication No. 10-2012-0079295 and PCT Publication No. W02012093821A2, which are incorporated herein by reference in their entirety, and the level of the technical field to which the present invention pertains and the contents of the present invention. This is explained more clearly.
  • Agilent data contained survival information about external tissue metastasis. That external tissue metastasis is the most critical event in prognostic determination, that external tissue metastasis is determined by the inherent characteristics of the cancer, and that most patients with collected data have information about external tissue metastasis. Survival analysis was performed based on the metastasis of external tissues. The information of all patients collected was compared to remove the overlapping expression profile of 186 patients and the study was performed on a total of 1,861 unique patients.
  • the collected patients were classified into a good prognosis group and a poor prognosis group.
  • 5-year survival or metastasis is classified using information. In other words, if metastasis occurs or dies within five years, the prognosis is poor, and if there is no metastasis or survives for more than five years, the prognosis is good.
  • Patient information from the discovery dataset was used to determine the distribution of survival times for patients with metastases. More than h of patients with metastasis developed metastasis within 5 years, and metastasis was observed after 10 years.
  • the raRNA of the ESR1 gene in the patient-specific expression profile was used to determine the ER state.
  • ROCOegion of convergence using ER IHC information and ESR1 mR A expression levels The analysis was performed.
  • the expression point with the highest accuracy (0.88) was set as the cut-off, and when the expression level was higher than the cut-off, ER + was expressed.
  • the good and bad prognosis groups were divided into ER + and ER- cases. A total of 275 patients had a good prognosis and 218 patients had a poor prognosis.
  • Significant Analysis of Microarray (SAM) analysis was performed to identify genes with different expression levels between prognostic groups. The genes overexpressed in the poor prognosis and overexpressed in the poor prognosis were selected using the q-value of the SAM analysis.
  • a cluster analysis was performed using a principal component analysis (PCA) method to find expression patterns of these genes.
  • PCA principal component analysis
  • is the survival time of the i th individual
  • T 0 is the baseline survival time
  • is the coefficient of the covariate to be measured
  • is the error .
  • logTi logTo + ⁇ + ⁇ 2 ⁇ 2 + ⁇ . + P q x q + ⁇ * (2) and the AFT model has the same shape as the general linear regression model.
  • Equation (2) cannot be treated like the linear regression model.
  • ⁇ * of the equation (2) is ropda the actual statistical troublesome because the distribution may be different in each case depending on the re-month data set as to assume a normal distribution in a general linear regression model.
  • W follows the distribution of logT and its variance is fixed to the value of the standardized distribution.
  • is a constant as a scale parameter whose value depends on the data set handled.
  • the AFT model Using the AFT model, various candidate prognostic prediction models were reported according to the Weibull distribution, loglogistic distribution, and lognormal distribution, and the most appropriate model was selected.
  • the risk distribution fits the AFT model using the hazard function that can be obtained by preparing the generation life table of the survival information of the discovery data set. Since the hazard function obtained from the generational life table has a unimodal form, it is predicted that the distribution of the Weibull, logistic logistic, and logarithmic normal is well suited. The choice of the final model
  • Validation of the selected model was performed for 'calibration' and 'discriminat ion'.
  • 'Calibration' is to find out how much the predicted survival probability agrees with the observed survival probability by using the prognostic prediction model.
  • 'Discrimination' is when the patient group given by the prognostic prediction model is classified as a prognostic group.
  • the separability of the The actual observed probabilities here refer to values obtained by the Kaplan-Meier method.
  • the AFT-based prognostic model can provide patient-specific survival rates for all time periods. Survival Probability Predicted by the Model and Liver by the Kaplan-Meier Method The probability of survival was compared.
  • the survival probability curve of all patients was calculated by 0.1 unit from 0yr-25yrs to calculate the average survival probability for each hour.
  • a five-year survival probability was also compared with the survival probability comparison for the overall survival time.
  • Survival predicted using the prognostic prediction model for the 5-year survival probability of patients in a given dataset was compared with the 5-year survival probability calculated using the hazard regression analysis Hare as observations.
  • Prognostic index is a dependent variable of survival model. The clearer the KM graph for the four predicted prognostic groups, the better the model of discrimination.
  • the 'calibration' and 'discrimination' were all examined for the discovery dataset and three independent verification datasets.
  • the key R packages used for statistical analysis are:
  • affy pre-processing of the XEL file using the rma algorithm.
  • samr Gene discovery with difference in expression level between prognostic groups.
  • GOstats Identify the functions associated with the selected gene set.
  • KMsurv Creates a life table using survival data from the discovery data set.
  • rma Estimate the coefficient of prognostic model using AFT model. Perform a calibration on the model.
  • RNA from formal in-fixed paraffin embedded (FFPE) tissues and samples is considered suitable for expression analysis due to many processes that impair RNA stability, such as fixation that causes cross-1 inking between tissues during tissue or sample processing. It was not brought in.
  • FFPE formal in-fixed paraffin embedded
  • the gene sets were selected by giving priority to high expression levels.
  • selecting multiple genes of the same pattern of each p-gene and i-gene has limitations in measuring the exact expression level of microarray data, and the number of genes in the pattern is greater than that of one gene representing the pattern. This is because the average expression of dog genes may be more representative of actual expression patterns.
  • RNA samples and frozen samples were collected from the same patient, and RNA was extracted according to RNA extraction from FFPE or frozen samples.
  • the expression level of each of the 32 genes selected using the extracted RNA as a template was measured. Since gene expression may vary between individuals, it is necessary to normalize it, so five genes selected as standardization genes, namely, CBP-terminal-binding protein 1 (CTBP1) and TBP (TATA-binding protein) ), The expression of HMBS (hydroxymethylbilane synthase), CULl (cullin 1) and UBQLNl (Ubiqui 1 in-1) were normalized to determine the association of gene expression between FFPE and frozen samples. The high and the high is between sample distribution reliable gene expression in a wide variety of genes early breast cancer prognostic gene, followed by final selection, correlation values based on the measurement result associated with the expression level results in the respective gene-specific samples (correlation rate).
  • CBP1 CBP-terminal-binding protein 1
  • TBP TATA-binding protein
  • Principal component analysis was performed on the expression levels of selected 302 genes. GO function analysis was performed on principal component 1 and principal component 2. Principle 1 was very clearly involved in proliferation, while Principle 2 was strongly associated with immune response. Based on this, the gene belonging to principal component 1 was selected, and by selecting the gene belonging to principal component 2, two expression patterns were reflected in the prognostic prediction model.
  • genes selected were selected as genes with the largest prognostic differences, as well as the largest differences in expression between prognostic groups.
  • the gene selected from principal component 1 for proliferation was p-gene
  • the gene selected from principal component 2 for immunological response was named i-genes.
  • ER estrogen receptor
  • p-genes and i-genes Two functions represented by selected genes in relation to prognosis, proliferation and immune response, are interesting functions in the mechanism of cancer.
  • Sixteen genes selected (p-genes and i-genes) were used to compare ER- breast cancer and ER + breast cancer.
  • p-genes and i-genes were stratified in three steps (pi, p2, p3 or il, i2, i3) according to the average expression level.
  • pi was assumed to be the lowest expression group of p-gene and the slowest growth.
  • p3 is the population with the highest expression level of p-genes and it is assumed that proliferation will occur most actively.
  • p2 assumes moderate expression and mediates proliferation. il assumes that the i-genes are the least expressed and have weak immune response. i3 is the most expressive group of i-genes and has a very strong immune response. i2 was considered to have moderate expression and activity.
  • ER- breast cancer had a higher rate of p3 type proliferation than ER + breast cancer.
  • About 62% of ER- breast cancers show very high p-genes expression levels (p3), while only 18% of ER + breast cancers show high p-genes expression levels, making ER- breast cancers much more aggressive than ER + breast cancers. It was as known to appear.
  • About 35% of ER + breast cancers are weak P- genes (pi) were shown and the ratio of pi was only 93 ⁇ 4> for ER-.
  • An active immune response function is another feature of ER- breast cancer. 38% subtype of ER- breast cancer has a high expression level of i-genes (i3). In contrast, 2% of ER + breast cancers had high i-genes expression. The more active the proliferation of both ER + and ER- was, the more active the immune response was, but ER- breast cancer showed a more active immune response. In addition, the degree of differentiation of breast cancer was also closely related to proliferation. Less well differentiated breast cancer (G3) showed faster proliferation, and most well differentiated breast cancer (G1) showed weak growth. The patient's prognosis was also correlated with proliferation. It was observed that many patients with poor prognosis, whose metastasis occurred within 5 years, were concentrated in the fast growing population.
  • ER- breast cancer was much more active than ER + breast cancer in both proliferation and immune responses, and it is estimated that the expression level of ER affects the mechanism of breast cancer development and development.
  • survival information from the discovery data set and selected p-genes and i-genes were used to create an AFT prognostic model for the metastasis of early breast cancer patients.
  • survival data of the discovery data set was prepared for each year to calculate the approximate risk.
  • the probability of mortality obtained from generational life tables is unimodal, so the Weibull, logarithmic, and lognormal distributions are well-suited.
  • Covariates to be included in the prognostic model are p.mean and i. mean.
  • p. mean is p—the mean of genes, i. mean is the mean value of i ⁇ genes.
  • AK Akaikes information criterion was used to select the final model according to the lognormal distribution.
  • 'Calibration' is to find out how similar the survival probability predicted by the model is to the actual observed survival probability.
  • the observed survival probability is the survival probability obtained using the Kaplan-Meier method.
  • 'Discrimination' is the classification of patients into prognostic groups using models. Two performance verifications were performed on the discovery dataset from which the model was developed and three independent verification datasets.
  • the prognostic index (PI) is divided into four prognostic groups for the discovery data set developed by the prognostic prediction model. Prognostic indexes were compared using the KM graph, which is the observed survival probability for the four prognostic groups. As a result, it was found that the four prognostic groups were classified very well, and that the predicted survival probability of each prognostic group matched the observed survival probability.
  • the survival probability predicted by the KM survival probability and the prognostic prediction model was compared using the graph. Because the prognostic prediction model finds all the hourly survival probabilities for all patients, the mean of each patient's hourly (0–25 years, 0.1 interval) to obtain a probability curve for the overall survival time, such as the KM survival curve. A survival probability graph was drawn using survival probability. The predicted survival probability was slightly higher than that of KM, but overall it was similar. In addition to the survival probability for the overall survival time, the survival probability for the fifth year was also compared. The 5-year survival probability by the model was similar to the 5-year survival probability observed. In particular, the higher the predicted 5-year survival probability, the better the predicted probability and the observed probability.
  • the prognostic prediction model was validated using three independent verification data sets.
  • the first verification data set is a combination of two data sets created with the Affymetrix U133A platform.
  • the second set of validation data is data generated with the Affymetric U133A platform, all of which are ER + patients who have been taking tamoxifen for five years.
  • the third validation dataset was the dataset used for the discovery and validation of 70 prognostic predictive genes (currently available as mammaprints) and was generated on the Agilent Hu25K platform.
  • Discovery data for validation datasets 1 and 2 The expression levels were normalized with the Discovery data set to be made with the same Affymetrix U133A flats as the set.
  • Validation data sets 1 and 2 assessed the performance of calibration and discrimination, and validation data set 3 evaluated discrimination and performance only as a standardization problem.
  • IQR interquartile range
  • samples with both FFPE samples and frozen samples from patients or cancerous tissues are required.
  • the 27 pairs of FFPE samples and frozen samples thus obtained were measured for the expression level of each of the 32 selected genes and the correlation between the FFPE and freeze samples.
  • 12 genes in p-gene and 15 genes in i-gene were selected as genes with high reliability in early breast cancer prognosis.
  • FIGS. 6 and 7 The result of measuring the association for each gene is shown in FIGS. 6 and 7.
  • the solid line in the figure indicates the equivalent values of the horizontal axis and the vertical axis (slope 1, ie, the same values of the horizontal axis and the vertical axis are displayed as lines).
  • the present invention provides a genetic marker for prognostic prediction of early breast cancer.
  • Gene markers of the present invention can be useful for the purpose of presenting clues about the direction of breast cancer treatment, including the determination of the need for chemotherapy, since it is possible to predict and diagnose the prognosis of breast cancer patients.

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biomedical Technology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 조기 유방암 예후 예측 진단용 유전자 및 이의 용도에 관한 것으로, 보다 상세하게는 유방암 환자의 예후 예측 진단에 필요한 정보를 제공하기 위한 TRBC1 (T cel l receptor beta constant 1), BTN3A2 (butyrophilin, subfamily 3, member A2) 또는 HLA-DPA1 (major histocompatibility complex, class II, DP alpha 1)의 유방암 예후 예측 진단 유전자 마커 및 이의 용도에 관한 것이다. 본 발명의 유전자 마커는 유방암 환자의 예후 예측 진단이 가능하므로 항암치료의 필요성의 판단을 비롯하여 향후 유방암 치료의 방향에 대한 단서를 제시하는 목적으로 유용하게 사용할 수 있다.

Description

[명세서】
【발명의 명칭】
조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도 【기술분야】
본 출원은 2013년 4월 18일에 출원된 대한민국 특허출원 제 10-2013-0043160 호 (출원번호)를 우선권으로 주장하고, 상기 명세서 전체는 본 출원의 참고문헌이 다.
본 발명은 조기 유방암 예후 예측 진단용 유전자 및 이의 용도에 관한 것으 로, 보다 상세하게는 유방암 환자의 예후 예측 진단에 필요한 정보를 제공하기 위 한 TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 또는 HLA-DPA1 (major histocompatibility complex, class II, DP alpha 1)의 유방암 예후 예측 진단 유전자 마커 및 이의 용도에 관한 것이다.
【배경기술】
인간 유전체정보가 활발하게 활용되면서 암연구는 유전체 수준에서 메카니즘 을 밝히는 방향으로 나아가고 있다. 특히 마이크로어레이를 이용하여 수만 개의 유 전자의 발현패턴이나 유전자 개수의 증가 혹은 감소에 대한 정보를 바탕으로 거시 적인 관점에서 암세포의 특성을 규명할 수 있쳬 되었다. 이러한 유전체수준의 정보 를 분석하는 것은 유기적이고 복잡한 생명현상을 이해하는데 매우 획기적인 방법으 로, 앞으로 더욱더 활성화될 것이다. 특히 암과 같은 복합질병 (complex disease)의 경우, 소수의 특정유전자에 대한 분석으로는 편협한 결과를 얻기 쉬우며, 암의 발 생 및 발달에 대한 큰 행동패턴을 포착하는 것이 중요하기 때문에 유전체 정보 분 석이 반드시 필요하다. 이처럼 암 연구에 기본이 되는 대부분의 유전체 정보는 마 이크로어레이와 같은 유전체 칩을 이용하여 생성되는데, 수만 개의 유전자에 대한 정보를 한꺼번에 얻을 수 있는 기술은 날로 진화하고 있으며, 고비용의 단점에도 불구하고 마이크로어레이를 이용한 연구 활동이 활발하게 전개되면서 관련정보의 양도 폭발적으로 증가하고 있다. 2000년도 중반부터 이러한 유전체 정보가 수집되 어 데이터베이스화되기 시작하였고, 이렇게 수집된 정보를 이용하여 2차 및 3차 분 석을 수행하는 일은 생명현상 연구의 구심점이 되어가고 있다.
일반적인 발현 (expression) 유전자 칩의 경우, 약 2만 -3만개의 유전자를 나 타내는 수만 개의 probe가 심어져 있고, SNP와 같은 정밀한 정보를 측정하는 마이 크로어레이는 백만 개 이상의 probe를 가지고 있는 경우도 있다. 이러한 마이크로 어레이는 실험법이 비교적 간단하고 표준화가 되어있으며, 대량의 정보를 짧은 시 간에 한꺼번에 얻어 매우 효율적이나, 얻어진 결과를 분석하는 일이 핵심이자 어려 운 병목지점이 되었다. 기존의 소수의 유전자를 분석하는 것과는 비교가 되지 않는 수만 개의 유전자에 대한 종합적 분석은, 통계적 분석기술뿐 만 아니라 유전체에 대한 해박한 지식이 뒷받침되어야 비로소 유용한 정보를 캐낼 수 있는 것이다. 뿐 만 아니라 대량의 정보를 저장하고 분석을 수행할 수 있는 고성능 전산장비도 필요 하며, 관련 전산기술 역시 필수이다. 전통적인 생물학적 연구범위와 실험방법에만 익숙한 연구자가 수행하기 어렵기 때문에, 유전체정보가 엄청난 속도로 증가하더라 도 이를 유용하게 활용하지 못하고 있는 것이 국내의 현실이다. 북미나 유럽에 비 해 부족한 자본과 연구기술력에 대한 국내 사정을 감안한다면, 공개된 유전체 정보 를 적극 활용하는 것이야말로 생물정보학에서 선두 지휘해야 할 부분이다. 특히 암 에 대한 연구는 가장 활발하게 유전체 분석을 도입해 왔으며, 관련 정보가 상당한 양으로 축적되어 있다.
유방암은 자가진단이 가능하고 자가진단의 중요성이 많이 흥보되면서 초기에 발견되는 경우가 많다. 이러한 초기 유방암 환자들에 대해 수술 후 항암치료의 여 부를 결정하기가 어려웠다. 병리학적 관찰로 대략적인 예후를 예측할 수 있으나, 관찰결과에 대한 표준화와 정량화가 어렵고 예후예측에 대한 신뢰성이 낮아, 실제 임상에서는 대부분의 초기 유방암 환자에게 항암치료를 권하고 있다. 항암치료의 특성상 환자가 겪는 고통이 매우 크고 경제적 지출이 요구되는데, 초기 유방암의 경우, 항암치료가 필요하지 않은 환자가 절반 이상일 것으로 추측된다. 따라서, 초 기 유방암의 특성을 분석하여 환자의 예후를 예측하여 불필요한 항암치료를 줄인다 면, 환자의 삶의 질에 큰 도움이 될 것이다. 마이크로어레이를 이용하여 유방암의 수만 개의 유전자의 발현량에 대한 정보를 한 번에 얻을 수 있게 되면서, 분자수준 에서 유방암을 분류하고 암의 발생과 발달에 대한 메커니즘을 밝히고자 하는 연구 가 활발하게 수행되고 있다. 초기유방암 환자의 예후를 예측하는 것은 임상에서 중 요한 일이고, 마이크로어레이를 이용하여 예후를 예측하는 유전자를 발굴하는 일은 이미 2000년대 초부터 시작되었다. 마이크로어레이를 이용한 연구가 고비용임에도 불구하고, 상당한 수의 유방암조직에 대한 발현 profiles이 생산되었고, 연구자들 에게 공개되어왔다. 2002년, 78명의 초기유방암 조직과 10여년 동안 추적된 환자의 생존정보를 분석하여 70개의 예후예측유전자가 발굴된 것을 시작으로 하여, 이후 십여 가지의 예후예측 유전자들이 발표되었고, 그 중 몇 가지는 이미 상용화되어 임상에서 활용되고 있다 (Chang, H.Y. , et al . , Gene expression signature of fibroblast serum response predicts human cancer progression-' similarities between tumors and wounds . PLoS Biol 2(2): p. E7(2004); van de Vijver, M.J. , et .al., A gene-expression signature as a predictor of survival in breast cancer . N Engl J Med 347(25): 1999-2009(2002); van 't Veer, L.J. , et al . , Gene expression profiling predicts clinical outcome of breast cancer . Nature 415(6871): 530-536(2002); Wang, Y., et al . , Gene-expression profiles to predict distant metastasis of lymphᅳ node—negat ive primary breast cancer . Lancet 365(9460): 671-679(2005); Buyse, M. , et al. , Validation and clinical utility of a 70-gene prognostic signature for women with node-negative breast cancer . J Natl Cancer Inst, 98(17): 1183-92(2006); Paik, S. , Development and clinical utility of a 21-gene recurrence score prognostic assay in patients with early breast cancer treated with tamoxifen. Oncologist 12(6): 631- 635(2007); Paik, S. , et al . , A multigene assay to predict recurrence of tamoxifenᅳ treated, node-negative breast cancer . N Engl J Med 351(27) :2817- 2826(2004); Sotiriou, C. , et al . , Gene expression profiling in breast cancer: understanding the molecular basis of histologic grade to improve prognosis. J Natl Cancer Inst 98(4) :262-72(2006); Pawitan, Y. , et al . , Gene expression profiling spares early breast cancer patients from adjuvant therapy: derived and validated in two population-based cohorts. Breast Cancer Res 7(6): R953- 964(2005); Mi Her, L.D. , et al . , An expression signature for p53 status in human breast cancer predicts mutation status, transcript ional effects , and patient survival. Proc Natl Acad Sci USA, 102(38): 13550-13555(2005); Bild, A.H. , et al . , Oncogenic pathway signatures in human cancers as a guide to targeted therapies. Nature 439(7074) :353-357(2006); Teschendorf f , A.E., et al . , A consensus prognostic gene expression classifier for ER positive breast cancer . Genome Biol 7(10): R10K2006); Desmedt , C. , et al . , Strong time dependence of the 76-gene prognostic signature for node-negat ive breast cancer patients in the TRANSBIG multi center independent validation series. Clin Cancer Res 13(11): 3207-3214(2007)). 대표적으로 tnammaprint(Agendia)와 Oncotype DXCgenomic health)가 있으며 임상에서 현재 활용되고 있지만, 여전히 예 후에 대한 하나의 참고 자료로서 사용되는 경우가 많은 실정이다 (van de Vijver, M. J . , et al . , A gene-expression signature as a predictor of survival in breast cancer . N Engl J Med 347(25): 1999-2009(2002) ; Paik, S. , et al . , A mult igene assay to predict recurrence of tamoxi fen-treated, node-negat ive breast cancer . N Engl J Med 351(27) :2817-2826(2004)).
본 명세서 전체에 걸쳐 다수의 논문 및 특허문헌이 참조되고 그 인용이 표시 되어 있다. 인용된 논문 및 특허문헌의 개시 내용은 그 전체로서 본 명세서에 참조 로 삽입되어 본 발명이 속하는 기술 분야와 수준 및 본 발명의 내용이 보다 명확하 게 설명된다.
【발명의 상세한 설명】
【기술작 과제]
이에 본 발명자들은 환자의 암세포를 포함하는 조직의 FFPE 시료를 이용하여 초기 유방암 환자에 대한 예후예측 및 항암치료 여부 등을 진단할 수 있는 유전자 진단 시스템을 개발하기 위하여 예의 연구 노력한 결과, 초기 유방암 조직으로부터 얻은 마이크로어레아 데이터와 임상정보를 수집 및 분석하여 예후예측과 관련된 유 전자를 발굴하고, 발굴된 유전자 증 FFPE 시료에 적용시키기 적합한 유전자 및 이 의 세트를 선별하여 이의 유용성을 확인함으로써 본 발명을 완성하였다. 따라서, 본 발명의 목적은 유방암 환자를 예후 예측 진단하는 유전자 마커 및 이의 용도를 제공하는 것이다.
본 발명의 다른 목적은 유방암 환자를 예후 예측 진단하는 새로운 방법을 제 공하는 것이다.
본 발명의 또다른 목적은 유방암 환자의 예후 예측 진단용의 키트를 제공하 는 것이다.
본 발명의 또다른 목적은 유방암 환자의 예후 예측 진단에 필요한 정보를 제공하기 위하여, 환자의 시료로 부터 mRNA 분리, 유전자 발현 수준 측정, 이의 표준화 및 예측치의 산출 단계를 포함하는 유방암 예후 예측치를 산출하는 방법을 제공하는 것이다.
【기술적 해결방법】
상기와 같은 목적을 달성하기 위하여, 본 발명은 유방암 환자를 예후 예측 진단하는 유전자 마커 및 이의 용도를 제공한다. 본 발명의 다른 목적을 달성하기 위하여, 본 발명은 유방암 환자를 예후 예 측 진단하는 새로운 방법을 제공한다.
본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 유방암 환자의 예후 예측 진단용의 키트를 제공한다.
본 발명의 또다른 목적을 달성하기 위하여, 본 발명은 유방암 환자의 예후 예측 진단에 필요한 정보를 제공하기 위하여, 환자의 시료로 부터 mRNA분리, 유전 자 발현 수준 측정, 이의 표준화 및 예측치의 산출 단계를 포함하는 유방암 예후 예측치를 산출하는 방법을 제공한다.
본 발명의 또다른 목적을 달성하가 위하여, 본 발명은 TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 및 HLA-DPA1 (major histocompatibility complex, class II, DP alpha 1)로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍을 제공한다.
본 발명의 또다른 목적을 달성하기 위하여 , 본 발명은 TRBCl, BTN3A2 및 HLA-DPA1로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상유전자를 증폭할 수 있는 것임을 특징으 로 하는 프라이머쌍의 유방암 예후 예측용 제제의 제조를 위한 용도를 제공한다. ᅳ다른 정의가 없는 한, 본 명세서에 사용된 모든 기술적 및 과학적 용어는 당 업자들에 의해 통상적으로 이해되는 동일한 의미를 가진다. 다음의 참고문헌은 본 발명의 명세서에 사용된 여러 용어들의 일반적인 정의를 갖는 기술 (skill)의 하나 를 제공한다: Singleton et al., DICTIONARY OF MICROBIOLOGY AND MOLECULAR BI0L0TY (2ded.l994); THE CAMBRIDGE DICTIONARY OF SCIENCE AND TECHNOLOGY (Walkered.,1988); 및 Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY. 이하 본 발명와내용을 보다 상세히 설명하기로 한다. 본 발명은 유방암 환자를 예후 예측 진단하는 유전자 마커 및 이의 용도를 제공한다. 보다 구체적으로 본 발명은 유방암, 특히 조기 유방암의 예후 예측 진단 을 위해서 TRBCl (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 또는 HLA-DPA1 (major histocompatibility complex, class II, DP alpha 1)의 유전자 마커를 제공한다. 아울러, 본 발명은 (a) 시료로 부터 mRNA를 분리하는 단계, (b) TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophilin, subfamily 3, member A2) 및 HLA-DPAl (major histocompatibility complex, class II, DP alpha 1)으로 이루어진 군에서 하나이 상 선택된 유전자의 mRNA 발현 수준을 측정하는 단계, (c) 상기 유전자의 mRNA 발 현 수준을 표준화하는 단계 및 (d) 상기 유전자의 과발현은 유방암 예후가 좋은 것 으로 판별하는 단계를 포함하는 유방암 예후 예측 방법을 제공한다. 본 발명에서 유전자 마커로 기능하는 것은 TRBC1 (T cell receptor beta constant 1), BTN3A2 (butyrophilin, subfamily 3, member A2) 또는 HLA-DPAl (major histocompatibility com lex, class II, DP alpha 1)일 수 있다. 이들은 각 각 독립적으로 선택되거나 2개의 유전자의 조합 또는 3개의 유전자의 조합에 의해 서 조기 유방암의 예후 예측 진단에 이용될 수 있다. 각 유전자는 당업계에 공지된 각 유전자의 서열 또는 각 유전자의 동의어 (synonym)의 서열, 바람직하게는 인간에 서 유래된 각 유전자의 서열일 수 있으며, 더 바람직하게는 TRBC1은 Genbank Accession No. BC030533.1, BTN3A2는 Genbank Accession No. 匪 _007047.3 HLA-DPAl 은 Genbank Accession No. 匪_001242524.1, NM_001242525.1, 丽 _033554.3에 기재된 서열일 수 있다. 각 유전자에 대한 동의어 및 그 서열은 Genbank또는 Swissprot에 서 검색할 수 있다. 본 발명에서 유방암은 침윤 유방암, 또는 I기, II기 또는 III기 유방암일 수 있다. 또한 본 발명의 유방암은 에스트로겐 수용체 양성 (Estrogen receptor positive, ER+)일 수 있다. 본 발명에서 "예후 (prognosis)"는 질병을 진단하여 판단된 장래의 증세 또는 경과에 대한 전망을 말한다. 암 환자에 있어서 예후는 통상적으로 암 발병 또는 외 과적 시술 후 일정기간 내의 전이 여부 또는 생존기간을 뜻한다. 예후의 예측 (또 는 예후의 진단)은 특히 초기유방암 환자의 화학치료 여부를 비롯하여 향후 유방암 치료의 방향에 대한 단서를 제시하므로 매우 중요한 임상적 과제이다. 예후 예측은 질환 치료제에 대한 환자의 반응, 치료 경과에 대한 예측도 포함한다. 본 발명에서 시료는 유방암 환자의 유방암 조직일 수 있다. 상기 유방암 조 직에는 일부 정상 세포도 포함되어 있을 수 있으며, 바람직하게는 환자의 암세포를 포함하는 유방암 조직의 포르말린 고정 파라핀 포매 (formalin-fixed paraffin- embedded, FFPE) 시료일 수 있다. 본 발명의 유방암 예후 예측 진단 마커의 검출은 대상 유전자에 대한 PCR (polymerase chain reaction) 증훅을통해 수행될 수 있다. 본 발명의 대상 유전자 의 검출은 바람직하게는 대상 유전자의 발현량의 검출, 더 바람직하게는 대상 유전 자의 발현량의 정량적인 검출이다. 발현량의 검출을 위해서 시료 조직내에서의 mRNA 분리 및 mRNA에서의 cDNA 합성과정이 필요할 수 있다. mRNA의 분리를 위해서 는 당업계에 공지된 시료에서의 RNA 분리 방법이 이용될 수 있으며, 바람직하게는 시료는 FFPE 시료이므로 FFPE 샘플에 적합한 mRNA의 분리방법일 수 있다. cDNA 합 성과정은 mRNA를 주형으로 하여 이루어지는 당업계에 공지된 cDNA 합성 방법이 이 용될 수 있다. 바람직하게 본 발명의 유방암 예후 예측 진단 마커의 검출은 FFPE 시료에서의 mRNA 발현의 정량적 검출이므로 FFPE 시료에 대한 mRNA 분리방법 및 RT-qPCR (reverse transcriptation quantitative polymerase chain reaction) 방법 에 의한 검출일 수 있다. 본 발명에서 검출은 mRNA 발현 수준 (expression level)을 측정일 수 있다. 발현 수준의 측정은 당업계에 공지된 방법에 따라 수행될 수 있으나, 리포터 형광 염료 및 /또는 ¾쳐 (quencher) 형광 염료로 표지된 프로브를 사용한 광학적 정량 분석 시스템에 의해서 측정될 수 있다. 상기 측정은 상업적으로 판매되는 장비, 예 를 들어, ABI PRISM 7700™ Sequence Detection System™, Roche Molecular Biochemicals Light cycler 및 이에 부속되는 소프트웨어 등의 시스템에 의해서 이 루어질 수 있다. 이와 같은 축정 데이터는 측정값 또는 역치 사이클 (Ct 또는 Cp) 로서 표현될 수 있다. 측정된 형광값이 처음으로 통계학적으로 유의한 것으로 기록 될 때의 지점이 역치 사이클이며, 이는 검출 대상이 PCR 반응의 주형으로써 존재하 는 초기값에 반비례하여 나타나므로 역치 사이클 값이 작은 경우 정량적으로 더 많 은 검출 대상이 존재하는 것을 나타낸다. 한편, 본 발명은 TRBCl, BTN3A2 및 HLA-DPA1로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상 유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍를 유효성분으로 포함하 는 유방암 예후 예측 진단용 조성물을 제공한다. 본 명세서에서 사용되는 용어 "프라이머"는 을리고뉴클레오타이드를 의미하 는 것으로, 핵산쇄 (주형)에 상보적인 프라이머 연장 산물의 합성이 유도되는 조건 즉, 뉴클레오타이드와 DNA 중합효소와 같은 중합제의 존재, 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있다. 바람직하게는, 프라이머는 디옥 시리보뉴클레오타이드이며 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연 (naturally occurring) dNMP (즉, dAMP, dGMP, dCMP 및 dTMP), 변형 뉴클레오타이드 또는 비 -자연 뉴클레오타이드를 포함할 수 있다. 또한, 프라이머는 리보뉴클레오타 이드도 포함할 수 있다.
본 발명의 프라이머는 타겟 핵산에 어닐링 되어 주형-의존성 핵산 중합효소 에 의해 타겟 핵산에 상보적인 서열을 형성하는 연장 프라이머 (extension primer) 일 수 있으며, 이는 고정화 프로브가 어닐링 되어 있는 위치까지 연장되어 프로브 가 어닐링 되어 있는 부위를 차지한다.
본 발명에서 이용되는 연장 프라이머는 타겟 핵산의 제 1위치에 상보적인 흔 성화 뉴클레오타이드 서열을 포함한다. 용어 "상보적' '은 소정의 어닐링 또는 흔성 화 조건하에서 프라이머 또는 프로브가 타겟 핵산 서열에 선택적으로 흔성화할 정 도로 층분히 상보적인 것을 의미하며, 실질적으로 상보적 (substantially com lement ry) 및 완전히 상보적 (perfectly complementary)인 것을 모두 포괄하는 의미를 가지며, 바람직하게는 완전히 상보적인 것을 의미한다. 본 명세서에서, 프 라이머 서열과 관련하여 사용되는 용어, "실질적으로 상보적인 서열"은 완전히 일 치되는 서열뿐만 아니라, 특정 서열에 어닐링하여 프라이머 역할을 할 수 있는 범 위 내에서, 비교 대상의 서열과 부분적으로 불일치되는 서열도 포함되는 의미이다. 프라이머는, 중합제의 존재 하에서 연장 산물의 합성을 프라이밍시킬 수 있 을 정도로 층분히 길어야 한다. 프라이머의 적합한 길이는 다수의 요소, 예컨대, 온도, 응용분야 및 프라이머의 소스 (source)에 따라 결정되지만 전형적으로 15-30 뉴클레오타이드이다. 짧은 프라이머 분자는 주형과 층분히 안정된 흔성 복합체를 형성하기 위하여 일반적으로 보다 낮은 온도를 요구한다. 용어 "어닐링'' 또는 "프 라이밍 "은 주형 핵산에 을리고디옥시뉴클레오타이드 또는 핵산이 병치 (apposition) 되는 것을 의미하며, 상기 병치는 중합효소가 뉴클레오타이드를 중합시켜 주형 핵 산 또는 그의 일부분에 상보적인 핵산 분자를 형성하게 한다. 프라이머의 서열은 주형의 일부 서열과 완전하게 상보적인 서열을 가질 필요 는 없으며, 주형과 흔성화 되어 프라이머 고유의 작용을 할 수 있는 범위 내에서의 충분한 상보성을 가지면 층분하다. 따라서 본 발명에서 의 프라이머는 주형인 상술 한 뉴클레오티드 서열에 완벽하게 상보적인 서열을 가질 필요는 없으며, 이 유전자 서열에 흔성화되어 프라이머 작용을 할수 있는 범위 내에서 충분한 상보성을 가지 면 충분하다. 이러한 프라이머의 디자인은 상술한 뉴클레오티드 서열을 참조하여 당업자에 의해 용이하게 실사할 수 있으며, 예컨대, 프라이머 디자인용 프로그램( 예 : PRIMER 3 프로그램)을 이용하여 할 수 있다. 본 발명은 본 발명의 프라이머쌍을 포함하는 유방암 예후 예측 진단 키트를 제공한다. 본 발명의 키트는 TRBC1, BTN3A2 및 /또는 HLA-DPA1의 PCR에 의한 증폭이 가능한 프라이머쌍 이외에 PCR 반웅, 시료에서의 RNA 분리 및 cDNA의 합성에 사용 되는 당 업계에 공지된 도구 및 /또는 시먁을 추가로 포함할 수 있다. 본 발명의 키 트는 필요에 따라 각 성분들을 흔합하는데 사용될 튜브, 웰 플레이트 및 사용방법 을 기재한 지시자료 등을 추가로 포함할 수 있다. 본 발명은 유방암 환자의 예후 예측 진단에 필요한 정보를 제공하기 위하여, 환자의 시료로 부터 하기 단계를 포함하는 유방암 예후 예측치를 산출하는 방법을 제공한다:
(a) 시료로부터 mRNA를 분리하는 단계 ,
(b) TRBC1, BTN3A2 및 HLA-DPA1으로 이루어진 군에서 하나이상 선택된 유전 자의 mRNA 발현 수준을 측정하는 단계,
(c) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계 및
(d) 표준화된 수치를 미리 정해진 계산식에 대입하여 수치를 계산하는 단계,
(e) 상기 수치 값의 수준에 따라 유방암 예후가 좋은 것으로 산출하거나, 유 방암 예후가 나쁜 것으로 산출하는 단계. 본 발명에서의 검출 대상의 발현 수준은 대상 환자 또는 시료에 따라 전체적 인 유전자 발현량 또는 발현 수준에 차이가 있을 수 있으므로 표준화가 필요하다. 표준화는 기본 발현량 또는 발현 수준의 차이를 나타낼 수 있는 유전자의 발현량 또는 발현 수준과의 차이를 통해 이루어지며, 바람직하게는 CTBP1 (C-terminal- binding protein 1) , TBP (TATAᅳ binding protein) , HMBS ( hydr oxyme t h 1 b i 1 ane synthase), CUL1 (cull in 1) 및 UBQLN1 (Ubiquilin-1)에서 하나 내지 다섯의 유전 자의 발현량 (또는 복수의 유전자가 선별된 경우 이들 발현량의 평균)을 측정하여 이에 대한 비를 산출하는 것에 의해서 수행될 수 있다. 한편, 본 발명은 TRBCl, BTN3A2 및 HLA-DPA1로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상 유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍을 이용하여 유방암 환 자의 시료로부터 상기 선택된 유전자의 mRNA 발현 수준을 측정하는 단계를 포함하 는 유방암 예후 예측 진단 방법을 제공한다.
또한 본 발명은 TRBCl, BTN3A2 및 HLA-DPA1로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍이며, 상기 프라이머쌍은 PCR증폭에 의해서 대상 유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍을 제공한다.
또한 본 발명은 TRBCl, BTN3A2 및 HLA-DPA1로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍이며, 상기 프라이머쌍은 PCR증폭에 의해서 대상 유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍의 유방암 예후 예측용 제제의 제조를 위한 용도를 제공한다. 참고로, 상기에서 언급한 뉴클레오티드 및 단백질 작업에는 다음의 문헌을 참조할 수 있다 (Maniatis et al . , Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor , N.Y. (1982); Sambrook et al . , Molecular Cloning: A Laboratory Manual , 2d Ed. , Cold Spring Harbor Laboratory Press(1989); Deutscher , M. , Guide to Protein Purification Methods Enzymoiogy, vol . 182. Academic Press. Inc. , San Diego, CA(1990); Ausubel et al . , Current Protocols of Molecular Biology, John Wiley and Sons (1997); Rupp and Locker , Lab Invest . 56: A67 (1987); De Andres et al . , BioTechniques 18: 42044 (1995); Held et al . , Genome Research 6:986—994 (1996); T.E. Godfrey et al . J. Molec. Diagnostics 2: 84-91 (2000); K. Specht et al . , Am. J. Pathol. 158: 419-29 (2001)).
【유리한 효과】
따라서, 본 발명은 초기 유방암의 예후 예측 진단용의 유전자 마커를 제공한 다. 본 발명의 유전자 마커는 유방암 환자의 예후 및 예측의 진단이 가능하므로 항 암치료의 필요성의 판단을 비롯하여 향후 유방암 치료의 방향에 대한 단서를 제시 하는 목적으로 유용하게 사용할 수 있다.
【도면의 간단한 설명】
도 la는 유방암조직의 마이크로어레이데이터의 큐레이션 (curat ion) 및 전처 리 (pre-processing)에 의한 표준화 과정을 나타낸 모식도이다. 도 lb는 디스커버리 데이터 세트로부터 예후 예측유전자를 발굴하는 과정을 나타낸 그림이다.
도 2는 예후예측모델 (동결 시료)을 디스커버리데이터 세트에서 검증한 결과 이다. 9a는 예후예측모델 (동결 시료)을 이용한 전체환자의 예후예측지수를 4등분하 여 4개의 예후집단으로 분류한 뒤, 각 예후집단의 관찰된 생존확률이 잘 분리되었 는지 보는 것이다. 관찰된 생존확률과 예측된 생존확를도 비교하였다.ᅳ 9b는 전체환 자의 관찰된 생존확률과 예후예측모델을 이용하여 예측된 생존확률을 비교한 것이 다. 9c는 가장 영향력이 높은 p. mean에 대해 전체 환자를 4개의 집단으로 나눈 뒤 각 집단의 관찰된 생존확를이 예후예측모델 (동결 시료)을 이용하여 예측된 생존확 률과 잘 일치하는 지 알아본 그림이다. 9d는 5년생존률에 대해 관찰된 생존확률과 예측된 생존확률이 얼마나 잘 일치하는지 알아본 그림이다.
도 3은 예후예측모델 (동결 시료)을 검증세트 1에서 검증한 결과이다. 디스커 버리데이터 세트에서 검증한 방법과 동일하다. 10a는 판별에 대한 검증결과이고, 10b는 전체 관찰된 시간에 대한 교정에 대한 검증결과이다. 10c는 5년 생존를에 대 한 교정에 대한 검증결과이다.
도 4는 예후예측모델 (등결 시료)을 검증세트 2에서 검증한 결과이다. 디스커 버리데이터 세트에서 검증한 방법과 동일하다. 11a는 판별에 대한 검증결과이고, lib는 전체 관찰된 시간에 대한 교정에 대한 검증결과이다. 11c는 5년 생존를에 대 한교정에 대한 검증결과이다.
도 5는 예후예축모델 (동결 시료)올 검증세트 3에서 검증한 결과이다. 디스커 버리데이터 세트에서 검증한 방법과동일하다.
도 6은 선별된 p-gene에 대한 FFPE 시료 (Siemens, 세로축 )/동결 시료 (frozen, 가로축)간의 연관성 측정 결과이며, 유전자의 명칭 및 연관성 값 (cor)은 각각 기재된 것과 같다.
도 7은 선별된 i-gene에 대한 FFPE 시료 (Siemens, 세로축 )/동결 시료 (frozen, 가로축)간의 연관성 측정 결과이며, 유전자의 명칭 및 연관성 값 (cor)은 각각 기재된 것과 같다.
【발명의 실시를 위한 형태]
이하, 본 발명을 실시예에 의해 상세히 설명한다.
단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실 시예에 한정되는 것은 아니다.
본 명세서의 실시예는 대한민국 특허공개공보 제 10-2012-0079295호 및 PCT 공개공보 W02012093821A2에 개시된 내용이 그 전체로서 본 명세서에 참조로 삽입되 어 본 발명이 속하는 기술 분야의 수준 및 본 발명의 내용이 보다 명확하게 설명된 다.
<실험방법> 초기유방암조직의 발현 프로파일의 수집
초기 유방암 환자의 넁동 암 조직을 이용하여 얻은 발현 프로파일과 임상정 보를 공개 데이터베이스인 GEOChttp://丽. ncbi.nlm.nih.gov/geo)에서 수집하였다. 총 9개의 독립된 발현 프로파일 세트들은 각각 100 개 이상의 샘플로 구성된 비교 적 큰 데이터 세트이며 모두 초기유방암환자의 예후와 관련된 연구를 수행하기 위 해서 만들어졌다 (2, 4, 9, 10, 13, 25, 32, 33). 이중 8개의 데이터 세트는 Affymetrix U133A라는 마이크로어레이 플랫품으로 만들었고, 나머지 하나만 Agilent Hu25K로 제작하였다. 대부분의 경우 환자의 중요 임상정보 (나이 성별, 암 의 크기, 전이상태 및 암의 분화정도)와 생존정보가 함께 수집되어있다. 8개의 Affymetrix U133A로 제작된 데이터 세트들 중에서 6개의 데이터 세트는 생존정보가 외부조직으로의 전이 (distant metastasis free survival)에 대한 것이며, 나머지 2 개는 생존기간 (overall survival)이였다. Agilent 데이터는 외부조직 전이에 대한 생존정보를 가지고 있었다. 외부조직의 전이가 예후 결정에 있어 가장 결정적인 사 건인 점, 외부조직 전이는 암의 고유의 특성에 의해 결정된다는 점 및 수집된 데이 터에 가장 많은 환자가 외부 조직전이에 대한 정보를 가지고 있다는 점을 기반으로 외부조직 전이여부를 기초로 하여 생존분석을 수행하기로 하였다. 수집된 모든 환 자의 정보를 비교하여 중복된 186명의 환자의 발현 프로파일을 제거하였고, 총 1,861명의 유일한 (unique) 환자들에 대해서 연구를 수행하였다. 동일한 플랫폼 (Affymetrix U133A)으로 제작된 7개의 데이터 세트에 대해, 해당하는 모든 환자의 발현 프로파일의 원본파일 (.CEL)을 모아서 한꺼번에 표준화를 시켰다. 표준화 방법 은 rma( background correction : rma, normalization : quant i 1 e , summarization : medianpolish) 방법으로 수행하였다. 표준화 수행시 Manhong Dai 등이 개발한 custom CDF(http://brainarray.mbni .med.umich.edu/Brainarray/) ENTREZG version 13를 이용하였다 (34). 표준화를 수행한 후, 각 프로브의 발현량은 디스커버리 데이 터 세트 내의 프로브 별 평균값을 뺌으로써 1-색 (color) 발현량을 2-색 발현량과 같은 형태로 변환시켰다. 총 8개의 표준화된 데이터세트에서 5개의 데이터세트는 하나로 묶어서 디스커버리 데이터 세트로 사용하였고, 2개는 따로 묶어서 검증 (validation) 데이터 세트 1로, 나머지 1개는 검증 데이터 세트 2로 이용하였다. Agilent 데이터 세트도 검증 데이터 세트 3으로 사용하였다. 환자의 예후 및 ER상태에 대한 정의 설정
환자의 예후와 관련된 유전자를 발굴하기 위해사수집된 환자를 예후가 좋은 집단과 예후가 나쁜 집단으로 분류하였다. 일반적으로 임상에서는 5년 생존 흑은 전이 정보를 이용하여 분류한다. 즉, 5년 내에 전이가 발생하거나 사망을 할 경우 예후가 나쁘다고 말하고, 5년 이상 전이가 없거나 생존하였을 경우 예후가 좋다고 말한다. 디스커버리 데이터세트의 환자정보를 이용하여 전이가 일어난 환자들의 생 존시간의 분포를 알아보았다. 전이가 발생한 환자의 h 이상이 5년 이내에 전이가 발생하였으며, 10년 이후에 전이가 관찰된 경우는 Ί 미만이었다. 이를 바탕으로 디스커버리 데이터세트의 환자 중에서 5년 이내에 전이가 발생한 217명의 환자를 ' 예후가 나쁜 집단'으로 10년 이상 전이가 발생하지 않은 281명의 환자를 '예후가 좋은 집단'으로 분류하였다. 분류 결과, 예후가 좋은 집단의 생존 시간 중앙값은 2.4년이었고, 예후가 나쁜 집단의 생존 시간 중앙값은 12.9년 이었다. 예후가 나쁜 집단과 좋은 집단을 명확하게 구분함으로써 불확실한 생존정보에 의한 오류를 최소 한으로 줄일 수 있었다. 에스트로겐 수용체 (Estrogen receptor, ER)의 발현 여부는 유방암 환자를 서브타입으로 분류할 때 가장 보편적으로 사용하는 기준이다. 보통 임상에서는 병리학자에 의한 ER IHC(immunohistochetnistry)의 판독결과에 의해 ER+ 혹은 ER-로 나눈다. 수집된 디스커버리 데이터 세트에서 200여명의 환자가 ER IHC 정보가 없었고, 디스커버리 데이터 세트를 구성하는 5개의 데이터 세트마다 독립적 으로 ER IHC의 결정이 이루어진 점을 고려하여, 환자별 발현 프로파일 내의 ESR1 유전자의 raRNA 발현량을 이용하여 ER 상태를 결정하였다. ER IHC 정보가 있는 환자 에 대해, ER IHC 정보와 ESR1 mR A 발현량올 이용하여 ROCOegion of convergence) 분석을 수행하였다 . ER IHC 결과와 ESR1 mRNA 발현량을 비교하여 가장 정확도 (0.88)가 높은 발현량 지점을 컷 오프로 잡았고, 컷 오프 이상의 발현량을 보이는 경우는 ER+로, 컷 오프 이하의 발현량을 보이는 경우는 ER-로 분류하였다. 디스커 버리 데이터 세트에서 864명을 ER+로, 240명을 ER-로 배치하였다. 예후 예측휴전자의 선택
디스커버리 데이터 세트에서 예후가 좋은 집단과 예후가 나쁜 집단을 ER+, ER-와 경우로 나누었다. 예후가 좋은 환자는 총 275명 이였으며, 예후가 나쁜 환자 는 218명 이였다. SAM(Significant Analysis of Microarray) 분석을 통해 예후집단 간 발현량이 차이가 나는 유전자를 알아보았다. SAM 분석결과의 q-값을 이용하여 예후가 좋은 집단에서 과발현된 유전자, 예후가 나쁜 집단에서 과발현된 유전자를 선택하였다. 선택된 유전자를 하나로 합친 결과 총 302개의 중복되지 않는 유전자 세트가 만들어졌고, 이 유전자들의 발현패턴을 알아보기 위한 군집분석을 주성분 분석 (Principal Component Analysis, PCA) 방법을 이용하여 수행하였다. 2개의 주 성분을 선택하여 각 주성분에 대해, 관련된 생물학적 기능을 알아보기 위하여, 군 집별로 GO기능분석을 수행하였다.
GO 분석결과 주성분 1은 증식에 집중되어 있고 주성분 2는 면역반응에 집중 되어 있는 것으로 나타났다. 증식과 면역반응에 관여하는 2개의 주성분에 속하는 유전자를 대상으로 예후 집단간 발현량이 가장 큰 유전자를 각각 선택하였다. 각 유전자세트는 유전자는 증식의 발현패턴을 대표하는 의미에서 p-gene, 면역반웅의 발현패턴을 나타내는 i -gene으로 명명하였다. 모수적 생존분석을 이용한 예후예측모델 구성
모수형 생존모델 중 가속화 고장시간모델 (accelerated failure time model, AFT)을 이용하여 p— gene과 igene의 발현량을 공변수로 하는 회귀분석을 수행하였 다. 4개의 p— gene은 환자별로 평균값을 구하여 p. mean으로 변환하였고, 5개의 i- gene도 역시 환자별로 평균값을 구하여 i .mean으로 변환하여 적용하였다. 가속과 고장시간모델은
Ti = T0 expCPiX! + ί32χ2+ · · · + β χ^ε^Ι)
로서 여기서 ^는 i번째 개체의 생존시간, T0는 기저선 생존시간, 는 공 변수의 백터 (j=i,2, ...,q), β는 대웅하는 공변수의 계수이고 ε는 오차이다. ᄋ 모델에서는 공변수가 기저선 생존시간에 상승적인 영향을 미치기 때문에 이것을 자 주 이용하는 산업계에서 가속화 고장시간 모델이라고 부른다. 생존시간에 상승적으 로 작용하는 효과 $ = ^) + 2Χ2+ · · · + | qxq를 가속요인이라고 칭한다. 식 (1)의 자연대수를 얻으면
logTi = logTo +βιχι + β2χ2+ · . · + Pqxq+ ε*(2) 이 되어 AFT모델은 일반 선형회귀 모델과 동일한 형태를 갖는다. 그러나 종 속변수 logT는 정규분포를 하지 않을 뿐더러 생존분석 자료에는 선형회귀 모델에서 용납되지 않는 중도절단예가 존재하기 마련이이서 식 (2)를 선형회귀모델과 같이 처 리할 수 없다. 식 (2)의 ε*는 일반 선형회귀모델에서 정규분포를 가정하는 것과 달 리 데이터세트에 따라 경우마다 분포가 다를 수 있기 때문에 실제적인 통계처리가 번거롭다. 이를 극복하기 위하여 logT0와 ε'를 변형하여 다음과 같이 표현한다. logT; = logTo +PlXi + β2χ2+ · ' · + |3qxq+ oW (3)
여기서 W는 logT의 분포를 따르며 그 분산은 표준화 분포의 값으로 고정되어 있다. σ는 척도모수로서 상수인데 그 값은 다루는 데이터 세트에 따라 결정된다.
AFT모델을 이용하여 다양한 후보 예후예측모델에 대해, 와이블 (weibull) 분 포, 대수로지스틱 (loglogistic)분포, 대수정규 (lognormal) 분포에 맞추어 보고, 가 장 적합한 모델을 선택하였다. AFT모델에 맞출 위험도 분포는 디스커버리 데이터 세트의 생존정보의 세대생명표를 작성하여 얻을 수 있는 해저드함수를 이용하였다. 세대생명표로 얻은 해저드함수는 단봉 (unimodal)형태를 보이므로, 와이블, 대수로 지스틱, 대수정규 분포가 잘 적합할 것으로 예측되었다. 최종 모델의 선택은
Akaike's information criterion(AIC)과 R square(R2)를 고려하여 선택되었다. 예후예측모델의 검증
선택된 모델에 대한 검증은 '교정 (calibration)'과 '판별 (discriminat ion) ' 에 대해 수행하였다. '교정 '은 만들어진 예후예측모델을 이용하여 예측된 생존확률 과 실제 관찰된 생존확를이 얼마만큼 일치하는지를 알아보는 것이고, '판별 '은 예 후 예측모델에 의해 주어진 환자집단을 예후집단으로 분류하였을 때의 분리성을 알 아보는 것이다. 여기서 말하는 실제 관찰되는 생존확률은 Kaplan-Meier 법에 의해 구해진 값을 뜻한다. AFT 기반의 예후예측 모델은 환자별 생존확률을 모든 시간대 에 대해 구할 수 있다. 모델에 의해 예측된 생존확률과 Kaplan-Meier법에 의한 생 존확률을 비교하였다. Kaplan-Meier와 같이 전체 시간에 따른 예측 생존확률을 얻 기 위해, 전체 환자들의 생존확률곡선은 0yr-25yrs까지 0.1 단위로 구하여 각 시간 별 평균생존확률을 계산하여 구하였다. 전체 생존시간에 대한 생존확률비교와 함 께, 5년 생존확를도 비교하였다. 주어진 데이터세트에서 환자들의 5년 생존확를을 예후 예측모델을 이용하여 예측한 생존확를을, 해저드회귀분석인 Hare을 이용하여 계산되는 5년 생존확률을 관측값으로 하여 비교하였다.
'판별 '은 주어진 데이터세트의 모든 환자의 예후예측지수 (prognostic index) 를 4구간으로 나눈 뒤, 각 구간에 속하는 환자들의 생존확률을 KM 그래프로 비교하 였다. 예후예측지수는 생존모델의 종속변수이다. 4개의 예측된 예후집단에 대한 KM 그래프가 분명하게 나뉠수록 판별의 기능이 좋은 모델이다.
디스커버리 데이터세트와 3개의 독립적인 검증 데이터 세트들에 대해 모두' 교정 '과 '판별 '을 알아보았다.
통계분석에 사용된 중요 R 패키지들은 다음과 같다:
affy : XEL 파일에 대해 rma 알고리듬을 이용한 전 처리 (pre-processing) . samr : 예후집단간 발현량에 차이가 있는유전 발굴.
GOstats : 선택된 유전자세트와 관련된 기능을 알아봄.
KMsurv : 디스커버리 데이터 세트의 생존자료를 이용하여 생명표를 작성함. rma : AFT 모델을 이용하여 예후예측모델의 계수를 추정함. 모델에 대한교정 수행.
FFPE 샘플에 적용가능한 유전자 세트의 선별
FFPE( formal in- fixed paraffin embedded) 조직, 시료로부터 추출한 RNA는 조 직 또는 시료의 처리과정에서 조직간의 cross-1 inking을 일으키는 고정 등 RNA의 안정성을 저해하는 많은 과정으로 인해 발현분석에 적합한 것으로 받아들여지지는 않았었다. 본 발명에서는 실제 유방암 치료과정에 근거하여 FFPE 샘플에 적합한 유 방암 예후 예측 방법을 개발하기 위하여 상기 주성분 분석 및 주성분 분석에 대한 기능 분석 (GO 기능분석 또는 GO 분석)에 따라 얻어진 증식의 발현패턴을 대표하는 p-gene (증식관련 유전자 세트), 면역반웅의 발현패턴을 나타내는 i-gene (면역반 응 관련 유전자 세트)에서 각각 가장 기여도가 높은 유전자순으로 IQR (interquartile range)이 높은 것에, 그리고, 평균발현량이 높은 것에 우선순위를 두어 유전자 세트를 선별하였다. 본 발명에서 각각의 p-gene, i-gene의 동일한 패턴의 유전자를 여러 개 선택 한 것은 microarray 데이터가 정확한 발현량을 측정하기에 한계가 있고, 패턴을 대 표하는 유전자 1개의 발현량보다 패턴내의 여러 개의 유전자의 평균발현량이 실제 발현패턴을 더 대표할 수 있기 때문이다.
FFPE시료와 Frozen시료간유전자간 연관성 (correlation) 측정 및 유전자 선별
같은 환자에서 채취한 FFPE 시료와 동결 (frozen) 시료를 27종을 확보하여 각각에 대해서 FFPE 또는 동결 시료에서의 RNA추출방법에 따라 RNA를 추출하였다. 추출된 RNA를 주형으로 하여 선별된 32종의 유전자에 대해서 그 발현량을 각각 측 정하였다. 유전자 발현량은 개체간에 차이가 있을 수 있으므로 이를 표준화 (normalization)할 필요가 있기 때문에 표준화용 유전자로 선별된 5종의 유전자 즉 , CTBP1 (C-terminal-binding protein 1), TBP (TATA-binding protein), HMBS (hydroxymethylbilane synthase), CULl (cullin 1) 및 UBQLNl (Ubiqui 1 in-1)의 발 현량으로 표준화하여 FFPE 시료와 동결 시료간의 유전자 발현의 연관성을 측정하 였다. ' 연관성 측정 결과와 각 유전자별 시료에서의 발현량 결과를 바탕으로 연관성 값 (correlation rate)이 높고 샘플 간 유전자 발현 분포가 다양한 유전자를 초기 유방암 예후예측에 신뢰성이 높은 유전자를 최종 선별하였다.
<실험 결과 > 예후 예측모델을위한 예후유전자의 선택
초기 유방암 조직의 발현 프로파일로 이루어진 5개의 데이터 세트를 모두 합 쳐서 1,104개 샘플의 디스커버리 데이터 세트를 구성하였다. 모든 환자들은 화학치 료를 받지 않았고, 거의 대부분 액와절 전이가 전혀 없거나 (NO or N-) 유방암초기 (1기 또는 2기)이다. 이 중, 외부조직 전이에 대한 생존정보를 가지는 1,072명을 대상으로 통계적 분석을 수행하였다. 예후와 관련된 유전자를 찾기 위하여 예후가 좋은 집단 (10년이상 전이가 없는 경우)과 예후가 나쁜 집단 (5년 이내에 전이가 있 는 경우)의 발현 프로파일로 나누어 비교하였다. 예후가 좋은 집단에서 높은 발현 량을 보인 182개의 유전자와 예후가 나쁜 집단에서 높은 발현량을 보인 120개의 유 전자를 선택하였다 (결과미도시, FDR < 0.001).
선택된 302개의 유전자의 발현량에 대해 주성분 분석을 수행하였다. 주성분 1과 주성분 2에 대해 GO 기능분석을 수행하였다. 주성분 1은 매우 뚜렷하게 증식에 관련되어 있었고, 주성분 2는 면역반웅과 관련이 강하게 나타났다. 이를 기반으로 주성분 1에 속하는 유전자를 선택하였고, 주성분 2에 속하는 유전자를 선택함으로 써 2개의 발현패턴을 예후 예측모델에 반영하도록 하였다.
선택된 9개의 유전자들은 예후와 관련이 있을 뿐만 아니라, 예후집단간 발현 차이가 가장 큰 유전자들로 선택하였다. 증식을 나타내는 주성분 1에서 선택된 유 전자는 p-gene로 면역반웅을 나타내는 주성분 2에서 선택된 유전자는 i -genes로 명 하였다.
ER+유방암과 ER-유방암의 비교
에스트로겐 수용체 (estrogen receptor, ER)의 발현유무는 유방암의 발생 및 발달과 밀접한 관련이 있는 것으로 알려져 있다. 예후와 관련하여 선택된 유전자들 이 나타내는 2가지 기능, 즉 증식과 면역반응은 암의 메카니즘에 있어 흥미로운 기 능이다. 선택된 16개의 유전자들 (p-genes 및 i-genes)을 이용하여 ER- 유방암과 ER+ 유방암을 비교하여 보았다. 각 기능의 강도를 나타내기 위하여 p-genes 과 i- genes는 평균 발현량에 따라 3단계 (pi, p2, p3 또는 il, i2, i3)로 층화하였다. pi은 p-gene의 발현량이 가장 낮은 집단이고 증식이 가장 느릴 것으로 가정하였다. p3는 p-genes의 발현량이 가장 높은 집단이고 증식이 가장 활발하게 일어날 것으로 가정하였다. p2는 중간 발현량을 보아고 중간수준의 증식을 가정하였다. il은 i- genes가 가장 적게 발현하는 집단이고 약한 면역반웅이 있다고 가정하였다. i3는 i-genes가 가장 많이 발현하는 집단이고 매우 강한 면역반응이 있다고 보았다. i2 는 중간수준의 발현량과 활동을 보일 것으로 간주하였다.
디스커버리 데이터 세트 내의 1,072 명에 대해 p-gene과 i-gene의 발현량에 따라 분류를 하고 ER 상태별로 각 기능의 강도에 대한 구성을 살펴보았다. ER- 유 방암은 ER+ 유방암에 비해 매우 활발히 증식하는 p3 타입의 비율이 매우 높았다. 약 62%의 ER- 유방암이 매우 높은 p-genes 발현량 (p3)을 보인 반면, 18%의 ER+ 유 방암만이 높은 p-genes 발현량을 보임으로써, ER- 유방암이 ER+ 유방암보다 훨씬 공격적인 성향을 보인다고 알려진 바와 같았다. 약 35%의 ER+ 유방암이 약한 P- genes (pi)을 보였고, ER-의 경우는 pi의 비율이 9¾>밖에 되지 않았다. 활발한 면역 반응 기능은 ER- 유방암의 또 다른 특징으로서 38% 아상의 ER- 유방암은 i -genes (i3)의 발현량이 매우 높았다. 반면 ER+ 유방암은 2 % 정도가 높은 i-genes 발현량 을 보였다. ER+와 ER- 모두 증식이 활발해질수록 면역반웅 역시 활발해지는 것이 관찰되었지만, ER- 유방암이 면역반응을 더욱 적극적으로 보이는 것으로 나타났다. 이 외에, 유방암의 분화 (grade)정도도 증식과 밀접한 관계가 있는 것으로 나타났다. 분화가 잘 안되어 있는 유방암 (G3)일수록 빠른 증식을 보였고, 분화가 잘된 유방암 (G1)은 대부분 약한 증식을 보였다. 환자의 예후도 증식과 상관관계가 있는 것으로 나타났다. 5년 내에 전이가 일어난 예후가 나쁜 환자의 많은 수가 증 식이 빠른 집단에 더 많이 몰려있는 것이 관찰되었다.
종합적으로 ER- 유방암은 증식과 면역반응 모두 ER+ 유방암에 비해 매우 활 발하였고, ER의 발현량이 유방암의 발생 및 발달의 메카니즘에 영향을 주는 것으로 추측된다. 예후 예측모델의 확립
디스커버리 데이터 세트의 생존정보와 선택된 p-gene과 i -gene을 이용하여 초기 유방암 환자의 전이에 대한 AFT 예후예측모델을 만들었다. 디스커버리 데이터 세트의 생존정보를 이용하여 1년 단위의 세대생명표를 작성하여 대략적인 위험도를 계산하였다.
세대생명표로 얻은 사망확률은 단봉 (unimodal)형태를 보이므로, 와이블, 대 수로지스틱, 대수정규 분포가 잘 적합할 것으로 예측되었다. 예후예측모델에 포함 될 공변수는 p.mean와 i. mean이다. p. mean 은 p— genes의 평균값이면, i. mean은 i一 genes의 평균값이다.
3개의 모델에 대해 와이블, 대수로지스틱, 대수정규 분포에 대해 적용을 시 킨 결과, 대수정규분포와 가장 잘 적합하였다. AK Akaikes information criterion)을 이용하여 대수정규분포에 따른 최종모델을 선택하였다.
log(T)= -0.689 X p.mean + 0.274 x i .mean + 3.219
위의 추정된 모델에 의하면, p.mean, 즉 증식은 생존시간 (T)과 음의 상관관 계 (-0.689, p값 = 2.47 X e_1?)를 가지므로 증식이 활발할수록 생존시간은 짧아지게 된다. 반대로, i .mean은 생존시간과 양의 상관관계 (0.274, p 값 = 3.69 x e— U)를 가지는데, 면역반웅이 활발할수록 생존시간이 길어지는 것을 뜻한다. 위의 추정된 변수들을 해석하면, 증식이 유방암의 예후에 결정적인 역할을 하며 활발할수록 예 후가 나쁜 반면, 면역반웅이 빠른 증식에 대한 방어 메커니즘으로 활동하는 것으로 결론지을 수 있다. , 예후예측모델의 검증
디스커버리 데이터세트의 1,072명의 초기유방암 환자의 발현 프로파일을 이 용하여 만든 예후 예측모델에 대한 검증은 '교정 ' 과 '판별 '에 대해 수행되었다. ' 교정'은 모델을 통해 예측된 생존확률이 실제 관찰된 생존확를과 얼마나 비슷한지 를 알아보는 것인데, 이때 실제 관찰된 생존확률은 Kaplan-Meier 방법을 이용하여 얻은 생존확률을 말한다. '판별 '은 모델을 이용하여 환자를 예후집단으로 잘 분류 하는가 이다. 두 가지 성능에 대한 검증은 모델을 개발한 디스커버리 데이터세트와 3개의 독립된 검증 데이터세트에 대해 수행하였다.
예후 예측모델올 개발한 디스커버리 데이터 세트에 대해 예후예측지수 (prognostic index, PI)를 4등분하여 4개의 예후집단으로 분류하였다. 예후예측지 수에 꾀해 분류된 4개의 예후그룹에 대해 관찰된 생존확률인 KM그래프를 이용하여 비교하였다. 그 결과, 4개의 예후그룹이 매우 잘 분류된 것을 볼 수 있었으며, 각 예후집단의 예측된 생존확률과 관찰된 생존확률이 잘 일치하는 것을 볼 수 있다.
. KM 생존확률과 예후예측모형에 의해 예측된 생존확률을 그래프를 이용하여 비교하였다. 예후 예측모델은 모든 환자에 대해 모든 시간별 생존확률을 구하기 때 문에, KM 생존곡선과 같이 전체 생존시간에 대한 확률곡선을 얻기 위해, 각 환자들 의 시간별 (0년 -25년, 0.1 간격) 평균 생존확률을 이용하여 생존확률그래프를 그렸 다. 예측된 생존확률이 KM에 의한 생존확를보다 약간 높게 나오기는 했지만 전체적 으로 비슷하였다. 전체 생존시간에 대한 생존확률 비교 외에 5년차 생존확률에 대 해서도 비교하였다. 모델에 의한 5년 생존확률도 실제 관찰된 5년 생존확률과 유사 하였고 특히 예측된 5년 생존확률이 높을수록 예측확률과 관찰확률이 잘 일치하였 다.
보다 객관적인 검증을 위하여 3개의 독립적인 검증 데이터 세트들을 이용하 여 예후예측모델을 검증하였다. 첫 번째 검증 데이터 세트는 Affymetrix U133A 플 랫품으로 생성된 2개의 데이터 세트를 합친 것이다. 두 번째 검증 데이터 세트는 Affymetric U133A 플랫폼으로 생성된 데이터로서 모두 tamoxifen을 5년간 복용한 ER+ 환자이다. 세 번째 검증 데이터 세트는 70개의 예후 예측유전자 (현재 mammaprint로 상용화)의 발굴 및 검증을 위하여 사용된 데이터세트로 Agilent Hu25K 플랫품으로 생성되었다. 검증 데이터세트 1과 2의 경우 디스커버리 데이터 세트와 같은 Affymetrix U133A 플랫픔으로제작된 것으로 디스커버리 데아터 세트와 함께 발현량을 표준화하였다. 검증 데이터 세트 1과 2는 교정과 판별의 성능을 평 가하였고, 검증 데이터 세트 3은 발현량 표준화 문제로 판별와성능만 평가하였다.
FFPE샘폴에 적용가능한유전자세트의 선별
1,104개 샘플의 디스커버리 데이터 세트 중에서 예후가 좋은 집단에서 높은 발현량을 보인 182개의 유전자와 예후가 나쁜 집단에서 높은 발현량을 보인 120개 의 유전자에 대해서 각각 가장 기여도가 높은 유전자순으로 IQR (interquartile range)이 높은 것에, 그리고, 평균발현량이 높은 것에 우선순위를 두어 32종의 유 전자를 선별하였다.
FFPE시료와 Frozen시료간유전자간연관성 (correlation) 측정 및 유전자 선별
FFPE 시료 /동결 시료간의 연관성을 측정하기 위하여 환자 또는 암 조직에서 FFPE 시료와 동결 시료가 모두 확보된 샘플이 필요하다. 이와 같이 확보된 27쌍의 FFPE 시료 및 동결 시료에 대해서 선별된 32종의 유전자 각각의 발현량 및 FFPE 시 료 /동결 시료간의 연관성을 측정한 값을 얻었다. 그 결과 중에서 연관성 값 (correlation rate)가 높고 샘플 간 유전자 발현 분포가 다양한 유전자를 p-gene에 서 12종, i-gene에서 15종을 초기유방암 예후예측에 신뢰성이 높은 유전자로 선별 하였다.
상기 선별된 유전자 중 예후 진단용 키트에 포함시킬 유전자를 9종의 p-gene 과 6종의 i-gene을 선별하였다.
각각의 유전자에 대한 연관성을 측정한 결과는 도 6 및 도 7에서와 같다. 도 면에서의 실선은 가로축 및 세로축의 등가값 (기울기 1, 즉 가로축과 세로축의 같 은 값을 이어 선으로 표시한 것)을 표시한다.
한편 , 상기 각 유전자 중 TRBCl, BTN3A2, HLA-DPA1의 예후가 좋은 집단과 예 후가 나쁜 집단에서의 발현 수준에 유의적인 차이가 있었다. 이와 같은 분석을 통 해 TRBCl, BTN3A2, HLA-DPA1가 예후가 좋은 집단에서 유의작으로 발현이 증가되어 있음을 알 수 있었고, 아울러, 발현이 증가된 것 (과발현)이 좋은 유방암 예후를 나타냄을 확인할 수 있었다.
【산업상 이용가능성】 이상 살펴본 바와 같이, 본 발명은 초기 유방암의 예후 예측 진단용의 유전 자 마커를 제공한다. 본 발명의 유전자 마커는 유방암 환자의 예후의 예측, 진단이 가능하므로 항암치료의 필요성의 판단을 비롯하여 향후 유방암 치료의 방향에 대한 단서를 제시하는 목적으로 유용하게 사용할 수 있다.

Claims

【청구의 범위】
【청구항 1】
하기 단계를 포함하는 유방암 예후 예측 방법 :
(a) 시료로부터 mRNA를 분리하는 단계,
(b) TRBCl (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 및 HLA-DPA1 (major histocompatibility complex, class II, DP alpha 1)으로 이루어잔 군에서 하나이상 선택된 유전자의 mRNA 발현 수준을 측정하는 단계,
(c) 상기 유전자의 mRNA발현 수준을 표준화하는 단계 및
(d) 상기 유전자와 과발현은 유방암 예후가 좋은 것으로 판별하는 단계.
【청구항 2
게 1항에 있어서, 상기 발현 수준의 측정은 대상 유전자에 대한 PCR 증폭을 통해 수행되는 것을 특징으로 하는 방법.
【청구항 3】
제 1항에 있어서, 상기 시료는 환자의 암세포를 포함하는 조직의 포르말린 고 정 파라핀 포매 (formalin-fixed paraffin-embedded, FFPE) 시료인 것을 특징으로 하는 방법 .
【청구항 4】
제 1항에 있어서, 상기 표준화는 CTBP1 (C-terminal-binding protein 1), TBP (TATA-binding protein), HMBS (hydroxyme thy lbi lane synthase), CULl (cullin 1) 및 UBQLN1 (Ubiquilin-1)로 이루어진 군에서 하나이상 선택된 표준유전자의 평균 발현량에 대한 비를 산출하는 것에 의해서 주행되는 것을 특징으로 하는 방법.
【청구항 5]
TRBCl (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 및 HLA-DPA1 (major histocompatibility com lex, class II, DP alpha 1)로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍 이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍를 유효성분으로 포함하는 유방암 예후 예측 진단용 조성
【청구항 6】 '
제 5항의 조성물을 포함하는 유방암 예후 예측 진단 키트 .
【청구항 7]
유방암 환자의 예후 예측 진단에 필요한 정보를 제공하기 위하여, 환자의 시 료로 부터 하기 단계를 포함하는 유방암 예후 예측치를 산출하는 방법 :
(a) 시료로부터 mRNA를 분리하는 단계,
(b) TRBC1 (T cel l receptor beta constant 1) , BTN3A2 (butyrophi 1 in, subfami ly 3, member A2) 및 HLA— DPAl (major histocompat ibi l i ty complex, class I I, DP alpha 1)으로 이루어진 군에서 하나이상 선택된 유전자의 mRNA 발현 수준을 측정하는 단계 '
(c) 상기 유전자의 mRNA 발현 수준을 표준화하는 단계,
(d) 표준화된 수치를 미 리 정해진 계산식에 대입하여 수치를 계산하는 단계,
(e) 상기 수치 값와 수준에 따라 유방암 예후가 좋은 것으로 산출하거나, 유 방암 예후가 나쁜 것으로 산출하는 단계 .
【청구항 8】
제 7항에 있어서, 상기 발현 수준의 측정은 대상 유전자에 대한 PCR 중폭을 통해 수행되는 것을 특징으로 하는 방법 .
【청구항 9】
제 7항에 있어서, 상기 시료는 환자의 암세포를 포함하는 조직 의 포르말린 고 정 파라핀 포매 (formal in-f ixed paraff in-embedded, FFPE) 시료인 것을 특징으로 하는 방법 .
【청구항 10]
제 7항에 있어서 , 상기 표준화는 CTBP1 (C-terminal-binding protein 1), TBP (TATA— binding protein) , HMBS ( hydr oxyme t hy 1 b i 1 ane synthase) , CULl (cul l in 1) 및 UBQLN1 (Ubiqui l in-1)로 이루어진 군에서 하나이상 선택된 표준유전자의 평균 발현량에 대한 비를 산출하는 것에 의해서 수행되는 것을 특징으로 하는 방법 .
[청구항 11】
TRBCl (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 및. HLA—DPAl (major histocompatibility complex, class II, DP alpha 1)로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍 이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍을 이용하여 유방암 환자의 시료로부터 상기 선택된 유전 자의 mRNA발현 수준을 측정하는 단계를 포함하는 유방암 예후 예측 진단 방법 .
【청구항 12]
TRBCl (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 및 HLA-DPAl (major histocompatibility com 1 ex , class II, DP alpha 1)로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍 이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍.
【청구항 13】
TRBCl (T cell receptor beta constant 1), BTN3A2 (butyrophi 1 in, subfamily 3, member A2) 및 HLA-DPAl (major histocompatibility complex, class II, DP alpha 1)로 이루어진 군에서 선택된 어느 하나의 유전자에 대한 프라이머쌍 이며, 상기 프라이머쌍은 PCR 증폭에 의해서 대상유전자를 증폭할 수 있는 것임을 특징으로 하는 프라이머쌍의 유방암 예후 예측용 제제의 제조를 위한 용도.
PCT/KR2014/003384 2013-04-18 2014-04-18 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도 WO2014171778A1 (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
SG11201508544VA SG11201508544VA (en) 2013-04-18 2014-04-18 Genetic marker for early breast cancer prognosis prediction and diagnosis, and use thereof
CN201480034674.1A CN105339797B (zh) 2013-04-18 2014-04-18 早期乳腺癌的预后预测诊断用基因标记物及其用途
EP14785227.1A EP2988131A4 (en) 2013-04-18 2014-04-18 Genetic marker for early breast cancer prognosis prediction and diagnosis, and use thereof
JP2016508874A JP2016516426A (ja) 2013-04-18 2014-04-18 早期乳癌の予後予測診断用遺伝子マーカーおよびその用途
US14/886,948 US20160102359A1 (en) 2013-04-18 2015-10-19 Genetic marker for early breast cancer prognosis prediction and diagnosis, and use thereof
US16/155,220 US10655187B2 (en) 2013-04-18 2018-10-09 Genetic marker for early breast cancer prognosis prediction and diagnosis, and use thereof

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130043160A KR101672531B1 (ko) 2013-04-18 2013-04-18 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도
KR10-2013-0043160 2013-04-18

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/886,948 Continuation US20160102359A1 (en) 2013-04-18 2015-10-19 Genetic marker for early breast cancer prognosis prediction and diagnosis, and use thereof

Publications (2)

Publication Number Publication Date
WO2014171778A1 true WO2014171778A1 (ko) 2014-10-23
WO2014171778A8 WO2014171778A8 (ko) 2015-12-23

Family

ID=51731629

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2014/003384 WO2014171778A1 (ko) 2013-04-18 2014-04-18 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도

Country Status (7)

Country Link
US (1) US20160102359A1 (ko)
EP (1) EP2988131A4 (ko)
JP (1) JP2016516426A (ko)
KR (1) KR101672531B1 (ko)
CN (1) CN105339797B (ko)
SG (1) SG11201508544VA (ko)
WO (1) WO2014171778A1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11220716B2 (en) * 2016-11-25 2022-01-11 Gencurix Inc. Methods for predicting the prognosis of breast cancer patient
CN114717242A (zh) * 2022-05-20 2022-07-08 中国医学科学院肿瘤医院 Loc107984813在诊断、预测预后、治疗癌症中的应用

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3155592B1 (en) * 2014-06-10 2019-09-11 Leland Stanford Junior University Predicting breast cancer recurrence directly from image features computed from digitized immunohistopathology tissue slides
KR101896558B1 (ko) * 2016-11-21 2018-09-07 주식회사 젠큐릭스 유방암 환자의 예후 예측 방법
KR101950717B1 (ko) * 2016-11-23 2019-02-21 주식회사 젠큐릭스 유방암 환자의 화학치료 유용성 예측 방법
CN107164519A (zh) * 2017-06-26 2017-09-15 深圳优圣康医学检验所有限公司 一种基于荧光pcr检测esr1基因突变的引物及探针
WO2019005764A1 (en) * 2017-06-27 2019-01-03 Institute For Cancer Research D/B/A The Research Institute Of Fox Chase Cancer Center MHC-I GENOTYPE LIMITING THE ONCOGEN MUTATIONAL LANDSCAPE
KR20190071393A (ko) 2017-12-14 2019-06-24 충남대학교산학협력단 메탈로티오네인 2a를 포함하는 유방암 환자의 전이 및 예후 예측용 조성물
CN108441559B (zh) * 2018-02-27 2021-01-05 海门善准生物科技有限公司 一种免疫相关基因群作为标志物在制备评估高增殖性乳腺癌远处转移风险的产品中的应用
CN109801680B (zh) * 2018-12-03 2023-02-28 广州中医药大学(广州中医药研究院) 基于tcga数据库的肿瘤转移复发预测方法及系统
CN110373463A (zh) * 2019-07-08 2019-10-25 江苏医药职业学院 检测跨膜p24转运蛋白9表达水平的试剂的应用和试剂盒

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080206769A1 (en) * 2007-01-31 2008-08-28 Applera Corporation Molecular prognostic signature for predicting breast cancer distant metastasis, and uses thereof
KR20090088757A (ko) * 2008-02-15 2009-08-20 재단법인서울대학교산학협력재단 표준 발현 유전자를 발굴하기 위한 유전자 발현 데이터처리, 분석 방법
US20100035240A1 (en) * 2004-08-10 2010-02-11 Cardiff Biologicals Limited Methods and kit for the prognosis of breast cancer
KR20110110031A (ko) * 2010-03-30 2011-10-06 서울대학교산학협력단 유방암 예후 예측을 위한 조성물 및 이를 포함하는 키트
WO2012093821A2 (ko) 2011-01-04 2012-07-12 주식회사 바이오트라이온 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005001138A2 (en) * 2003-06-18 2005-01-06 Arcturus Bioscience, Inc. Breast cancer survival and recurrence
GB0323225D0 (en) * 2003-10-03 2003-11-05 Ncc Technology Ventures Pte Lt Materials and methods relating to breast cancer classification
US8065093B2 (en) * 2004-10-06 2011-11-22 Agency For Science, Technology, And Research Methods, systems, and compositions for classification, prognosis, and diagnosis of cancers
US20070059720A9 (en) * 2004-12-06 2007-03-15 Suzanne Fuqua RNA expression profile predicting response to tamoxifen in breast cancer patients
US8178505B2 (en) * 2005-01-05 2012-05-15 Sloan-Kettering Institute For Cancer Research Method of predicting and reducing risk of metastasis of breast cancer to lung
EP1777523A1 (en) * 2005-10-19 2007-04-25 INSERM (Institut National de la Santé et de la Recherche Médicale) An in vitro method for the prognosis of progression of a cancer and of the outcome in a patient and means for performing said method
FR2892730A1 (fr) * 2005-10-28 2007-05-04 Biomerieux Sa Methode pour detecter la presence ou le risque de developper un cancer
US20080182246A1 (en) * 2006-09-05 2008-07-31 Yixin Wang Methods of predicting distant metastasis of lymph node-negative primary breast cancer using biological pathway gene expression analysis
PT2121977T (pt) * 2007-01-11 2017-08-18 Erasmus Univ Medical Center Captura da conformação cromossómica circular (4c)
CA2695814A1 (en) * 2007-09-07 2009-04-23 Universite Libre De Bruxelles Methods and tools for prognosis of cancer in her2+ patients
US20090123932A1 (en) * 2007-11-09 2009-05-14 Anne-Marie Mes-Masson Quantitative test to detect disease progression markers of epithelial ovarian cancer patients
AU2009234444A1 (en) * 2008-04-11 2009-10-15 China Synthetic Rubber Corporation Methods, agents and kits for the detection of cancer
MX337650B (es) * 2009-11-23 2016-03-14 Genomic Health Inc Metodos para predecir el desenlace clinico del cancer.
WO2012166700A2 (en) * 2011-05-29 2012-12-06 Lisanti Michael P Molecular profiling of a lethal tumor microenvironment

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100035240A1 (en) * 2004-08-10 2010-02-11 Cardiff Biologicals Limited Methods and kit for the prognosis of breast cancer
US20080206769A1 (en) * 2007-01-31 2008-08-28 Applera Corporation Molecular prognostic signature for predicting breast cancer distant metastasis, and uses thereof
KR20090088757A (ko) * 2008-02-15 2009-08-20 재단법인서울대학교산학협력재단 표준 발현 유전자를 발굴하기 위한 유전자 발현 데이터처리, 분석 방법
KR20110110031A (ko) * 2010-03-30 2011-10-06 서울대학교산학협력단 유방암 예후 예측을 위한 조성물 및 이를 포함하는 키트
WO2012093821A2 (ko) 2011-01-04 2012-07-12 주식회사 바이오트라이온 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법
KR20120079295A (ko) 2011-01-04 2012-07-12 주식회사 젠큐릭스 초기유방암의 예후 예측용 유전자 및 이를 이용한 초기유방암의 예후예측 방법

Non-Patent Citations (28)

* Cited by examiner, † Cited by third party
Title
AUSUBEL ET AL.: "Current Protocols of Molecular Biology", 1997, JOHN WILEY AND SONS
BILD, A.H. ET AL.: "Oncogenic pathway signatures in human cancers as a guide to targeted therapies", NATURE, vol. 439, no. 7074, 2006, pages 353 - 357, XP002460134, DOI: doi:10.1038/nature04296
BUYSE, M. ET AL.: "Validation and clinical utility of a 70-gene prognostic signature for women with node-negative breast cancer", J NATL CANCER INST, vol. 98, no. 17, 2006, pages 1183 - 92
CHANG, H.Y. ET AL.: "Gene expression signature of fibroblast serum response predicts human cancer progression: similarities between tumors and wounds", PLOSBIOL, vol. 2, no. 2, 2004, pages E7, XP008154100, DOI: doi:10.1371/journal.pbio.0020007
DE ANDRES ET AL., BIOTECHNIQUES, vol. 18, 1995, pages 42044
DESMEDT, C. ET AL.: "Strong time dependence of the 76-gene prognostic signature for node-negative breast cancer patients in the TRANSBIG multicenter independent validation series", CLIN CANCER RES, vol. 13, no. 11, 2007, pages 3207 - 3214, XP055003155, DOI: doi:10.1158/1078-0432.CCR-06-2765
DEUTSCHER, M.: "Guide to Protein Purification Methods Enzymology", vol. 182, 1990, ACADEMIC PRESS. INC.
HALE; MARHAM: "THE HARPER COLLINS DICTIONARY OF BIOLOGY"
HELD ET AL., GENOME RESEARCH, vol. 6, 1996, pages 986 - 994
K. SPECHT ET AL., AM. J. PATHOL., vol. 158, 2001, pages 419 - 29
LE PAGE, CECILE ET AL.: "BTN3A2 Expression in Epithelial Ovarian Cancer Is Associated with Higher Tumor Infiltrating T Cells and a Better Prognosis", PLOS ONE, vol. 7, no. 6, 2012, pages E38541, XP055286966 *
MANIATIS ET AL.: "Molecular Cloning: A Laboratory Manual", 1982, COLD SPRING HARBOR LABORATORY
MILLER, L.D. ET AL.: "An expression signature for p53 status in human breast cancer predicts mutation status, transcriptional effects, and patient survival.", PROC NATL ACADSCI USA, vol. 102, no. 38, 2005, pages 13550 - 13555, XP008155357, DOI: doi:10.1073/pnas.0506230102
PAIK, S. ET AL.: "A multigene assay to predict recurrence of tamoxifen-treated, node-negative breast cancer", N ENGL J MED, vol. 351, no. 27, 2004, pages 2817 - 2826, XP002578486
PAIK, S.: "Development and clinical utility of a 21-gene recurrence score prognostic assay in patients with early-stage breast cancer treated with tamoxifen", ONCOLOGIST, vol. 12, no. 6, 2007, pages 631 - 635, XP002566234, DOI: doi:10.1634/theoncologist.12-6-631
PAWITAN, Y. ET AL.: "Gene expression profiling spares early-stage breast cancer patients from adjuvant therapy: derived and validated in two population-based cohorts.", BREAST CANCER RES, vol. 7, no. 6, 2005, pages R953 - 964
RUPP; LOCKER, LAB INVEST., vol. 56, 1987, pages A67
SAMBROOK ET AL.: "Molecular Cloning: A Laboratory Manual, 2d Ed.", 1989, COLD SPRING HARBOR LABORATORY PRESS
See also references of EP2988131A4
SINGLETON ET AL.: "DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOTY, 2nd ed.", 1994
SOTIRIOU, C. ET AL.: "Gene expression profiling in breast cancer: understanding the molecular basis of histologic grade to improve prognosis", J NATL CANCER INST, vol. 98, no. 4, 2006, pages 262 - 72, XP002490627, DOI: doi:10.1093/jnci/djj052
T.E. GODFREY ET AL., J. MOLEC. DIAGNOSTICS, vol. 2, 2000, pages 84 - 91
TESCHENDORFF, A.E. ET AL.: "A consensus prognostic gene expression classifier for ER positive breast cancer", GENOME BIOL, vol. 7, no. 10, 2006, pages R101, XP021027290, DOI: doi:10.1186/gb-2006-7-10-r101
VAN DE VIJVER, M.J. ET AL.: "A gene-expression signature as a predictor of survival in breast cancer", N ENGL J MED, vol. 347, no. 25, 2002, pages 1999 - 2009, XP008032093, DOI: doi:10.1056/NEJMoa021967
VAN DE VIJVER, M.J. ET AL.: "A gene-expression signature as a predictor of survival in breast cancer.", N ENGL J MED, vol. 347, no. 25, 2002, pages 1999 - 2009, XP008032093, DOI: doi:10.1056/NEJMoa021967
VAN 'T VEER, L.J. ET AL.: "Gene expression profiling predicts clinical outcome of breast cancer", NATURE, vol. 415, no. 6871, 2002, pages 530 - 536, XP008138701, DOI: doi:10.1038/415530a
WALKERED: "THE CAMBRIDGE DICTIONARY OF SCIENCE AND TECHNOLOGY", 1988
WANG, Y. ET AL.: "Gene-expression profiles to predict distant metastasis of lymph-node-negative primary breast cancer", LANCET, vol. 365, no. 9460, 2005, pages 671 - 679, XP002713581, DOI: doi:10.1016/S0140-6736(05)70933-8

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11220716B2 (en) * 2016-11-25 2022-01-11 Gencurix Inc. Methods for predicting the prognosis of breast cancer patient
CN114717242A (zh) * 2022-05-20 2022-07-08 中国医学科学院肿瘤医院 Loc107984813在诊断、预测预后、治疗癌症中的应用

Also Published As

Publication number Publication date
EP2988131A4 (en) 2017-04-12
KR101672531B1 (ko) 2016-11-17
CN105339797B (zh) 2017-07-11
CN105339797A (zh) 2016-02-17
JP2016516426A (ja) 2016-06-09
SG11201508544VA (en) 2015-11-27
WO2014171778A8 (ko) 2015-12-23
KR20140125239A (ko) 2014-10-28
EP2988131A1 (en) 2016-02-24
US20160102359A1 (en) 2016-04-14

Similar Documents

Publication Publication Date Title
WO2014171778A1 (ko) 조기 유방암 예후 예측 진단용 유전자 마커 및 이의 용도
US10697975B2 (en) Methods for identifying, diagnosing, and predicting survival of lymphomas
KR101896545B1 (ko) 유방암 환자의 예후 예측 방법
US8183353B2 (en) Breast cancer prognostics
EP1526186B1 (en) Colorectal cancer prognostics
US8030060B2 (en) Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer
WO2006127537A2 (en) Thyroid fine needle aspiration molecular assay
US10718030B2 (en) Methods for predicting effectiveness of chemotherapy for a breast cancer patient
US20170130269A1 (en) Diagnosis of neuromyelitis optica vs. multiple sclerosis using mirna biomarkers
WO2010104473A1 (en) A method for the systematic evaluation of the prognostic properties of gene pairs for medical conditions, and certain gene pairs identified
WO2014171800A1 (ko) 조기 유방암 예후 예측 진단용 자동화 시스템
KR101504818B1 (ko) 위암에 대한 예후 예측 시스템
CN116926190A (zh) 测量乳腺癌远端转移风险的预后标志物及其应用
CN116936086A (zh) 乳腺癌远端转移风险预测基因模型的建构方法和风险预测方法
EP4278015A1 (en) Methods for determining cancer
CN117004711A (zh) 测量乳腺癌局部复发风险的预后标志物的工具及其应用
CN117012376A (zh) 乳腺癌局部复发模型的建构方法和风险预测方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201480034674.1

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 14785227

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016508874

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2014785227

Country of ref document: EP