KR20160086145A - 유방암의 예후 예측용 유전자 선별방법 - Google Patents

유방암의 예후 예측용 유전자 선별방법 Download PDF

Info

Publication number
KR20160086145A
KR20160086145A KR1020150003508A KR20150003508A KR20160086145A KR 20160086145 A KR20160086145 A KR 20160086145A KR 1020150003508 A KR1020150003508 A KR 1020150003508A KR 20150003508 A KR20150003508 A KR 20150003508A KR 20160086145 A KR20160086145 A KR 20160086145A
Authority
KR
South Korea
Prior art keywords
breast cancer
genes
expression
gene
patient
Prior art date
Application number
KR1020150003508A
Other languages
English (en)
Inventor
박애경
권정연
김소희
신성철
김지수
Original Assignee
순천대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 순천대학교 산학협력단 filed Critical 순천대학교 산학협력단
Priority to KR1020150003508A priority Critical patent/KR20160086145A/ko
Publication of KR20160086145A publication Critical patent/KR20160086145A/ko

Links

Images

Classifications

    • G06F19/24
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 표준화된 유방암 환자군의 유전자 발현 데이터를 하기 수학식 1에 대입하여 환자를 고발현 군집과 저발현 군집으로 분류한 후, 생존분석(survival analysis)을 수행하여 상기 분류된 두 환자 군집의 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자를 재분류하는 단계를 포함하는 유방암 예후 예측용 유전자의 선별방법, 및 유방암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터를 상기 수학식 1에 대입하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 유방암 환자의 예후를 판단하는 단계를 포함하는 유방암 환자의 예후를 예측하는 방법에 관한 것이다.

Description

유방암의 예후 예측용 유전자 선별방법{Selection method of predicting genes for breast cancer prognosis}
본 발명은 유방암의 예후 예측용 유전자 선별방법 및 그 선별된 유전자를 이용하여 유방암의 예후 예측방법에 관한 것으로, 보다 상세하게는 최적화 함수를 통해 유방암 예후 예측을 위한 유전자를 정확하면서도 신속하게 선별하는 방법, 및 유방암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터를 최적화 함수에 대입하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 상기 선별된 유전자를 이용하여 유방암 환자의 예후를 판단하는 단계를 포함하는 유방암 환자의 예후를 예측하는 방법에 관한 것이다.
유방암(breast cancer)은 서양 여성에서 많이 발생하며, 미국에서만 해마다 약 40,000명의 생명을 앗아가고, 약 200,000명의 여성에게서 진단되고 있다(Elledge RM, et al., 1992, Sem Oncol., 19:244.). 또한, 우리나라에서 유방암의 발생빈도는 여성에서 자궁경부암, 위암에 이어 세 번째로 많은 악성 종양으로 점차 증가하여 여성암의 13.3% 정도에 이르러 많은 여성들이 관심을 갖고 있는 질환이다(보건사회부, 1997, 한국인 암등록 조사 자료분석 보고서).
최근 종양의 진단기술 및 치료방법의 발전과 유방암에 대한 인식변화로 초기단계에 유방암의 발견 빈도가 증가함에 따라 생존률이 현저하게 증가하고 있다. 구체적으로, 유방암 환자들 중 약 80%는 생존율이 가장 높은 초기단계에 진단되고 있으며, 그 결과, 유방암 환자들은 진단 후 적어도 5년 이상은 생존하는 것으로 나타났다. 이러한 진단기술의 발전에도 불구하고, 유방암은 매우 다양한 성질을 갖는 종양으로서 같은 조직학적 유형이라도 임상 경과는 환자마다 달라서 수십년을 재발없이 지내는 경우가 있는가 하면, 치료 후 일년도 못되서 전이성 암으로 재발하여 사망하는 등 매우 다양하다. 이러한 차이는 현재까지 밝혀진 여러 예후 인자에 의해 결정된다고 보고되고 있다. 이에 최근 연구는 환자의 예후를 결정하는 예후인자들을 발견하는데 초점이 맞추어지고 있다. 특히, 예후가 좋다고 알려진 액과 림프절 전이가 없는 유방암의 경우 70%~75% 정도는 수술 또는/및 방사선 치료만으로도 충분하여 더 이상의 화학치료를 하지 않아도 재발없이 지내지만 나머지 20%~25%는 암이 재발하여 수술 후 화학적 치료가 요구된다(Carter CL., et al., 1989, Cancer, 63: 181-187.; Posen PP, et al., 1983, Ann Surg, 197: 276-283.). 이와 같은 경우 예후인자들은 생존율 예측뿐만 아니라 보존치료를 결정하는 판단인자로도 작용하므로 그 중요성이 더욱 강조되고 있다.
현재까지 잘 알려진 예후인자로는 종양크기, 액과 림프절의 전이, 종양의 조직학적 형태 및 분화도, 에스트로겐(ER)이나 프로게스테론(PR) 호르몬 수용기, DNA ploidy 등이 있다. 또한, 최근에는 생물학적인 관점에서 유방암에서도 c-erbB-2, ras 및 p53 등과 같은 종양 유전자가 환자의 예후에 영향을 미친다고 알려져 있으며, 연구자마다 의견의 차이는 있으나 상기 종양유전자가 종양세포에서 발현되면 예후가 나쁘다는 의견이 지배적이다. 또한, 표피 성장인자 수용체(epidermal growth factor receptor)가 발현은 재발율이 증가하여 양호하지 않은 유방암 예후와 관련성이 있다고 알려져 있다.
유방암의 예후 예측용 유전자의 선별과 관련하여 van't Veer 등(van't Veer LJ et al., 2002, Nature, 415:530-536.)은 마이크로어레이(microarray, 미세배열)를 이용하여 117명의 유방암 환자 시료에 대한 유전자 발현 양상을 분석하여, 예후가 좋은 환자와 나쁜 환자를 구별할 수 있는 70개의 유전자를 선별한 후, 이들 70개의 유전자를 통해 유방암 환자의 예후를 정확히 판단할 수 있다고 보고하고 있으며, 대한민국 등록특허 제10-1287600호에는 유방암 조직으로부터 얻은 마이크로어레이 데이터와 임상정보를 수집 및 분석하여 예후와 관련된 유전자를 발굴하고, 이를 이용하여 유방암 환자의 예후 예측모델을 구성한 후 검증을 통해 환자의 예후를 간단한 방법으로 예측할 수 있음을 개시하고 있다. 이때, 유방암 관련 유전자의 선별은 발현 양상을 분석하여 이루어지는데, 상기 유방암 관련 유전자의 발현 양상은 일반적으로 지지 벡터 머신(support vector machines, SVM), 신경망, 결정트리, k-최근접 이웃(k-nearest neighbor, k-NN) 등과 같은 기계 학습 알고리즘들을 이용하여 분석되어 왔다. 그러나 상기 방법들은 유전자들 간의 상호작용을 고려하지 못하고, 개별 유전자들을 기반으로 하여 고차원 공간상에 사상시키거나 결정 경계를 이용한 분류 방법들이기 때문에 암환자의 발현 데이터에서 유전자 선택과 분류의 정확도가 다소 떨어지는 문제가 있다. 또한 이러한 방법들은 단순한 기계적 알고리즘을 적용한 방법으로서 환자 자료 또는 임상 자료에서 나타나는 유전적, 임상적 특징을 접목하지 않은 방법들이다.
이에 본 발명자들은 기존의 유방암 환자의 유전자 발현 데이터를 이용하여 유방암 무전이 생존(distant metastasis free survival, DMFS) 예후와 관련된 유전자의 유전적, 임상적 의미를 적용하면서 정확도가 높은 선별방법을 개발하고자 노력한 결과, 유방암 환자들의 유전자 발현 데이터를 수집한 후 최적화 함수에 대입하여 유전자의 발현 양상이 양봉형 정규 분포(bimodal normal distribution)를 나타내는 유전자를 검출한 후, 환자 군집을 분류하고 생존분석을 통해 유방암 예후 예측용 유전자를 선별할 수 있음을 확인하고 본 발명을 완성하였다.
본 발명의 하나의 목적은 종래 표준화된 유방암 환자의 유전자 발현 데이터를 최적화 함수에 대입하여 유방암의 예후 예측과 관련된 유전자를 간단하고 효율적으로 유방암 예후 예측용 유전자를 선별하는 방법을 제공하는 것이다.
본 발명의 다른 하나의 목적은 종래 표준화된 유방암 환자의 유전자 발현 데이터를 최적화 함수에 대입하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 상기 선별된 유전자를 이용하여 유방암 환자의 예후를 판단하는 단계를 포함하는 유방암 환자의 예후를 예측하는 방법을 제공하는 것이다.
하나의 양태로서, 본 발명은 표준화된 유방암 환자의 유전자 발현 데이터를 최적화 함수에 대입하여 환자를 고발현 군집과 저발현 군집으로 분류한 후, 생존분석을 수행하여 상기 분류된 두 환자 군집에 속하는 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자를 재분류하는 단계를 포함하는 유방암 예후 예측용 유전자를 선별하는 방법에 관한 것이다.
본 발명에 있어서, 상기 유방암 환자의 유전자 발현 데이터는 유방암 환자의 생체 내에서 유전자가 mRNA의 형태로 발현하는 유전자의 정보를 모아놓은 정보를 말한다. 상기 mRNA의 형태로 발현하는 유전자는 생체의 생명현상을 유지해야 하거나 조절이 필요한 상황에서 이를 위한 단백질을 만들기 위해 발현하는 것이다.
상기 유방암 환자의 유전자 발현 데이터의 수집은 당업계에 알려진 방법이라면 어느 것이나 사용하여 이루어질 수 있다. 예를 들어 마이크로어레이 유전자 발현 자료, 멀티 플렉스 PCR(multiplex polymerase chain reaction), 정량 RT-PCR(quantitative reverse transcription polymerase chain reaction), 타일링 어레이(tiling array)를 이용한 전사체(transcriptome) 해석, 쇼트 리드 시퀀싱(short read sequencing)를 이용하여 수집할 수 있으며, 바람직하게는 마이크로어레이 유전자 발현 자료로부터 수집할 수 있다. 그러나 반드시 이에 한정되는 것은 아니다.
상기 방법으로 수집된 유방암 환자의 유전자 발현 데이터는 통계적으로 분석하기 위해서, 당업계에서 통상적으로 사용하는 다양한 방법의 표준화 방법을 이용할 수 있으며, 바람직하게는 RMA(Robust Multi-array Average) 표준화(normalization) 방법을 사용한다.
하나의 구체적 양태로서, GEO(gene exprssion omnibus) 데이터 베이스에 공개되어 있는 유방암 환자의 mRNA 발현 세트를 수집하였으며, 상기 수집된 mRNA 발현 세트를 통계 프로그램 R 상에서 affy bioconductor library의 RMA 방법을 이용하여 표준화한 후 log2 값으로 변환하여 유전자 발현 양상을 결정하는데 사용하였다.
본 발명에 있어서, 고발현 군집과 저발현 군집의 분류는 상기 수집된 유방암 환자의 유전자 발현 데이터를 대상으로 최적화 함수에 대입하여 양봉형 정규분포(bimodal distribution) 양상을 나타내는 유전자를 검출한 후 두 개의 정규분포(normal distribution)가 교차하는 지점을 컷오프(cutoff) 값으로 지정하고, 상기 분류된 각 유전자의 컷오프 값을 기준으로 데이터 값이 증가하는 환자를 고발현 군집으로, 데이터 값이 감소하는 환자를 저발현 군집으로 분류하는 것을 특징으로 한다. 여기서, 데이터 값은 유전자의 발현량을 의미한다.
본 발명에 있어서, 상기 최적화 함수의 일반식은 하기 수학식 1과 같다.
Figure pat00001
여기서, 상기 μ1와 μ2는 두 군집의 정규분포의 평균(means of the two normal distributions)이고, σ1와 σ2 두 군집의 표준편차(standard deviations of the two normal distributions)이며, π는 mixing parameter(percentage of the distribution)로 전체 환자군 중에서 군집 1의 환자가 차지하는 비율을 말하며, φ는 정규분포식(normal distribution function), yi i번째 환자의 유전자 발현 정도, n은 수집된 전체 환자수를 의미한다.
본 발명에 있어서, 상기 양봉형 정규분포(bimodal distribution) 양상을 나타내는 유전자는 유방암 환자 집단에서 특정 유전자의 발현 정도가 뚜렷하게 다른 두 군의 집단이 존재하는 것으로 환자 모집단(patient population)에서 유전적 변이(genetic mutation), 유전적 다형성(genetic polymorphism), 유전자의 소실(genetic deletion)이나 증폭(amplification), 유전자 발현 조절 변화(change of gene expression regulation) 등 다양한 유전적 변화가 일어났다는 것을 의미한다. 특히, 발현정도가 뚜렷한 양봉형 정규분포 양상을 나타내는 동시에 두 유전자 군집의 생존결과가 통계적 유의성을 보이면서 다르게 나타나는 경우 유방암에 있어서 이 유전자 발현정도의 변화가 유방암의 예후와 밀접하게 연관되어 있다고 볼 수 있다.
따라서, 본 발명에 따른 수학식 1은 유방암 환자의 유전자 발현 데이터로부터 양봉형 정규분포 양상을 나타내는 유전자를 선별함으로써 유방암 환자군에서 뚜렷한 유전적 변화를 나타내는 유전자의 검색을 가능하게 한다는 장점이 있다. 또한 결과적으로 기존에는 발현 분포의 특징에 대한 고려없이 평균값(mean)이나 중앙값(median), 임의의 변위치(quantile)를 컷오프로 사용하여 고발현군과 저발현군을 나누던 방식에 비하여 유전적, 임상적 의미가 부여된 컷오프의 설정이 가능하게 되므로 정확하게 환자를 고발현 군집과 저발현 군집으로 분류할 수 있다는 장점이 있다.
본 발명에 있어서, 상기 생존분석(survival analysis)은 상기 분류된 두 환자 군집의 유전자를 이용하여 무전이 생존(distant metastasis free survival, DMFS) 집단을 분류할 수 있는지의 여부를 알아보기 위한 통계학적 기술을 의미한다.
상기 생존분석은 당업계에서 통상적으로 사용하는 다양한 방법을 사용할 수 있다. 예를 들어, 단일 변수 분석법인 카플란-마이어법(kaplan-meier method) 또는 로그-랭크 시험법(log-rank test)을 사용하거나, 다중 변수 분석법인 콕스 비례 위험 회귀 모델(cox proportional-hazards regression model)을 사용하여 할 수 있다.
본 발명에 있어서, 상기 유방암 예후 예측용 유전자는 유방암 환자의 유전자 발현 데이터를 상기 수학식 1에 대입하여 분류된 고발현 군집과 저발현 군집에 속하는 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자인 것을 특징으로 한다.
하나의 구체적 양태로서, 유방암 환자의 유전자 발현 데이터(GPL 96 및 GPL 570)에서 유전적 변화가 일어난 유전자가 될 확률이 높다는 가정 하에 상기 수학식 1을 사용하여 양봉분포(bimodal distribution)를 나타내는 유전자를 검출하고, 상기 분류된 각 유전자의 컷오프 값을 기준으로 환자를 고발현 군집과 저발현 군집으로 분류한 다음 콕스 비례 위험 모델, 로그 순위 검정 및 카플란-마이어 방법을 이용하여 상기 분류된 두 환자 군집에서 생존결과가 통계적 유의성을 나타내는 유전자로 재분류한 결과, 발현량이 증가하면서 생존확률이 감소하는 유전자, 즉, 예후가 나쁜 유전자(17개 up-regulation: CTSL2, LMNB1, KRT16, TYMS, RAB11FIP1, UBE2W, EIF4EBP1, APOBEC3B, LAD1, RIPK4, GCLM, C13orf27, NDRG1, SPRR1B, KRT6A, PCSK1N 및 PDSS1)와 발현량이 감소하면서 생존확률이 감소하는 유전자, 즉 예후가 좋은 유전자(11개 down-regulation: 11개; ZBTB16, ARHGEF6, XBP1, ACSL5, MAT2B, TNFRSF17, EPHX2, ACADM, TMPRSS3, PTER 및 C3)를 발견하였으며, 종래 알려진 자료를 토대로 상기 재분류된 유전자들은 유방암의 예후와 밀접한 관련이 있음을 확인하였다.
본 발명의 명세서에서, 용어 "예후"는 환자에서의 유방암 발병 또는 외과적 시술 후 일정기간 내 암 전이 여부 또는 생존기간을 예측하는 것을 의미한다.
본 발명의 명세서에서, 용어 "무전이 생존(distant metastasis free survival)"은 외과적 수술 도중 또는 수술 후 환자의 질병 상태가 악화되지 않은 상태로, 임상연구 또는 시험에 사용될 수 있는 기간을 의미한다.
다른 하나의 양태로서, 본 발명은 유방암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터를 상기 수학식 1에 대입하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 유방암 환자의 예후를 판단하는 단계를 포함하는 유방암 환자의 예후를 예측하는 방법에 관한 것이다.
본 발명에 있어서, 상기 생물학적 시료는 개체로부터 얻은 각종 유형의 시료, 구체적으로 고체 조직 시료, 액체 조직 시료, 생물학적 액체, 기관지 흡입액, 세포 및 세포 단편을 사용할 수 있다. 생물학적 시료의 구체적인 예로는 수술과정에서 개체로부터 제거한 고체 조직 시료, 병리학적 표본, 보존된 시료 또는 생검 표본, 조직 배양액 또는 이들로부터 유래된 세포 및 이들의 자손과, 이들의 급원으로부터 제조된 절편 또는 도말이 있으나, 이에 한정되는 것은 아니다.
본 발명에 있어서, 상기 고발현 군집과 저발현 군집을 분류하는 방법은 상술한 바와 같으므로, 이하에서는 생략한다.
본 발명에 있어서, 상기 유방암 환자의 예후는 본 발명에 따라 분류된 고발현 군집에 속하는 유전자가 DNACTL2(cathepsin L2), TYMS(thymidylate synthetase), EIF4EBP1(eukaryotic translation initation factor 4E-binding protein 1), APOBEC3B(apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like 3B), KRT16(karatin 16), KRT6A(karatin 6A), RIPK4(Receptor-interacting protein kinase 4), RAB11FIP1(Rab-coupling protein), LMNB1(lamin B1), LAD1(Linear IgA disease antigen), C13orf27(testis-expressed sequence 30 protein, TEX30), GCLM(glutamate-cysteine ligase, modifier subunit), PCSK1N(proprotein convertase subtilisin/kexin type 1 inhibitor), NDRG1(N-myc downstream-regulated gene 1), UBE2W(ubiquitin-conjugating enzyme E2W), PDSS1(prenyldiphosphate synthase, subunit 1) 및 SPRR1B(small proline- rich proteins 1 B)로 이루어진 군으로부터 선택된 1개 또는 2개 이상, 바람직하게는 5개 이상, 보다 바람직하게는 10개 이상, 보다 더 바람직하게는 전체 유전자인 경우 유방암의 재발 가능성이 높고 생존 예후가 나쁜 환자로 판단하고, 저발현 군집에 속하는 환자의 유전자가 ZBTB16(zinc finger and BTB domain containing 16), ARHGEF6(Rac/Cdc42 guanine nucleotide exchange factor, GEF), EPHX2(Epoxide Hydrolase 2), ACSL5(Acyl-CoA synthetase 5), XBP1(X-box binding protein1), TMPRSS3(Transmembrane protease, serine 3), MAT2B(Methionine adenosyltransferase 2B), TNFRSF17(Tumor necrosis factor receptor superfamily member 17), C3(complement 3), ACADM(acyl-Coenzyme A dehydrogenase , C-4 to C-12 straight chain) 및 PTER(phosphotriesterase-related)로 이루어진 군으로부터 선택된 1개 또는 2개 이상, 바람직하게는 5개 이상, 보다 바람직하게는 10개 이상, 보다 더 바람직하게는 전체 유전자인 경우 유방암의 재발 가능성이 낮고 생존 예후가 좋은 환자로 판단하는 단계를 포함하는 것을 특징으로 한다.
하나의 구체적 양태로서, 새로운 유방암 환자의 mRNA 데이터를 상기 수학식 1에 대입하여 양봉분포 양상을 나타내는 유전자를 검출한 후, 상기 검출된 유전자가 CTSL2이며 컷오프(cutoff) 값을 기준으로 고발현 군집에 속하는 경우 이 환자는 생존예후가 좋지 못한 것으로 판단할 수 있다.
따라서, 본 발명에 따른 유방암 환자의 예후를 예측하는 방법은 당업계에서 통상적으로 이루어지는 생존분석을 실시하지 않더라도 유방암의 예후를 예측할 수 있으므로 불필요한 항암치료를 줄일 수 있는 예후 진단에 유용하게 이용할 수 있을 것이다.
한편, 유방암 환자의 생물학적 시료로부터 본 발명에 따라 선별된 예후 예측용 유전자들의 mRNA 존재 여부, 이들의 발현정도 또는 이들의 유전자에 의해 코딩되는 단백질의 발현 함량에 따라 유방암의 예후를 예측할 수 있으므로, 유방암의 예후 예측을 위한 마커 유전자로 사용될 수 있다.
본 발명에 있어서, 상기 예후 예측용 마커, 예후 예측을 위한 마커 또는 예후 예측 마커는 유방암 세포를 정상 세포와 구분하여 유방암 치료 후 재발 여부를 비롯한 예후를 예측할 수 있는 물질을 의미한다.
본 발명에 따른 방법은 최적화 함수를 통해 유방암 예후 예측을 위한 유전자를 정확하면서도 간단하게 선별할 수 있다. 아울러, 상기 방법으로 선별된 유방암 예후 예측 유전자들의 발현 데이터를 최적화 함수를 이용하여 고발현군과 저발현군으로 분류함으로써 유방암의 예후를 예측하여 불필요한 항암치료를 줄일 수 있는 예후 진단에 유용하게 이용될 수 있다.
도 1a 내지 도 1e는 본 발명의 일 실시예에 따라 선별된 유방암의 DMFS(distant metastasis free survival)와 연관된 17개의 발현이 증가하면서 예후 좋지 못한 결과를 나타내는 유전자의 양봉분포 및 생존곡선을 측정한 결과이다.
도 2a 내지 도 2c는 본 발명의 일 실시예에 따라 선별된 유방암의 DMFS(distant metastasis free survival)와 연관된 11개의 발현이 감소하면서 예후가 좋지 못한 결과를 나타내는 유전자의 양봉분포 및 생존곡선을 측정한 결과이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1 : 유방암 환자의 mRNA 발현 데이터 세트 수집
유방암 환자의 mRNA 발현 데이터 세트를 공개 데이터베이스인 GEO(http://www.ncbi.nlm.nih.gov/geo)에서 수집하였다. 수집된 데이터 세트는 Affymetrix genechip human genome U133 array set HG-U133A 플랫폼(GPL96)을 기반으로 한 유방암 환자(3,221명) 데이터 세트와 Affymetrix genechip human genome U133 array set HG-U133 plus 2.0 플랫폼(GPL570)을 기반으로 한 유방암 환자(2,346명) 데이터 세트이다. 상기 두 개의 플랫폼은 생존정보가 외부조직으로의 전이(distant-metastasis free survival, DMFS)에 대한 것이였다. 외부조직으로의 전이(DMFS)는 예후 결정에 있어 가장 결정적인 사건인 점, 암 고유의 특성에 의해 결정된다는 점 및 수집된 데이터에서 가장 많은 환자가 외부조직으로의 전이(DMFS)에 대한 정보를 가지고 있다는 점을 기반으로 외부조직 전이여부를 기초로하여 생존분석을 수행하기로 하였다. 수집된 모든 환자의 정보를 비교하여 중복된 4,165명의 환자의 발현 데이터 세트를 제거하였고, 총 1,402명(GPL570:194명; GPL96:1,208명)의 환자들에 대하여 분석을 수행하였다.
구체적으로, 공개 데이터베이스인 GEO로부터 수집한 데이터 세트의 원본파일(.CEL)을 다운받아 RMA(Robust Multi-array Average) 방법을 이용하여 표준화(normalize)시켰다. 표준화 시킨 데이터는 log2 로 변환하여 사용하였다.
실시예 2 : 양봉분포(bimodal distribution) 및 통계학적 분석을 통한 유방암 예후 예측 관련 유전자 선별
본 발명자들은 양봉분포(bimodal distribution)를 나타내는 유전자의 경우 유전적 변화가 일어난 유전자가 될 확률이 높다는 가정 하에 하기 수학식 1에 나타낸 최적화 함수를 사용하여 양봉분포(biomodal distribution)를 나타내는 유전자를 선별하였다.
구체적으로, 상기 실시예 1에서 표준화시킨 데이터를 하기 수학식 1에 대입하여 양봉분포(biomodal distribution)를 나타내는 유전자를 선별하였다. 그 다음 상기 이봉분포는 두 개의 정규분포(normal distribution)가 교차하는 지점을 컷오프(cutoff) 값으로 지정하고, 상기 컷오프 값을 기준으로 환자군을 고발현 (high expression) 군집과 저발현(low expression) 군집으로 나누었다.
[수학식 1]
Figure pat00002
μ1, μ2 : means of the two normal distributions
σ1, σ2 : standard deviations of the two normal distributions
π : mixing parameter(percentage of the distribution)
φ : normal distribution function
y1 : expression level of ith sample
또한, 상기 정규분포(normal distribution) 양상을 나타내는 유전자들과 예후와의 관련성을 확인하기 위하여 유전자 발현 값의 증가에 따라 변동하는 위험도를 추정하여 단변량의 의미를 알아내는데 쓰이는 콕스 비례 위험 모델(Cox proportional hazards regression model)과 생존률에 유의한 차이가 없다는 귀무가설을 검정하는데 사용되는 로그 순위 검정(log-rank test)을 이용하여 생존분석을 실시하였다. 또한, 카플란-마이어 곡선(kaplan-meier curves)를 이용하여 생존률 그래프를 구하였다. 이를 토대로 유방암 예후 예측 유전자를 선별하였다. 그 결과를 도 1, 도 2 및 표 1에 나타내었다.
Up-regulated genes(발현이 증가하면서 예후가 좋지 않은 결과를 나타내는 유전자)
CTSL2 Cathepsin L2
TYMS Thymidylate synthetase
EIF4EBP1 Eukaryotic translation initiation factor 4E-binding protein 1
APOBEC3B apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like 3B
KRT16 Keratin 16
KRT6A Keratin 6A
RIPK4 Receptor-interacting protein kinase 4
RAB11FIP1 Rab-coupling protein
LMNB1 Lamin B1
LAD1 Linear IgA disease antigen
C13orf27 TEX30(testis-expressed sequence 30 protein)라고도 불림
GCLM glutamate-cysteine ligase, modifier subunit
PCSK1N proprotein convertase subtilisin/kexin type 1 inhibitor
NDRG1 N-myc downstream-regulated gene 1
UBE2W ubiquitin-conjugating enzyme E2W
PDSS1 prenyldiphosphate synthase, subunit 1
SPRR1B small proline- rich proteins 1 B
down-regulated genes(발현이 감소하면서 예후가 좋지 않은 결과를 나타내는 유전자)
ZBTB16 zinc finger and BTB domain containing 16
ARHGEF6 Rac/Cdc42 guanine nucleotide exchange factor(GEF)
EPHX2 Epoxide Hydrolase 2
ACSL5 Acyl-CoA synthetase 5
XBP1 X-box binding protein1
TMPRSS3 Transmembrane protease, serine 3
MAT2B Methionine adenosyltransferase 2B
TNFRSF17 Tumor necrosis factor receptor superfamily member 17
C3 complement 3
ACADM acyl-Coenzyme A dehydrogenase , C-4 to C-12 straight chain
PTER phosphotriesterase-related
실험결과, Affymetrix HG-U133A(GPL96)와 HG-U133 Plus 2.0(GPL570) 마이크로어레이 기반의 두개의 데이터 세트를 이용한 분석에서, 공통된 31개의 유전자, 즉 발현이 증가하면서 예후가 좋지 못한 17개 유전자(up-regulated genes; CTSL2, LMNB1, KRT16, TYMS, RAB11FIP1, UBE2W, EIF4EBP1, APOBEC3B, LAD1, RIPK4, GCLM, C13orf27, NDRG1, SPRR1B, KRT6A, PCSK1N, PDSS1), 발현이 감소하면서 예후가 좋지 못한 11개 유전자(down-regulated genes; ZBTB16, ARHGEF6, XBP1, ACSL5, MAT2B, TNFRSF17, EPHX2, ACADM, TMPRSS3, PTER, C3)를 발견하였다.

Claims (4)

  1. 표준화된 유방암 환자군의 유전자 발현 데이터를 하기 수학식 1에 대입하여 환자를 고발현 군집과 저발현 군집으로 분류한 후, 생존분석(survival analysis)을 수행하여 상기 분류된 두 환자 군집의 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자를 재분류하는 단계를 포함하는 유방암 예후 예측용 유전자의 선별방법.

    [수학식 1]
    Figure pat00003

    [여기서, μ1와 μ2는 두 집단의 정규분포의 평균(means of the two normal distributions)이고, σ1와 σ2 두 집단의 표준편차(standard deviations of the two normal distributions)이며, π는 mixing parameter(percentage of the distribution)로 전체 환자군 중에서 집단 1의 환자가 차지하는 비율을 말하며, φ는 정규분포식(normal distribution function), yi i번째 환자의 유전자 발현 정도, n은 수집된 전체 환자수를 의미한다.]
  2. 제1항에 있어서, 상기 고발현 군집에 속하며 생존결과가 통계적 유의성을 보이는 유전자는 CTL2(cathepsin L2), TYMS(thymidylate synthetase), EIF4EBP1(eukaryotic translation initation factor 4E-binding protein 1), APOBEC3B(apolipoprotein B mRNA editing enzyme, catalytic polypeptide-like 3B), KRT16(karatin 16), KRT6A(karatin 6A), RIPK4(Receptor-interacting protein kinase 4), RAB11FIP1(Rab-coupling protein), LMNB1(lamin B1), LAD1(Linear IgA disease antigen), C13orf27(testis-expressed sequence 30 protein, TEX30), GCLM(glutamate-cysteine ligase, modifier subunit), PCSK1N(proprotein convertase subtilisin/kexin type 1 inhibitor), NDRG1(N-myc downstream-regulated gene 1 ), UBE2W(ubiquitin-conjugating enzyme E2W), PDSS1(prenyldiphosphate synthase, subunit 1) 및 SPRR1B(small proline- rich proteins 1 B)로 이루어진 군으로부터 선택된 1개 또는 2개 이상의 유전자인 것을 특징으로 하는 유방암 예후 예측용 유전자의 선별방법.
  3. 제1항에 있어서, 상기 저발현 군집에 속하며 생존결과가 통계적 유의성을 보이는 유전자는 ZBTB16(zinc finger and BTB domain containing 16), ARHGEF6(Rac/Cdc42 guanine nucleotide exchange factor, GEF), EPHX2(Epoxide Hydrolase 2), ACSL5(Acyl-CoA synthetase 5), XBP1(X-box binding protein1), TMPRSS3(Transmembrane protease, serine 3), MAT2B(Methionine adenosyltransferase 2B), TNFRSF17(Tumor necrosis factor receptor superfamily member 17), C3(complement 3), ACADM(acyl-Coenzyme A dehydrogenase , C-4 to C-12 straight chain) 및 PTER(phosphotriesterase-related)로 이루어진 군으로부터 선택된 1개 또는 2개 이상의 유전자인 것을 특징으로 하는 유방암 예후 예측용 유전자의 선별방법.
  4. 유방암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터를 상기 수학식 1에 대입하여 고발현 군집과 저발현 군집으로 분류한 후, 상기 고발현 군집에 속하는 유전자가 상기 제2항의 유전자로 이루어진 군으로부터 선택된 1개 또는 2개 이상인 경우 유방암의 재발 가능성이 높고 생존 예후가 나쁜 환자로 판단하고, 상기 저발현 군집에 속하는 유전자가 상기 제3항의 유전자로 이루어진 군으로부터 선택된 1개 또는 2개 이상인 경우 유방암의 재발 가능성이 낮고 생존 예후가 좋은 것으로 판단하는 단계를 포함하는 유방암 환자의 예후를 예측하는 방법.
KR1020150003508A 2015-01-09 2015-01-09 유방암의 예후 예측용 유전자 선별방법 KR20160086145A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150003508A KR20160086145A (ko) 2015-01-09 2015-01-09 유방암의 예후 예측용 유전자 선별방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150003508A KR20160086145A (ko) 2015-01-09 2015-01-09 유방암의 예후 예측용 유전자 선별방법

Publications (1)

Publication Number Publication Date
KR20160086145A true KR20160086145A (ko) 2016-07-19

Family

ID=56616305

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150003508A KR20160086145A (ko) 2015-01-09 2015-01-09 유방암의 예후 예측용 유전자 선별방법

Country Status (1)

Country Link
KR (1) KR20160086145A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180038346A (ko) * 2016-10-06 2018-04-16 광주과학기술원 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법
KR20190000169A (ko) * 2017-06-22 2019-01-02 한국과학기술원 암의 재발 예후 예측을 위한 바이오마커 발굴 시스템 및 방법
WO2020111451A1 (ko) * 2018-11-30 2020-06-04 주식회사 쓰리빌리언 신규 표적 단백질과 그에 대한 동반진단 바이오마커 발굴 시스템 및 방법
KR20200109471A (ko) * 2019-03-13 2020-09-23 울산대학교 산학협력단 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180038346A (ko) * 2016-10-06 2018-04-16 광주과학기술원 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법
KR20190000169A (ko) * 2017-06-22 2019-01-02 한국과학기술원 암의 재발 예후 예측을 위한 바이오마커 발굴 시스템 및 방법
WO2020111451A1 (ko) * 2018-11-30 2020-06-04 주식회사 쓰리빌리언 신규 표적 단백질과 그에 대한 동반진단 바이오마커 발굴 시스템 및 방법
JP2022518660A (ja) * 2018-11-30 2022-03-16 スリービリエン 新規の標的タンパク質と、それに関する同伴診断バイオマーカーの発掘システム及び方法
EP3893242A4 (en) * 2018-11-30 2022-08-24 3Billion NOVEL TARGET PROTEIN AND COMPANION DIAGNOSTIC BIOMARKER DISCOVERY SYSTEM AND METHOD
KR20200109471A (ko) * 2019-03-13 2020-09-23 울산대학교 산학협력단 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법

Similar Documents

Publication Publication Date Title
US10697975B2 (en) Methods for identifying, diagnosing, and predicting survival of lymphomas
Glinsky et al. Gene expression profiling predicts clinical outcome of prostate cancer
de Reyniès et al. Gene expression profiling reveals a new classification of adrenocortical tumors and identifies molecular predictors of malignancy and survival
Glinsky et al. Microarray analysis identifies a death-from-cancer signature predicting therapy failure in patients with multiple types of cancer
US7901881B2 (en) Diagnostic tool for diagnosing benign versus malignant thyroid lesions
Vachani et al. A 10-gene classifier for distinguishing head and neck squamous cell carcinoma and lung squamous cell carcinoma
CA2693847C (en) Bladder cancer diagnosis and/or prognosis method
CN104093859A (zh) 多基因生物标志物的鉴定
EP2121988B1 (en) Prostate cancer survival and recurrence
WO2006127537A2 (en) Thyroid fine needle aspiration molecular assay
US20110224908A1 (en) Gene signature for diagnosis and prognosis of breast cancer and ovarian cancer
WO2013052480A1 (en) Marker-based prognostic risk score in colon cancer
WO2008070301A2 (en) Predicting lung cancer survival using gene expression
US9721067B2 (en) Accelerated progression relapse test
CN105102636A (zh) 用于检测和测定前列腺癌预后的组合物和方法
EP1651775A2 (en) Breast cancer survival and recurrence
KR20160086145A (ko) 유방암의 예후 예측용 유전자 선별방법
US20050186577A1 (en) Breast cancer prognostics
TWI622892B (zh) 基因表現圖譜以及將其應用於乳癌醫療之方法與套組與微陣列晶片
JP2008538284A (ja) 乳房の腫瘍のレーザーマイクロダイセクションおよびマイクロアレイ解析が、エストロゲン受容体に関係する遺伝子および経路を明らかにする
CN113168885A (zh) 用于体细胞突变的方法和系统及其用途
CN113774135B (zh) 一组用于预测高级别浆液性卵巢癌预后的标志物及其应用
KR20170032892A (ko) 난소암의 예후 예측용 유전자 선별방법
KR20160086496A (ko) 난소암의 예후 예측용 유전자 선별방법
EP2872651B1 (en) Gene expression profiling using 5 genes to predict prognosis in breast cancer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application