KR20170032892A - 난소암의 예후 예측용 유전자 선별방법 - Google Patents

난소암의 예후 예측용 유전자 선별방법 Download PDF

Info

Publication number
KR20170032892A
KR20170032892A KR1020170031404A KR20170031404A KR20170032892A KR 20170032892 A KR20170032892 A KR 20170032892A KR 1020170031404 A KR1020170031404 A KR 1020170031404A KR 20170031404 A KR20170031404 A KR 20170031404A KR 20170032892 A KR20170032892 A KR 20170032892A
Authority
KR
South Korea
Prior art keywords
ovarian cancer
expression
gene
prognosis
protein
Prior art date
Application number
KR1020170031404A
Other languages
English (en)
Inventor
박애경
서보경
신성철
김지수
Original Assignee
순천대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 순천대학교 산학협력단 filed Critical 순천대학교 산학협력단
Priority to KR1020170031404A priority Critical patent/KR20170032892A/ko
Publication of KR20170032892A publication Critical patent/KR20170032892A/ko

Links

Images

Classifications

    • G06F19/24
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Physics & Mathematics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Analytical Chemistry (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Software Systems (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 표준화된 난소암 환자군의 유전자 발현 데이터를 하기 수학식 1에 대입하여 환자를 고발현 군집과 저발현 군집으로 분류한 후, 생존분석(survival analysis)을 수행하여 상기 분류된 두 환자 군집의 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자를 재분류하는 단계를 포함하는 난소암 예후 예측용 유전자의 선별방법, 및 난소암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터를 상기 수학식 1에 대입하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 난소암 환자의 예후를 판단하는 단계를 포함하는 난소암 환자의 예후를 예측하는 방법에 관한 것이다.

Description

난소암의 예후 예측용 유전자 선별방법{Selection method of predicting genes for ovarian cancer prognosis}
본 발명은 난소암의 예후 예측용 유전자 선별방법 및 그 선별된 유전자를 이용하여 난소암의 예후 예측방법에 관한 것으로, 보다 상세하게는 최적화 함수를 통해 난소암 예후 예측을 위한 유전자를 정확하면서도 신속하게 선별하는 방법, 및 난소암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터를 최적화 함수에 대입하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 상기 선별된 유전자를 이용하여 난소암 환자의 예후를 판단하는 단계를 포함하는 난소암 환자의 예후를 예측하는 방법에 관한 것이다.
난소암(ovarian cancer)은 50~70세의 여성에서 가장 많이 발생하는 부인과 질환으로, 국립 암센터 통계에 의하면 2010년에 약 1,981명의 난소암 발생 환자가 발생되었다(보건사회부, 2010, 한국인 암등록 조사 자료분석 보고서). 이러한 난소암은 초기에 아무런 자각증세가 없어 약 70%의 난소암 환자가 3기 또는 4기의 상태에서 진단되는 특징이 있으며, 수술요법과 항암화학요법 등의 발달에도 불구하고, 다른 암들에 비해 5년 생존율 25~30% 정도로 예후가 극히 불량한 질환이다(McGurie WP., et al., 2011, Eur J Gynaecol Oncol., 32(1):103-106; Engel J., et al., 2002, Eur J Cancer, 38(18):2435-2445.).
이에 난소암으로 인한 사망률을 줄이기 위해서는 조기진단의 필요성이 요구된다. 일반적으로 난소암의 진단은 초음파, X선을 이용한 CT, MRI 등의 화상진단, 혈액 종양 표식자 검사(CA125) 등을 통해 이루어진다. 이들 방법에 의하여 질병의 병변이 발견되는 경우, 정밀한 조직검사를 통해 비교적 정확한 검사결과를 얻을 수 있다. 그러나, 상기 화상진단은 환자에게 고통이 따르는 불편함이 있어 피검자들이 꺼려하며, 조직검사를 위해 조직을 떼어내는 과정에서 암세포가 다른 외부 장기로 퍼질 가능성이 있다. 또한, 혈액 속 종양 표식자(CA125)의 수치는 다수의 생식기 문제로 인해 상승될 수 있으며, 조기 난소암에는 양성반응을 보이는 비율이 낮기 때문에 종양 표식자의 수치만으로는 암을 확진할 수 없다. 따라서 난소암을 조기에 발견할 수 있는 예측 또는 진단용 바이오마커의 발견에 대한 연구의 중요성이 강조되고 있다.
난소암의 예후 예측용 바이오마커와 관련하여 대한민국 공개특허 제2014-0024860호에는 난소암 환자로부터 분리한 생물학적 샘플 내 바이오마커의 발현 수준을 측정하여 난소암의 존재, 아류형 및 단계를 예측하기 위한 바이오마커 패널, 진단방법 및 시험키트에 대하여 개시하고 있으며, 대한민국 등록특허 제10-1102960호에는 3차원적으로 배양된 암 세포주에 방사선을 조사하여 유전자의 발현 변화를 분석하여 암 특이적인 유전자를 검출하는 방법에 대한 것으로, 상기 방법은 2차원적인 세포 배양 시스템에서는 검출하지 못함 암과 관련된 타켓 유전자의 검출이 가능하다고 개시되어 있다. 이때, 일부 선행문헌에서 암 관련 유전자의 선별은 유전자의 발현 양상 또는 변화를 분석하여 이루어지는데, 상기 유전자의 발현 양상은 일반적으로 지지 벡터 머신(support vector machines, SVM), 신경망, 결정트리, k-최근접 이웃(k-nearest neighbor, k-NN), 랜덤 포리스트 등과 같은 기계 학습 알고리즘들을 이용하여 분석되어 왔다. 그러나 상기 방법들은 유전자들 간의 상호작용을 고려하지 못하고, 개별 유전자들을 기반으로 하여 고차원 공간상에 사상시키거나 결정 경계를 이용한 분류 방법들이기 때문에 암환자의 발현 데이터에서 유전자 선택과 분류의 정확도가 다소 떨어지는 문제가 있다. 또한 이러한 방법들은 단순한 기계적 알고리즘을 적용한 방법으로서 환자 자료 또는 임상 자료에서 나타나는 유전적, 임상적 특징을 접목하지 않은 방법들이다.
이에 본 발명자들은 기존의 난소암 환자의 유전자 발현 데이터를 이용하여 난소암 예후와 관련된 유전자의 유전적, 임상적 의미를 적용하면서 정확도가 높은 선별방법을 개발하고자 노력한 결과, 난소암 환자들의 유전자 발현 데이터를 수집한 후 최적화 함수에 대입하여 유전자의 발현 양상이 양봉형 정규 분포(bimodal normal distribution)를 나타내는 유전자 검출한 후, 환자 군집을 분류하고 생존분석을 통해 난소암 예후 예측용 유전자를 선별할 수 있음을 확인하고 본 발명을 완성하였다.
본 발명의 하나의 목적은 종래 표준화된 난소암 환자의 유전자 발현 데이터를 최적화 함수에 의하여 난소암의 예후 예측과 관련된 유전자를 간단하고 효율적으로 난소암 예후 예측용 유전자를 선별하는 방법을 제공하는 것이다.
본 발명의 다른 하나의 목적은 종래 표준화된 난소암 환자의 유전자 발현 데이터로부터 최적화 함수에 의해 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 상기 선별된 유전자를 이용하여 난소암 환자의 예후를 판단하는 단계를 포함하는 난소암 환자의 예후를 예측하는 방법을 제공하는 것이다.
하나의 양태로서, 본 발명은 표준화된 난소암 환자의 유전자 발현 데이터로부터 최적화 함수에 의해 환자를 고발현 군집과 저발현 군집으로 분류한 후, 생존분석을 통하여 상기 분류된 두 환자 군집에 속하는 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자를 재분류하는 단계를 포함하는 난소암 예후 예측용 유전자를 선별하는 방법에 관한 것이다.
본 발명에 있어서, 상기 난소암 환자의 유전자 발현 데이터는 난소암 환자의 생체 내에서 유전자가 mRNA의 형태로 발현하는 유전자의 정보를 모아놓은 정보를 말한다. 상기 mRNA의 형태로 발현하는 유전자는 생체의 생명현상을 유지해야 하거나 조절이 필요한 상황에서 이를 위한 단백질을 만들기 위해 발현하는 것이다.
상기 난소암 환자의 유전자 발현 데이터의 수집은 당업계에 알려진 방법이라면 어느 것이나 사용하여 이루어질 수 있다. 예를 들어 마이크로어레이 유전자 발현 자료, 멀티 플렉스 PCR(multiplex polymerase chain reaction), 정량 RT-PCR(quantitative reverse transcription polymerase chain reaction), 타일링 어레이(tiling array)를 이용한 전사체(transcriptome) 해석, 쇼트 리드 시퀀싱(short read sequencing)를 이용하여 수집할 수 있으며, 바람직하게는 마이크로어레이 유전자 발현 자료로부터 수집할 수 있다. 그러나 반드시 이에 한정되는 것은 아니다.
상기 방법으로 수집된 난소암 환자의 유전자 발현 데이터는 통계적으로 분석하기 위해서, 당업계에서 통상적으로 사용하는 다양한 방법의 표준화 방법을 이용할 수 있으며, 바람직하게는 RMA(Robust Multi-array Average) 표준화(normalization) 방법을 사용한다.
하나의 구체적 양태로서, GEO(gene exprssion omnibus) 데이터 베이스에 공개되어 있는 난소암 환자의 mRNA 발현 세트를 수집하였으며, 상기 수집된 mRNA 발현 세트를 통계 프로그램 R 상에서 affy bioconductor library의 RMA 방법을 이용하여 표준화한 후 log2 값으로 변환하여 유전자 발현 양상을 결정하는데 사용하였다.
본 발명에 있어서, 고발현 군집과 저발현 군집의 분류는 상기 수집된 난소암 환자의 유전자 발현 데이터를 대상으로 최적화 함수에 대입하여 양봉형 정규분포(bimodal distribution) 양상을 나타내는 유전자를 검출한 후 두 개의 정규분포(normal distribution)가 교차하는 지점을 컷오프(cutoff) 값으로 지정하고, 상기 분류된 각 유전자의 컷오프 값을 기준으로 데이터 값이 증가하는 환자를 고발현 군집으로, 데이터 값이 감소하는 환자를 저발현 군집으로 분류하는 것을 특징으로 한다. 여기서, 데이터 값은 유전자의 발현량을 의미한다.
본 발명에 있어서, 상기 최적화 함수의 일반식은 하기 수학식 1과 같다.
Figure pat00001
여기서, 상기 μ1와 μ2는 두 군집의 정규분포의 평균(means of the two normal distributions)이고, σ1와 σ2 두 군집의 표준편차(standard deviations of the two normal distributions)이며, π는 mixing parameter(percentage of the distribution)로 전체 환자군 중에서 군집 1의 환자가 차지하는 비율을 말하며, φ는 정규분포식(normal distribution function), yi i번째 환자의 유전자 발현 정도, n은 수집된 전체 환자수를 의미한다.
본 발명에 있어서, 상기 양봉형 정규분포(bimodal distribution) 양상을 나타내는 유전자는 난소암 환자 집단에서 특정 유전자의 발현 정도가 뚜렷하게 다른 두 군의 집단이 존재하는 것으로 환자 모집단(patient population)에서 유전적 변이(genetic mutation), 유전적 다형성(genetic polymorphism), 유전자의 소실(genetic deletion)이나 증폭(amplification), 유전자 발현 조절 변화(change of gene expression regulation) 등 다양한 유전적 변화가 일어났다는 것을 의미한다. 특히, 발현정도가 뚜렷한 양봉형 정규분포 양상을 나타내는 동시에 두 유전자 군집의 생존결과가 통계적 유의성을 보이면서 다르게 나타나는 경우 난소암에 있어서 이 유전자 발현정도의 변화가 난소암의 예후와 밀접하게 연관되어 있다고 볼 수 있다.
따라서, 본 발명에 따른 수학식 1은 난소암 환자의 유전자 발현 데이터로부터 양봉형 정규분포 양상을 나타내는 유전자를 선별함으로써 난소암 환자군에서 뚜렷한 유전적 변화를 나타내는 유전자의 검색을 가능하게 한다는 장점이 있다. 또한 결과적으로 기존에는 발현 분포의 특징에 대한 고려없이 평균값(mean)이나 중앙값(median), 임의의 변위치(quantile)를 컷오프로 사용하여 고발현군과 저발현군을 나누던 방식에 비하여 유전적, 임상적 의미가 부여된 컷오프의 설정이 가능하게 되므로 정확하게 환자를 고발현 군집과 저발현 군집으로 분류할 수 있다는 장점이 있다.
본 발명에 있어서, 상기 생존분석(survival analysis)은 상기 분류된 두 환자 군집의 유전자를 이용하여 생존여부(overall survival) 집단을 분류할 수 있는지의 여부를 알아보기 위한 통계학적 기술을 의미한다.
상기 생존분석은 당업계에서 통상적으로 사용하는 다양한 방법을 사용할 수 있다. 예를 들어, 단일 변수 분석법인 카플란-마이어법(kaplan-meier method) 또는 로그-랭크 시험법(log-rank test)을 사용하거나, 다중 변수 분석법인 콕스 비례 위험 회귀 모델(cox proportional-hazards regression model)을 사용하여 할 수 있다.
본 발명에 있어서, 상기 난소암 예후 예측용 유전자는 난소암 환자의 유전자 발현 데이터를 상기 수학식 1에 대입하여 분류된 고발현 군집과 저발현 군집에 속하는 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자인 것을 특징으로 한다.
하나의 구체적 양태로서, 난소암 환자의 유전자 발현 데이터(GPL 96 및 GPL 570)에서 유전적 변화가 일어난 유전자가 될 확률이 높다는 가정 하에 상기 수학식 1을 사용하여 양봉분포(bimodal distribution)를 나타내는 유전자를 검출하고, 컷오프 값을 기준으로 환자를 고발현 군집과 저발현 군집으로 분류한 다음 콕스 비례 위험 모델, 로그 순위 검정 및 카플란-마이어 방법을 이용하여 상기 분류된 두 환자 군집에서 생존결과가 통계적 유의성을 나타내는 유전자로 재분류한 결과, 발현량이 증가하면서 생존확률이 감소하는 유전자, 즉, 예후가 나쁜 유전자(6개 up-regulation: SRPX2, HES1, NELL2, NRAS, PMEPA1 및 TGFB1I1)와 발현량이 감소하면서 생존확률이 감소하는 유전자, 즉, 예후가 좋은 유전자(6개 down-regulation: FOXO1, ID4, PAEP, UBR5, SLC5A1 및 IFT74)를 발견하였으며, 종래 알려진 자료를 토대로 상기 재분류된 유전자들은 난소암의 예후와 밀접한 관련이 있음을 확인하였다.
본 발명의 명세서에서, 용어 "예후"는 환자에서의 난소암 발병 또는 외과적 시술 후 일정기간 내 암 전이 여부 또는 생존기간을 예측하는 것을 의미한다.
본 발명의 명세서에서, 용어 "생존여부(overall survival)"은 외과적 수술 후 환자의 생존 여부를 알고 있는 기간을 의미한다.
다른 하나의 양태로서, 본 발명은 난소암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터로부터 상기 수학식 1에 의하여 환자를 고발현 군집 또는 저발현 군집으로 분류한 후 난소암 환자의 예후를 판단하는 단계를 포함하는 난소암 환자의 예후를 예측하는 방법에 관한 것이다.
본 발명에 있어서, 상기 생물학적 시료는 개체로부터 얻은 각종 유형의 시료, 구체적으로 고체 조직 시료, 액체 조직 시료, 생물학적 액체, 기관지 흡입액, 세포 및 세포 단편을 사용할 수 있다. 생물학적 시료의 구체적인 예로는 수술과정에서 개체로부터 제거한 고체 조직 시료, 병리학적 표본, 보존된 시료 또는 생검 표본, 조직 배양액 또는 이들로부터 유래된 세포 및 이들의 자손과, 이들의 급원으로부터 제조된 절편 또는 도말이 있으나, 이에 한정되는 것은 아니다.
본 발명에 있어서, 상기 고발현 군집과 저발현 군집을 분류하는 방법은 상술한 바와 같으므로, 이하에서는 생략한다.
본 발명에 있어서, 상기 난소암 환자의 예후는 본 발명에 따라 분류된 고발현 군집에 속하는 유전자가 SRPX2(Sushi repeat-containing protein), HES1(hairy and enhancer of split-1), NELL2(protein kinase C-binding protein), NRAS(neuroblastoma RAS viral (v-ras) oncogene homolog), PMEPA1(transmembrane prostate androgen-induced protein) 및 TGFB1I1(transforming growth factor beta-1-induced transcript 1 protein)로 이루어진 군으로부터 선택된 1개 또는 2개 이상, 바람직하게는 5개 이상, 보다 바람직하게는 전체 유전자인 경우, 난소암의 재발 가능성이 높고 생존 예후가 나쁜 환자로 판단하고, 저발현 군집에 속하는 유전자가 FOXO1(forkhead box protein O1), ID4(DNA-binding protein inhibitor), PAEP(progestogen-associated endometrial protein), UBR5(Ubiquitin protein ligase E3 component n-recognin 5), SLC5A1(Solute carrier family 5 (sodium/glucose cotransporter), member 1) 및 IFT74(Intraflagellar transport protein 74 homolog)로 이루어진 군으로부터 선택된 1개 또는 2개 이상, 바람직하게는 5개 이상, 보다 바람직하게는 전체 유전자인 경우, 난소암의 재발 가능성이 낮고 생존 예후가 좋은 환자로 판단하는 단계를 포함하는 것을 특징으로 한다.
하나의 구체적 양태로서, 새로운 난소암 환자의 mRNA 데이터를 상기 수학식 1에 대입하여 양봉분포 양상을 나타내는 유전자를 검출한 후, 상기 검출된 유전자가 SRPX2이며 컷오프(cutoff) 값을 기준으로 고발현 군집에 속하는 경우 이 환자는 생존예후가 좋지 못한 것으로 판단할 수 있다.
따라서, 본 발명에 따른 난소암 환자의 예후를 예측하는 방법은 당업계에서 통상적으로 이루어지는 생존분석을 실시하지 않더라도 난소암의 예후를 예측할 수 있으므로 불필요한 항암치료를 줄일 수 있는 예후 진단에 유용하게 이용할 수 있을 것이다.
한편, 난소암 환자의 생물학적 시료로부터 본 발명에 따라 선별된 예후 예측용 유전자들의 mRNA 존재 여부, 이들의 발현정도 또는 이들의 유전자에 의해 코딩되는 단백질의 발현 함량에 따라 난소암의 예후를 예측할 수 있으므로, 난소암의 예후 예측을 위한 마커 유전자로 사용될 수 있다.
본 발명에 있어서, 상기 예후 예측용 마커, 예후 예측을 위한 마커 또는 예후 예측 마커는 난소암 세포를 정상 세포와 구분하여 난소암 치료 후 재발 여부를 비롯한 예후를 예측할 수 있는 물질을 의미한다.
본 발명에 따른 방법은 최적화 함수를 통해 난소암 예후 예측을 위한 유전자를 정확하면서도 간단하게 선별할 수 있다. 아울러, 상기 방법으로 선별된 난소암 예후 예측 유전자들의 발현 데이터를 최적화 함수를 이용하여 고발현군과 저발현군으로 분류함으로써 난소암의 예후를 예측하여 불필요한 항암치료를 줄일 수 있는 예후 진단에 유용하게 이용될 수 있다.
도 1 및 도 2는 본 발명의 일 실시예에 따라 선별된 난소암의 OS(overall survival)와 연관된 6개의 유전자로서 발현이 증가하면서 예후 좋지 못한 유전자의 양봉분포 및 생존곡선을 측정한 결과이다.
도 3 및 도 4는 본 발명의 일 실시예에 따라 선별된 난소암의 OS(overall survival)와 연관된 6개의 유전자로서 발현이 감소하면서 예후 좋은 유전자의 양봉분포 및 생존곡선을 측정한 결과이다.
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다. 이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 요지에 따라 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 있어서 자명할 것이다.
실시예 1 : 난소암 환자의 mRNA 발현 데이터 세트 수집
난소암 환자의 mRNA 발현 데이터 세트를 공개 데이터베이스인 GEO(http://www.ncbi.nlm.nih.gov/geo)에서 수집하였다. 수집된 데이터 세트는 Affymetrix genechip human genome U133 array set HG-U133A 플랫폼(GPL96)을 기반으로 한 난소암 환자(451명) 데이터 세트와 Affymetrix genechip human genome U133 array set HG-U133 plus 2.0 플랫폼(GPL570)을 기반으로 한 난소암 환자(801명) 데이터 세트이다. 상기 두 개의 플랫폼은 생존정보가 생존여부(overall survival)에 대한 것이였다. 생존여부(overall survival)는 예후 결정에 있어 가장 결정적인 사건인 점, 암 고유의 특성에 의해 결정된다는 점 및 수집된 데이터에서 가장 많은 환자가 생존여부에 대한 정보를 가지고 있다는 점을 기반으로 생존여부(overall survival)를 기초로하여 생존분석을 수행하였다.
구체적으로, 공개 데이터베이스인 GEO로부터 수집한 데이터 세트의 원본파일(.CEL)을 다운받아 RMA(Robust Multi-array Average) 방법을 이용하여 표준화(normalize)시켰다. 표준화 시킨 데이터는 log2 로 변환하여 사용하였다.
실시예 2 : 양봉분포( bimodal distribution ) 및 통계학적 분석을 통한 난소암 예후 예측 관련 유전자 선별
본 발명자들은 양봉분포(bimodal distribution)를 나타내는 유전자의 경우 유전적 변화가 일어난 유전자가 될 확률이 높다는 가정 하에 하기 수학식 1에 나타낸 최적화 함수를 사용하여 양봉분포(biomodal distribution)를 나타내는 유전자를 선별하였다.
구체적으로, 상기 실시예 1에서 표준화시킨 데이터를 하기 수학식 1에 대입하여 양봉분포(biomodal distribution)를 나타내는 유전자를 선별하였다. 그 다음 상기 이봉분포는 두 개의 정규분포(normal distribution)가 교차하는 지점을 분철(cutoff)로 지정하고, 환자군을 고발현군(high expression)과 저발현군(low expression)으로 나누었다.
[수학식 1]
Figure pat00002
μ1, μ2 : means of the two normal distributions
σ1, σ2 : standard deviations of the two normal distributions
π : mixing parameter(percentage of the distribution)
φ : normal distribution function
y1 : expression level of ith sample
또한, 상기 정규분포(normal distribution) 양상을 나타내는 유전자들과 예후와의 관련성을 확인하기 위하여 유전자 발현 값의 증가에 따라 변동하는 위험도를 추정하여 단변량의 의미를 알아내는데 쓰이는 콕스 비례 위험 모델(Cox proportional hazards regression model)과 생존률에 유의한 차이가 없다는 귀무가설을 검정하는데 사용되는 로그 순위 검정(log-rank test)을 이용하여 생존분석을 실시하였다. 또한, 카플란-마이어 곡선(kaplan-meier curves)를 이용하여 생존률 그래프를 구하였다. 이를 토대로 난소암 예후 예측 유전자를 선별하였다. 그 결과를 도 1, 도 2, 도 3, 도 4 및 표 1에 나타내었다.
Up - regulated genes (발현이 증가하면서 예후가 좋지 않은 결과를 나타내는 유전자)
SRPX2 Sushi repeat-containing protein
HES1 hairy and enhancer of split-1
NELL2 Protein kinase C-binding protein
NRAS Neuroblastoma RAS viral (v-ras) oncogene homolog
PMEPA1 Transmembrane prostate androgen-induced protein
TGFB1I1 Transforming growth factor beta-1-induced transcript 1 protein
down-regulated genes(발현이 감소하면서 예후가 좋지 않은 결과를 나타내는 유전자)
FOXO1 Forkhead box protein O1
ID4 DNA-binding protein inhibitor
PAEP progestogen-associated endometrial protein
UBR5 Ubiquitin protein ligase E3 component n-recognin 5
SLC5A1 Solute carrier family 5 (sodium/glucose cotransporter), member 1
IFT74 Intraflagellar transport protein 74 homolog
실험결과, Affymetrix HG-U133A(GPL96)와 HG-U133 Plus 2.0(GPL570) 마이크로어레이 기반의 두개의 데이터 세트를 이용한 분석에서, 공통된 12개의 유전자, 즉 발현이 증가하면서 예후가 좋지 못한 6개 유전자(up-regulated genes; SRPX2, HES1, NELL2, NRAS, PMEPA1, TGFB1I1), 발현이 감소하면서 예후가 좋지 못한 6개 유전자(down-regulated genes; FOXO1, ID4, PAEP, UBR5, SLC5A1, IFT74)를 발견하였다.

Claims (4)

  1. 표준화된 난소암 환자군의 유전자 발현 데이터로부터 하기 수학식 1에 의해 환자를 고발현 군집과 저발현 군집으로 분류한 후, 생존분석(survival analysis)을 통하여 상기 분류된 두 환자 군집의 유전자 중 생존결과가 통계적 유의성을 나타내는 유전자를 재분류하는 단계를 포함하는 난소암 예후 예측용 유전자의 선별방법.
    [수학식 1]
    Figure pat00003

    여기서, μ1와 μ2는 두 집단의 정규분포의 평균(means of the two normal distributions)이고, σ1와 σ2 두 집단의 표준편차(standard deviations of the two normal distributions)이며, π는 mixing parameter(percentage of the distribution)로 전체 환자군 중에서 집단 1의 환자가 차지하는 비율을 말며, φ는 정규분포식(normal distribution function), yi i번째 환자의 유전자 발현 정도, n은 수집된 전체 환자수를 의미한다.
  2. 제1항에 있어서, 상기 고발현 군집에 속하며 생존결과가 통계적 유의성을 보이는 유전자는 SRPX2(Sushi repeat-containing protein), HES1(hairy and enhancer of split-1), NELL2(protein kinase C-binding protein), NRAS(neuroblastoma RAS viral (v-ras) oncogene homolog), PMEPA1(transmembrane prostate androgen-induced protein) 및 TGFB1I1(transforming growth factor beta-1-induced transcript 1 protein)로 이루어진 군으로부터 선택된 1개 또는 2개 이상의 유전자인 것을 특징으로 하는 난소암 예후 예측용 유전자의 선별방법.
  3. 제1항에 있어서, 상기 저발현 군집에 속하며 생존결과가 통계적 유의성을 보이는 유전자는 FOXO1(forkhead box protein O1), ID4(DNA-binding protein inhibitor), PAEP(progestogen-associated endometrial protein), UBR5(Ubiquitin protein ligase E3 component n-recognin 5), SLC5A1(Solute carrier family 5 (sodium/glucose cotransporter), member 1) 및 IFT74(Intraflagellar transport protein 74 homolog)로 이루어진 군으로부터 선택된 1개 또는 2개 이상의 유전자인 것을 특징으로 하는 난소암 예후 예측용 유전자의 선별방법.
  4. 난소암 환자의 생물학적 시료로부터 측정된 유전자 발현 데이터로부터 상기 수학식 1에 의해 고발현 군집과 저발현 군집으로 분류한 후, 상기 고발현 군집에 속하는 유전자가 상기 제2항의 유전자로 이루어진 군으로부터 선택된 1개 또는 2개 이상인 경우 난소암의 재발 가능성이 높고 생존 예후가 나쁜 환자로 판단하고, 상기 저발현 군집에 속하는 유전자가 상기 제3항의 유전자로 이루어진 군으로부터 선택된 1개 또는 2개 이상인 경우 유난소암의 재발 가능성이 낮고 생존 예후가 좋은 것으로 판단하는 단계를 포함하는 난소암 환자의 예후를 예측하는 방법.
KR1020170031404A 2017-03-13 2017-03-13 난소암의 예후 예측용 유전자 선별방법 KR20170032892A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170031404A KR20170032892A (ko) 2017-03-13 2017-03-13 난소암의 예후 예측용 유전자 선별방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170031404A KR20170032892A (ko) 2017-03-13 2017-03-13 난소암의 예후 예측용 유전자 선별방법

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020150003517A Division KR20160086496A (ko) 2015-01-09 2015-01-09 난소암의 예후 예측용 유전자 선별방법

Publications (1)

Publication Number Publication Date
KR20170032892A true KR20170032892A (ko) 2017-03-23

Family

ID=58496368

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170031404A KR20170032892A (ko) 2017-03-13 2017-03-13 난소암의 예후 예측용 유전자 선별방법

Country Status (1)

Country Link
KR (1) KR20170032892A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200065385A (ko) * 2018-11-30 2020-06-09 주식회사 쓰리빌리언 신규 표적 단백질과 그에 대한 동반진단 바이오마커 발굴 시스템 및 방법
WO2021107232A1 (ko) * 2019-11-29 2021-06-03 의료법인 성광의료재단 난소암 진단을 위한 바이오마커 패널을 구성하는 방법 및 난소암 진단을 위한 바이오마커 패널
CN117594243A (zh) * 2023-10-13 2024-02-23 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200065385A (ko) * 2018-11-30 2020-06-09 주식회사 쓰리빌리언 신규 표적 단백질과 그에 대한 동반진단 바이오마커 발굴 시스템 및 방법
EP3893242A4 (en) * 2018-11-30 2022-08-24 3Billion NOVEL TARGET PROTEIN AND COMPANION DIAGNOSTIC BIOMARKER DISCOVERY SYSTEM AND METHOD
WO2021107232A1 (ko) * 2019-11-29 2021-06-03 의료법인 성광의료재단 난소암 진단을 위한 바이오마커 패널을 구성하는 방법 및 난소암 진단을 위한 바이오마커 패널
CN117594243A (zh) * 2023-10-13 2024-02-23 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法
CN117594243B (zh) * 2023-10-13 2024-05-14 太原理工大学 基于跨模态视图关联发现网络的卵巢癌预后预测方法

Similar Documents

Publication Publication Date Title
JP5725274B2 (ja) 乳癌の予後の検査方法
JP5237076B2 (ja) 乳癌患者の診断および予後
US7901881B2 (en) Diagnostic tool for diagnosing benign versus malignant thyroid lesions
ES2962775T3 (es) Método para predecir el pronóstico de pacientes con cáncer de mama
ES2650610T3 (es) Perfiles de expresión génica para predecir desenlaces en cáncer de mama
CN103299188B (zh) 用于癌症的分子诊断试验
JP2019076096A (ja) 目的遺伝子発現の線形結合を用いた細胞信号伝達経路活性の評価
JP5089993B2 (ja) 乳癌の予後診断
AU2019277698A1 (en) Convolutional neural network systems and methods for data classification
US8183353B2 (en) Breast cancer prognostics
US20200219587A1 (en) Systems and methods for using fragment lengths as a predictor of cancer
KR20220133868A (ko) 패치 컨볼루션 신경망을 사용한 암 분류
US11929148B2 (en) Systems and methods for enriching for cancer-derived fragments using fragment size
WO2008070301A2 (en) Predicting lung cancer survival using gene expression
ES2963390T3 (es) Método para predecir la eficacia de la quimioterapia en pacientes con cáncer de mama
JP2004329211A (ja) 結腸直腸癌の予後
US20050186577A1 (en) Breast cancer prognostics
KR20170032892A (ko) 난소암의 예후 예측용 유전자 선별방법
WO2015154715A1 (en) A method of diagnosis, prognosis or treatment of a cancer
US20220042106A1 (en) Systems and methods of using cell-free nucleic acids to tailor cancer treatment
KR20160086145A (ko) 유방암의 예후 예측용 유전자 선별방법
JP2008538284A (ja) 乳房の腫瘍のレーザーマイクロダイセクションおよびマイクロアレイ解析が、エストロゲン受容体に関係する遺伝子および経路を明らかにする
KR20160086496A (ko) 난소암의 예후 예측용 유전자 선별방법
US20100112592A1 (en) Methods for identifying an increased likelihood of recurrence of breast cancer
CN113774135B (zh) 一组用于预测高级别浆液性卵巢癌预后的标志物及其应用

Legal Events

Date Code Title Description
A107 Divisional application of patent
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid