KR101941011B1 - 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법 - Google Patents

유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법 Download PDF

Info

Publication number
KR101941011B1
KR101941011B1 KR1020160129378A KR20160129378A KR101941011B1 KR 101941011 B1 KR101941011 B1 KR 101941011B1 KR 1020160129378 A KR1020160129378 A KR 1020160129378A KR 20160129378 A KR20160129378 A KR 20160129378A KR 101941011 B1 KR101941011 B1 KR 101941011B1
Authority
KR
South Korea
Prior art keywords
gene
group
expression
breast cancer
genes
Prior art date
Application number
KR1020160129378A
Other languages
English (en)
Other versions
KR20180038346A (ko
Inventor
남호정
조수복
Original Assignee
광주과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 광주과학기술원 filed Critical 광주과학기술원
Priority to KR1020160129378A priority Critical patent/KR101941011B1/ko
Priority to US15/726,999 priority patent/US20180100199A1/en
Publication of KR20180038346A publication Critical patent/KR20180038346A/ko
Application granted granted Critical
Publication of KR101941011B1 publication Critical patent/KR101941011B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/30Unsupervised data analysis
    • G06F19/20
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57415Specifically defined cancers of breast
    • G06F19/26
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/70Mechanisms involved in disease identification
    • G01N2800/7023(Hyper)proliferation
    • G01N2800/7028Cancer

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Organic Chemistry (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Urology & Nephrology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Hematology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Food Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)

Abstract

실시예는 유방암 환자의 예후 판단 방법 유방암이라 판단된 환자정보에서 환자군에 대한 암 조직에 대한 정보를 수집하는 단계, 환자군 각각의 유전자 발현 정보를 수집하는 단계, 환자군 각각의 유전자 발현을 기준으로 발현이 높은 그룹과 낮은 그룹에 대한 검정을 실시하여 유전자를 선별하는 단계, 선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계, 유전자에 대한 유전자 발현비를 이용하여 예후 판단 점수를 정의하는 단계, 상기 예후판단 점수를 통해 환자군의 유방암에 대한 예후를 도출하는 단계를 포함할 수 있다.

Description

유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법{Method for predicting prognosis of breast cancer by using gene expression data}
본 발명은 유방암 환자의 예후 판단 방법에 관한 것으로서, 보다 상세하게는 유방암 환자에게 발현되는 유전자를 통해 예후 판단 점수를 구하여 마커로 활용하기 위한 예후 판단 방법에 관한 것이다.
유방암은 전 세계적으로 여성 암의 발생 및 사망 1위를 차지하고 있으며, 우리나라에서 역시 유방암은 갑상선암에 이어 여성에게서 가장 많이 발생하는 종양이다. 일반적으로 유방암은 하나의 일관된 종양이 아닌 다양한 관점에서 분류되고 있다. 특히, 삼중음성유방암(Triple-Negative Breast Cancer) 환자는 임상에서 에스트로겐 수용체(estrogen receptor), 프로게스테론 수용체(progesterone receptor), 인간상피증식인자 수용체 2(human epidermal growth factor 2 receptor)가 종양세포에 존재하지 않는다는 것을 통해 분류될 수 있으며 유방암 환자의 대략 15~20%를 차지한다. 특정약물에 반응하는 표적이 존재하지 않기 때문에, 삼중음성 유방암은 통상적인 화학요법으로 치료되고 있으며, 또한 삼중음성유방암 환자는 조기 재발률이 높으며 발병 초기에 낮은 생존율을 보이고 있다. 따라서 삼중음성유방암과 같은 유방암에서 발견되는 다양한 병리적 특성들을 밝히는데 여러 연구들이 수행되고 있으며, 오믹스(Omics) 수준에서 보다 정확한 지도를 그리고 현실적 양상을 재현할 수 있는 실험 모델이 요구된다. 기존의 예후 분석 및 예측을 위한 연구는 특정 유전자의 성질을 파악함으로써 해당 유전자가 예후판단 유전자로 정의되거나, 특정 표현형(phenotype)을 갖는 환자 군과 그렇지 않은 환자 군과의 비교를 통하여 예후판단 유전자를 모색해 왔다. 예를 들면 전이가 일어난 그룹과 일어나지 않은 그룹, 유방암에서 삼중음성 환자와 아닌 환자, 이렇게 특정 군들 간의 비교를 벗어나 해당 생존기록을 토대로 모든 유전자에 통계적 검증을 통해 유의한 예후판단 유전자를 찾을 필요가 있다.
실시예는 유전자의 발현 정도를 사용하여 유방암 환자의 예후를 판단하기 위해 유전자의 발현 정도를 기반으로, 유방암의 예후에 영향을 미치는 유전자들을 선별하고 이를 통해 환자의 예후분석을 수행 할 수 있는 유방암 환자의 예후 판단 방법을 제공하는데 그 목적이 있다.
실시예는 유방암 환자의 예후 판단 방법에 관한 것으로 유방암이라 판단된 환자정보에서 환자군에 대한 암 조직에 대한 정보를 수집하는 단계; 환자군 각각의 유전자 발현 정보를 수집하는 단계; 환자군 각각의 유전자 발현을 기준으로 발현이 높은 그룹과 낮은 그룹에 대한 검정을 실시하여 유전자를 선별하는 단계; 선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계; 유전자에 대한 유전자 발현비를 이용하여 예후 판단 점수를 정의하는 단계; 및 상기 예후판단 점수를 통해 환자군의 유방암에 대한 예후를 도출하는 단계를 포함할 수 있다.
환자군 각각의 유전자 발현을 기준으로 발현이 높은 그룹과 낮은 군에 대한 검정을 실시하여 유전자를 선별하는 단계는, 로그 순위 검정(log-rank test)을 실시하여 통계적 유의성(p-value) 과 두 그룹의 생존관계를 나타내는 위험률(Hazard ratio)값을 구하고, 해당 유전자의 발현이 생존에 미치는 정도를 파악하는 것을 특징으로 한다.
각 유전자는 발현 정도에 따라 두개의 그룹으로 나눠지며, 발현정도가 상대적으로 높을 때 생존률이 낮은 그룹과, 발현정도가 상대적으로 낮을 때 생존률이 낮은 그룹으로 이루어지는 것을 특징으로 한다.
실시예는 선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계는, 두 그룹에 해당되는 유전자를 대상으로 최대 완전 그래프를 생성하여 피어슨 상관계수를 통해 유전자 그래프를 군집화하는 것을 특징으로 한다.
실시예는 발현이 높을수록 생존율이 안 좋은 그룹의 군집과 발현이 낮을수록 생존율이 안 좋은 그룹의 군집에 해당되는 유전자들 간에 피어슨 상관계수(유사도)를 구하여 상반되는 발현을 보이는 유전자를 찾는 것을 특징으로 한다.
실시예는 상기 예후 판단 점수는 생존률이 낮은 환자에서 발현이 높은 유전자 발현량의 평균값을 생존률이 낮은 환자에서 발현이 낮은 유전자 발현량의 평균값으로 나눠준 값으로 설정되는 것을 특징으로 한다.
실시예에서 상기 예후 판단 점수를 통해 환자군의 유방암에 대한 예후를 도출하는 단계는, 상기 예후 판단 점수가 상대적으로 높게 나타나는 경우 유방암에 대한 예후가 좋지 않다고 판단하는 과정을 포함할 수 있다.
본 발명의 실시예에 따르면, 유방암의 예후 예측을 위한 유전자 마커를 찾아내고, 이를 이용하여 예후 예측 점수를 고안함으로써, 향후 치료 약물 타켓 및 맞춤 치료에 필요한 정보를 제시할 수 있다.
도 1은 실시예에 따른 유전자 발현 데이터를 통한 유방암 환자 예후판단 방법에 대한 흐름도
도 2는 환자의 생존율에 영향을 미치는 유전자 선별과정을 나타낸 모식도
도 3은 로그 검정 순위에 의해 시간에 따른 환자의 생존율을 나타낸 그래프
도 4는 최대 완전 그래프를 통한 유전자 군집화를 나타낸 도면
도 5는 예후 판단 점수에 의한 환자의 생존율을 분석한 그래프
도 6은 유방암 환자 성질에 따른 예후 판단 점수 분포를 나타낸 도면
이하 첨부된 도면들을 참조하여 본 발명의 실시예들을 상세하게 설명하지만, 본 발명의 실시예에 의해 제한되거나 한정되는 것은 아니다. 본 발명을 설명함에 있어서, 공지된 기능 혹은 구성에 대해 구체적인 설명은 본 발명의 요지를 명료하게 하기 위해 생략될 수 있다.
도 1은 실시예에 따른 유전자 발현 데이터를 통한 유방암 환자 예후판단 방법에 대한 흐름도를 나타내고 있다.
도 1을 참조하면, 실시예의 유방암 환자 예후판단 방법은 암에 걸린 것을 알고 있는 환자정보에서 환자군에 대한 암 조직에 대한 정보를 수집하는 단계(S10), 환자군의 유전자 발현 정보를 수집하는 단계(S20), 환자군의 유전자 발현을 기준으로 발현이 높은 군과 낮은 군에 대한 로그 순위 검정, t-검정을 실시하여 유전자를 선별하는 단계(S30), 선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계(S40), 유전자에 대한 유전자 발현비를 이용하여 예후판단 점수를 정의하는 단계(S50) 및 상기 예후판단 점수를 통해 환자군의 유방암에 대한 예후를 도출하는 단계(S60)를 포함하여 수행될 수 있다. 이어서, 각 단계에서 특징에 대해서 설명한다.
실시예에 사용되는 유전자는 마이크로 어레이 또는 RNA-seq 등으로 측정될 수 있는 모든 유전자가 될 수 있다. 실시예는 우선 암에 걸린 것을 알고 있는 환자정보에서 환자군에 대한 암 조직에 대한 정보를 수집하는 단계(S10)와 환자군의 유전자 발현 정보를 수집하는 단계(S20)를 수행한다.
도 2는 환자의 생존율에 영향을 미치는 유전자 선별과정을 나타낸 모식도이다. 도 2를 참조하면, 유전자(Gene 1)에 대해 발현양 수준(GE level)에 따른 빈도(Frequency)를 나타낸 것이다.
환자군의 유전자 발현을 기준으로 발현이 높은 군과 낮은 군에 대한 로그 순위 테스트, t-test를 실시하여 유전자를 선별하는 S30 단계는 다음과 같다.
우선, 각각의 유전자마다 발현양의 크기순으로 환자를 나열한 후에 상위 환자 그룹과 하위 환자 그룹을 대상으로 로그-순위 검정(log-rank test) 및 t-검정을 수행한다. 로그 순위 검정은 두 샘플의 생존 분포를 비교하기 위한 가설적인 검증 방법으로, 데이터가 왜곡되거나 측정값이 부분적으로만 알려져 있는 경우에 적합한 비모수적(nonparametric) 검증방법이다. 실시예에서는 상위 25%, 하위 25%의 환자 그룹으로 정의하였으며 이 수준은 사용자 정의에 따라 적절한 변경이 가능하다.
도 3은 로그 순위 검정에 의해 시간에 따른 환자의 생존율을 나타낸 그래프이다. 도 3을 참조하면, 로그 순위 검정을 통해 도출되는 통계적 유의성(p-value) 과 두 그룹간의 생존관계를 나타내는 위험률값(Hazard ratio)을 통하여 해당 유전자의 발현이 생존에 미치는 정도를 측정하여 나타낸 그래프로 카플란-마이어 생존 곡선(Kaplan-Meier survival curve)을 나타낸다.
로그 순위 검정을 수행하면, 수행한 유전자 수만큼의 그 결과를 도출할 수 있으며, 예후 인자로서의 생존과 관련된 유전자를 찾기 위한 각 유전자의 로그-순위 검정 후의 유의성(p-value)을 계산할 수 있다. 실시예에서 p값은 10- 4이하가 되도록 컷오프하였다.
각 유전자는 발현 정도에 따라 두개의 그룹으로 나누어 질 수 있으며, 즉, 환자군의 유전자 발현을 기준으로, 발현정도가 상대적으로 높을 때(HE) 생존률이 낮은 그룹(high-expressed genes in poor survival)과, 발현 정도가 상대적으로 낮을 때(LE) 생존률이 낮은 그룹(low-expressed genes in poor survival)으로 나누어질 수 있다.
이어서, 선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계(S40)는 다음과 같다. 상술한 방법을 통하여 추출된 유전자들은 각각의 발현량에만 차이를 둔 것으로 전체 샘플에 대해 클러스터링 방법을 적용하면 유전자들의 발현정도의 유사도에 따라 군집하게 된다.
도 4는 최대 완전 그래프를 통한 유전자 군집화를 나타낸 도면이다.
도 4를 참조하면, 발현이 높았을 때 생존율이 낮아지는 유전자들을 대상으로 유전자 그래프를 구성한다. 그래프의 각 점은 유전자를 나타내고, 선은 유전자 발현 유사도에 따라 생성되며, 두 벡터간의 유사성을 판단할 수 있는 수학적 값을 사용한다. 여러 가지 상관계수가 사용될 수 있으며, 실시예에서는 피어슨 상관계수를 사용하여 유사도를 결정하였으며, 피어슨 상관계수는 다음과 같은 수학식으로 표현될 수 있다.
Figure 112016097033384-pat00001
여기서, rX,Y는 유전자 X와 Y의 피어슨 상관계수를 나타내고, μX는 X 유전자 발현양의 평균, μY는 Y 유전자 발현양의 평균, σX, σY는 각각 유전자 X, Y의 표준편차를 나타낸다. m은 전체 환자 샘플 수를 의미한다.
실시예는 상기 피어슨 상관계수 값을 통하여 구성된 유전자 그래프를 군집화하는데 이용한다. 우선, 최대 완전그래프 알고리즘(maximal clique algorithm)을 사용하여, 가장 큰 완전그래프를 찾고 여기에 속한 유전자들을 첫 번째 군집으로 정의한다.
찾아진 그래프의 모든 연결을 지우고, 다시 최대 완전그래프를 찾고 여기서 해당되는 유전자를 두 번째 군집으로 정의한다. 이러한 과정은 S30 단계에서 구해진 두 개의 유전자 그룹에 모두 적용되며, 유전자 발현이 높은 그룹과 낮은 그룹 모두에서 각각의 군집화된 유전자 집합들을 찾을 수 있다.
상술한 S40 단계에서와 같이 두 개의 유전자 그룹에서 각각 군집화를 이루게 되면, 상호 반대로 발현되는 유전자 집합을 군집간의 유전자들을 대상으로 찾아낼 수 있다.
발현이 높을수록 생존율이 안 좋은 그룹의 군집 A와 발현이 낮을수록 생존율이 안 좋은 그룹의 군집 A’유전자들 간에 피어슨 상관계수(유사도)를 구하게 되면 발현 패턴이 상반될수록 낮은 상관계수 값을 가지므로 이를 통해 상반되는 발현을 보이는 유전자를 찾을 수 있으며, 이는 예후분석에 사용되는 척도에 중요한 유전자들로써 사용할 수 있다.
실시예에서는 이 과정에서 최대 완전 이분 그래프 알고리즘(maximal bi-clique algorithm)을 사용하였다. 군집 A 와 A' 에 속한 유전자들 간에 그래프를 구성하고 각각의 연결선은 피어슨 상관계수 값으로 결정하고, 최대 완전 그래프를 찾으면 최종 예후 분석에 사용되는 유전자 집합을 찾을 수 있다.
상술한 과정을 거친 후에 유전자에 대한 유전자 발현비를 이용하여 예후판단 점수를 정의하는 단계(S50)는 다음과 같다.
S40 단계에서 최종 유전자가 선별되면, 유전자들은 발현이 높을수록 생존이 낮거나, 발현이 낮을수록 생존이 낮은 유전자들로 선별될 수 있다. 실시예에서는 예후 판단 점수(S)를 두 유전자 집합의 평균들의 비로 정의하였으며, 생존률이 낮은 환자에서 발현이 높은 유전자 발현량의 평균값(GEH)을 생존률이 낮은 환자에서 발현이 낮은 유전자 발현량의 평균값(GEL)으로 나눠준 값으로 나타내어 질 수 있다.
실시예는 상기 예후 판단 점수에 따라서, 환자군의 유방암에 대한 예후를 도출하는 단계(S60)를 수행할 수 있다.
도 5는 예후 판단 점수에 의한 환자의 생존율을 분석한 그래프이다.
도 5를 참조하면, S50 단계에서와 같이 정의된 예후 판단 점수가 다른 환자들의 예후 예측에도 적용이 가능한지 확인하기 위해 3개의 독립된 어레이 데이터를 사용하여 검증을 수행한 그래프이다. 사용된 데이터 셋은 GEO 데이터 베이스에서 가져온 것으로 (a)는 GSE25066, (b)는 GSE3494, (c) GSE2034 의 어레이 정보이다.
각각의 데이터에 대해서 환자들은 예후 판단 점수를 기준으로 두 그룹으로 나누고, 두 환자 그룹에 대해 카플란-마이어 생존 곡선(Kaplan-Meier survival curve)을 나타내었다.
도 5의 그래프들을 살펴보면, 예후 판단 점수가 높은 환자들에 비해 점수가 낮은 환자들의 예후가 좋게 나타남을 알 수 있고, (a)~(c) 모두 유의한 p값을 나타내고 있으므로 실시예에서 정의한 예후 판단 점수가 유방암의 예후 예측을 하는데 사용될 수 있음을 알 수 있다.
이러한 점수는 유방암환자들의 특정 성질에 따라 경향이 달라지는 것을 확인할 수 있는데 이는 기존에 예후가 좋지 않은 성격을 갖는 유방암 환자들에서 높은 것을 볼 수 있다. 도 6은 유방암 환자 성질에 따른 예후 판단 점수 분포를 나타낸 도면이다.
유방암은 분류 기준에 따라 여러 가지로 분류되며, 대표적으로 호르몬수용체 양성 유방암, HER-2 유전자 양성 유방암, 호르몬 수용체와 HER-2 유전자가 모두 음성인 삼중음성유방암(TNBC)으로 분류될 수 있고, PAM 50 분류 기준에 따라서는 HER2-enriched, Basal-like, Luminal A, Luminal B 로 구분 될 수도 있다. 이외에도, 환자 각각의 상태에 따라, 종양분화도(Tumor grade), TP53 유전자의 변이 상태 등도 분류기준에 포함되기도 한다.
도 6을 참조하면, (a)는 삼중음성유방암에 해당하는 유방암인 경우와 그렇지 않은 유방암인 경우의 예후 판단 점수를 나타낸 그래프이다. 삼중음성유방암에 해당하는 유방암인 경우에는 예후 판단 점수가 중앙값이 0.8에 분포하며, 그렇지 않은 경우에는 -2.2 근방에분포하는 것을 알 수 있다. 삼중음성유방암은 기존에 위험도가 높은 유방암으로 알려져 있으며, 실시예의 유방암 환자 예후 판단 방법으로 예후 판단 점수를 도출한 결과 다른 경우에 비해 높게 나타남을 알 수 있으므로 본 발명의 판단점수는 기존의 위험도가 높은 환자 군에 대한 위험도를 표현하고 있다고 판단할 수 있다.
(b)의 그래프와 같이, HER2-enriched, Basal-like 환자군 역시 다른 PAM 50 분류에 따른 환자군들에 비해 높음을 확인 할 수 있으며, (c)에서는 에스트로겐수용체 음성 환자와 TP53 유전자 변이 그룹이 환자에서 예후판단 점수가 높고, (d)에서는 암의 종양분화도가 높을수록(더 악성 일수록) 예후 판단 점수가 높게 나타남을 확인할 수 있다.
즉, 실시예의 예후 판단 점수를 통한 유방암의 예후 예측은 기존에 알려진 유방암에 대해서 높은 값을 가짐을 확인하였고, 상기 예후 판단 점수를 통해서 알려지지 않은 유전자를 판별할 수 있음을 알 수 있다.
실시예는 유방암에 의해 발현되는 유전자 발현량에 따른 유전자 마커를 찾아내고, 이를 이용하여 예후 예측 점수를 고안함으로써, 상기 예후 예측 점수를 통해 향후 치료 약물 타켓 및 맞춤 치료에 필요한 정보를 제시하는데 유리하게 적용이 가능하다.
이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 예를 들어, 본 발명의 실시예에 구체적으로 나타난 각 구성 요소는 변형하여 실시할 수 있는 것이다. 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (7)

  1. 유방암이라 판단된 환자정보에서 환자군에 대한 암 조직에 대한 정보를 수집하는 단계;
    환자군 각각의 유전자 발현 정보를 수집하는 단계;
    환자군 각각의 유전자 발현을 기준으로 발현이 높은 그룹과 낮은 그룹에 대한 검정을 실시하여 유전자를 선별하는 단계;
    선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계;
    군집화된 유전자 그룹을 대상으로 최대 완전 이분 그래프 알고리즘을 적용하여 최종 예후 분석에 사용되는 유전자 그룹을 찾는 단계;
    상기 최종 예후 분석에 사용되는 유전자 그룹의 유전자에 대한 유전자 발현비를 이용하여 예후 판단 점수를 정의하는 단계; 및
    상기 예후판단 점수를 통해 환자군의 유방암에 대한 예후를 도출하는 단계를 포함하고,
    상기 유전자를 선별하는 단계는, 유전자마다 발현양의 크기순으로 환자를 나열한 후에 상위 설정 비율에 해당하는 제1 그룹과 하위 설정 비율에 해당하는 제2 그룹을 대상으로 로그 순위 검정(log-rank test)을 실시하는 단계를 포함하고,
    선별된 유전자에 대한 발현 패턴 기준의 유전자를 군집화하는 단계는, 상기 제1 그룹과 제2 그룹에 각각에 대해 각 그룹에 해당되는 유전자를 대상으로 최대 완전 그래프를 찾아 해당 그래프에 속한 유전자들을 제1 군집으로 정의하고, 상기 제1 군집에서 사용된 그래프의 모든 연결을 지우고 다시 최대 완전 그래프를 찾는 과정을 반복하는 단계를 포함하고,
    상기 예후 판단 점수를 정의하는 단계는, 상기 제1 그룹에 대한 유전자 발현량의 평균값을 상기 제2 그룹에 대한 유전자 발현량의 평균값으로 나눈 값을 예후 판단 점수로 정의하는 단계를 포함하는,
    유방암 환자의 예후 판단 방법.
  2. 제 1항에 있어서,
    환자군의 유전자 발현을 기준으로 발현이 높은 그룹과 낮은 군에 대한 검정을 실시하여 유전자를 선별하는 단계는,
    로그 순위 검정(log-rank test)을 실시하여 통계적 유의성(p-value)와 두 그룹의 생존관계를 나타내는 위험률(Hazard ratio)값을 구하고, 해당 유전자의 발현이 생존에 미치는 정도를 파악하는 유방암 환자의 예후 판단 방법.
  3. 삭제
  4. 삭제
  5. 제 1항에 있어서,
    발현이 높을수록 생존율이 안 좋은 그룹의 군집과 발현이 낮을수록 생존율이 안 좋은 그룹의 군집에 해당되는 유전자들 간에 피어슨 상관계수(유사도)를 구하여 상반되는 발현을 보이는 유전자를 찾는 것을 특징으로 하는 유방암 환자의 예후 판단 방법.
  6. 삭제
  7. 삭제
KR1020160129378A 2016-10-06 2016-10-06 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법 KR101941011B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020160129378A KR101941011B1 (ko) 2016-10-06 2016-10-06 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법
US15/726,999 US20180100199A1 (en) 2016-10-06 2017-10-06 Method for determining prognosis of breast cancer patient by using gene expression data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160129378A KR101941011B1 (ko) 2016-10-06 2016-10-06 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법

Publications (2)

Publication Number Publication Date
KR20180038346A KR20180038346A (ko) 2018-04-16
KR101941011B1 true KR101941011B1 (ko) 2019-01-22

Family

ID=61829976

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160129378A KR101941011B1 (ko) 2016-10-06 2016-10-06 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법

Country Status (2)

Country Link
US (1) US20180100199A1 (ko)
KR (1) KR101941011B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101990430B1 (ko) * 2017-06-22 2019-06-18 한국과학기술원 암의 재발 예후 예측을 위한 바이오마커 발굴 시스템 및 방법
CN108363907B (zh) * 2018-05-09 2022-01-18 中国科学院昆明动物研究所 一种基于多基因表达特征谱的肺腺癌个性化预后评估方法
CN108733980B (zh) * 2018-05-09 2022-01-18 中国科学院昆明动物研究所 基于多基因表达特征谱胶质母细胞瘤个性化预后评估方法
KR102234904B1 (ko) * 2018-11-30 2021-04-01 주식회사 쓰리빌리언 신규 표적 단백질과 그에 대한 동반진단 바이오마커 발굴 시스템 및 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160086145A (ko) * 2015-01-09 2016-07-19 순천대학교 산학협력단 유방암의 예후 예측용 유전자 선별방법

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
B. Kaba 외 4인, "Clustering gene expression data using graph separators", LIMOS/RR-07-02, University Paris 7, 2007.05.11.*
Yun-Yong Park 외 9인, "Development and Validation of a Prognostic Gene-Expression Signature for Lung Adenocarcinoma", PLOS ONE, 7권, 9호, 2012.09.*

Also Published As

Publication number Publication date
US20180100199A1 (en) 2018-04-12
KR20180038346A (ko) 2018-04-16

Similar Documents

Publication Publication Date Title
KR101941011B1 (ko) 유전자 발현 데이터를 통한 유방암 환자 예후 판단 방법
CN102272764B (zh) 从基因库选择候选基因集合的方法和系统
Yu et al. Feature selection and molecular classification of cancer using genetic programming
CN106909806A (zh) 定点检测变异的方法和装置
CN113234829B (zh) 结肠癌预后评估基因集及其构建方法
CN110010195A (zh) 一种探测单核苷酸突变的方法及装置
CN116564409A (zh) 基于机器学习的转移性乳腺癌转录组测序数据识别方法
CN116312785A (zh) 乳腺癌诊断标志基因及其筛查方法
KR101990430B1 (ko) 암의 재발 예후 예측을 위한 바이오마커 발굴 시스템 및 방법
Men et al. A prognostic 11 genes expression model for ovarian cancer
KR102543757B1 (ko) 이종 플랫폼의 dna 메틸레이션 데이터를 이용한 암의 예후 예측용 바이오마커 발굴 방법 및 장치
KR102265529B1 (ko) 복합 유전 정보 네트워크 분석에 기반한 질병 위험도 진단 방법
CN110942808A (zh) 一种基于基因大数据的预后预测方法及预测系统
US20210142864A1 (en) Prognostic indicators of poor outcomes in pregnant metastatic breast cancer cohort
CN114822688A (zh) 基于原发性肝癌基因分类和肝癌组织能量代谢的预后分析方法
CN113178264A (zh) 一种深肌层浸润数据预测方法及系统
US20220292363A1 (en) Method for automatically determining disease type and electronic apparatus
CN109346181B (zh) 均衡临床混杂因素的放疗敏感性标志基因筛选方法
Firoozbakht et al. A new compact set of biomarkers for distinguishing among ten breast cancer subtypes
KR102462746B1 (ko) 암 환자의 유전자 네트워크 생성 및 예후 예측을 위한 유전자 쌍 발굴 방법과 시스템
CN112840402B (zh) 获得细胞内确定性事件的方法及电子设备
CN109754843A (zh) 一种探测基因组小片段插入缺失的方法及装置
CN112771618B (zh) 疾病治疗管理因素特征自动预测方法及电子设备
CN116206672A (zh) 构建癌症的分型模型的方法及其应用
WO2011124758A1 (en) A method, an arrangement and a computer program product for analysing a cancer tissue

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant