KR102186571B1 - 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법 - Google Patents

면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법 Download PDF

Info

Publication number
KR102186571B1
KR102186571B1 KR1020190028540A KR20190028540A KR102186571B1 KR 102186571 B1 KR102186571 B1 KR 102186571B1 KR 1020190028540 A KR1020190028540 A KR 1020190028540A KR 20190028540 A KR20190028540 A KR 20190028540A KR 102186571 B1 KR102186571 B1 KR 102186571B1
Authority
KR
South Korea
Prior art keywords
recurrence
differentially expressed
breast cancer
expressed genes
differential expression
Prior art date
Application number
KR1020190028540A
Other languages
English (en)
Other versions
KR20200109471A (ko
Inventor
공경엽
이희진
김영애
서정한
박성희
임경백
윤성민
Original Assignee
울산대학교 산학협력단
재단법인 아산사회복지재단
숭실대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산대학교 산학협력단, 재단법인 아산사회복지재단, 숭실대학교 산학협력단 filed Critical 울산대학교 산학협력단
Priority to KR1020190028540A priority Critical patent/KR102186571B1/ko
Publication of KR20200109471A publication Critical patent/KR20200109471A/ko
Application granted granted Critical
Publication of KR102186571B1 publication Critical patent/KR102186571B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6809Methods for determination or identification of nucleic acids involving differential detection
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Pathology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Oncology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Hospice & Palliative Care (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법에 대한 것이다.
본 발명에 따르면, 피검자인 유방암 환자로부터 생검 조직을 수집하는 단계, RNA 추출 키트를 사용하여 상기 생검 조직으로부터 복수의 차등적 발현 유전자 및 발현량 정보를 획득하는 단계, 그리고 상기 복수의 차등적 발현 유전자에 대한 발현량 정보를 기 학습된 면역유전자 차등발현 예측 모델에 적용하여 상기 피검자의 재발 가능성을 예측하는 단계를 포함한다.
이와 같이 본 발명에 따르면, 유방암 환자에 대한 재발 예측 방법은 유방암 내에 면역 관련 유전자 중에서 차등적으로 발현하는 유전자를 추출하고, 추출된 차등적 발현 유전자를 통해 샘플의 수가 적은 데이터로부터 재발을 예측할 수 있는 면역유전자 차등발현 예측 모델을 구축할 수 있다. 따라서, 적은 비용으로 높은 정확성을 통해 유방암 환자의 재발을 예측할 수 있다.

Description

면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법 {Relapse Prediction Method for patient with breast cancer Using immune response differential gene expression Model}
본 발명은 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법에 관한 것으로서, 더욱 상세하게는 유방암 내에 면역 관련 유전자 중에서 차등적으로 발현하는 유전자를 추출하여 면역유전자 차등발현 예측 모델을 구축하고, 구축된 면역유전자 차등발현 예측 모델을 이용하여 재발 발생 여부를 예측하는 재발 예측 방법에 관한 것이다.
삼중음성 유방암이란 전체 유방암의 15-25%를 차지하는 한 아형으로 에스트로겐 수용체, 프로게스테론 수용체, HER2 수용체 모두가 발현되지 않아 유방암의 대표적 표적치료제인 항호르몬제(tamoxifen)이나 트라스투주맙(trastuzumab)의 사용이 불가능하며 효과적인 표적치료제가 없어 다른 아형에 비해서 예후가 나쁘다.
그러나, 삼중음성 유방암 환자의 경우 선행항암화학요법을 시행하면 삼중음성 유방암이 아닌 환자들에 비해 유의하게 높은 완전 관해율(pathologic complete response, pCR)을 보인다.
여기서, 삼중음성 유방암 환자들의 항암제에 대한 반응성과 예후를 분석해보면, 수술 전에 선행항암화학요법을 받은 환자들 중에서 항암제에 대한 반응성이 좋으면 좋은 예후를 보이고, 항암제에 대해 반응성이 좋지 않으면 암의 진행이 급격히 이루어져 나쁜 예후를 보인다.
따라서 환자 개개인의 치료 반응을 최적화하고 항암치료로 인한 독성을 최소화하기 위한 개인 맞춤치료전략(personalized therapy) 수립이 절실하며 이를 위해서는 항암치료에 대한 종양의 반응을 예측할 수 있는 생체 표지자의 개발이 필요하다.
본 발명의 배경이 되는 기술은 대한민국 공개특허공보 제10-2018-0094497호(2018.03.23. 공개)에 개시되어 있다.
본 발명이 이루고자 하는 기술적 과제는, 유방암 내에 면역 관련 유전자 중에서 차등적으로 발현하는 유전자를 추출하여 면역유전자 차등발현 예측 모델을 구축하고, 구축된 면역유전자 차등발현 예측 모델을 이용하여 재발 발생 여부를 예측하는 재발 예측 방법을 제공하는데 목적이 있다.
이러한 기술적 과제를 이루기 위한 본 발명의 실시예에 따르면, 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법에 있어서, 피검자인 유방암 환자로부터 생검 조직을 수집하는 단계, RNA 추출 키트를 사용하여 상기 생검 조직으로부터 복수의 차등적 발현 유전자 및 발현량 정보를 획득하는 단계, 그리고 상기 복수의 차등적 발현 유전자에 대한 발현량 정보를 기 학습된 면역유전자 차등발현 예측 모델에 적용하여 상기 피검자의 재발 가능성을 예측하는 단계를 포함한다.
또한, 상기 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 단계를 더 포함하며, 상기 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 단계는, 선행항암화학요법을 받은 복수의 유방암 환자로부터 생검 조직을 수집하는 단계, RNA 추출키트를 이용하여 상기 생검 조직으로부터 유전자 정보를 획득하는 단계, 상기 복수의 유방암 환자를 재발이 발생된 환자 그룹과 재발이 발생하지 않은 환자 그룹으로 그룹핑하고, 각 그룹으로부터 획득한 유전자 정보를 이용하여, 상기 두 그룹 간의 차등적으로 발현되는 복수의 차등적 발현 유전자를 선택하는 단계, 상기 선택된 복수의 차등적 발현 유전자가 유방암 재발에 영향력을 주는 유전자인지 검증을 하는 단계, 그리고 상기 검증된 복수의 차등적 발현 유전자 및 발현량 정보를 랜덤 포레스트를 기반으로 학습하여 면역유전자 차등발현 예측 모델을 구축하는 단계를 포함할 수 있다.
상기 복수의 차등적 발현 유전자를 선택하는 단계는, 음이항(Negative binominal) 모형을 적용한 edgeR 방법을 이용하여 재발이 발생된 환자 그룹과 재발이 발생하지 않은 환자 그룹 사이에서 차등적으로 발현되는 복수의 차등적 발현 유전자를 선택할 수 있다.
상기 복수의 차등적 발현 유전자를 선택하는 단계는, 상기 생검 조직으로부터 획득한 유전자 정보를 상기 edgeR 방법에 적용하여 FDR 값이 0.05보다 낮은 유전자를 차등적 발현 유전자로 선택할 수 있다.
상기 검증을 하는 단계는, Cox모델에 상기 선택된 복수의 차등적 발현 유전자를 적용하여 생존에 대한 치료 효과를 추정하고, 추정된 결과에 따라 차등적 발현유전자가 유방암 재발에 미치는 영향력을 검증할 수 있다.
상기 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 단계는, 상기 복수의 차등적 발현 유전자 중에서 무작위로 n개 선택하여 테스트 셋을 생성하고, 생성된 테스트 셋을 이용하여 면역유전자 차등발현 예측 모델을 구축하여 학습시킬 수 있다.
상기 복수의 차등적 발현 유전자는, CCL5, CCL7, TNFSF13B, CSF2RB, CLEC4E, CCL8, SELE, EDNRB, IL17B, IL2RA, FCER1A, TGFBI 및 GZMB 중에서 적어도 하나를 포함할 수 있다.
상기 유방암 환자는, 삼중음성 유방암 환자를 포함할 수 있다.
이와 같이 본 발명에 따르면, 유방암 내에 포함된 면역 관련 유전자 중에서 재발을 예측하는 차등적 발현 유전자를 추출하고, 추출된 차등적 발현 유전자를 통해 샘플의 수가 적은 데이터로부터 재발을 예측할 수 있는 면역유전자 차등발현 예측 모델을 구축할 수 있다. 따라서, 적은 비용으로 높은 정확성을 통해 유방암 환자의 재발을 예측할 수 있다.
또한, 본 발명에 따르면, 유방암 환자의 예후와 치료반응 예측에 중요한 것으로 대두되고 있는 면역관련 인자를 분석하여 치료제 개발 기반을 마련할 수 있고, 치료제 개발로 인해 유방암의 진료 지침이 개선될 수 있다.
또한, 본 발명에 따르면, 유방암 환자의 치료 반응성 예측 모델 및 예후 예측 모델을 임상에 적용하여 사용할 수 있으며, 모델 개발에 사용된 분석 방법을 다른 암종에도 적용하여 면역 프로파일링 모델의 확장이 가능한 효과를 지닌다.
도 1은 본 발명의 실시예에 따른 재발 예측 장치를 개략적으로 도시한 도면이다.
도 2는 본 발명의 실시예에 따른 재발 예측을 위한 면역유전자 차등발현 예측 모델을 구축하는 방법을 개략적으로 도시한 순서도이다.
도 3은 도 2에 도시된 S230단계에서 선택된 차등적 발현 유전자를 나타내는 도면이다.
도 4는 도 2에 도시된 S230단계에서 선택된 13개의 차등적 발현 유전자에 대해 검증한 결과를 나타내는 도면이다.
도 5는 도 4에 도시된 검증 결과에 따른 생존곡선을 나타내는 그래프이다.
도 6은 도 2에 도시된 S240단계에서 구축된 면역유전자 차등발현 예측 모델의 유효성을 평가한 결과를 나타내는 그래프이다.
도 7은 본 발명의 실시예에 따른 면역유전자 차등발현 예측 모델을 통해 재발을 예측하는 방법을 개략적으로 도시한 순서도이다.
이하 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명하기로 한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다.
또한 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서, 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
이하에서는 도1을 이용하여 본 발명의 실시예에 따른 재발 예측 장치를 더욱 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 재발 예측 장치를 개략적으로 도시한 도면이다.
도 1에 도시된 바와 같이, 유방암 환자에 대한 재발 예측 장치(100)는 수집부(110), 유전자 선택부(120), 모델생성부(130) 및 예측부(140)을 포함한다.
먼저, 수집부(110)는 선행항암화학요법을 받은 복수의 삼중음성 유방암 환자로부터 생검 조직을 수집한다. 여기서, 수집부(110)는 삼중음성 유방암 환자에 한정하지 않고 모든 유방암 환자로부터 생검 조직을 수집한다. 그리고, 생검 조직은 FFPE(Formalin-fixed, paraffin-embedded) 형태로 제공된다.
유전자 선택부(120)는 수집된 생검 조직에 FFPE RNA 추출 키트를 사용하여 RNA를 추출한다. 다만, 추출 키트는 FFPE RNA 추출 키트에 한정하지 않고, 당업자에게 알려져 있는 키트를 사용할 수도 있다.
그리고, 유전자 선택부(120)는 추출된 RNA를 nCounter®Analysis System에 적용하여 유전자 발현 데이터를 획득한다. 그 다음 유전자 발현 데이터를 재발이 발생된 환자 그룹과 재발이 없는 환자 그룹으로 나뉘어 지면, 유전자 선택부(120)는 각 그룹 간 사이에 차등적으로 발현되는 복수의 차등적 발현 유전자를 선택한다.
모델생성부(130)는 선택된 복수의 차등적 발현 유전자를 이용하여 면역유전자 차등발현 예측 모델을 생성한다. 이때, 면역유전자 차등발현 예측 모델은 재발 확률을 예측하는 모델이다.
부연하자면, 모델생성부(130)는 복수의 차등적 발현 유전자 중에서 무작위로 n개 선택하여 조합한 복수의 데이터 셋을 생성한다. 그리고, 모델생성부(130)는 생성된 복수의 데이터 셋을 7:3의 비율로 나뉘어, 7에 해당되는 데이터셋은 학습용으로 사용하고, 3에 해당하는 데이터 셋은 테스트용으로 사용한다. 즉, 모델생성부(130)는 데이터 셋을 이용하여 학습 및 테스트를 거침으로써 재발을 예측하는 면역유전자 차등발현 예측 모델을 생성한다.
그리고, 예측부(140)는 피검자로부터 획득한 차등적 발현 유전자 정보를 기 학습된 면역유전자 차등발현 예측 모델에 적용하여 상기 피검자의 재발에 대한 확률을 예측한다.
이하에서는 도 2 내지 도 6을 이용하여 재발 예측 장치를 이용하여 면역유전자 차등발현 예측 모델을 구축하는 방법에 대해 더욱 상세하게 설명한다.
도 2는 본 발명의 실시예에 따른 재발 예측을 위한 면역유전자 차등발현 예측 모델을 구축하는 방법을 개략적으로 도시한 순서도이고, 도 3은 도2에 도시된 S230단계에서 선택된 차등적 발현 유전자를 나타내는 도면이다.
도 2에 도시된 바와 같이, 먼저 수집부(110)는 선행항함화학요법을 받은 유방암 환자로부터 분리된 생검 조직을 수집한다(S210).
부연하자면, 수집부(110)는 특정 기간 동안 선행항함화학요법을 받은 복수의 유방암 환자로부터 생검 조직을 획득하여 수집한다. 여기서, 복수의 환자는 재발이 발생된 환자와 재발이 없는 환자를 포함한다.
그 다음, 유전자 선택부(120)는 수집된 생검 조직으로부터 유전자 및 발현량에 대한 정보를 획득한다(S220).
상기 S220를 더욱 상세하게 설명하면, 유전자 선택부(120)는 재발이 발생된 환자 그룹과 재발이 없는 환자 그룹으로부터 각각 생검 조직을 획득하고, RNA 추출키트에 적용하여 생검 조직으로부터 RNA를 추출한다. 추출된 RNA는 그룹간의 상호 비교분석이 가능해지도록 정규화과정을 거친다.
즉, 유전자 선택부(120)는 추출된 RNA를 nCounter®Analysis System을 통해 분석한다. nCounter®Analysis System은 디지털 분석기가 RNA에 포함된 각 분자의 색을 포착 및 카운팅하여 유전자 및 발현량 정보를 획득한다.
그 다음, 유전자 선택부(120)는 획득한 유전자 및 발현량 정보를 음이항(Negative binominal) 모형을 적용한 edgeR 방법에 적용하여 재발이 발생된 환자 그룹과 재발이 없는 환자 그룹 사이에서 차등적으로 발현되는 복수의 차등적 발현 유전자를 선택한다(S230).
부연하자면, edgeR방볍을 통하여, 유방암에 대해 재발이 발생된 환자 그룹으로부터 분산을 추정한 후 분석하여 FDR(False Discovery Rate)값이 0.05보다 낮은 유전자를 추출한다.
즉, 도 3에 도시된 바와 같이, 유전자 선택부(120)는 재발이 발생된 환자 그룹과 재발이 없는 환자 그룹 사이에서 차등적으로 발현되는 13개의 차등적 발현 유전자를 선택한다.
13개의 차등적 발현 유전자는 하기의 표 1에 나타난 바와 같다.
Figure 112019025580992-pat00001
이하에서는 도 4 및 도 5를 이용하여 13개의 차등적 발현 유전자가 재발에 영향력을 주는 유전자인지를 검증한 결과를 설명하기로 한다.
도 4는 도 2에 도시된 S230단계에서 선택한 13개의 차등적 발현 유전자에 대해 검증한 결과를 나타내는 도면이고, 도 5는 도 4에 도시된 검증 결과에 따른 생존곡선을 나타내는 그래프이다.
도 4 에 도시된 바와 같이, Cox모델을 통하여 선택된 13개의 차등적 발현 유전자를 적용하여 생존에 대한 재발 예측 결과를 추정할 수 있다.
도 5는 재발이 발생된 환자 그룹과 재발이 발생되지 않은 환자 그룹 각각에 대하여 시간이 경과함에 따라서 변화하는 사망률을 생존곡선으로 나타낸 그래프이다. 여기서, 재발이 발생된 환자 그룹의 생존곡선과 재발이 발생되지 않은 환자 그룹 의 생존곡선이 서로 평행을 이루므로 13개의 차등적 발현 유전자의 선택이 합당함을 알 수 있다.
그 다음, 모델생성부(130)는 검증된 13개의 차등적 발현 유전자를 이용하여 면역유전자 차등발현 예측 모델을 구축하고 학습시킨다(S240).
모델생성부(130)는 13개의 차등적 발현 유전자 및 발현량 정보를 랜덤 포레스트를 기반으로 학습하여 면역유전자 차등발현 예측 모델을 구축한다. 즉, 모델생성부(130)는 13개의 차등적 발현 유전자 중에서 무작위로 n개의 차등적 발현 유전자를 선택하여 조합된 복수개의 데이터 셋을 생성한다. 복수개의 데이터셋은 7:3의 비율로 나뉜 다음, 70%에 해당하는 데이터셋은 학습 데이터로 사용하여 면역유전자 차등발현 예측 모델을 학습시킨다.
면역유전자 차등발현 예측 모델은 학습 데이터를 학습하면서 재발을 예측할 수 있는 확률의 오차 범위를 감소시킬 수 있으며, 동시에 정확한 예측이 가능한 레이어 개수를 결정한다.
그리고 모델생성부(130)는 결정된 레이어 개수를 이용하여 구축된 면역유전자 차등발현 예측 모델에 30%에 해당되는 데이터 셋을 입력 데이터로 사용하여 재발 예측이 가능한지 테스트할 수 있다.
이하에서는 도 6을 통하여 본 발명의 실시예에 따른 면역유전자 차등발현 예측 모델의 성능을 평가한 결과에 대하여 설명한다.
도 6은 도 2에 도시된 S240단계에서 구축된 면역유전자 차등발현 예측 모델의 유효성을 평가한 결과를 나타내는 그래프이다.
면역유전자 차등발현 예측 모델에서 발생할 수 있는 분산문제를 해결하기 위하여, 모델생성부(130)는 GridSearch와 5-fold 교차검증을 통하여 면역유전자 차등발현 예측 모델의 유효성을 검증한다.
5-fold 교차검증에 의하면 데이터는 5개의 세트로 나뉘고, 나뉘어진 데이터 중에서 1개의 세트는 훈련용으로 사용되고 나머지 4개의 세트는 테스트용으로 사용된다. 그 다음, 모델생성부(130)는 첫번째 폴드에서 다섯번째 폴드가 진행되는 과정까지 사용하여 얻은 결과의 평균값을 표준편차값으로 사용하여 분산을 제거한다.
도 6에 도시된 바와 같이, 본 발명의 실시예에 따른 면역유전자 차등발현 예측 모델은 AUC(area under the curve)값이 0.83로 높은 정확성을 보인다.
이하에서는 도 7을 이용하여 본 발명의 실시예에 따라 구축된 면역유전자 차등발현 예측 모델을 이용하여 유방암 환자의 재발 가능성을 예측하는 방법에 대하여 상세하게 설명한다.
도 7은 본 발명의 실시예에 따른 면역유전자 차등발현 예측 모델을 통해 재발을 예측하는 방법을 개략적으로 도시한 순서도이다.
도 7에 도시된 바와 같이, 먼저 수집부(110)는 피검자인 유방암 환자로부터 생검 조직을 수집한다(S710).
그리고, 생검 조직에 대한 정보는 유전자 선택부(120)에 전달된다. 유전자 선택부(120)는 RNA 추출 키트를 사용하여 전달받은 생검 조직으로부터 유전자 정보를 획득한다(S720).
그 다음 유전자 선택부(120)는 피검자의 유전자 중에서 13개의 차등적 발현 유전자와 매칭되는 유전자만을 선택한다(S730).
부연하자면, 유전자 선택부(120)는 피검자의 유전자 정보 중에서 9개의 차등적 발현 유전자를 선택한다. 그리고 유전자 선택부(120)는 nCounter®Analysis System을 통해 선택된 13개의 차등적 발현 유전자에 대한 발현량 정보를 추출한다.
그리고, 유전자 선택부(120)는 선택된 13개의 차등적 발현 유전자에 대한 발현량 정보를 예측부(140)에 전달한다.
그러면, 예측부(140)는 면역유전자 차등발현 예측 모델에 13개의 차등적 발현 유전자의 발현량 정보를 입력하여 유방암에 걸린 피검자에 대하여 재발 확률을 예측한다(S740).
이와 같이 본 발명의 실시예에 따른 유방암에 대한 재발 예측 방법은 유방암 내에 면역 관련 유전자 중에서 차등적으로 발현하는 유전자를 추출하고, 추출된 차등적 발현 유전자를 통해 샘플의 수가 적은 데이터로부터 재발을 예측할 수 있는 면역유전자 차등발현 예측 모델을 구축할 수 있다. 따라서, 적은 비용으로 높은 정확성을 통해 유방암 환자의 재발을 예측할 수 있다.
또한, 본 발명의 실시예에 따른 유방암에 대한 재발 예측 방법은 유방암의 예후와 치료반응 예측에 중요한 것으로 대두되고 있는 면역관련 인자를 분석하여 치료제 개발 기반을 마련할 수 있고, 치료제 개발로 인해 유방암의 진료 지침이 개선될 수 있다.
또한, 본 발명의 실시예에 따른 유방암 환자에 대한 재발 예측 방법은 유방암의 치료 반응성 예측 모델 및 예후 예측 모델을 임상에 적용하여 사용할 수 있으며, 모델 개발에 사용된 분석 방법을 다른 암종에도 적용하여 면역 프로파일링 모델의 확장이 가능한 효과를 지닌다.
본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명의 진정한 기술적 보호범위는 아래의 특허청구범위의 기술적 사상에 의하여 정해져야 할 것이다.
100 : 재발 예측 장치 110 : 수집부
120 : 유전자 선택부 130 : 모델생성부
140 : 예측부

Claims (8)

  1. 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법에 있어서,
    피검자인 유방암 환자로부터 분리된 생검 조직을 수집하는 단계,
    RNA 추출 키트를 사용하여 상기 수집된 생검 조직으로부터 복수의 차등적 발현 유전자 및 발현량 정보를 획득하는 단계,
    상기 복수의 차등적 발현 유전자에 대한 발현량 정보를 기 학습된 면역유전자 차등발현 예측 모델에 적용하여 상기 피검자의 재발 가능성을 예측하는 단계 , 그리고
    상기 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 단계를 포함하며,
    상기 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 단계는,
    선행항암화학요법을 받은 복수의 유방암 환자로부터 분리된 생검 조직을 수집하는 단계,
    RNA 추출키트를 이용하여 상기 생검 조직으로부터 유전자 정보를 획득하는 단계,
    상기 복수의 유방암 환자를 재발이 발생된 환자 그룹과 재발이 발생하지 않은 환자 그룹으로 그룹핑하고, 각 그룹으로부터 획득한 유전자 정보를 edgeR 방법에 적용하여 FDR 값이 0.05보다 낮은 유전자를 상기 두 그룹 간의 차등적으로 발현되는 차등적 발현 유전자로 선택하는 단계,
    상기 선택된 복수의 차등적 발현 유전자가 유방암 재발에 영향력을 주는 유전자인지 검증을 하는 단계, 그리고
    상기 검증된 복수의 차등적 발현 유전자 및 발현량 정보를 랜덤 포레스트를 기반으로 학습하여 면역유전자 차등발현 예측 모델을 구축하는 단계를 포함하며,
    상기 복수의 차등적 발현 유전자는,
    CCL5, CCL7, TNFSF13B, CSF2RB, CLEC4E, CCL8, SELE, EDNRB, IL17B, IL2RA, FCER1A, TGFBI 및 GZMB 중에서 적어도 하나를 포함하는 재발 예측 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 복수의 차등적 발현 유전자를 선택하는 단계는,
    음이항(Negative binominal) 모형을 적용한 edgeR 방법을 이용하여 재발이 발생된 환자 그룹과 재발이 발생하지 않은 환자 그룹 사이에서 차등적으로 발현되는 복수의 차등적 발현 유전자를 선택하는 재발 예측 방법.
  4. 삭제
  5. 제1항에 있어서,
    상기 검증을 하는 단계는,
    Cox모델에 상기 선택된 복수의 차등적 발현 유전자를 적용하여 생존에 대한 치료 효과를 추정하고, 추정된 결과에 따라 차등적 발현유전자가 유방암 재발에 미치는 영향력을 검증하는 재발 예측 방법.
  6. 제1항에 있어서,
    상기 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 단계는,
    상기 복수의 차등적 발현 유전자 중에서 무작위로 n개 선택하여 테스트 셋을 생성하고, 생성된 테스트 셋을 이용하여 면역유전자 차등발현 예측 모델을 구축하여 학습시키는 재발 예측 방법.
  7. 삭제
  8. 제1항에 있어서,
    상기 유방암 환자는,
    삼중음성 유방암 환자를 포함하는 재발 예측 방법.
KR1020190028540A 2019-03-13 2019-03-13 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법 KR102186571B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190028540A KR102186571B1 (ko) 2019-03-13 2019-03-13 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190028540A KR102186571B1 (ko) 2019-03-13 2019-03-13 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법

Publications (2)

Publication Number Publication Date
KR20200109471A KR20200109471A (ko) 2020-09-23
KR102186571B1 true KR102186571B1 (ko) 2020-12-03

Family

ID=72708830

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190028540A KR102186571B1 (ko) 2019-03-13 2019-03-13 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법

Country Status (1)

Country Link
KR (1) KR102186571B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102509550B1 (ko) * 2021-02-17 2023-03-10 가톨릭대학교 산학협력단 재발 예측 장치 및 방법
KR102507110B1 (ko) * 2022-02-15 2023-03-07 주식회사 네오젠티씨 주조직 적합성 복합체의 타입들을 분석하기 위한 방법 및 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006052218A1 (en) 2004-10-06 2006-05-18 Agency For Science, Technology And Research Methods, systems, and arrays based on correlating p53 status with gene expression profiles, for classification, prognosis, and diagnosis of cancers

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101751806B1 (ko) * 2014-12-17 2017-06-29 재단법인 아산사회복지재단 암 환자의 예후 및 항암제 감수성 예측용 마커 조성물
KR20160086145A (ko) * 2015-01-09 2016-07-19 순천대학교 산학협력단 유방암의 예후 예측용 유전자 선별방법
CN109154027A (zh) * 2016-04-15 2019-01-04 豪夫迈·罗氏有限公司 用于监测和治疗癌症的方法
KR20180051990A (ko) * 2016-11-09 2018-05-17 주식회사 피디젠 암 재발 및 전이 모니터링 방법 및 그 시스템

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006052218A1 (en) 2004-10-06 2006-05-18 Agency For Science, Technology And Research Methods, systems, and arrays based on correlating p53 status with gene expression profiles, for classification, prognosis, and diagnosis of cancers

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Hee Jin Lee., Breast Cancer Res. Treat., 151, p.619-627, 2015.*
Jhajaira M. Araujo et al., Scientific Report, 8, 4899, 2018.*
Wei Hu, J. Biomedical Science and Engineering, 3, p.59-64, 2010.*

Also Published As

Publication number Publication date
KR20200109471A (ko) 2020-09-23

Similar Documents

Publication Publication Date Title
Prat et al. Development and validation of the new HER2DX assay for predicting pathological response and survival outcome in early-stage HER2-positive breast cancer
Guiu et al. Molecular subclasses of breast cancer: how do we define them? The IMPAKT 2012 Working Group Statement
Reis-Filho et al. Gene expression profiling in breast cancer: classification, prognostication, and prediction
CN111564214B (zh) 一种基于7个特殊基因的乳腺癌预后评估模型的建立与验证方法
Wang et al. Identification of a six‐gene signature with prognostic value for patients with endometrial carcinoma
CN106661614A (zh) 确定癌症侵袭性、预后和治疗响应
KR102186571B1 (ko) 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 재발 예측 방법
CN113462776B (zh) m6A修饰相关联合基因组在预测肾透明细胞癌患者免疫治疗疗效中的应用
WO2014044853A1 (en) A new method for classification of liver samples and diagnosis of focal nodule dysplasia, hepatocellular adenoma, and hepatocellular carcinoma
Santos et al. Intrinsic cancer subtypes-next steps into personalized medicine
CN115410713A (zh) 一种基于免疫相关基因的肝细胞癌预后风险预测模型构建
Wang et al. The 3′ UTR signature defines a highly metastatic subgroup of triple-negative breast cancer
AU2020215312A1 (en) Method of predicting survival rates for cancer patients
CN111128385A (zh) 一种用于食管鳞癌的预后预警系统及其应用
CN111440869A (zh) 一种用于预测原发性乳腺癌发生风险的dna甲基化标记物及其筛选方法和应用
CN113066585A (zh) 一种基于免疫基因表达特征谱对ⅱ期结直肠癌患者预后进行高效快捷评估的方法
CN113782090A (zh) 铁死亡模型构建方法与应用
Plichta et al. A novel staging system for de novo metastatic breast cancer refines prognostic estimates
Wang et al. Establishing a three-miRNA signature as a prognostic model for colorectal cancer through bioinformatics analysis
Lim et al. Prediction of prognostic signatures in triple-negative breast cancer based on the differential expression analysis via NanoString nCounter immune panel
CN110760585A (zh) 前列腺癌生物标志物及其应用
US20230047712A1 (en) Methods of Treatments Based Upon Molecular Response to Treatment
KR102186570B1 (ko) 면역유전자 차등발현 예측 모델을 이용한 유방암 환자에 대한 완전 관해 예측 방법
Hou et al. Development and validation of a nomogram for individually predicting pathologic complete remission after preoperative chemotherapy in chinese breast cancer: a population-based study
Luo et al. Identification and validation of a potent multi-mirna signature for prediction of prognosis of osteosarcoma patients

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right