KR20200017140A - 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법 - Google Patents

빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법 Download PDF

Info

Publication number
KR20200017140A
KR20200017140A KR1020180092386A KR20180092386A KR20200017140A KR 20200017140 A KR20200017140 A KR 20200017140A KR 1020180092386 A KR1020180092386 A KR 1020180092386A KR 20180092386 A KR20180092386 A KR 20180092386A KR 20200017140 A KR20200017140 A KR 20200017140A
Authority
KR
South Korea
Prior art keywords
tumor
prediction
treatment
big data
variable
Prior art date
Application number
KR1020180092386A
Other languages
English (en)
Other versions
KR102159861B9 (ko
KR102159861B1 (ko
Inventor
김강모
김남국
Original Assignee
울산대학교 산학협력단
재단법인 아산사회복지재단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 울산대학교 산학협력단, 재단법인 아산사회복지재단 filed Critical 울산대학교 산학협력단
Priority to KR1020180092386A priority Critical patent/KR102159861B1/ko
Publication of KR20200017140A publication Critical patent/KR20200017140A/ko
Application granted granted Critical
Publication of KR102159861B1 publication Critical patent/KR102159861B1/ko
Publication of KR102159861B9 publication Critical patent/KR102159861B9/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H80/00ICT specially adapted for facilitating communication between medical practitioners or patients, e.g. for collaborative diagnosis, therapy or health monitoring

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법에 관한 것으로, 간암 임상 빅데이터를 저장하는 데이터베이스(10)와, 학습에 사용할 독립변수 및 종속변수를 지정하는 변수지정부(20)와, 상기 변수지정부(20)에서 지정한 독립변수로부터 종속변수에 이르는 다수의 의사결정 트리를 작성하여, 상기 데이터베이스(10)에 저장된 임상 빅데이터를 학습하고, 최종 의사결정 트리를 작성하는 학습처리부(30)와, 환자의 정보 및 종양 상태를 입력하는 입력부(40)와, 상기 입력부(40)를 통해 입력된 환자의 정보 및 종양 상태를 상기 학습처리부(30)의 학습결과를 토대로 작성된 최종 의사결정 트리를 이용하여 처리하여, 치료 방법을 결정함과 아울러 그 치료 방법으로 치료를 수행하였을 때 예후 예측 결과를 결정하는 예측 및 결정부(50)와, 결정된 치료 방법과 예후 예측 결과를 출력하는 출력부(60)를 포함한다.

Description

빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법{Prediction and treatment policy determination system and method for liver cancer using big data}
본 발명은 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법에 관한 것으로, 더욱 상세하게는 임상 빅데이터를 이용하여 환자 개인 마다 적합한 치료 방침을 결정하고, 예후를 예측할 수 있는 시스템 및 방법에 관한 것이다.
통상 간암은 기존에 만성 간염이나 간경변이 있는 상태에서 발생하는 경우가 대부분이고, 간암의 병기뿐 아니라, 치료 후 잔존 간기능이 예후에 지대한 영향을 미치기 때문에 치료법을 결정할 때, 치료 후 잔존 간기능에 대한 고려가 필요하다.
또한, 간암의 간 내 위치나, 간 기능, 치료법의 침습성, 환자의 사회경제적 상태 등의 요인들을 고려하는 치료방법을 결정해야 하지만, 이러한 결정방법은 매우 어렵기 때문에 현재의 간암의 치료법을 제시하고 있는 가이드라인들은 이러한 요소들을 반영하지 못하고 있는 실정이다. 그리고 기존의 전통적인 통계기법으로 이러한 많은 변수를 제대로 처리하는데 한계가 있다.
종래에 간암의 예후 예측을 위한 연구로 "Deep Learning-Based Multi-Omics Integration Robustly Predicts Survival in Liver Cancer. Kumardeep Chaudhary et al. October 5, 2017. Clinical Cancer Research"가 있다.
위의 연구에서는 환자들의 RNA 염기서열분석, 마이크로 RNA 염기분석 결과를 토대로 하는 딥러닝 모델을 제시하여, 다중 오믹스 분석을 통해 간암 환자의 생존을 예측한다.
하지만, 데이터의 획득 및 분석 과정이 매우 복잡하며, 환자 개인의 특성이나 간 기능 정보를 이용하여 치료의 종류를 제시하지 못한다는 단점이 있다.
본 발명이 해결하고자 하는 기술적 과제는, 일반적인 임상 환경에서 접근 가능한 다양한 인자들을 효과적으로 고려 및 조합하여 예후 예측이 가능하고, 치료법을 결정할 수 있는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법을 제공함에 있다.
좀 더 구체적으로, 본 발명이 해결하고자 하는 과제는 빅데이터 분석을 통하여 다양한 인자들 중 유의미한 특정 변수를 추출하여 개발함으로써 본 시스템을 일반적인 임상 환경에서 널리 사용 가능하게 함에 있다.
상기와 같은 과제를 해결하기 위한 본 발명의 일측면에 따른 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템은, 간암 임상 빅데이터를 저장하는 데이터베이스(10)와, 학습에 사용할 독립변수 및 종속변수를 지정하는 변수지정부(20)와, 상기 변수지정부(20)에서 지정한 독립변수로부터 종속변수에 이르는 다수의 의사결정 트리를 작성하여, 상기 데이터베이스(10)에 저장된 임상 빅데이터를 학습하고, 최종 의사결정 트리를 작성하는 학습처리부(30)와, 환자의 정보 및 종양 상태를 입력하는 입력부(40)와, 상기 입력부(40)를 통해 입력된 환자의 정보 및 종양 상태를 상기 학습처리부(30)의 학습결과를 토대로 작성된 최종 의사결정 트리를 기반으로 처리하여, 치료 방법을 결정함과 아울러 그 치료 방법으로 치료를 수행하였을 때 예후 예측 결과를 결정하는 예측 및 결정부(50)와, 결정된 치료 방법과 예후 예측 결과를 출력하는 출력부(60)를 포함한다.
본 발명의 일 실시예에 따르면, 상기 데이터베이스(10), 변수지정부(20) 및 학습처리부(30)는 클라우드 환경에 위치할 수 있으며, 입력부(40)의 정보를 기반으로 결정부(50)의 결과를 출력부(60)에서 가시화 할 수 있다.
본 발명의 일 실시예에 따르면, 상기 독립변수는 호스트 요인(Host factor)과 종양 요인(Tumor factor)이며, 종속변수는 초치료 종류와 예후 예측일 수 있다.
본 발명의 일 실시예에 따르면, 상기 호스트 요인은 성별(sex), 나이(age), 간기능(liver function), 다른 동반 질병(other comoribidity)을 포함하며, 상기 종양 요인은 종양 수(tumor number), 종양 크기(tumor size), 종양 위치(tumor location), 혈관 침범(Vascular invasion), 원격 전이(distant metastasis)를 포함할 수 있다.
본 발명의 일실시예에 따르면, 상기 예측 및 결정부(50)는, 데이터를 기반으로 상기 독립변수에 대한 가중치가 계산되어 초치료 종류와 예후 예측을 수행하며, 상기 종양 요인의 종양 수에 대한 가중치가 가장 높게 설정되고, 종양 크기를 그 다음의 가중치로 설정될 수 있다.
또한, 본 발명의 다른 측면에 따른 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 방법은, a) 변수지정부(20)로부터 독립변수와 종속변수를 입력받아, 학습처리부(30)에서 독립변수로부터 종속변수에 이르는 다수의 의사결정 트리를 작성하고, 데이터베이스(10)에 저장된 간암 임상 빅데이터를 각 의사결정 트리를 통해 학습한 후, 최종 의사결정 트리를 작성하는 단계와, b) 예측 및 결정부(50)에서 입력부(40)를 통해 입력된 환자의 정보 및 종양 상태를, 상기 학습된 의사결정 트리를 통해 의사결정하는 단계와, c) 상기 입력부(40)에 대한 사용자의 입력과 상기 예측 및 결정부(50)의 의사결정 결과인 치료법 및 예후 예측결과를 출력부(60)를 통해 출력하는 단계를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 상기 a) 단계 및 b) 단계는 클라우드 환경에서 처리되고, c) 단계는 로컬 환경에서 처리될 수 있다.
본 발명의 일 실시예에 따르면, 상기 독립변수는 호스트 요인(Host factor)과 종양 요인(Tumor factor)이며, 종속변수는 초치료 종류와 예후 예측일 수 있다.
본 발명의 일 실시예에 따르면, 상기 호스트 요인은 성별(sex), 나이(age), 간기능(liver function), 다른 동반 질병(other comoribidity)을 포함하며, 상기 종양 요인은 종양 수(tumor number), 종양 크기(tumor size), 종양 위치(tumor location), 혈관 침범(Vascular invasion), 전이(distant metastasis)를 포함할 수 있다.
본 발명의 일 실시예에 따르면, 상기 b) 단계는, 상기 독립변수에 가중치를 두어 치료법의 결정과 예후 예측을 수행하며, 상기 종양 요인의 종양 수에 대한 가중치를 가장 높게 설정하며, 종양 크기를 그 다음의 가중치로 설정할 수 있다.
본 발명은 기존의 임상 빅데이터를 기반으로 랜덤 포레스트(Random Forest) 기법을 이용한 학습을 통해 의사결정 트리들을 학습하고, 환자의 정보 및 종양의 특징에 따른 치료 방법을 결정하고, 예후를 예측할 수 있어 임상 전문가의 경험과 무관하게 정확한 치료 결정 및 예측을 할 수 있는 효과가 있다.
나아가 본 발명은 임상 데이터가 축적됨에 따라 학습 모델의 정확도를 향상시킬 수 있으며, 새로운 치료법의 도입 시 검증과 임상 데이터의 공유가 가능하여 간암의 치료와 예후 예측의 신뢰성을 높일 수 있는 효과가 있다.
도 1은 본 발명의 바람직한 실시예에 따른 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 구성도이다.
도 2는 본 발명에서 사용하는 변수를 지정한 표이다.
도 3은 본 발명의 학습처리부에서 생성하는 의사결정 트리들의 예시도이다.
도 4는 독립변수의 성분마다 설정한 가중치의 예시도이다.
도 5는 최종 의사결정 트리의 예시도이다.
도 6은 상기 제1분류기의 혼동 행렬(confusion matrix)의 예시도이다.
도 7은 본 발명을 이용하여 분석한 경우, 예측과 실제 데이터를 비교한 그래프이다.
도 8은 예후 예측 그래프의 예시도이다.
이하, 본 발명 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법에 대하여 첨부한 도면을 참조하여 상세히 설명한다.
본 발명의 실시 예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위해 제공되는 것이며, 아래에 설명되는 실시 예들은 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 아래의 실시 예들로 한정되는 것은 아니다. 오히려, 이들 실시 예는 본 발명을 더욱 충실하고 완전하게 하며 당업자에게 본 발명의 사상을 완전하게 전달하기 위하여 제공되는 것이다.
본 명세서에서 사용된 용어는 특정 실시 예를 설명하기 위하여 사용되며, 본 발명을 제한하기 위한 것이 아니다. 본 명세서에서 사용된 바와 같이 단수 형태는 문맥상 다른 경우를 분명히 지적하는 것이 아니라면, 복수의 형태를 포함할 수 있다. 또한, 본 명세서에서 사용되는 경우 "포함한다(comprise)" 및/또는"포함하는(comprising)"은 언급한 형상들, 숫자, 단계, 동작, 부재, 요소 및/또는 이들 그룹의 존재를 특정하는 것이며, 하나 이상의 다른 형상, 숫자, 동작, 부재, 요소 및/또는 그룹들의 존재 또는 부가를 배제하는 것이 아니다. 본 명세서에서 사용된 바와 같이, 용어 "및/또는"은 해당 열거된 항목 중 어느 하나 및 하나 이상의 모든 조합을 포함한다. 
본 명세서에서 제1, 제2 등의 용어가 다양한 부재, 영역 및/또는 부위들을 설명하기 위하여 사용되지만, 이들 부재, 부품, 영역, 층들 및/또는 부위들은 이들 용어에 의해 한정되지 않음은 자명하다. 이들 용어는 특정 순서나 상하, 또는 우열을 의미하지 않으며, 하나의 부재, 영역 또는 부위를 다른 부재, 영역 또는 부위와 구별하기 위하여만 사용된다. 따라서, 이하 상술할 제1 부재, 영역 또는 부위는 본 발명의 가르침으로부터 벗어나지 않고서도 제2 부재, 영역 또는 부위를 지칭할 수 있다.
이하, 본 발명의 실시 예들은 본 발명의 실시 예들을 개략적으로 도시하는 도면들을 참조하여 설명한다. 도면들에 있어서, 예를 들면, 제조 기술 및/또는 공차에 따라, 도시된 형상의 변형들이 예상될 수 있다. 따라서, 본 발명의 실시 예는 본 명세서에 도시된 영역의 특정 형상에 제한된 것으로 해석되어서는 아니 되며, 예를 들면 제조상 초래되는 형상의 변화를 포함하여야 한다.
도 1은 본 발명의 바람직한 실시예에 따른 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 구성도이다.
도 1을 참조하면 본 발명의 바람직한 실시예에 따른 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템은, 간암 임상 빅데이터를 저장하는 데이터베이스(10)와, 학습에 사용할 변수를 지정하는 변수지정부(20)와, 상기 변수지정부(20)에서 지정한 변수에 맞춰 상기 데이터베이스(10)에 저장된 임상 빅데이터를 학습하는 학습처리부(30)와, 환자의 정보 및 종양 상태를 입력하는 입력부(40)와, 상기 입력부(40)를 통해 입력된 환자의 정보 및 종양 상태를 상기 학습처리부(30)의 학습결과를 토대로 작성된 의사결정 트리를 이용하여 처리하여, 치료 방법을 결정함과 아울러 그 치료 방법으로 치료를 수행하였을 때 예후 예측 결과를 결정하는 예측 및 결정부(50)와, 결정된 치료 방법과 예후 예측 결과를 출력하는 출력부(60)를 포함하여 구성된다.
이하, 상기와 같이 구성되는 본 발명의 바람직한 실시예에 따른 빅데이터를 이용한 간암 예후 예측과 치료법 결정 시스템의 구성과 작용에 대하여 더 상세히 설명한다.
먼저, 데이터베이스(10)는 간암 임상데이터들을 저장한다. 간암 임상데이터는 간암 환자들의 정보와 종양 정보, 치료방법, 예후를 포함한다. 이때 데이터베이스(10)에 저장되는 간암 환자들의 정보는 연령과 성별, 간기능, 다른 동반 질병이며, 종양 정보는 크기, 위치, 혈관 침범, 원격 전이를 포함한다.
상기 데이터베이스(10)는 로컬 데이터베이스를 사용할 수 있으나, 더 많은 임상 데이터를 효율적으로 활용 및 축적하기 위하여 클라우드 데이터베이스를 사용할 수 있다.
상기 데이터베이스(10)에 저장되는 임상 데이터는 하나의 병원에서 간암 환자를 진단하고 치료 및 예후를 관찰한 데이터일 수 있으나, 더 많은 임상 데이터의 확보를 위하여 간암을 진단, 치료하고, 예후를 관찰하는 모든 병원의 임상 데이터가 되는 것이 바람직하다.
이와 같은 임상 데이터의 공유를 통해 기계학습을 수행하는 학습처리부(30)는 보다 심도 있는 학습이 가능하며, 다양한 임상 데이터를 활용하여 과적합 및 예외적인 처리 불능의 경우가 발생하는 것을 방지할 수 있다.
상기 학습처리부(30)는 저장수단과 학습프로세스를 처리할 수 있는 제어수단을 포함하는 것으로 하며, 퍼스널 컴퓨터 등을 사용할 수 있다.
상기 학습처리부(30)는 랜덤 포레스트(Random Forest) 기법을 사용하여 임상 데이터를 학습하고, 다양한 의사결정 트리를 형성할 수 있다.
상기 변수지정부(20)에서 제공되는 변수는 기계학습을 통해 선택 또는 재표현 등으로 가변이 가능하나, 본 발명에서는 독립변수(입력변수)와 종속변수(출력변수)를 구체적으로 지정하여 독립변수들과 종속변수의 관계를 분류 및 예측할 수 있도록 하여, 과적합을 피할 수 있다.
상기 학습처리부(30)는 로컬 환경에서 학습된 후 독립적인 소프트웨어 형태로 배포됨으로써 로컬 환경에서 각각의 예측 및 결정부(50)의 결과를 출력할 수 있다.
그러나 조건의 통일성과 본 발명을 이용하여 새롭게 결정된 치료법과 예측된 예후를 포함하는 임상 데이터를 다시 데이터베이스(10)에 제공하여 저장할 때의 일관성 및 신뢰성을 확보하는 동시에 학습처리부(30)를 지속적으로 업데이트 함으로써 기계학습 모델을 더욱 강건하게 하기 위하여 클라우드 서버로 구현되는 것이 바람직하다.
도 2는 본 발명에서 사용하는 변수를 도시한 표이다.
도 2를 참조하면, 상기 변수지정부(20)는 독립변수로서 호스트 요인(Host factor)과 종양 요인(Tumor factor)를 제공하며, 종속변수로 초치료 종류와 예후 예측을 포함한다.
상기 호스트 요인은 성별(sex), 나이(age), 간기능(liver function), 다른 동반 질병(other comoribidity)을 포함할 수 있으며, 종양 요인은 종양 수(tumor number), 종양 크기(tumor size), 종양 위치(tumor location), 혈관 침범(Vascular invasion), 원격 전이(distant metastasis)를 포함할 수 있다.
도 3은 상기 학습처리부(30)에서 생성하는 의사결정 트리들의 예시도이다.
도 3을 참조하면, 상기 학습처리부(30)는 앞서 설명한 독립변수들 각각에 대하여 종속변수를 선택하는 의사결정 트리들을 형성한다.
이때 분류는 각 독립변수들 마다 다른 분류기준에 의해 분류된다.
예를 들어 독립변수인 환자의 나이는 10대, 20대, 30대 등 10년을 기준으로 나눌 수도 있으며, 5년 단위 또는 1년 단위 아니면 원령단위로도 나눌 수 있으며, 이러한 분류에 의해 해당 나이에 대한 종속변수를 학습한다.
상기 데이터베이스(10)에 저장된 임상 빅데이터들 중 50대 간암 환자의 종속변수, 즉 초치료 종류와 예후를 각각 확인하여 가장 많은 초치료 종류와 예후를 학습할 수 있다.
종속변수인 초치료 종류는 간 이식(Liver transplantation), 간 절제(Hepatic resection), 고주파술 (RFA, radiofrequency ablation) 또는 알코올 삽입술(ethanol injection), 간동맥색전술(화학, 방사선)(TACE, DEB-TACE, TARE), 소라페니브(Sorafenib), 치료안함, 기타(Palliative RT, SBRT, combined treatment etc)로 나뉠 수 있으며, 새로운 치료법의 개발에 따라 추가될 수 있다.
위의 처리에 대한 예후는 완치, 재발, 사망을 포함할 수 있으며, 따라서 본 발명은 처리 결과로서 재발률, 생존율, 생존기간 등의 정보를 제공할 수 있다.
학습처리부(30)는 독립변수들 마다 결정된 종속변수들 및 예후를 학습하는 과정을 처리하고, 이와 같은 학습은 하나의 독립변수에 대한 의사결정 트리마다 이루어진다. 완전한 학습이 완료된 후, 하나의 최종 의사결정 트리로 결합된다.
상기 학습처리부(30)에서 완성된 최종 의사결정 트리는 예측 및 결정부(50)에 전달되며, 입력부(40)를 통해 입력되는 정보를 상기 최종 의사결정 트리를 이용하여 예측 및 결정하게 된다.
상기 예측 및 결정부(50)는 일체의 하드웨어 구성을 가질 수도 있으나, 예측 및 결정부(50)는 학습처리부(30)와 함께 클라우드로 구성되는 것이 바람직하다. 예측 및 결정부(50)는 저장수단, 표시수단 및 제어수단을 포함하는 통상의 퍼스널 컴퓨터일 수 있다.
상기 입력부(40)는 마우스, 키보드 등을 포함하는 입력수단일 수 있으며, 환자의 임상 데이터를 저장하는 저장장치 또는 퍼스널 컴퓨터일 수 있다.
상기 입력부(40)를 통해 예측 및 결정부(50)로 입력되는 정보는, 환자의 성별, 나이, 간기능, 다른 동반 질병을 포함한다. 또한, 종양 요인으로서 종양 수, 종양 크기, 종양 위치, 혈관 침범, 원격 전이를 포함한다.
상기와 같이 입력부(40)를 통해 입력된 환자의 정보 및 종양 요인들은 예측 및 결정부(50)에 저장된 최종 의사결정 트리의 정보들과 비교되어 적합한 치료방법과 그 치료방법으로 치료하였을 때의 예후 예측 결과를 상기 출력부(60)를 통해 출력한다.
상기 출력부(60)는 디스플레이 장치 또는 인쇄장치일 수 있다.
상기 출력부(60)는 상기 입력부(40)를 통해 입력된 환자 정보, 종양 요인과 함께 적합한 치료법 및 예후 예측 결과를 상기 데이터베이스(10)에 저장하여 이후 실제 임상결과와 비교할 수 있도록 한다.
이처럼 본 발명은 과거의 임상데이터를 이용하여 환자의 특성과 종양 요인에 부합하는 치료법을 제시하고, 제시한 치료법에 따라 치료를 하였을 때의 예후를 예측할 수 있다.
이때, 과거의 임상데이터들은 최근에 소개된 치료방법을 포함하지 않을 수 있으며, 이를 보완하기 위하여 가중치를 설정하여 신뢰성이 높은 치료방법을 제안할 수 있다.
상기 가중치는 종양 요인, 환자 정보 등 독립변수와 함께 종속변수인 치료법 및 예후 예측 모두에 설정할 수 있다. 위의 독립변수의 가중치는 이전의 임상 데이터에 적용할 때 각 독립변수의 중요도를 판단하는 기준이 되며, 종속변수인 치료법에 대한 가중치는 최종 의사결정 트리에서 의사결정을 하는 분류기의 분류기준으로 적용할 수 있다.
도 4는 독립변수의 성분마다 설정한 가중치의 예시도이다.
상기 가중치는 상대적인 개념으로 단위가 없는 상수이다.
간암의 치료와 예후 예측에서 가장 중요하게 판단되는 종양 수(tumor_number)의 가중치를 가장 크게하며, 종양의 최대 크기(max_tumor size)를 그 다음으로 하며, 환자의 혈소판 수치(PLT)와 알파태아단백(AFP) 및 분포(distribution)를 그 다음으로, 알부민(alb), 체질량지수(BMI), 나이(age), 알라닌아미노전이효소(ALT), 프로트롬빈시간(PT INR)을 그 다음으로 큰 가중치를 부여한다.
그 다음은 기재 순서에 따라 가중치가 점차 줄어드는 것으로, 혈색소(Hb), 총 빌리루빈(TB), 잔여 간기능(Child), 원격 전이(meta), 신장 기능 (Cr, creatinine), 간문맥 전이 위치(Pvi-loca), 수행능력(ECOG), RFA 가능성(RFA_feasibility), 정맥류(varix), 복수(ascites) 등일 수 있으며, 이러한 가중치의 요소들은 변경 또는 추가가 가능하다.
도 4에서는 독립변수들의 가중치의 예를 보인 것이며, 종속변수인 치료법에도 가중치를 부여할 수 있으며, 이때의 가중치는 분류기의 분류 기준에 의해 적용될 수 있다.
도 5는 최종 의사결정 트리의 예시도이다.
이에 도시한 바와 같이 최종 의사결정 트리는 입력된 환자 정보를 학습된 기준을 통해 분류하여, 치료법과 예후 예측을 추천하도록 구성된다.
이때 트리의 각 단계에서는 학습 결과에 따라 의사를 결정하도록 하는 뷴류기들(classifier)이 사용된다.
먼저, 제1분류기(classifier1)는 치료법 중 에탄올 주입술 또는 수술법(op)과 그 외의 치료법(etc.)을 구분한다. 이때 우선순위는 에탄올 주입술 또는 수술법(op)으로 한다.
제1분류기(classifier1)에 의한 의사결정으로 에탄올 주입술 또는 수술법(op)이 선택된 경우 제2분류기(classifier2)에 의해 다시 에탄올 주입술을 선택하거나 수술법(op)을 선택하도록 한다.
이처럼 치료법인 에탄올 주입술 또는 수술법(op)이 선택된 경우 각각의 치료법으로 치료하였을 때 예후 예측인 생존 기간을 함께 표시할 수 있다.
상기 제1분류기(classifier1)에 의해 에탄올 주입술 또는 수술법(op)이 선택되지 않고, 그 외의 치료법(etc.)이 선택된 경우 제3분류기(classifier3)에 의해 간동맥색전술(TACE) 또는 그 외의 치료법(etc.)을 선택할 수 있다. 간동맥색전술(TACE)이 선택된 경우 그에 따른 생존 기간 예측 결과를 함께 출력한다.
상기 제3분류기(classifier3)에 의해 간동맥색전술(TACE)이 선택되지 않은 경우, 다시 제4분류기(classifier4)를 통해 간동맥색전술(TACE) 및 완화 방사선치료(RT)의 병행을 선택하거나 그 외의 치료법(etc.)을 선택하도록 할 수 있다.
도 6은 상기 제1분류기의 혼동 행렬(confusion matrix)의 예시도로서, 예측 레이블(Predicted label)과 실제 레이블(True label)을 통해 학습 결과에 따른 결정의 정확도를 확인할 수 있다.
도 7은 본 발명을 이용하여 치료법을 선택한 경우, 별도의 생존위험모형의 예측 결과와 실제 데이터를 비교한 그래프이다.
도 7에는 55세, 남성, 체질량지수(BMI) 23, 수행능력(ECOG) 0, 최대 종양 크기(Mximal tumor size) 4.1cm, 종양 수(Tumor number) 1개, 잔여간기능(Child) class 5, 정맥류(Varix) 0, 복수(ascites) 0, 혈소판 수치(PLT) 154K, 프로트롬빈시간PT(INR) 1.02, 알부민(alb) 4.3, 알파태아단백(AFP 128)의 예측 데이터와 실제 데이터를 도시하였으며, 이때 예측 및 결정부(50)의 치료법 제안은 수술(op)이었으며, 예후는 도 8에 도시한 바와 같이 8년 이상 생존이었다.
본 발명은 상기 실시예에 한정되지 않고 본 발명의 기술적 요지를 벗어나지 아니하는 범위 내에서 다양하게 수정, 변형되어 실시될 수 있음은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어서 자명한 것이다.
10:데이터베이스 20:변수지정부
30:학습처리부 40:입력부
50:예측 및 결정부 60:출력부

Claims (10)

  1. 간암 임상 빅데이터를 저장하는 데이터베이스(10);
    학습에 사용할 독립변수 및 종속변수를 지정하는 변수지정부(20);
    상기 변수지정부(20)에서 지정한 독립변수로부터 종속변수에 이르는 다수의 의사결정 트리를 작성하여, 상기 데이터베이스(10)에 저장된 임상 빅데이터를 학습하고, 최종 의사결정 트리를 작성하는 학습처리부(30);
    환자의 정보 및 종양 상태를 입력하는 입력부(40);
    상기 입력부(40)를 통해 입력된 환자의 정보 및 종양 상태를 상기 학습처리부(30)의 학습결과를 토대로 작성된 최종 의사결정 트리를 이용하여 처리하여, 치료 방법을 결정함과 아울러 그 치료 방법으로 치료를 수행하였을 때 예후 예측 결과를 결정하는 예측 및 결정부(50); 및
    결정된 치료 방법과 예후 예측 결과를 출력하는 출력부(60)를 포함하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템.
  2. 제1항에 있어서,
    상기 데이터베이스(10), 변수지정부(20) 및 학습처리부(30)는 클라우드 환경에 위치하는 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템.
  3. 제1항 또는 제2항에 있어서,
    상기 독립변수는 호스트 요인(Host factor)과 종양 요인(Tumor factor)이며, 종속변수는 초치료 종류와 예후 예측인 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템.
  4. 제3항에 있어서,
    상기 호스트 요인은 성별(sex), 나이(age), 간기능(liver function), 다른 동반 질병(other comoribidity)을 포함하며,
    상기 종양 요인은 종양 수(tumor number), 종양 크기(tumor size), 종양 위치(tumor location), 혈관 침범(Vascular invasion), 원격 전이(distant metastasis)를 포함하는 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템.
  5. 제3항에 있어서,
    상기 예측 및 결정부(50)는,
    상기 독립변수에 가중치를 두어 초치료 종류와 예후 예측을 수행하며, 상기 종양 요인의 종양 수에 대한 가중치를 가장 높게 설정하며, 종양 크기를 그 다음의 가중치로 설정하는 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템.
  6. a) 변수지정부(20)로부터 독립변수와 종속변수를 입력받아, 학습처리부(30)에서 독립변수로부터 종속변수에 이르는 다수의 의사결정 트리를 작성하고, 데이터베이스(10)에 저장된 간암 임상 빅데이터를 각 의사결정 트리를 통해 학습한 후, 최종 의사결정 트리를 작성하는 단계;
    b) 예측 및 결정부(50)에서 입력부(40)를 통해 입력된 환자의 정보 및 종양 상태를, 상기 최종 의사결정 트리를 통해 의사결정하는 단계; 및
    c) 상기 예측 및 결정부(50)의 의사결정 결과인 치료법 및 예후 예측결과를 출력부(60)를 통해 출력하는 단계를 포함하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 방법.
  7. 제6항에 있어서,
    상기 a) 단계는 클라우드 환경에서 처리되고, b) 단계 및 c) 단계는 로컬 환경에서 처리되는 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 방법.
  8. 제6항 또는 제7항에 있어서,
    상기 독립변수는 호스트 요인(Host factor)과 종양 요인(Tumor factor)이며, 종속변수는 초치료 종류와 예후 예측인 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 방법.
  9. 제8항에 있어서,
    상기 호스트 요인은 성별(sex), 나이(age), 간기능(liver function), 다른 동반 질병(other comoribidity)을 포함하며,
    상기 종양 요인은 종양 수(tumor number), 종양 크기(tumor size), 종양 위치(tumor location), 혈관 침범(Vascular invasion), 원격 전이(distant metastasis)를 포함하는 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 방법.
  10. 제8항에 있어서,
    상기 b) 단계는,
    상기 독립변수에 가중치를 두어 치료법의 결정과 예후 예측을 수행하며, 상기 종양 요인의 종양 수에 대한 가중치를 가장 높게 설정하며, 종양 크기를 그 다음의 가중치로 설정하는 것을 특징으로 하는 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 방법.
KR1020180092386A 2018-08-08 2018-08-08 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법 KR102159861B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180092386A KR102159861B1 (ko) 2018-08-08 2018-08-08 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180092386A KR102159861B1 (ko) 2018-08-08 2018-08-08 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법

Publications (3)

Publication Number Publication Date
KR20200017140A true KR20200017140A (ko) 2020-02-18
KR102159861B1 KR102159861B1 (ko) 2020-09-24
KR102159861B9 KR102159861B9 (ko) 2021-07-26

Family

ID=69638784

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180092386A KR102159861B1 (ko) 2018-08-08 2018-08-08 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102159861B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112347201B (zh) * 2020-11-26 2021-05-18 德联易控科技(北京)有限公司 信息处理方法、信息处理装置及终端设备
WO2021177644A3 (ko) * 2020-03-05 2021-10-28 가톨릭대학교 산학협력단 환자의 정보를 기반으로 재원기간을 예측하는 장치, 방법 및 프로그램

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100794516B1 (ko) * 2007-12-03 2008-01-14 한국정보통신대학교 산학협력단 사례 기반 기계학습 추론을 이용한 질환 진단 및 검사 항목선정 시스템 및 방법
KR101737279B1 (ko) * 2016-12-15 2017-05-18 신성대학 산학협력단 뇌졸중 발병 예측 시스템

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100794516B1 (ko) * 2007-12-03 2008-01-14 한국정보통신대학교 산학협력단 사례 기반 기계학습 추론을 이용한 질환 진단 및 검사 항목선정 시스템 및 방법
KR101737279B1 (ko) * 2016-12-15 2017-05-18 신성대학 산학협력단 뇌졸중 발병 예측 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021177644A3 (ko) * 2020-03-05 2021-10-28 가톨릭대학교 산학협력단 환자의 정보를 기반으로 재원기간을 예측하는 장치, 방법 및 프로그램
CN112347201B (zh) * 2020-11-26 2021-05-18 德联易控科技(北京)有限公司 信息处理方法、信息处理装置及终端设备

Also Published As

Publication number Publication date
KR102159861B9 (ko) 2021-07-26
KR102159861B1 (ko) 2020-09-24

Similar Documents

Publication Publication Date Title
Azadifar et al. Graph-based relevancy-redundancy gene selection method for cancer diagnosis
JP6305437B2 (ja) 臨床判断支援のためのシステムおよび方法
KR20180071243A (ko) 세포 라인 유전체학으로부터 약물 반응의 환자-특정 예측을 위한 시스템 및 방법
Riegman et al. Biobanking for interdisciplinary clinical research
JP2016513303A5 (ko)
Suchorska et al. Contrast enhancement is a prognostic factor in IDH1/2 mutant, but not in wild-type WHO grade II/III glioma as confirmed by machine learning
KR20180010176A (ko) 고분화 방광암의 화학요법에 대한 반응 예측을 위한 시스템들 및 방법들
Jerez et al. Improvement of breast cancer relapse prediction in high risk intervals using artificial neural networks
JP2006519440A (ja) 疾患の増大リスクの統計学的同定法
KR20200017140A (ko) 빅데이터를 이용한 간암 예후 예측과 치료 방침 결정 시스템 및 방법
KR20200086168A (ko) 실용학적 임상시험 지원 시스템 및 방법
Krittanawong et al. How artificial intelligence could redefine clinical trials in cardiovascular medicine: lessons learned from oncology
Götte et al. Improving probabilities of correct interim decision in population enrichment designs
US20200222538A1 (en) Automated techniques for identifying optimal combinations of drugs
Li et al. An interpretable machine learning survival model for predicting long-term kidney outcomes in IgA nephropathy
EP3718116B1 (en) Apparatus for patient data availability analysis
Perco et al. Histogenomics: association of gene expression patterns with histological parameters in kidney biopsies
JP6623774B2 (ja) パスウェイ解析プログラム、パスウェイ解析方法、及び、情報処理装置
US20190252040A1 (en) Detection of cancer-specific diagnostic markers in genome
Sobhan et al. Explainable machine learning to identify patient-specific biomarkers for lung cancer
EP4064294A1 (en) Artificial intelligence-based system for analysing biomarkers and personalising cancer treatments
KR20130104883A (ko) 관상동맥석회화 수준 변화 예측장치 및 예측방법
KR102336311B1 (ko) 딥러닝을 이용한 암의 예후 예측 모델
KR102513634B1 (ko) 원발 부위 예측 장치, 사용자의 유전체 데이터를 이용하여 원발 부위를 예측하는 방법 및 컴퓨터 프로그램
Cutigi et al. GeNWeMME: a network-based computational method for prioritizing groups of significant related genes in cancer

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
G170 Publication of correction