KR102512674B1 - 딥러닝 기반의 생존 시간 예측 시스템 및 방법 - Google Patents

딥러닝 기반의 생존 시간 예측 시스템 및 방법 Download PDF

Info

Publication number
KR102512674B1
KR102512674B1 KR1020200141199A KR20200141199A KR102512674B1 KR 102512674 B1 KR102512674 B1 KR 102512674B1 KR 1020200141199 A KR1020200141199 A KR 1020200141199A KR 20200141199 A KR20200141199 A KR 20200141199A KR 102512674 B1 KR102512674 B1 KR 102512674B1
Authority
KR
South Korea
Prior art keywords
survival time
data
deep learning
medical data
risk
Prior art date
Application number
KR1020200141199A
Other languages
English (en)
Other versions
KR20220056527A (ko
Inventor
백으뜸
양형정
김수형
이귀상
오인재
강세령
Original Assignee
전남대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전남대학교산학협력단 filed Critical 전남대학교산학협력단
Priority to KR1020200141199A priority Critical patent/KR102512674B1/ko
Publication of KR20220056527A publication Critical patent/KR20220056527A/ko
Application granted granted Critical
Publication of KR102512674B1 publication Critical patent/KR102512674B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4842Monitoring progression or stage of a disease
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/60ICT specially adapted for the handling or processing of medical references relating to pathologies

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Surgery (AREA)
  • Molecular Biology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physiology (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 에 관한 것으로, 수신부가 환자 정보 및 의료 데이터를 수집하고, 사망 위험도 데이터베이스 구축부가 수신된 의료 데이터를 이용하여 의료 데이터에 대한 사망 위험도를 나타내는 사망 위험도 데이터를 생성하고 의료 데이터 별 사망 위험도 데이터베이스를 구축하며, 생존 시간 데이터베이스 구축부가 사망 위험도 데이터에 따라 생존 시간을 나타내는 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축한 다음, 생존 시간 도출부가 환자 정보 및 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출하여 환자의 생존 기간에 대한 신뢰성과 정확성을 향상시킬 수 있다.

Description

딥러닝 기반의 생존 시간 예측 시스템 및 방법{DEEP LEARNING-BASED SURVIVAL TIME PREDICTION SYSTEM AND METHOD}
본 발명은 딥러닝 기반의 생존 시간 예측 시스템 및 방법에 관한 것으로, 더욱 상세하게는, 환자 정보 및 의료 데이터를 이용하여 사망 위험도 및 환자의 생존 시간을 예측하여 환자의 생존 시간을 정확하게 도출할 수 있도록 한 기술에 관한 것이다.
의료 분야에서는 의료 영상, 건강검진자료, 질병자료, EMR(Electronic Medical Record), 유전체 분석 데이터 등 의료 데이터의 양이 증가하고 있으며, 최근 딥러닝(Deep learning) 분야의 발전과 함께 의료 분야에서도 환자의 생존 분석이 필수적인 분석 기술로 생존 분석에 대한 수요가 급증하고 있다.
그러나, 연구가 종료되거나 참가자가 사건이 발생하기 전에 연구가 중단되어 중도 단절된 데이터로 인해 정확한 생존 가능한 시간을 예측하기 어렵고, 이러한 문제로 인해 생존 분석에 대한 정보가 부족하여 일반 회귀 모델을 생존 분석에 적용하기에는 다소 어려운 문제가 있다.
이러한 문제를 해결하기 위해 환자의 생존 가능 시간을 예측할 수 있는 Kaplan-Meier 및 Cox 위험 모델을 기반으로 많은 연구가 수행되었고, 딥 러닝이 도입된 이후 성능은 크게 향상되었다.
그러나, 개인의 생존 시간을 예측하려면 Weibull, Gompertz, 및 로그 정규 분포와 같은 특정 분포를 사용하여 위험도를 생존 시간으로 변환 해야하는데, 가장 널리 사용되는 생존 분석 방법 중 하나인 Kaplan-Meier는 중도 단절된 된 데이터에 대해서는 생존 분포 함수를 예측할 수 있지만 환자의 공변량을 포함하지 않아 개인의 생존 시간 예측에 적용할 수 없다.
반면, Cox 위험 모델은 중도 단절된 데이터와 위험도을 예측하기 위해 환자의 공변량과 생존 시간 간의 연관성을 고려하기 때문에 의료 분야에서 일반적으로 사용되고 있다.
그러나, Cox 위험 모델은 위험도를 예측하는 모델의 일종이므로 생존 시간을 직접 예측할 수 없어 사용자가 수동으로 특정 분포를 미리 설정해야하는 문제점이 있다.
이에, Cox 위험 모델과 분포 함수 네트워크를 통합한 생존 분석을 통해 생존 시간을 예측하는 심층 신경망을 제안한다.
본 발명은, 의료 분야에서 다양한 환자 정보 및 의료 데이터를 이용하여 사망 위험도 및 환자의 생존 시간을 예측하여 환자의 생존 시간을 정확하게 도출할 수 있는 딥러닝 기반의 생존 시간 예측 시스템 및 방법을 제공할 수 있다.
본 발명의 일 측면에 따른 딥러닝 기반의 생존 시간 예측 시스템은 환자 정보 및 의료 데이터를 수집하는 수신부; 상기 수신된 의료 데이터를 이용하여 의료 데이터에 대한 사망 위험도를 나타내는 사망 위험도 데이터를 생성하고, 의료 데이터 별 사망 위험도 데이터베이스를 구축하는 사망 위험도 데이터베이스 구축부; 상기 사망 위험도 데이터에 따라 생존 시간을 나타내는 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축하는 생존 시간 데이터베이스 구축부를 포함할 수 있다.
바람직하게는, 상기 환자 정보 및 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출하는 생존 시간 도출부를 더 포함할 수 있다.
바람직하게는, 상기 환자 정보는 성별, 나이, 생년월일, 몸무게, 입실일자, 퇴실일자, 사망일자, 진단명 중 적어도 하나일 수 있다.
바람직하게는, 상기 의료 데이터는 비소세포폐암(NSCLC) 데이터, 유방암(METABRIC) 데이터, 심장질환(Heart disease) 데이터, 일차성 담즙성 간경변(PBC) 데이터 중 적어도 하나의 데이터일 수 있다.
바람직하게는, 상기 비소세포폐암 데이터는 T단계, N단계, M단계, TNM단계, 및 조직학 정보 중 적어도 하나로 구성될 수 있다.
바람직하게는, 상기 유방암 데이터는 림프절 수, 노팅엄 예후 지수(NPI), 세포성, 화학 요법, 면역 상태, 에스트로겐 수용체(ER) 상태, 인간 표피 성장 인자 수용체2(HER2) 중 적어도 하나로 구성될 수 있다.
바람직하게는, 상기 심장질환 데이터는 흉통 유형, 휴식 혈압, 혈청 콜레스테롤, 공복 혈당, 휴식 심전도, 최대 심박수, 운동 유발 협심증, 운동으로 인해 유발된 ST 우울증 상태, 피크 운동 ST 세그먼트 기울기, 주요 혈관수 중 적어도 하나로 구성될 수 있다.
바람직하게는, 상기 일차성 담즙성 간경변 데이터는 부종, 빌리루빈 농도, 알부민 농도, 프로트롬빈 시간, 및 질병 단계 정보 중 적어도 하나로 구성될 수 있다.
본 발명의 다른 측면에 따른 딥러닝 기반의 생존 시간 예측 방법은 환자 정보 및 의료 데이터를 수집하는 수신 단계; 상기 수신된 의료 데이터를 이용하여 의료 데이터에 대한 사망 위험도를 나타내는 사망 위험도 데이터를 생성하고, 의료 데이터 별 사망 위험도 데이터베이스를 구축하는 사망 위험도 데이터베이스 구축 단계; 상기 사망 위험도 데이터에 따라 생존 시간을 나타내는 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축하는 생존 시간 데이터베이스 구축 단계를 포함할 수 있다.
바람직하게는, 상기 환자 정보 및 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출하는 생존 시간 도출 단계를 더 포함할 수 있다.
바람직하게는, 상기 환자 정보는 성별, 나이, 생년월일, 몸무게, 입실일자, 퇴실일자, 사망일자, 진단명 중 적어도 하나일 수 있다.
바람직하게는, 상기 의료 데이터는 비소세포폐암(NSCLC) 데이터, 유방암(METABRIC) 데이터, 심장질환(Heart disease) 데이터, 일차성 담즙성 간경변(PBC) 데이터 중 적어도 하나의 데이터일 수 있다.
바람직하게는, 상기 비소세포폐암 데이터는 T단계, N단계, M단계, TNM단계, 및 조직학 정보 중 적어도 하나로 구성될 수 있다.
바람직하게는, 상기 유방암 데이터는 림프절 수, 노팅엄 예후 지수(NPI), 세포성, 화학 요법, 면역 상태, 에스트로겐 수용체(ER) 상태, 인간 표피 성장 인자 수용체2(HER2) 중 적어도 하나로 구성될 수 있다.
바람직하게는, 상기 심장질환 데이터는 흉통 유형, 휴식 혈압, 혈청 콜레스테롤, 공복 혈당, 휴식 심전도, 최대 심박수, 운동 유발 협심증, 운동으로 인해 유발된 ST 우울증 상태, 피크 운동 ST 세그먼트 기울기, 주요 혈관수 중 적어도 하나로 구성될 수 있다.
바람직하게는, 상기 일차성 담즙성 간경변 데이터는 부종, 빌리루빈(bilirubin) 농도, 알부민(Albumin) 농도, 프로트롬빈(prothrombin) 시간, 및 질병 단계 정보 중 적어도 하나로 구성될 수 있다.
본 발명에 따르면, 다양한 환자 정보 및 의료 데이터를 통해 사망 위험도 및 환자의 생존 시간을 예측함으로써 생존 기간에 대한 신뢰성과 정확성을 향상시킬 수 있다.
도 1은 일 실시예에 따른 딥러닝 기반의 생존 시간 예측을 위한 시스템 장치의 구성도이다.
도 2는 일 실시예에 따른 환자 정보 및 의료 데이터 수신부의 세부구성도이다.
도 3은 일 실시예에 따른 일차성 담즙성 간경변(PBC) 환자의 데이터를 Kaplan-Meier 곡선으로 나타낸 그래프이다.
도 4는 일 실시예에 따른 비소세포폐암(NSCLC) 환자의 데이터를 Kaplan-Meier 곡선으로 나타낸 그래프이다.
도 5는 일 실시예에 따른 심장질환(Heart disease) 환자의 데이터를 Kaplan-Meier 곡선으로 나타낸 그래프이다.
도 6은 일 실시예에 따른 유방암(METABRIC) 환자의 데이터를 Kaplan-Meier 곡선으로 나타낸 그래프이다.
도 7은 일 실시예에 따른 딥러닝 기반의 생존 시간 예측을 위한 순서를 나타낸 순서도이다.
이하에서는 본 발명에 따른 딥러닝 기반의 생존 시간 예측 시스템 및 방법을 첨부된 도면들을 참조하여 상세하게 설명한다. 이러한 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자 단말, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로, 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
본 발명의 목적 및 효과는 하기의 설명에 의해서 자연스럽게 이해되거나 보다 분명해 질 수 있으며, 하기의 기재만으로 본 발명의 목적 및 효과가 제한되는 것은 아니다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이, 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하기로 한다.
본 명세서에서 사용되는 용어, "환자"는 사망 발생의 위험도를 예측하고자 하는 대상을 의미할 수 있다. 한편, 본원 명세서 내에서 환자는 '병원에 입원한 환자' 또는 '병원에 내원한 적이 있는 환자'일 수 있으나, 이에 제한되는 것은 아니며 사망 발생의 위험도를 예측하고자 하는 모든 대상을 포함할 수 있다. 예를 들어, 환자는 임상 데이터를 얻기 위해 진행한 임상시험 단계의 의료를 받은 환자일 수도 있다.
본 명세서에서 사용되는 용어, "의료 데이터"는 환자로부터 얻어진 생물학적 시료에 대한 임상적 데이터를 의미할 수 있다.
도 1은 일 실시예에 따른 딥러닝 기반의 생존 시간 예측을 위한 시스템 장치의 구성도이다.
도 1에서 나타낸 바와 같이, 딥러닝 기반의 생존 시간 예측을 위한 시스템은 환자 정보 및 의료 데이터 수신부(100), 사망 위험도 데이터베이스 구축부(300), 생존 시간 데이터베이스 구축부(500), 및 생존 시간 도출부(700)를 포함할 수 있다.
도 2는 일 실시예에 따른 환자 정보 및 의료 데이터 수신부의 세부구성도이다.
도 2에서 나타낸 바와 같이, 환자 정보 및 의료 데이터 수신부(100)는 환자 정보 수집 모듈(110), 및 의료 데이터 수집 모듈(130)로 구성될 수 있다.
여기서, 환자정보 수집 모듈은 환자의 성별, 나이, 생년월일, 몸무게, 입실일자, 퇴실일자, 사망일자, 진단명 중 적어도 하나를 수집할 수 있고, 의료 데이터 수집 모듈은 비소세포폐암(NSCLC) 데이터, 유방암(METABRIC) 데이터, 심장질환(Heart disease) 데이터, 일차성 담즙성 간경변(PBC) 데이터 중 적어도 하나를 수집할 수 있으나, 반드시 상술한 정보 및 데이터만 수집하는 것으로 한정되는 것은 아니다.
비소세포암 데이터는 T단계, N단계, M단계, TNM단계, 및 조직학 정보 중 적어도 하나로 구성될 수 있다.
유방암 데이터는 림프절 수, 노팅엄 예후 지수(NPI), 세포성, 화학 요법, 면역 상태, 에스트로겐 수용체(ER) 상태, 인간 표피 성장 인자 수용체2(HER2) 중 적어도 하나로 구성될 수 있다.
심장질환 데이터는 흉통 유형, 휴식 혈압, 혈청 콜레스테롤, 공복 혈당, 휴식 심전도, 최대 심박수, 운동 유발 협심증, 운동으로 인해 유발된 ST 우울증 상태, 피크 운동 ST 세그먼트 기울기, 주요 혈관수 중 적어도 하나로 구성될 수 있다.
일차성 담즙성 간경변 데이터는 부종, 빌리루빈 농도, 알부민 농도, 프로트롬빈 시간, 및 질병 단계 정보 중 적어도 하나로 구성될 수 있다
사망 위험도 데이터베이스 구축부(300)는 의료 데이터를 이용하여 의료 데이터 별 사망 위험도 데이터를 생성하고, 의료 데이터 별 사망 위험도 데이터베이스를 구축할 수 있다.
사망 위험도 데이터베이스 구축부(300)는 수신된 환자의 의료 데이터에 따른 환자의 생존 기간을 고려하여 사망 위험도를 측정한다.
사망 위험도 데이터베이스를 구축하기 위해 생존 분석에 사용되는 DeepSurv 네트워크가 차용되었다. 여기서, DeepSurv는 네트워크의 가중치로 매개 변수화 된 로그 위험 함수 h(x)를 도출하는 딥 피드 포워드 신경망이고, 출력 계층에는 Cox 모델의 로그 위험 함수를 추정하는 하나의 선형 활성화 노드가 있다. 이때, Cox 위험 모델은 수학식 1로 표현될 수 있다.
[수학식 1]
Figure 112020114724689-pat00001
수학식 1에서, h(t)는 위험 함수이고, t는 생존 시간이다.
Figure 112020114724689-pat00002
는 공변량 x에 영향을 받는 계수이고, ho(t)는 기준 위험 함수이다. 여기서, Cox 위험 모델에 손실 함수인 음의 로그 부분 가능도함수(Negative log-partial likelihood function)를 적용하여 회귀계수에 대한 함수를 정의할 수 있다. Cox의 음의 부분 가능도함수
Figure 112020114724689-pat00003
는 수학식 2로 표현될 수 있다.
[수학식 2]
Figure 112020114724689-pat00004
수학식 2에서, Ti 와 Ei 는 사망 발생 시간과 사망 여부이고, xi 는 환자에 대한 임상 공변량 벡터 i이며, R(Ti)는 사망하지 않은 환자의 집합이다.
생존 시간 데이터베이스 구축부(500)는 의료 데이터의 사망 위험도에 따라 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축할 수 있다.
의료 데이터 별 사망 위험도에 따른 생존 시간 데이터를 구축하기 위해 Cox 비례 위험 모델이 사용된다. 그러나, Cox 비례 위험 모델은 위험을 겪을 확률이고, 개별 생존 시간에 대해서 직접 생성할 수 없다.
따라서, 생존 시간을 도출하기 위해서는 Cox 모델에 특정 정규 분포를 사용하여 사망 위험도를 생존 시간으로 변환할 수 있다. 이때, 환자 개별의 생존 시간 데이터를 생성하기 위한 개인의 사망 위험도에 따른 생존 시간(T)는 다음 수학식 3으로 표현될 수 있다.
[수학식 3]
Figure 112020114724689-pat00005
수학식 3에서, u는 임의의 사건에 대한 랜덤 변수이고, 랜덤 변수는 임의의 수치로 부여될 수 있으며,
Figure 112020114724689-pat00006
는 일반적인 위험도이다. 여기서, 수학식 3을 MSE(Mean Squared Error)에 적용하여 손실 함수를 만들 수 있고, 손실 함수(Loss)는 다음 수학식 4로 표현될 수 있다.
[수학식 4]
Figure 112020114724689-pat00007
수학식 4에서,
Figure 112020114724689-pat00008
는 개인 i의 생존 시간 분포를 나타내고,
Figure 112020114724689-pat00009
는 개인 i의 사망시간을 나타내며,
Figure 112020114724689-pat00010
은 사망 위험 데이터에서의 위험도을 나타낸다. 즉, 사망 위험도 데이터에 따른 개인 i의 생존 시간을 도출하여 생존 시간 데이터를 생성하고, 생존 시간 데이터베이스를 구축할 수 있다.
생존 시간 도출부(700)는 사망 위험도에 따른 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출할 수 있다.
생존 시간을 도출하기 위해 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터는 다음 수학식 5에서 표현될 수 있다.
[수학식 5]
Figure 112020114724689-pat00011
수학식 5에서,
Figure 112020114724689-pat00012
은 예상 생존 시간이다.
사망 위험도 데이터에서의 위험도와 개인 i의 생존 시간 분포를 이용하여 환자의 예상 생존 시간을 도출할 수 있다.
도 3 내지 6은 일 실시예에 따른 일차성 담즙성 간경변(PBC), 비소세포폐암(NSCLC) 환자의 데이터, 심장질환(Heart disease) 환자의 데이터, 및 유방암(METABRIC) 환자의 데이터를 Kaplan-Meier 곡선으로 나타낸 그래프이다.
도 3 내지 6에서 나타낸 바와 같이, 일 실시예에 따른 일차성 담즙성 간경변(PBC), 비소세포폐암(NSCLC), 심장질환(Heart disease), 및 유방암(METABRIC) 환자의 데이터를 Kaplan-Meier 곡선 변환한 결과, 실측 데이터와 유사한 수치를 갖는 것을 확인할 수 있다.
도 7은 일 실시예에 따른 딥러닝 기반의 생존 시간 예측을 위한 순서를 나타낸 순서도이다.
도 7에서 나타낸 바와 같이, 딥러닝 기반의 생존 시간 예측을 위한 순서는 환자 정보 및 의료 데이터 수신 단계(S100), 사망 위험도 데이터베이스 구축 단계(S300), 생존 시간 데이터베이스 구축 단계(S500), 및 생존 시간 도출 단계(S700)로 구성될 수 있다.
환자 정보 및 의료 데이터 수신 단계(S100)는 환자정보 및 의료 데이터가 수집될 수 있다. 이때, 환자정보는 환자의 성별, 나이, 생년월일, 몸무게, 입실일자, 퇴실일자, 사망일자, 진단명 중 적어도 하나가 수집될 수 있고, 의료 데이터 수집 모듈은 비소세포폐암(NSCLC) 데이터, 유방암(METABRIC) 데이터, 심장질환(Heart disease) 데이터, 일차성 담즙성 간경변(PBC) 데이터 중 적어도 하나가 수집될 수 있으나, 반드시 상술한 정보 및 데이터만 수집되는 것으로 한정되는 것은 아니다.
여기서, 비소세포암 데이터는 T단계, N단계, M단계, TNM단계, 및 조직학 정보 중 적어도 하나로 구성될 수 있다.
유방암 데이터는 림프절 수, 노팅엄 예후 지수(NPI), 세포성, 화학 요법, 면역 상태, 에스트로겐 수용체(ER) 상태, 인간 표피 성장 인자 수용체2(HER2) 중 적어도 하나로 구성될 수 있다.
심장질환 데이터는 흉통 유형, 휴식 혈압, 혈청 콜레스테롤, 공복 혈당, 휴식 심전도, 최대 심박수, 운동 유발 협심증, 운동으로 인해 유발된 ST 우울증 상태, 피크 운동 ST 세그먼트 기울기, 주요 혈관수 중 적어도 하나로 구성될 수 있다.
일차성 담즙성 간경변 데이터는 부종, 빌리루빈 농도, 알부민 농도, 프로트롬빈 시간, 및 질병 단계 정보 중 적어도 하나로 구성될 수 있다.
사망 위험도 데이터베이스 구축 단계(S300)는 의료 데이터를 이용하여 의료 데이터에 따른 사망 위험도가 도출될 수 있다. 이때, 사망 위험도 데이터는 의료 데이터에 따른 환자의 사망 비율, 생존 기간 등을 고려하여 위험도를 측정할 수 있다.
생존 시간 데이터베이스 구축 단계(S500)는 의료 데이터 별 사망 위험도에 따라 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축할 수 있다.
의료 데이터 별 사망 위험도에 따른 생존 시간 데이터를 구축하기 위해 사망 위험도 데이터에 따라 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축할 수 있다.
생존 시간 도출 단계(S700)는 의료 데이터 별 위험도 및 위험도에 따른 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출할 수 있다.
이때, 이상에서 대표적인 실시예를 통하여 본 발명을 상세하게 설명하였으나, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 상술한 실시예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리 범위는 설명한 실시예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 특허청구범위와 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태에 의하여 정해져야 한다.
100: 환자 정보 및 의료 데이터 수신부
300: 사망 위험도 데이터베이스 구축부
500: 생존 시간 데이터베이스 구축부
700: 생존 시간 도출부
110: 환자 정보 수집 모듈 130: 의료 데이터 수집 모듈

Claims (16)

  1. 환자 정보 및 의료 데이터를 수집하는 수신부;
    상기 수신된 의료 데이터를 이용하여 의료 데이터에 대한 사망 위험도를 나타내는 사망 위험도 데이터를 생성하고, 의료 데이터 별 사망 위험도 데이터베이스를 구축하는 사망 위험도 데이터베이스 구축부;
    상기 사망 위험도 데이터에 따라 생존 시간을 나타내는 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축하는 생존 시간 데이터베이스 구축부를 포함하고,
    상기 생존 시간 데이터베이스 구축부는 Cox 비례 위험 모델을 사용하여 사망 위험도를 생존 시간으로 변환하고,
    상기 생존 시간 데이터베이스 구축부는 상기 변환된 생존 시간을 평균제곱오차(MSE)에 적용으로 손실함수를 연산하는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  2. 제1항에 있어서,
    상기 환자 정보 및 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출하는 생존 시간 도출부를 더 포함하는 딥러닝 기반의 생존 시간 예측 시스템.
  3. 제1항에 있어서,
    상기 환자 정보는 성별, 나이, 생년월일, 몸무게, 입실일자, 퇴실일자, 사망일자, 진단명 중 적어도 하나인 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  4. 제1항에 있어서,
    상기 의료 데이터는 비소세포폐암(NSCLC) 데이터, 유방암(METABRIC) 데이터, 심장질환(Heart disease) 데이터, 일차성 담즙성 간경변(PBC) 데이터 중 적어도 하나의 데이터인 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  5. 제4항에 있어서,
    상기 비소세포폐암 데이터는 T단계, N단계, M단계, TNM단계, 및 조직학 정보 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  6. 제4항에 있어서,
    상기 유방암 데이터는 림프절 수, 노팅엄 예후 지수(NPI), 세포성, 화학 요법, 면역 상태, 에스트로겐 수용체(ER) 상태, 인간 표피 성장 인자 수용체2(HER2) 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  7. 제4항에 있어서,
    상기 심장질환 데이터는 흉통 유형, 휴식 혈압, 혈청 콜레스테롤, 공복 혈당, 휴식 심전도, 최대 심박수, 운동 유발 협심증, 운동으로 인해 유발된 ST 우울증 상태, 피크 운동 ST 세그먼트 기울기, 주요 혈관수 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  8. 제4항에 있어서,
    상기 일차성 담즙성 간경변 데이터는 부종, 빌리루빈 농도, 알부민 농도, 프로트롬빈 시간, 및 질병 단계 정보 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 시스템.
  9. 수신부가 환자 정보 및 의료 데이터를 수집하는 수신 단계;
    데이터베이스 구축부가 상기 수신된 의료 데이터를 이용하여 의료 데이터에 대한 사망 위험도를 나타내는 사망 위험도 데이터를 생성하고, 의료 데이터 별 사망 위험도 데이터베이스를 구축하는 사망 위험도 데이터베이스 구축 단계;
    생존 시간 데이터베이스 구축부가 상기 사망 위험도 데이터에 따라 생존 시간을 나타내는 생존 시간 데이터를 생성하여 의료 데이터 별 사망 위험도에 따른 생존 시간 데이터베이스를 구축하는 생존 시간 데이터베이스 구축 단계를 포함하고,
    상기 생존 시간 데이터베이스 구축 단계는 Cox 비례 위험 모델을 사용하여 사망 위험도를 생존 시간으로 변환하고,
    상기 생존 시간 데이터베이스 구축 단계는 상기 변환된 생존 시간을 평균제곱오차(MSE)에 적용으로 손실함수를 연산하는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
  10. 제9항에 있어서,
    상기 환자 정보 및 생존 시간 데이터를 이용하여 환자 별 생존 시간을 도출하는 생존 시간 도출 단계를 더 포함하는 딥러닝 기반의 생존 시간 예측 방법.
  11. 제9항에 있어서,
    상기 환자 정보는 성별, 나이, 생년월일, 몸무게, 입실일자, 퇴실일자, 사망일자, 진단명 중 적어도 하나인 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
  12. 제9항에 있어서,
    상기 의료 데이터는 비소세포폐암(NSCLC) 데이터, 유방암(METABRIC) 데이터, 심장질환(Heart disease) 데이터, 일차성 담즙성 간경변(PBC) 데이터 중 적어도 하나의 데이터인 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
  13. 제12항에 있어서,
    상기 비소세포폐암 데이터는 T단계, N단계, M단계, TNM단계, 및 조직학 정보 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
  14. 제12항에 있어서,
    상기 유방암 데이터는 림프절 수, 노팅엄 예후 지수(NPI), 세포성, 화학 요법, 면역 상태, 에스트로겐 수용체(ER) 상태, 인간 표피 성장 인자 수용체2(HER2) 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
  15. 제12항에 있어서,
    상기 심장질환 데이터는 흉통 유형, 휴식 혈압, 혈청 콜레스테롤, 공복 혈당, 휴식 심전도, 최대 심박수, 운동 유발 협심증, 운동으로 인해 유발된 ST 우울증 상태, 피크 운동 ST 세그먼트 기울기, 주요 혈관수 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
  16. 제12항에 있어서,
    상기 일차성 담즙성 간경변 데이터는 부종, 빌리루빈(bilirubin) 농도, 알부민(Albumin) 농도, 프로트롬빈(prothrombin) 시간, 및 질병 단계 정보 중 적어도 하나로 구성되는 것을 특징으로 하는 딥러닝 기반의 생존 시간 예측 방법.
KR1020200141199A 2020-10-28 2020-10-28 딥러닝 기반의 생존 시간 예측 시스템 및 방법 KR102512674B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200141199A KR102512674B1 (ko) 2020-10-28 2020-10-28 딥러닝 기반의 생존 시간 예측 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200141199A KR102512674B1 (ko) 2020-10-28 2020-10-28 딥러닝 기반의 생존 시간 예측 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20220056527A KR20220056527A (ko) 2022-05-06
KR102512674B1 true KR102512674B1 (ko) 2023-03-22

Family

ID=81584755

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200141199A KR102512674B1 (ko) 2020-10-28 2020-10-28 딥러닝 기반의 생존 시간 예측 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102512674B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240003394A (ko) 2022-06-30 2024-01-09 전남대학교산학협력단 멀티모달 기반 폐암환자 생존 함수 예측 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017021727A (ja) * 2015-07-15 2017-01-26 国立大学法人京都大学 イベント発生時期予測装置、イベント発生時期予測方法、及びイベント発生時期予測プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018143540A1 (ko) * 2017-02-02 2018-08-09 사회복지법인 삼성생명공익재단 인공신경망을 이용한 위암의 예후 예측 방법, 장치 및 프로그램
KR102257830B1 (ko) * 2018-12-18 2021-05-28 연세대학교 산학협력단 사망 위험도의 예측 방법 및 이를 이용한 디바이스

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017021727A (ja) * 2015-07-15 2017-01-26 国立大学法人京都大学 イベント発生時期予測装置、イベント発生時期予測方法、及びイベント発生時期予測プログラム

Also Published As

Publication number Publication date
KR20220056527A (ko) 2022-05-06

Similar Documents

Publication Publication Date Title
KR102024375B1 (ko) 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법
Sejdinović et al. Classification of prediabetes and type 2 diabetes using artificial neural network
CN106202968B (zh) 癌症的数据分析方法及装置
CN103201743A (zh) 患者疾病严重性、死亡率和住院时长的连续预测方法
US20170329918A1 (en) Internet of things based monitoring and assessment platform
Li et al. Progress in biological age research
JP2004503316A (ja) 自律神経系機能の指標を与えるための方法及び装置
CN106485061A (zh) 一种生活风险评估及改善系统的建立方法
KR102512674B1 (ko) 딥러닝 기반의 생존 시간 예측 시스템 및 방법
Bagula et al. Cyber-healthcare kiosks for healthcare support in developing countries
JP2013148996A (ja) 重症度判定装置、及び、重症度判定方法
CN113488168A (zh) 一种基于用户健康信息特征集的个性化体检项目推荐方法
US20240047077A1 (en) Method and system for generating personalized biological age prediction model
CN117484498A (zh) 一种基于人工智能的心肺复苏机器人
CN117275648A (zh) 一种基于物联网的重症监护病房患者智能护理方法
KR20130024535A (ko) 맥파를 이용한 건강 상태 판단 장치 및 방법
US10441252B2 (en) Medical toilet with user customized health metric validation system
Nogueira et al. Model to estimate the nursing workload required by trauma victims on intensive care unit discharge
Hansen et al. Validity and reliability of seismocardiography for the estimation of cardiorespiratory fitness
CN109192315B (zh) 基于加权核回归和封装式偏差搜索的综合年龄检测系统
Kim et al. A personal health index system with IoT devices
CN112420197A (zh) 一种智能公卫服务管理系统及方法
Ning et al. Artificial neural network based model for cardiovascular risk stratification in hypertension
Domingo et al. Cardiovascular health pre-diagnosis based on a BP profile using Artificial Neural Network
CN113782132B (zh) 标签信息的动态更新方法、装置及介质

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right