KR20180057300A - 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템 - Google Patents

딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템 Download PDF

Info

Publication number
KR20180057300A
KR20180057300A KR1020160155771A KR20160155771A KR20180057300A KR 20180057300 A KR20180057300 A KR 20180057300A KR 1020160155771 A KR1020160155771 A KR 1020160155771A KR 20160155771 A KR20160155771 A KR 20160155771A KR 20180057300 A KR20180057300 A KR 20180057300A
Authority
KR
South Korea
Prior art keywords
disease
sequence
data
learning
generating
Prior art date
Application number
KR1020160155771A
Other languages
English (en)
Other versions
KR101869438B1 (ko
Inventor
하정우
김정희
민구
신재경
Original Assignee
네이버 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 네이버 주식회사 filed Critical 네이버 주식회사
Priority to KR1020160155771A priority Critical patent/KR101869438B1/ko
Publication of KR20180057300A publication Critical patent/KR20180057300A/ko
Application granted granted Critical
Publication of KR101869438B1 publication Critical patent/KR101869438B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템이 개시된다. 질병 예후 예측 방법은, 환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하는 단계; 상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하는 단계; 및 상기 학습데이터를 이용하여 질병 예후를 예측하는 단계를 포함할 수 있다.

Description

딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템{METHOD AND SYSTEM FOR PREDICTING PROGNOSIS FROM DIAGNOSTIC HISTORIES USING DEEP LEARNING}
아래의 설명은 질병 예후를 예측하는 기술에 관한 것이다.
고혈압(HBP), 당뇨, 고지혈증 등과 같은 성인병들은 전세계적으로 중년들에게 매우 흔하게 나타나고 있는 질환 중 하나이다. 비록 성인병 그 자체가 건강에 치명적이지는 않더라도 이는 심각한 합병증을 유발시킬 수 있다.
특히, 성인병은 사망의 주요 원인인 심장, 뇌, 혈관 질환과 같은 고위험 질환과 관련성이 매우 높다는 점이 지속적으로 보고되고 있다. 따라서, 성인병 환자의 고위험 예후를 예측하는 것은 의료 분야 및 바이오 기술 분야에서 매우 중요한 문제라고 할 수 있다.
고위험 예후 예측을 위해 연령, 성별, 현재 상태, 가족력 등의 정보를 이용한다거나, 바이오마커 유전자 발현량, CT 등의 의료 이미지, 혈액분석 등을 이용한 다양한 방법이 사용되고 있다.
예컨대, 한국공개특허 제10-2014-0098561호(공개일 2014년 08월 08일)에는 분석 대상 질병에 관련된 단일염기다형성(single nucleotide polymorphism, SNP) 조합을 기초로 사용자의 질병 발생 위험도를 예측하는 기술이 개시되어 있다.
고위험 예후 예측을 위한 기존 방법에서 사용되는 데이터들은 종류도 다양할 뿐 아니라 전처리 등의 데이터 처리 과정이 복잡하기 때문에 필요한 데이터를 확보하는데 많은 시간과 노력, 비용을 필요로 한다.
딥 러닝(deep learning) 기법인 RNN(Recurrent Neural Networks) 등 신경망을 이용하여 성인병 환자의 진단 이력으로부터 고위험 예후를 예측할 수 있는 방법 및 시스템을 제공한다.
환자 분류, 진단 및 치료 코드 등을 단어 시퀀스(sequence) 형태의 피처(feature)로 표현하여 RNN을 이용한 학습을 통해 해당 환자의 고위험 예후를 분류 및 예측할 수 있는 방법 및 시스템을 제공한다.
컴퓨터로 구현되는 질병 예후 예측 방법에 있어서, 환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하는 단계; 상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하는 단계; 및 상기 학습데이터를 이용하여 질병 예후를 예측하는 단계를 포함하는 질병 예후 예측 방법을 제공한다.
일 측면에 따르면, 상기 학습데이터를 생성하는 단계는, 상기 시퀀스 데이터를 실수 벡터로 표현하여 상기 실수 벡터에 따른 질병 발생 확률을 계산하는 단계를 포함할 수 있다.
다른 측면에 따르면, 상기 학습데이터를 생성하는 단계는, 상기 시퀀스 데이터를 상기 RNN의 입력으로 하여 상기 RNN에서 단어 시퀀스 학습을 통해 시퀀스 정보가 포함된 워드 벡터를 표현하는 단계; 및 상기 시퀀스 정보가 포함된 워드 벡터를 이용하여 질병 발생 확률을 계산하는 단계를 포함하는 질병 예후 예측 방법을 포함할 수 있다.
또 다른 측면에 따르면, 상기 학습데이터를 생성하는 단계는, 단어 시퀀스에 대한 분산 표현(distributed representation)을 위한 임베딩 레이어(embedding layer)와, 시퀀스 모델링을 위한 회귀 레이어(recurrent layers), 및 질병 예후 분류를 위한 완전 연결 레이어(fully-connected layers)로 구성된 RNN을 이용할 수 있다.
또 다른 측면에 따르면, 상기 RNN의 학습은 상기 완전 연결 레이어, 상기 회귀 레이어, 상기 임베딩 레이어를 통해 입력 피처 레이어(input feature layer)로 예측 오차를 전파함으로써 E2E(end-to-end) 방식으로 진행될 수 있다.
또 다른 측면에 따르면, 상기 시퀀스 데이터를 생성하는 단계는, 상기 진단 분류 코드 중 최근 마지막 일정 개수의 코드를 이용하여 상기 시퀀스 데이터를 생성할 수 있다.
또 다른 측면에 따르면, 상기 시퀀스 데이터를 생성하는 단계는, 상기 진단 분류 코드 중 주어진 질환에 해당되는 코드를 해당 질환의 레이블로 대체할 수 있다.
또 다른 측면에 따르면, 상기 시퀀스 데이터를 생성하는 단계는, 상기 진단 분류 코드 중 주어진 질환에 해당되는 코드가 복수 개인 경우 각 질환에 대한 시퀀스 데이터를 생성할 수 있다.
또 다른 측면에 따르면, 상기 환자의 진단 시점의 시간 및 질병 기간, 치료 이력과 병리학적 측정 데이터 중 적어도 하나의 추가 임상 이력에 대한 시퀀스 데이터를 생성하는 단계를 더 포함하고, 상기 학습데이터를 생성하는 단계는, 상기 환자의 진단 이력과 상기 추가 임상 이력에 대해 해당 데이터의 특성에 따른 각각의 개별 신경망을 추가하여 학습하는 단계를 포함할 수 있다.
컴퓨터 시스템과 결합되어 질병 예후 예측 방법을 실행시키기 위해 컴퓨터 판독 가능한 기록 매체에 기록된 컴퓨터 프로그램에 있어서, 상기 질병 예후 예측 방법은, 환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하는 단계; 상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하는 단계; 및 상기 학습데이터를 이용하여 질병 예후를 예측하는 단계를 포함하는, 컴퓨터 프로그램을 제공한다.
컴퓨터로 구현되는 질병 예후 예측 시스템에 있어서, 컴퓨터가 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서를 포함하고, 상기 적어도 하나의 프로세서는, 환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하고, 상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하고, 상기 학습데이터를 이용하여 질병 예후를 예측하는 것을 특징으로 하는 질병 예후 예측 시스템을 제공한다.
본 발명의 실시예들에 따르면, 진단 분류 코드를 단어 시퀀스 형태의 피처로 표현하고 RNN을 이용한 학습을 통해 해당 환자의 고위험 예후를 예측할 수 있다. 따라서, 코드로 표현된 간단한 진단 이력만으로 보다 빠르고 정확하게 고위험 예후를 예측할 수 있으며 고위험 예후에 대한 신속한 경고를 제공할 수 있다.
도 1은 본 발명의 일 실시예에 있어서 컴퓨터 시스템의 내부 구성의 일례를 설명하기 위한 블록도이다.
도 2는 본 발명의 일 실시예에 따른 컴퓨터 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 컴퓨터 시스템이 수행할 수 있는 질병 예후 예측 방법의 예를 도시한 순서도이다.
도 4는 본 발명의 일 실시예에 있어서 진단 분류 코드로부터 시퀀스 데이터를 생성하는 과정의 예를 도시한 것이다.
도 5는 본 발명의 일 실시예에 있어서 질병 예후 예측을 위한 RNN 모델 구조의 예를 도시한 것이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
본 발명의 실시예들은 질병 예후를 예측하는 기술에 관한 것이다.
본 명세서에서 구체적으로 개시되는 것들을 포함하는 실시예들은 질병 예후 예측을 달성하고 이를 통해 효율성, 정확성, 신속성, 비용 절감 등의 측면에 있어서 상당한 장점들을 달성한다.
도 1은 본 발명의 일 실시예에 있어서 컴퓨터 시스템의 내부 구성의 일례를 설명하기 위한 블록도이다. 예를 들어, 본 발명의 실시예들에 따른 질병 예후 예측 시스템이 도 1의 컴퓨터 시스템(100)을 통해 구현될 수 있다. 도 1에 도시한 바와 같이, 컴퓨터 시스템(100)은 질병 예후 예측 방법을 실행하기 위한 구성요소로서 프로세서(110), 메모리(120), 영구 저장 장치(130), 버스(140), 입출력 인터페이스(150) 및 네트워크 인터페이스(160)를 포함할 수 있다.
프로세서(110)는 환자들의 진단 이력으로부터 고위험 예후를 예측하기 위한 구성요소로서 명령어들의 시퀀스를 처리할 수 있는 임의의 장치를 포함하거나 그의 일부일 수 있다. 프로세서(110)는 예를 들어 컴퓨터 프로세서, 이동 장치 또는 다른 전자 장치 내의 프로세서 및/또는 디지털 프로세서를 포함할 수 있다. 프로세서(110)는 예를 들어, 서버 컴퓨팅 디바이스, 서버 컴퓨터, 일련의 서버 컴퓨터들, 서버 팜, 클라우드 컴퓨터, 컨텐츠 플랫폼 등에 포함될 수 있다. 프로세서(110)는 버스(140)를 통해 메모리(120)에 접속될 수 있다.
메모리(120)는 컴퓨터 시스템(100)에 의해 사용되거나 그에 의해 출력되는 정보를 저장하기 위한 휘발성 메모리, 영구, 가상 또는 기타 메모리를 포함할 수 있다. 메모리(120)는 예를 들어 랜덤 액세스 메모리(RAM: random access memory) 및/또는 다이내믹 RAM(DRAM: dynamic RAM)을 포함할 수 있다. 메모리(120)는 컴퓨터 시스템(100)의 상태 정보와 같은 임의의 정보를 저장하는 데 사용될 수 있다. 메모리(120)는 예를 들어 질병 예후 예측을 위한 명령어들을 포함하는 컴퓨터 시스템(100)의 명령어들을 저장하는 데에도 사용될 수 있다. 컴퓨터 시스템(100)은 필요에 따라 또는 적절한 경우에 하나 이상의 프로세서(110)를 포함할 수 있다.
버스(140)는 컴퓨터 시스템(100)의 다양한 컴포넌트들 사이의 상호작용을 가능하게 하는 통신 기반 구조를 포함할 수 있다. 버스(140)는 예를 들어 컴퓨터 시스템(100)의 컴포넌트들 사이에, 예를 들어 프로세서(110)와 메모리(120) 사이에 데이터를 운반할 수 있다. 버스(140)는 컴퓨터 시스템(100)의 컴포넌트들 간의 무선 및/또는 유선 통신 매체를 포함할 수 있으며, 병렬, 직렬 또는 다른 토폴로지 배열들을 포함할 수 있다.
영구 저장 장치(130)는 (예를 들어, 메모리(120)에 비해) 소정의 연장된 기간 동안 데이터를 저장하기 위해 컴퓨터 시스템(100)에 의해 사용되는 바와 같은 메모리 또는 다른 영구 저장 장치와 같은 컴포넌트들을 포함할 수 있다. 영구 저장 장치(130)는 컴퓨터 시스템(100) 내의 프로세서(110)에 의해 사용되는 바와 같은 비휘발성 메인 메모리를 포함할 수 있다. 영구 저장 장치(130)는 예를 들어 플래시 메모리, 하드 디스크, 광 디스크 또는 다른 컴퓨터 판독 가능 매체를 포함할 수 있다.
입출력 인터페이스(150)는 키보드, 마우스, 음성 명령 입력, 디스플레이 또는 다른 입력 또는 출력 장치에 대한 인터페이스들을 포함할 수 있다. 구성 명령들 및/또는 질병 예후 예측을 위한 입력이 입출력 인터페이스(150)를 통해 수신될 수 있다.
네트워크 인터페이스(160)는 근거리 네트워크 또는 인터넷과 같은 네트워크들에 대한 하나 이상의 인터페이스를 포함할 수 있다. 네트워크 인터페이스(160)는 유선 또는 무선 접속들에 대한 인터페이스들을 포함할 수 있다. 구성 명령들 및/또는 질병 예후 예측을 위한 입력이 네트워크 인터페이스(160)를 통해 수신될 수 있다.
또한, 다른 실시예들에서 컴퓨터 시스템(100)은 도 1의 구성요소들보다 더 많은 구성요소들을 포함할 수도 있다. 그러나, 대부분의 종래기술적 구성요소들을 명확하게 도시할 필요성은 없다. 예를 들어, 컴퓨터 시스템(100)은 상술한 입출력 인터페이스(150)와 연결되는 입출력 장치들 중 적어도 일부를 포함하도록 구현되거나 또는 트랜시버(transceiver), GPS(Global Positioning System) 모듈, 카메라, 각종 센서, 데이터베이스 등과 같은 다른 구성요소들을 더 포함할 수도 있다.
본 발명에서는 딥 러닝 기법인 RNN을 이용하여 환자들의 진단 이력으로부터 고위험 예후를 예측하는 기술을 제공한다. 본 명세서에서는 고혈압, 당뇨, 고지혈증 등을 성인병의 대표적인 예로 정의하고, 심혈관 질환과 뇌혈관 질환을 고위험 질환의 대표적인 예로 정의하나, 이에 한정되는 것은 아니다.
도 2는 본 발명의 일 실시예에 따른 컴퓨터 시스템의 프로세서가 포함할 수 있는 구성요소의 예를 도시한 도면이고, 도 3은 본 발명의 일 실시예에 따른 컴퓨터 시스템이 수행할 수 있는 질병 예후 예측 방법의 예를 도시한 순서도이다.
도 2에 도시된 바와 같이, 프로세서(110)는 시퀀스 생성부(210), 학습 처리부(220), 및 예후 예측부(230)를 포함할 수 있다. 이러한 프로세서(110)의 구성요소들은 적어도 하나의 프로그램 코드에 의해 제공되는 제어 명령에 따라 프로세서(110)에 의해 수행되는 서로 다른 기능들(different functions)의 표현들일 수 있다. 예를 들어, 프로세서(110)가 시퀀스 데이터를 생성하도록 컴퓨터 시스템(100)을 제어하기 위해 동작하는 기능적 표현으로서 시퀀스 생성부(210)가 사용될 수 있다. 프로세서(110) 및 프로세서(110)의 구성요소들은 도 3의 질병 예후 예측 방법이 포함하는 단계들(S310 내지 S340)을 수행할 수 있다. 예를 들어, 프로세서(110) 및 프로세서(110)의 구성요소들은 메모리(120)가 포함하는 운영체제의 코드와 상술한 적어도 하나의 프로그램 코드에 따른 명령(instruction)을 실행하도록 구현될 수 있다. 여기서, 적어도 하나의 프로그램 코드는 질병 예후 예측 방법을 처리하기 위해 구현된 프로그램의 코드에 대응될 수 있다.
질병 예후 예측 방법은 도시된 순서대로 발생하지 않을 수 있으며, 단계들 중 일부가 생략되거나 추가의 과정이 더 포함될 수 있다.
단계(S310)에서 프로세서(110)는 질병 예후 예측 방법을 위한 프로그램 파일에 저장된 프로그램 코드를 메모리(120)에 로딩할 수 있다. 예를 들어, 질병 예후 예측 방법을 위한 프로그램 파일은 도 1을 통해 설명한 영구 저장 장치(130)에 저장되어 있을 수 있고, 프로세서(110)는 버스를 통해 영구 저장 장치(130)에 저장된 프로그램 파일로부터 프로그램 코드가 메모리(120)에 로딩되도록 컴퓨터 시스템(110)을 제어할 수 있다. 이때, 프로세서(110) 및 프로세서(110)가 포함하는 시퀀스 생성부(210), 학습 처리부(220), 및 예후 예측부(230) 각각은 메모리(120)에 로딩된 프로그램 코드 중 대응하는 부분의 명령을 실행하여 이후 단계들(S320 내지 S340)을 실행하기 위한 프로세서(110)의 서로 다른 기능적 표현들일 수 있다. 단계들(S320 내지 S340)의 실행을 위해, 프로세서(110) 및 프로세서(110)의 구성요소들은 직접 제어 명령에 따른 연산을 처리하거나 또는 컴퓨터 시스템(100)을 제어할 수 있다.
단계(S320)에서 시퀀스 생성부(210)는 환자 각각에 대하여 환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스 형태의 피처로 표현함으로써 해당 환자에 대한 시퀀스 데이터를 생성할 수 있다.
보다 구체적인 예로, 심혈관 질환과 뇌혈관 질환의 예후를 예측하기 위해 성인병 환자의 진단 데이터를 이용할 수 있다. 진단 데이터로는 환자의 질병과 증상 등을 분류하는 코드, 일례로 국제 통계 분류 10차 개정판인 ICD-10으로 표현된 진단 분류 코드를 이용할 수 있다.
환자의 진단 데이터로 사용되는 ICD-10 코드는 총 6,667개이며, 이들 코드 전체를 사용하거나 혹은 환자들에게서 일정 횟수 이상 나타나는 일부 코드들, 예를 들어 50번 이상 나타나는 2,777개의 코드들을 선택적으로 이용할 수 있다. 혹은 예측 질병과 관련 없는 진단 코드들은 사용하지 않음으로써 학습 효율성을 향상시킬 수 있다.
ICD-10 코드 세트 x와 질환 세트 y가 주어지면 환자의 진단 이력이 ICD-10 코드의 시퀀스로 정의될 수 있다.
[수학식 1]
d={x, y}={(x1, x2, x3, …, xm), y} s.t. x∈X, y∈Y
[수학식 2]
dk={xk, y}={(x(m-n)-k+1, …, xm -n), y}
여기서, m은 ICD-10 코드 시퀀스의 길이를 나타내고, xk는 x의 마지막 k-길이 시퀀스를 의미한다. 환자의 시퀀스 길이가 다양하고 최근 진단이 환자의 상태를 더 정확하게 특성화할 가능성이 있으므로 예후 예측에는 최근 마지막 k개의 ICD-10 코드(즉, k-길이 시퀀스)를 사용한다. 고위험군 질병 예후의 조기 예측을 위해 m-n (n>0) 까지의 코드를 이용하여 모델을 학습할 수도 있다.
진단 분류 코드가 고위험 질환 세트의 원소(element)가 된다면 해당 환자를 고위험 환자로 분류할 수 있다.
도 4는 환자의 진단 이력으로부터 ICD-10 시퀀스 데이터를 생성하는 과정의 예를 도시한 것이다.
심혈관 질환 세트 YH1 {I210, I211, I212}와 뇌혈관 질환 세트 YH2 {I610, I611, I615}가 주어지는 것으로 가정한다.
시퀀스 생성부(210)는 ICD-10 코드로 표현된 환자 별 진단 이력을 이용할 수 있으며 각 환자의 진단 이력을 나타내는 ICD-10 코드 시퀀스를 만들 수 있다. 이때, 시퀀스 생성부(210)는 환자 별로 각 환자가 가지고 있는 질환에 따라 적어도 하나의 데이터 인스턴스를 생성할 수 있다.
시퀀스 생성부(210)는 각 환자의 시퀀스 데이터에 해당 환자가 가지고 있는 질환을 나타내는 레이블을 포함시킬 수 있다. 예를 들어, 고위험 질환이 없는 경우 H0, 심혈관 질환의 경우 H1, 뇌혈관 질환의 경우 H2를 적용한다.
진단 이력으로 ICD-10 코드 세트 {I10, I100, M870, M870, End}를 가진 환자(401)의 경우 주어진 질환 세트(YH1, YH2)에 해당되는 코드가 없기 때문에 레이블 H0을 포함한 ICD-10 시퀀스 데이터를 생성할 수 있다.
진단 이력으로 ICD-10 코드 세트 {I10, I100, L659, K297, I210}를 가진 환자(402)의 경우 주어진 질환 세트(YH1, YH2) 중 심혈관 질환에 해당되는 코드 I210를 포함하고 있기 때문에 해당 코드 대신 심혈관 질환을 나타내는 레이블 H1로 대체한 ICD-10 시퀀스 데이터를 생성할 수 있다.
진단 이력으로 ICD-10 코드 세트 {I10, I212, E835, M480, I610}를 가진 환자(403)는 주어진 질환 세트(YH1, YH2) 중에서 심혈관 질환에 해당되는 코드 I212와 뇌혈관 질환에 해당되는 코드 I610을 포함하고 있다. 한 명의 환자가 두 가지 고위험 질환을 가지고 있다면 두 개의 데이터 인스턴스가 생성될 수 있다. 이 경우 심혈관 질환에 해당되는 코드 I212까지의 제1 코드 시퀀스, 뇌혈관 질환에 해당되는 코드 I610까지의 제2 코드 시퀀스를 생성하되, 제1 코드 시퀀스에서 코드 I212를 심혈관 질환을 나타내는 레이블 H1로 대체하고 제2 코드 시퀀스에서는 코드 I610를 뇌혈관 질환을 나타내는 레이블 H2로 대체할 수 있다.
다시 도 3에서, 단계(S330)에서 학습 처리부(220)는 단계(S320)에서 생성된 시퀀스 데이터에 대해 RNN을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성할 수 있다. 상세하게, 학습 처리부(220)는 RNN 모델을 이용하여 진단 분류 코드로 생성된 시퀀스 데이터를 실수 벡터로 표현할 수 있고 실수 벡터에 따른 질병 발생 확률을 계산할 수 있다. 이때, 학습 처리부(220)는 환자의 진단 이력을 나타내는 ICD-10 코드로부터 생성된 시퀀스 데이터를 RNN의 입력으로 하여 RNN에서 단어 시퀀스 학습을 통해 시퀀스 정보가 포함된 워드 벡터를 표현할 수 있으며 시퀀스 정보가 포함된 워드 벡터를 이용하여 고위험 질환 별 발생 확률을 계산할 수 있다.
시퀀스 데이터로 생성된 각 ICD-10 코드는 순차적으로 기 학습된 RNN의 입력으로 주어질 수 있으며, 이러한 순차 입력이 완료되면 RNN에서는 새로운 출력 실수 벡터 값이 생성되고 이에 따라 각 질환의 발생 확률이 산출되어 출력될 수 있다. 다시 말해, 학습 처리부(220)는 워드 벡터가 단어 시퀀스 정보를 표현할 수 있도록 RNN을 이용하여 ICD-10 코드로 표현된 환자의 진단 이력에 대한 시퀀스 학습을 먼저 진행한 후 RNN의 시퀀스 학습 결과를 이용하여 해당 환자의 고위험 질환 발생 확률을 계산할 수 있다.
단계(S340)에서 예후 예측부(230)는 환자의 진단 이력에 대하여 RNN 모델을 통해 출력된 질병 발생 확률에 기초하여 해당 환자의 질병 예후를 예측할 수 있다. 다시 말해, 예후 예측부(230)는 단계(S330)에서 생성된 학습데이터를 이용하여 환자의 질병 예후를 예측할 수 있다. 일례로, 예후 예측부(230)는 고위험 질환 별 발생 확률을 이용하여 해당 환자에 대하여 질환 별 예후 등급을 결정할 수 있다. 예를 들어, 각 환자의 질병을 발생 확률에 따른 등급 레이블로 정의할 수 있으며, 환자 A에 대하여 [성인병:0, 고위험군:1] 혹은 [심혈관 질환:1, 뇌혈관 질환:0] 등과 같이 발생 가능성이 있는 질환에 별도의 레이블을 부여할 수 있다. 다른 예로, 예후 예측부(230)는 고위험 질환 별 발생 확률을 이용하여 적어도 하나의 질병군으로 해당 환자를 분류할 수 있다. 또 다른 예로, 예후 예측부(230)는 고위험 질환 별 발생 확률에 따라 가장 높은 확률의 질환에 대한 알럿(alert)을 제공할 수 있다.
진단 이력을 나타내는 시퀀스 데이터로부터 예후를 예측하는 것은 단어 시퀀스로부터 텍스트를 분류하는 작업과 유사하다고 할 수 있다.
도 5는 본 발명의 일 실시예에 있어서 질병 예후 예측을 위한 RNN 모델 구조의 예를 도시한 것이다.
도 5에 도시한 바와 같이, 본 발명의 예후 예측을 위한 RNN(이하, 'PP-RNN'라 칭함)은 분산 표현(distributed representation)을 위한 임베딩 레이어(embedding layer)(501), 시퀀스 모델링을 위한 멀티 회귀 레이어(multiple recurrent layers)(502), 예후 분류를 위한 완전 연결 레이어(fully-connected layers)(503)로 구성될 수 있다.
RNN은 다른 신경망들과는 달리 시간 요인을 고려하여 시퀀스 데이터의 패턴을 명시적으로 학습하는 모델이다.
임베딩 레이어(501)는 ICD-10 코드를 실수 벡터로 변환한다. 임베딩 레이어(501)는 단어들을 다차원 실수 벡터로 표현하고 단어 간의 의미/구조 유사성을 두 벡터 간의 거리로 표현함으로써 분산 표현이 가능하다. 이러한 분산 표현은 코드의 의미를 특성화하고 신경 언어 모델에서와 같이 코드가 연산 동작에 의해 계산될 수 있도록 수용한다.
멀티 회귀 레이어(502)는 ICD-10 코드의 시퀀스 패턴을 모델링 할 수 있다. 멀티 회귀 레이어(502)는 시퀀스가 입력으로 주어지는 데이터로부터 패턴을 효과적으로 학습 가능한, 시간적 측면이 고려된 신경망 계층에 해당된다.
완전 연결 레이어(503)는 ICD-10 코드의 시퀀스를 실수 벡터로서 표현하며, 이때 실수 벡터는 소프트맥스 함수를 통해 질환의 발병 가능성을 계산하는데 사용될 수 있다.
[수학식 3]
Figure pat00001
[수학식 4]
Figure pat00002
여기서,
Figure pat00003
는 k-길이 시퀀스와 질환에 대해 PP-RNN에 의해 계산된 스코어 함수이고,
Figure pat00004
는 xk로부터 예측된 질환을 의미한다.
그리고, PP-RNN의 학습은 완전 연결 레이어(503), 멀티 회귀 레이어(502), 임베딩 레이어(501)를 통해 입력 피처 레이어(input feature layer)(500)로 예측 오차를 전파함으로써 E2E(end-to-end) 방식으로 진행될 수 있다.
본 발명에서는 시퀀스 학습에 적합한 RNN을 이용함으로써 진단 분류 코드를 워드 임베딩 방법을 기반으로 쉽게 벡터 값으로 표현할 수 있다.
본 발명의 PP-RNN 모델은 코드 시퀀스를 워드 벡터로 표현하는 워드 임베딩뿐만 아니라 임베딩된 워드 벡터로부터 고위험 질환의 분류를 가능하게 한 E2E 형태의 질병 예후 예측 모델을 제공할 수 있다.
PP-RNN은 둘 이상의 이종(heterogeneous) 데이터 피처들을 위해 다수의 RNN을 포함할 수 있으며, 긴 시퀀스에 의해 발생하는 배니싱 그라디언트 문제(vanishing gradient problem)를 방지하기 위해 RNN의 회귀 레이어(502)로 GRU(gated recurrent unit) , LSTM(long short-term memory) 등 변형된 RNN 모델들을 사용할 수 있다.
그리고, 본 발명에서는 다수의 RNN을 병합하기 위해 여러 방법을 적용할 수 있으며, 도 5에 도시한 바와 같이 회귀 레이어(502)의 출력 벡터들을 연결함으로써 이들을 병합할 수 있다.
본 발명에서는 진단 분류 코드의 시퀀스에 대해 오직 하나의 RNN 모델을 사용하는 것 이외에도, 추가적인 임상 이력의 시퀀스에 대해 다수의 RNN을 사용하는 것 또한 가능하다. 진단 이력과 관련된 진단 분류 코드를 포함하여 진단 시점의 시간이나 질병 기간, 치료 이력과 병리학적 측정 데이터 등을 추가적인 피처들로서 사용할 수 있으며, 각각의 피처에 대한 시퀀스를 각각의 개별 신경망을 이용하여 학습하고 이를 병합하여 질병 예후를 분류할 수 있다. 예를 들어, 진단 이력에 따른 진단 분류 코드 이외에 외래 환자, 입원 환자, 응급 환자의 세 개의 값으로 구분되는 환자의 유형을 추가적인 임상 피처로서 활용할 수 있다. 추가되는 피처 각각에 대하여 해당 데이터의 특성에 따라 RNN은 물론, FFNN(feedforward neural network)이나 CNN(convolutional neural network)과 같은 개별 신경망을 추가하여 학습할 수 있다.
본 발명에 따른 질병 예후 예측 시스템 및 방법에서 진단 이력과 관련된 진단 분류 코드와 함께 추가적인 다른 임상 피처를 이용하는 경우 질병 예후에 대한 보다 정확한 예측 결과를 제공할 수 있다.
이처럼 본 발명의 실시예들에 따르면, 진단 분류 코드를 단어 시퀀스 형태의 피처로 표현하고 RNN을 이용한 학습을 통해 고위험 예후를 예측할 수 있다. 따라서, 코드로 표현된 간단한 진단 이력만으로 보다 빠르고 정확하게 고위험 예후를 예측할 수 있으며 고위험 예후에 대한 신속한 경고를 제공할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 매체는 컴퓨터로 실행 가능한 프로그램을 계속 저장하거나, 실행 또는 다운로드를 위해 임시 저장하는 것일 수도 있다. 또한, 매체는 단일 또는 수 개의 하드웨어가 결합된 형태의 다양한 기록수단 또는 저장수단일 수 있는데, 어떤 컴퓨터 시스템에 직접 접속되는 매체에 한정되지 않고, 네트워크 상에 분산 존재하는 것일 수도 있다. 매체의 예시로는, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM 및 DVD와 같은 광기록 매체, 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical medium), 및 ROM, RAM, 플래시 메모리 등을 포함하여 프로그램 명령어가 저장되도록 구성된 것이 있을 수 있다. 또한, 다른 매체의 예시로, 어플리케이션을 유통하는 앱 스토어나 기타 다양한 소프트웨어를 공급 내지 유통하는 사이트, 서버 등에서 관리하는 기록매체 내지 저장매체도 들 수 있다.
매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (17)

  1. 컴퓨터로 구현되는 질병 예후 예측 방법에 있어서,
    환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하는 단계;
    상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하는 단계; 및
    상기 학습데이터를 이용하여 질병 예후를 예측하는 단계
    를 포함하는 질병 예후 예측 방법.
  2. 제1항에 있어서,
    상기 학습데이터를 생성하는 단계는,
    상기 시퀀스 데이터를 실수 벡터로 표현하여 상기 실수 벡터에 따른 질병 발생 확률을 계산하는 단계
    를 포함하는 질병 예후 예측 방법.
  3. 제1항에 있어서,
    상기 학습데이터를 생성하는 단계는,
    상기 시퀀스 데이터를 상기 RNN의 입력으로 하여 상기 RNN에서 단어 시퀀스 학습을 통해 시퀀스 정보가 포함된 워드 벡터를 표현하는 단계; 및
    상기 시퀀스 정보가 포함된 워드 벡터를 이용하여 질병 발생 확률을 계산하는 단계
    를 포함하는 질병 예후 예측 방법.
  4. 제1항에 있어서,
    상기 학습데이터를 생성하는 단계는,
    단어 시퀀스에 대한 분산 표현(distributed representation)을 위한 임베딩 레이어(embedding layer)와, 시퀀스 모델링을 위한 회귀 레이어(recurrent layers), 및 질병 예후 분류를 위한 완전 연결 레이어(fully-connected layers)로 구성된 RNN을 이용하는 것
    을 특징으로 하는 질병 예후 예측 방법.
  5. 제4항에 있어서,
    상기 RNN의 학습은 상기 완전 연결 레이어, 상기 회귀 레이어, 상기 임베딩 레이어를 통해 입력 피처 레이어(input feature layer)로 예측 오차를 전파함으로써 E2E(end-to-end) 방식으로 진행되는 것
    을 특징으로 하는 질병 예후 예측 방법.
  6. 제1항에 있어서,
    상기 시퀀스 데이터를 생성하는 단계는,
    상기 진단 분류 코드 중 최근 마지막 일정 개수의 코드를 이용하여 상기 시퀀스 데이터를 생성하는 것
    을 특징으로 하는 질병 예후 예측 방법.
  7. 제1항에 있어서,
    상기 시퀀스 데이터를 생성하는 단계는,
    상기 진단 분류 코드 중 주어진 질환에 해당되는 코드를 해당 질환의 레이블로 대체하는 것
    을 특징으로 하는 질병 예후 예측 방법.
  8. 제1항에 있어서,
    상기 시퀀스 데이터를 생성하는 단계는,
    상기 진단 분류 코드 중 주어진 질환에 해당되는 코드가 복수 개인 경우 각 질환에 대한 시퀀스 데이터를 생성하는 것
    을 특징으로 하는 질병 예후 예측 방법.
  9. 제1항에 있어서,
    상기 환자의 진단 시점의 시간 및 질병 기간, 치료 이력과 병리학적 측정 데이터 중 적어도 하나의 추가 임상 이력에 대한 시퀀스 데이터를 생성하는 단계
    를 더 포함하고,
    상기 학습데이터를 생성하는 단계는,
    상기 환자의 진단 이력과 상기 추가 임상 이력에 대해 해당 데이터의 특성에 따른 각각의 개별 신경망을 추가하여 학습하는 단계
    를 포함하는 질병 예후 예측 방법.
  10. 컴퓨터 시스템과 결합되어 질병 예후 예측 방법을 실행시키기 위해 컴퓨터 판독 가능한 기록 매체에 기록된 컴퓨터 프로그램에 있어서,
    상기 질병 예후 예측 방법은,
    환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하는 단계;
    상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하는 단계; 및
    상기 학습데이터를 이용하여 질병 예후를 예측하는 단계
    를 포함하는, 컴퓨터 프로그램.
  11. 컴퓨터로 구현되는 질병 예후 예측 시스템에 있어서,
    컴퓨터가 판독 가능한 명령을 실행하도록 구현되는 적어도 하나의 프로세서
    를 포함하고,
    상기 적어도 하나의 프로세서는,
    환자의 진단 이력을 나타내는 진단 분류 코드를 단어 시퀀스(sequence) 형태로 표현함으로써 시퀀스 데이터를 생성하고,
    상기 시퀀스 데이터에 대해 RNN(Recurrent Neural Networks)을 이용한 단어 시퀀스 학습을 통해 학습데이터를 생성하고,
    상기 학습데이터를 이용하여 질병 예후를 예측하는 것
    을 특징으로 하는 질병 예후 예측 시스템.
  12. 제11항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 학습데이터를 생성하기 위해,
    상기 시퀀스 데이터를 상기 RNN의 입력으로 하여 상기 RNN에서 단어 시퀀스 학습을 통해 시퀀스 정보가 포함된 워드 벡터를 표현하고,
    상기 시퀀스 정보가 포함된 워드 벡터를 이용하여 질병 발생 확률을 계산하는 것
    을 특징으로 하는 질병 예후 예측 시스템.
  13. 제11항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 학습데이터를 생성하기 위해,
    단어 시퀀스에 대한 분산 표현(distributed representation)을 위한 임베딩 레이어(embedding layer)와, 시퀀스 모델링을 위한 회귀 레이어(recurrent layers), 및 질병 예후 분류를 위한 완전 연결 레이어(fully-connected layers)로 구성된 RNN을 이용하는 것
    을 특징으로 하는 질병 예후 예측 시스템.
  14. 제13항에 있어서,
    상기 RNN의 학습은 상기 완전 연결 레이어, 상기 회귀 레이어, 상기 임베딩 레이어를 통해 입력 피처 레이어(input feature layer)로 예측 오차를 전파함으로써 E2E(end-to-end) 방식으로 진행되는 것
    을 특징으로 하는 질병 예후 예측 시스템.
  15. 제11항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 시퀀스 데이터를 생성하기 위해,
    상기 진단 분류 코드 중 최근 마지막 일정 개수의 코드를 이용하여 상기 시퀀스 데이터를 생성하는 것
    을 특징으로 하는 질병 예후 예측 시스템.
  16. 제11항에 있어서,
    상기 적어도 하나의 프로세서는, 상기 시퀀스 데이터를 생성하기 위해,
    상기 진단 분류 코드 중 주어진 질환에 해당되는 코드가 복수 개인 경우 각 질환에 대한 시퀀스 데이터를 생성하는 것
    을 특징으로 하는 질병 예후 예측 시스템.
  17. 제11항에 있어서,
    상기 적어도 하나의 프로세서는,
    상기 환자의 진단 시점의 시간 및 질병 기간, 치료 이력과 병리학적 측정 데이터 중 적어도 하나의 추가 임상 이력에 대한 시퀀스 데이터를 생성하고,
    상기 환자의 진단 이력과 상기 추가 임상 이력에 대해 해당 데이터의 특성에 따른 각각의 개별 신경망을 추가하여 학습하는 것
    을 특징으로 하는 질병 예후 예측 시스템.
KR1020160155771A 2016-11-22 2016-11-22 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템 KR101869438B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160155771A KR101869438B1 (ko) 2016-11-22 2016-11-22 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160155771A KR101869438B1 (ko) 2016-11-22 2016-11-22 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20180057300A true KR20180057300A (ko) 2018-05-30
KR101869438B1 KR101869438B1 (ko) 2018-06-20

Family

ID=62300499

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160155771A KR101869438B1 (ko) 2016-11-22 2016-11-22 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템

Country Status (1)

Country Link
KR (1) KR101869438B1 (ko)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109599177A (zh) * 2018-11-27 2019-04-09 华侨大学 一种基于病历的深度学习预测医疗轨迹的方法
KR102009758B1 (ko) * 2019-03-21 2019-10-21 한국과학기술정보연구원 바이오 시그널 가시화 시스템 및 유효 패턴 추출 방법
KR20200016451A (ko) * 2018-08-07 2020-02-17 한국과학기술원 유방 영상 보고 데이터 시스템을 이용한 딥 네트워크의 시각적 진단 해석 방법 및 시스템
KR20200027091A (ko) 2018-08-31 2020-03-12 주식회사 비플컨설팅 환자의 주증상과 진단 관계에 대하여 인공신경망 기법을 이용하여 유사성 정도를 추론하여 진단 사례를 추천하는 시스템
KR102088980B1 (ko) * 2019-04-19 2020-03-13 이정의 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
KR20200104828A (ko) * 2019-02-27 2020-09-04 울산과학기술원 데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법
WO2020242239A1 (ko) * 2019-05-29 2020-12-03 (주)제이엘케이 앙상블 학습 알고리즘을 이용한 인공지능 기반 진단 보조 시스템
CN112236829A (zh) * 2018-06-04 2021-01-15 第一百欧有限公司 一种支持双重类别的疾病诊断系统及其方法
CN112289442A (zh) * 2018-10-29 2021-01-29 南京医基云医疗数据研究院有限公司 预测疾病终点事件的方法、装置及电子设备
KR20210016667A (ko) * 2019-08-05 2021-02-17 엔터씨스 주식회사 학습 데이터 분석장치 및 이를 이용한 학습 지원방법
CN112435745A (zh) * 2020-12-18 2021-03-02 深圳赛安特技术服务有限公司 就诊策略推荐方法、装置、电子设备及存储介质
CN113517046A (zh) * 2021-04-15 2021-10-19 中南大学 一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质
CN113628703A (zh) * 2021-07-20 2021-11-09 慕贝尔汽车部件(太仓)有限公司 职业健康档案管理方法、系统和网络测服务端
WO2022097971A1 (ko) * 2020-11-04 2022-05-12 주식회사 온택트헬스 질병의 발생을 예측하기 위한 방법 및 장치
KR102435178B1 (ko) * 2021-09-16 2022-08-23 주식회사 온택트헬스 질병의 발생을 예측하기 위한 방법 및 장치

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102215269B1 (ko) * 2018-08-07 2021-02-15 주식회사 딥바이오 진단 결과 생성 시스템 및 방법
KR102501629B1 (ko) 2021-02-03 2023-02-17 김종명 심프텀의 히스토리 추적을 통한 희귀 질병 예측 시스템

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508556A (ja) * 2001-11-02 2005-03-31 シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド 患者の状態を診断し予測するための患者データマイニング
KR20070033340A (ko) * 2004-04-27 2007-03-26 휴마나 인코포레이티드 미래의 건강 상태를 예측하는데 조력하는 과거의 건강 관리이용의 자동화 추출 및 디스플레이를 위한 방법 및 시스템
US20150220833A1 (en) * 2014-01-31 2015-08-06 Google Inc. Generating vector representations of documents
JP2016134169A (ja) * 2015-01-19 2016-07-25 三星電子株式会社Samsung Electronics Co.,Ltd. 言語モデル学習方法及び装置、言語認識方法及び装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005508556A (ja) * 2001-11-02 2005-03-31 シーメンス メディカル ソリューションズ ユーエスエー インコーポレイテッド 患者の状態を診断し予測するための患者データマイニング
KR20070033340A (ko) * 2004-04-27 2007-03-26 휴마나 인코포레이티드 미래의 건강 상태를 예측하는데 조력하는 과거의 건강 관리이용의 자동화 추출 및 디스플레이를 위한 방법 및 시스템
US20150220833A1 (en) * 2014-01-31 2015-08-06 Google Inc. Generating vector representations of documents
JP2016134169A (ja) * 2015-01-19 2016-07-25 三星電子株式会社Samsung Electronics Co.,Ltd. 言語モデル学習方法及び装置、言語認識方法及び装置

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112236829A (zh) * 2018-06-04 2021-01-15 第一百欧有限公司 一种支持双重类别的疾病诊断系统及其方法
KR20200016451A (ko) * 2018-08-07 2020-02-17 한국과학기술원 유방 영상 보고 데이터 시스템을 이용한 딥 네트워크의 시각적 진단 해석 방법 및 시스템
KR20200027091A (ko) 2018-08-31 2020-03-12 주식회사 비플컨설팅 환자의 주증상과 진단 관계에 대하여 인공신경망 기법을 이용하여 유사성 정도를 추론하여 진단 사례를 추천하는 시스템
CN112289442B (zh) * 2018-10-29 2024-05-03 南京医基云医疗数据研究院有限公司 预测疾病终点事件的方法、装置及电子设备
CN112289442A (zh) * 2018-10-29 2021-01-29 南京医基云医疗数据研究院有限公司 预测疾病终点事件的方法、装置及电子设备
CN109599177A (zh) * 2018-11-27 2019-04-09 华侨大学 一种基于病历的深度学习预测医疗轨迹的方法
KR20200104828A (ko) * 2019-02-27 2020-09-04 울산과학기술원 데이터 연합 기반의 질병 진단 시스템 및 그 운용 방법
KR102009758B1 (ko) * 2019-03-21 2019-10-21 한국과학기술정보연구원 바이오 시그널 가시화 시스템 및 유효 패턴 추출 방법
KR102088980B1 (ko) * 2019-04-19 2020-03-13 이정의 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
WO2020213843A1 (ko) * 2019-04-19 2020-10-22 이정의 사용자 맞춤형 의료정보 제공 시스템 및 이의 구동방법
WO2020242239A1 (ko) * 2019-05-29 2020-12-03 (주)제이엘케이 앙상블 학습 알고리즘을 이용한 인공지능 기반 진단 보조 시스템
KR20210016667A (ko) * 2019-08-05 2021-02-17 엔터씨스 주식회사 학습 데이터 분석장치 및 이를 이용한 학습 지원방법
WO2022097971A1 (ko) * 2020-11-04 2022-05-12 주식회사 온택트헬스 질병의 발생을 예측하기 위한 방법 및 장치
CN112435745B (zh) * 2020-12-18 2024-04-05 深圳赛安特技术服务有限公司 就诊策略推荐方法、装置、电子设备及存储介质
CN112435745A (zh) * 2020-12-18 2021-03-02 深圳赛安特技术服务有限公司 就诊策略推荐方法、装置、电子设备及存储介质
CN113517046A (zh) * 2021-04-15 2021-10-19 中南大学 一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质
CN113517046B (zh) * 2021-04-15 2023-11-07 中南大学 一种电子病历中异构数据特征融合方法及基于融合特征的预测方法、系统及可读存储介质
CN113628703A (zh) * 2021-07-20 2021-11-09 慕贝尔汽车部件(太仓)有限公司 职业健康档案管理方法、系统和网络测服务端
CN113628703B (zh) * 2021-07-20 2024-03-29 慕贝尔汽车部件(太仓)有限公司 职业健康档案管理方法、系统和网络测服务端
KR102435178B1 (ko) * 2021-09-16 2022-08-23 주식회사 온택트헬스 질병의 발생을 예측하기 위한 방법 및 장치
KR20230040882A (ko) 2021-09-16 2023-03-23 주식회사 온택트헬스 질병의 발생을 예측하기 위한 방법 및 장치

Also Published As

Publication number Publication date
KR101869438B1 (ko) 2018-06-20

Similar Documents

Publication Publication Date Title
KR101869438B1 (ko) 딥 러닝을 이용하여 환자의 진단 이력으로부터 질병 예후를 예측하는 방법 및 시스템
KR102216689B1 (ko) 시계열 의료 데이터를 통한 질병 예후 예측을 위한 딥 뉴럴 네트워크의 분류 결과 시각화 방법 및 시스템
US10032114B2 (en) Predicting application performance on hardware accelerators
KR102225894B1 (ko) 딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템
US10956821B2 (en) Accurate temporal event predictive modeling
US11694109B2 (en) Data processing apparatus for accessing shared memory in processing structured data for modifying a parameter vector data structure
US20230316092A1 (en) Systems and methods for enhanced user specific predictions using machine learning techniques
CN109326353B (zh) 预测疾病终点事件的方法、装置及电子设备
US20130185231A1 (en) Predicting diagnosis of a patient
CN114008641A (zh) 使用超参数预测器提高自动机器学习模型选择的准确度
CN113196314B (zh) 适配预测模型
US20200241878A1 (en) Generating and providing proposed digital actions in high-dimensional action spaces using reinforcement learning models
CN111125529A (zh) 产品匹配方法、装置、计算机设备及存储介质
KR20200029425A (ko) 딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템
US20230042243A1 (en) System and method for early diagnostics and prognostics of mild cognitive impairment using hybrid machine learning
CN113646776A (zh) 在机器学习模型训练中使用滞后梯度
US20220344051A1 (en) System and method for diagnostics and prognostics of mild cognitive impairment using deep learning
US20210158909A1 (en) Precision cohort analytics for public health management
US20220122736A1 (en) Machine learning techniques for generating hybrid risk scores
KR102561799B1 (ko) 디바이스에서 딥러닝 모델의 레이턴시를 예측하는 방법 및 시스템
Mishra et al. A decision support system in healthcare prediction
JP7235246B2 (ja) 情報処理装置、方法、プログラム、icチップ及び学習済モデル
US20200104234A1 (en) Event log processing
US20200175045A1 (en) Data curation on predictive data modelling platform
US20240005155A1 (en) Superclass-conditional gaussian mixture model for personalized prediction on dialysis events

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right