KR20220157330A - 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치 - Google Patents

머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치 Download PDF

Info

Publication number
KR20220157330A
KR20220157330A KR1020220081035A KR20220081035A KR20220157330A KR 20220157330 A KR20220157330 A KR 20220157330A KR 1020220081035 A KR1020220081035 A KR 1020220081035A KR 20220081035 A KR20220081035 A KR 20220081035A KR 20220157330 A KR20220157330 A KR 20220157330A
Authority
KR
South Korea
Prior art keywords
dementia
incubation period
period
medical record
record information
Prior art date
Application number
KR1020220081035A
Other languages
English (en)
Inventor
전홍우
임수진
권이남
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020220081035A priority Critical patent/KR20220157330A/ko
Publication of KR20220157330A publication Critical patent/KR20220157330A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/40Detecting, measuring or recording for evaluating the nervous system
    • A61B5/4076Diagnosing or monitoring particular conditions of the nervous system
    • A61B5/4088Diagnosing of monitoring cognitive diseases, e.g. Alzheimer, prion diseases or dementia
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Neurology (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Neurosurgery (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Child & Adolescent Psychology (AREA)
  • Developmental Disabilities (AREA)
  • Hospice & Palliative Care (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Psychology (AREA)
  • Mathematical Physics (AREA)
  • Physiology (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Molecular Biology (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

본 발명의 일 실시예에 따른 컴퓨팅 장치에 의해 수행되는 방법은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 서로 다른 잠복기별 학습 데이터를 생성하는 단계, 상기 잠복기별 학습 데이터 각각을 이용한 기계 학습을 수행하여 잠복기별 치매 예측 모델을 생성하는 단계, 및 사용자의 의료기록 정보를 상기 잠복기별 치매 예측 모델 각각에 입력하여, 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 단계를 포함한다.

Description

머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치{METHOD FOR PREDICTING DEMENTIA BY INCUBATION PERIOD BASED ON MACHINE LEARNING AND APPARATUS IMPLEMENTING THE SAME METHOD}
본 발명은 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치에 관한 것으로서, 보다 자세하게는, 기계 학습 알고리즘을 이용하여 치매를 조기에 예측하기 위한 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치에 관한 것이다.
치매(Dementia)는 그 자체가 하나의 질환을 의미하는 것은 아니고, 여러가지 원인에 의한 뇌손상에 의해 기억력을 위시한 여러 인지기능의 장애가 생겨 예전 수준의 일상생활을 유지할 수 없는 상태를 의미하는 포괄적인 용어이다.
치매의 원인 질환은 매우 다양하고, 그 중 주요 원인 질환으로 알츠하이머병, 혈관성 치매, 그리고 루이체 치매가 있다. 알츠하이머병은 가장 흔히 발생되는 치매의 원인으로, 전체 원인의 약 50%를 차지하고, 뇌졸증 후에 발생하는 혈관성 치매는 약 10-15%. 알츠하이머별과 혈관성 치매가 동시 발생하는 경우는 약 15% 정도로 알려져 있다.
치매의 정확한 진단을 위해서는 자기 공명 영상(MRI)이나 양전자 방출 단층 촬영 검사(PET), 신경 인지 심리 검사 등의 진단 방법 등이 사용되고 있다.
최근 고령화 추세에 따라 노인성 질환 중 하나인 치매 환자의 수가 빠르게 증가되고 있어 하나의 사회적인 문제가 되고 있으나, 아직까지 완전한 치료 방법은 없고 여러 가지 약품을 이용하여 치매의 진행을 늦추도록 하는 것이 일반적인 치료 방법이다.
또한, 치매는 초기 단계에서 진단을 받아 약품을 이용한 치료를 진행했을 때 비교적 높은 치료 효과를 보이므로, 치매의 조기 예측 및 조기 진단은 치매 증상의 완화에 결정적인 역할을 하고, 사회적인 비용 또한 줄일 수 있다.
최근 치매를 예측하기 위해, 개인의 과거 수년간의 의료기록 데이터를 이용하여 통계적 모델 또는 인공지능 알고리즘을 통해 분석 및 예측하는 방법들이 사용되고 있다.
그러나. 이와 같이 과거 수년간의 의료기록 데이터를 이용한 방법의 경우 예컨대 1년 후, 3년 후 등과 같이 가까운 미래의 치매 가능성을 예측하기 어려운 문제점이 있다.
따라서, 치매를 조기 예측함에 있어, 먼 미래 뿐만 아니라 가까운 미래의 치매 발생 가능성을 예측할 수 있는 기술이 요구된다. 또한, 먼 미래와 가까운 미래의 치매 발생에 영향을 미치는 위험 인자를 도출하여 치매 증상을 조기에 예방할 수 있는 방법이 필요하다.
등록특허공보 제10-1881731호(2018.07.19. 등록)
본 발명이 해결하고자 하는 기술적 과제는, 머신 러닝 기반으로 의료기록 정보를 이용하여 먼 미래 및 가까운 미래의 치매 발생 가능성을 예측할 수 있는 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 다른 기술적 과제는, 먼 미래와 가까운 미래의 치매 발생 가능성을 예측 시, 서로 다른 잠복기별로 치매 발생에 영향을 미치는 각각의 치매 위험 인자를 제공할 수 있는 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치를 제공하는 것이다.
본 발명이 해결하고자 하는 또 다른 기술적 과제는, 먼 미래와 가까운 미래의 치매 발생 가능성을 예측 시, 잠복기별로 공통된 치매 위험 인자의 분포 변화를 분석하여 각각의 치매 위험 인자의 영향도를 평가할 수 있는 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치를 제공하는 것이다.
본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시의 기술분야에서의 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 컴퓨팅 장치에 의해 수행되는 방법은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 서로 다른 잠복기별 학습 데이터를 생성하는 단계, 상기 잠복기별 학습 데이터 각각을 이용한 기계 학습을 수행하여 잠복기별 치매 예측 모델을 생성하는 단계, 및 사용자의 의료기록 정보를 상기 잠복기별 치매 예측 모델 각각에 입력하여, 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 단계를 포함한다.
일 실시예로서, 상기 서로 다른 잠복기별 학습 데이터를 생성하는 단계는, 상기 의료기록 정보 중 기준 시점에 진단된 기록을 이용하여 분류된 상기 치매 군 및 상기 정상 군의 의료기록 정보를 획득하는 단계, 및 상기 기준 시점으로부터 서로 다른 과거 시점까지의 상기 의료기록 정보를 이용하여 상기 잠복기별 학습 데이터를 생성하는 단계를 포함할 수 있다.
일 실시예로서, 상기 의료기록 정보 중 기준 시점에 진단된 기록을 이용하여 분류된 상기 치매 군 및 상기 정상 군의 의료기록 정보를 획득하는 단계는, 상기 의료기록 정보에 포함되어 있는 복수의 질병 분류 코드 중 치매에 해당하는 분류 코드의 존재 여부에 따라 상기 치매 군 및 상기 정상 군을 분류하는 단계를 포함하고, 상기 치매에 해당하는 분류 코드는, 상기 복수의 질병 분류 코드 중 기 설정된 일부의 분류 코드를 포함할 수 있다.
일 실시예로서, 상기 서로 다른 잠복기별 학습 데이터를 생성하는 단계는, 상기 의료기록 정보 중 약물 처방일수를 이용하여 질병의 중증도 레벨을 결정하는 단계를 포함할 수 있다.
일 실시예로서, 상기 중증도 레벨은, 급성 및 만성 질환인 경우 각각에 대해 상기 약물 처방일수의 서로 다른 기준을 이용하여 분류될 수 있다.
일 실시예로서, 상기 서로 다른 잠복기별 학습 데이터를 생성하는 단계는, 상기 의료기록 정보를 이용하여 복수의 피처들(features)을 생성하는 단계, 상기 복수의 피처들(features) 중 소정 기준에 따라 잠복기별 피처 그룹을 선정하는 단계, 및 상기 선정된 잠복기별 피처 그룹에 기반한 학습 데이터를 구성하는 단계를 포함할 수 있다.
일 실시예로서, 상기 복수의 피처들(features) 중 소정 기준에 따라 잠복기별 피처 그룹을 선정하는 단계는, 피처 선택 알고리즘을 이용하여 상기 잠복기별로 서로 다른 피처 그룹을 선정하는 단계를 포함하고, 상기 피처 선택 알고리즘은, 전진 선택(Forward Selection), 후방 제거(Backward Elimination), 및 단계별 선택(Stepwise Selection) 방식 중 어느 하나에 기반한 것일 수 있다.
일 실시예로서, 상기 피처 선택 알고리즘을 이용하여 상기 잠복기별로 서로 다른 피처 그룹을 선정하는 단계는, 상기 피처 선택 알고리즘의 수행 결과 획득되는 유의확률 값(p-value)에 기반하여 상기 잠복기별 피처 그룹에 포함될 피처를 결정하는 단계를 포함할 수 있다.
일 실시예로서, 상기 잠복기별 치매 예측 모델은, 상기 잠복기별 학습 데이터 각각을 이용하여 서로 다른 기계 학습 알고리즘에 기반한 기계 학습을 수행하여 생성되는 복수의 모델 중 성능 수치가 임계치 이상인 모델로 선정된 것일 수 있다.
일 실시예로서, 상기 서로 다른 기계 학습 알고리즘은, 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 및 다층 퍼셉트론(MLP: MultiLayer Perceptron)을 포함할 수 있다.
일 실시예로서, 상기 잠복기별 치매 예측 모델의 생성 시 산출되는 피처 중요도(feature importance)에 기초하여 상기 잠복기별 치매 위험 인자를 결정하는 단계, 및 상기 결정된 잠복기별 치매 위험 인자를 이용하여 상기 잠복기별로 상이한 치매 위험 인자를 식별하는 단계를 더 포함할 수 있다.
일 실시예로서, 상기 잠복기별 치매 예측 모델의 생성 시 산출되는 피처 중요도(feature importance)에 기초하여 상기 잠복기별 치매 위험 인자를 결정하는 단계, 및 상기 결정된 잠복기별 치매 위험 인자를 이용하여 상기 잠복기별로 공통으로 발견되는 치매 위험 인자를 식별하는 단계를 더 포함할 수 있다.
일 실시예로서, 상기 잠복기별로 질병의 중증도 레벨에 따른 상기 공통 치매 위험 인자의 분포를 산출하는 단계, 및 상기 잠복기별로 산출되는 상기 공통 치매 위험 인자의 분포 변화에 기초하여 상기 공통 치매 위험 인자의 영향도를 평가하는 단계를 더 포함할 수 있고, 상기 질병의 중증도 레벨은, 상기 의료기록 정보 중 약물 처방일수를 이용하여 결정된 것일 수 있다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 컴퓨터 판독 가능한 비일시적 기록 매체는, 컴퓨터로 하여금 상기 방법을 수행하도록 하는 컴퓨터 프로그램이 저장된 것이다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 컴퓨팅 장치에 의해 수행되는 방법은, 사용자의 의료기록 정보를 잠복기별 치매 예측 모델 각각에 입력하는 단계, 및 상기 잠복기별 치매 예측 모델 각각으로부터 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 단계를 포함하고, 상기 잠복기별 치매 예측 모델은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성된 서로 다른 잠복기별 학습 데이터를 이용한 기계 학습을 수행하여 생성된 것이다.
일 실시예로서, 상기 잠복기별 치매 예측 모델은, 최근 1년, 최근 3년, 및 최근 5년에 해당하는 잠복기별 학습 데이터를 이용한 기계 학습을 통해 1년 후, 3년 후, 및 5년 후에 해당하는 각 기간별로 생성될 수 있다.
일 실시예로서, 상기 잠복기별 치매 예측 모델에 기초하여 상기 잠복기별로 상이한 제1 치매 위험 인자 및 상기 잠복기별로 공통으로 발견되는 제2 치매 위험 인자를 식별하는 단계를 더 포함할 수 있다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 잠복기별 치매 예측 장치는, 외부 서버와 통신하는 통신부, 상기 외부 서버로부터 수집된 치매 군 및 정상 군의 의료기록 정보를 이용하여 서로 다른 잠복기별 학습 데이터를 생성하고, 상기 잠복기별 학습 데이터 각각을 이용한 기계 학습을 수행하여 잠복기별 치매 예측 모델을 생성하는 학습부, 및 사용자의 의료기록 정보를 상기 잠복기별 치매 예측 모델 각각에 입력하여, 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 예측부를 포함한다.
상기 기술적 과제를 해결하기 위한, 본 발명의 일 실시예에 따른 잠복기별 치매 예측 장치는, 하나 이상의 프로세서, 외부장치와 통신하는 통신 인터페이스, 상기 프로세서에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리, 및 상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되, 상기 컴퓨터 프로그램은, 사용자의 의료기록 정보를 잠복기별 치매 예측 모델 각각에 입력하는 동작, 및 상기 잠복기별 치매 예측 모델 각각으로부터 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 동작을 수행하기 위한 인스트럭션들(instructions)을 포함하고, 상기 잠복기별 치매 예측 모델은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성된 서로 다른 잠복기별 학습 데이터를 이용한 기계 학습을 수행하여 생성된 것이다.
도 1은 본 발명의 실시예에 따른 개념도이다.
도 2는 본 발명의 일 실시예에 따른 잠복기별 치매 예측 장치의 구성을 도시한 블록도이다.
도 3은 본 발명의 다른 실시예에 따른 잠복기별 치매 예측 장치의 구성을 도시한 블록도이다.
도 4 내지 도 6은 본 발명의 다른 실시예에 따른 잠복기별 치매 예측 방법을 설명하기 위한 순서도이다.
도 7은 본 발명의 몇몇 실시예에 따른 치매 군 및 정상 군의 의료기록 정보를 이용하여 잠복기별 학습 데이터를 생성하는 예이다.
도 8은 본 발명의 몇몇 실시예에 따른 학습 데이터의 생성 과정을 도시한 예이다.
도 9는 본 발명의 몇몇 실시예에 따른 학습 데이터를 구성하는 피처들을 보여주는 예이다.
도 10은 본 발명의 몇몇 실시예에 따른 질병 분류 코드를 이용하여 새로운 피처를 생성하는 예이다.
도 11은 본 발명의 몇몇 실시예에 따른 질병의 중증도 분류 방법을 도시한 예이다.
도 12는 본 발명의 몇몇 실시예에 따른 치매 예측 모델의 입력 변수로 사용될 최적의 피처 그룹을 선정하는 방식을 보여주는 예이다.
도 13은 본 발명의 몇몇 실시예에 따른 피처 선택 알고리즘에 따라 선정된 잠복기별 피처의 수를 보여주는 예이다.
도 14 내지 도 16은 본 발명의 몇몇 실시예에 따른 피처 선택 알고리즘에 따라 최적의 피처 그룹이 선정되는 방식을 시각적으로 보여주는 예이다.
도 17 및 도 18은 본 발명의 몇몇 실시예에 따른 잠복기별 치매 예측 모델의 평가를 위해 다양한 성능 수치를 참조하는 예이다.
도 19는 본 발명의 몇몇 실시예에 따른 치매 예측 모델에 기초하여 잠복기별 치매 위험 인자를 결정하는 예이다.
도 20은 본 발명의 몇몇 실시예에 따른 치매 예측 모델에 기초하여 기존 연구들에 의해 알려지지 않은 새로운 치매 위험 인자를 제공하는 예이다.
도 21 및 도 22는 본 발명의 몇몇 실시예에 따른 잠복기별 상이한 치매 위험 인자 및 공통인 치매 위험 인자를 식별하는 예이다.
도 23 및 도 24는 본 발명의 몇몇 실시예에 따른 잠복기별로 공통인 치매 위험 인자의 분포 변화를 도시한 예이다.
도 25는 본 발명의 몇몇 실시예에 따른 방법들을 구현할 수 있는 예시적인 컴퓨팅 장치의 하드웨어 구성도이다.
이하, 첨부된 도면을 참조하여 본 개시의 바람직한 실시 예들을 상세히 설명한다. 본 개시의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 개시의 기술적 사상은 이하의 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 이하의 실시예들은 본 개시의 기술적 사상을 완전하도록 하고, 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 본 개시의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 개시의 기술적 사상은 청구항의 범주에 의해 정의될 뿐이다.
각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 개시를 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있다. 또 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다. 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 개시를 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다.
또한, 본 개시의 구성 요소를 설명하는 데 있어서, 제1, 제2, A, B, (a), (b) 등의 용어를 사용할 수 있다. 이러한 용어는 그 구성 요소를 다른 구성 요소와 구별하기 위한 것일 뿐, 그 용어에 의해 해당 구성 요소의 본질이나 차례 또는 순서 등이 한정되지 않는다. 어떤 구성 요소가 다른 구성요소에 "연결", "결합" 또는 "접속"된다고 기재된 경우, 그 구성 요소는 그 다른 구성요소에 직접적으로 연결되거나 또는 접속될 수 있지만, 각 구성 요소 사이에 또 다른 구성 요소가 "연결", "결합" 또는 "접속"될 수도 있다고 이해되어야 할 것이다.
명세서에서 사용되는 "포함한다 (comprises)" 및/또는 "포함하는 (comprising)"은 언급된 구성 요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성 요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.
이하, 본 개시의 몇몇 실시예들에 대하여 첨부된 도면에 따라 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 개념도이다. 도 1을 참조하면, 본 발명의 실시예에 따른 치매 예측 장치(1)는 서로 다른 잠복기별 학습 데이터(21, 22, 23)를 이용하여 기계 학습(3)을 수행함에 의해 생성되는 잠복기별 치매 예측 모델(31, 32, 33)로부터 잠복기별 치매 예측 정보(5)를 출력할 수 있다.
도시된 예에서, 잠복기별 학습 데이터(21, 22, 23)는 기준 시점에 진단된 기록을 이용하여 분류된 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성되고, 서로 다른 과거 시점까지의 기간에 해당하는 제1 잠복기, 제2 잠복기, 및 제3 잠복기 동안의 의료기록 정보를 이용하여 생성될 수 있다. 일 실시예로서, 제1 잠복기, 제2 잠복기, 및 제3 잠복기가 각각 1년, 3년, 5년에 해당하는 기간으로 설정되는 경우, 잠복기별 학습 데이터(21, 22, 23)는 기준 시점으로부터 최근 1년, 3년, 및 5년 동안의 의료기록 정보를 이용하여 생성될 수 있다. 여기서, 제1 잠복기, 제2 잠복기, 및 제3 잠복기의 설정은 본 실시예에 의해 한정되지 않고, 데이터를 수집 가능한 기간이나 분석 요구 사항에 따라 다양한 기간으로 설정될 수 있다.
이와 같이 생성된 잠복기별 학습 데이터(21, 22, 23) 각각을 이용하여 기계 학습 알고리즘(3)을 학습함에 의해 잠복기별 치매 예측 모델(31, 32, 33)이 생성될 수 있다.
이 때, 잠복기별 학습 데이터(21, 22, 23)를 생성하기 위해 사용되는 의료기록 정보는, 외부 서버로부터 수집되는 건강보험 관련 자격 정보와 진료 정보를 포함할 수 있다. 건강보험 관련 자격 정보는 예컨대 인구사회학적 정보, 사회 경제적 수준 및 기타 정보, 사망 관련 정보, 건강 보장 유형 등을 포함하고, 진료 정보는 예컨대 의료기관 이용 정보, 요양 급여 비용, 진료과목, 진료 상병 정보, 진료, 처치, 수술 등의 급여 내역, 치료 재료 등 상세 진료 내역, 의약품 처방 내역 들을 포함할 수 있다.
치매 예측을 위해, 입력 정보(4)로서 사용자의 의료기록 정보가 잠복기별 치매 예측 모델(31, 32, 33)에 입력되면, 잠복기별 치매 예측 모델(31, 32, 33)을 이용하여 예측 결과가 생성되고, 예측 결과로서 잠복기별 치매 예측 정보(5)가 출력될 수 있다.
상기와 같은 본 발명의 실시예에 따라, 머신 러닝 기반으로 개인의 의료기록 정보를 이용하여 먼 미래 및 가까운 미래의 치매 발생 가능성을 예측할 수 있다.
도 2는 본 발명의 일 실시예에 따른 잠복기별 치매 예측 장치의 구성을 도시한 블록도이다. 도 2를 참조하면, 본 발명의 실시예에 따른 잠복기별 치매 예측 장치(1)는 학습부(11) 및 예측부(12)를 포함하고, 외부 서버(20), 및 사용자 단말(10)과 네트워크를 통해 연결될 수 있다. 잠복기별 치매 예측 장치(1)는 사용자 단말(10)로부터 수신되는 잠복기별 치매 예측을 위한 기계 학습 모델의 생성 및 분석 요청을 처리하여, 그 결과를 제공한다.
외부 서버(20)는 건강보험 관련 자격 정보와 진료 정보를 포함하는 의료기록 정보를 제공하는 서버로 구현되고, 잠복기별 치매 예측 장치(1)는 외부 서버(20)로부터 제공되는 의료기록 정보를 수집하여 잠복기별 학습 데이터(21, 22, 23)를 구성할 수 있다. 이 때, 잠복기별 학습 데이터(21, 22, 23)를 구성하기 위해 사용되는 의료기록 정보는, 기준 시점에 진단된 기록을 이용하여 치매 군 또는 정상 군으로 분류된 개인의 의료기록 정보를 포함하고, 기준 시점으로부터 과거 1년 전, 3년 전, 및 5년 전에 해당하는 각각의 잠복기별 의료기록 데이터를 포함할 수 있다.
학습부(11)는 수집 모듈(111), 전처리 모듈(112), 및 학습 모듈(113)로 구성되고, 이 중 수집 모듈(111)은 외부 서버(20)로부터 제공되는 의료기록 정보를 수집하여 잠복기별 학습 데이터(21, 22, 23)를 구성하고, 이를 데이터베이스에 저장한다.
전처리 모듈(112)은 수집 모듈(111)에 의해 데이터베이스에 저장된 잠복기별 학습 데이터(21, 22, 23)를 읽어 오고, 잠복기별 학습 데이터(21, 22, 23)를 기계 학습이 가능한 형태로 변환한다. 일 실시예로서, 전처리 모듈(112)은 잠복기별 학습 데이터(21, 22, 23)를 기계 학습이 가능하도록 벡터 형식의 데이터로 변환한다. 이 때, 벡터 형식의 데이터로 변환하기 위한 텍스트 임베딩(Text Embedding) 작업이 수행될 수 있다. 텍스트 임베딩 모델로서, 예컨대 Word2Vec, FastText, Glove, Sent2Vec, 및 Elmo 등 단어 또는 문장 기반의 모델이 적용될 수 있다.
학습 모듈(113)은 전처리 모듈(112)에서 전처리가 완료된 잠복기별 학습 데이터(21, 22, 23)를 이용하여 기계 학습(3)을 수행하고, 이로부터 잠복기별 치매 예측 모델(31, 32, 33)을 생성한다. 이 때, 학습을 위해 사용되는 기계 학습 알고리즘으로서 예컨대 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 및 다층 퍼셉트론(MLP: MultiLayer Perceptron) 등이 사용될 수 있다. 여기서는 일반적으로 성능이 우수한 것으로 알려진 기계 학습 알고리즘을 기재하였으나, 본 실시예에 의해 한정되지 않고 다양한 종류의 기계 학습 알고리즘이 선택적으로 사용될 수 있다.
예측부(12)는 입력 모듈(121), 전처리 모듈(122), 및 예측 모듈(123)로 구성되고, 사용자 단말(10)로부터 입력되거나 외부 장치로부터 제공되는 예측 대상 데이터를 이용하여 잠복기별 치매 예측 결과를 출력한다.
입력 모듈(121)에서는 사용자 단말(10) 또는 외부 장치로부터 제공되는 예측 대상 데이터가 입력된다. 이 때, 예측 대상 데이터는, 개인의 의료기록 정보를 포함하고, 예컨대 과거에 치매 진단을 받은 기록이 없는 사람의 최근 2년간의 진료 기록 및 건강보험 관련 자격 정보를 포함할 수 있다.
전처리 모듈(122)은 입력 모듈(121)에서 입력된 예측 대상 데이터를 기계 학습 모델 기반으로 예측이 가능한 형태로 변환한다. 이 때, 예측 대상 데이터의 변환 과정은 학습부(11)의 전처리 모듈(112)에서 수행되는 과정과 동일하다.
일 실시예로서, 전처리 모듈(122)는 입력된 의료기록 정보를 기계 학습 모델 기반으로 예측이 가능한 형태인 벡터 형식의 데이터로 변환 및 정규화(normalize) 작업을 수행할 수 있다.
예측 모듈(123)은 학습 모듈(113)에서 생성된 잠복기별 치매 예측 모델(31, 32, 33)을 로드하고, 로드 된 잠복기별 치매 예측 모델(31, 32, 33)을 이용하여 예측 대상 데이터로서 입력된 사용자의 의료기록 정보에 대한 잠복기별 치매 예측 결과를 생성한다.
또한, 예측 모듈(123)은 학습 모듈(113)에서 생성된 잠복기별 치매 예측 모델(31, 32, 33)의 성능 수치를 로드 한다. 여기서, 잠복기별 치매 예측 모델(31, 32, 33)의 성능 수치는, 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1 스코어, AUC(Area Under Curve), 정밀도-재현율 커브(Precision-Recall Curve) 등을 포함할 수 있다.
상기와 같은 본 발명의 실시예에 따른 잠복기별 치매 예측 장치(1)는 잠복기별 치매 예측을 위한 학습 과정 및 예측 과정을 모두 수행하는 장치로 구현될 수 있다. 이에 따라, 잠복기별 치매 예측 장치(1)는 서로 다른 잠복기별로 높은 성능을 나타내는 예측 모델을 생성하고, 이를 통해 먼 미래 및 가까운 미래의 치매 발생 가능성을 예측할 수 있다.
도 3은 본 발명의 다른 실시예에 따른 잠복기별 치매 예측 장치의 구성을 도시한 블록도이다. 도 3을 참조하면, 본 발명의 실시예에 따른 잠복기별 치매 예측 장치(7)는 예측부(12)를 포함하고, 네트워크를 통해 서버(6)와 연결된다. 서버(6)는 학습부(11)를 포함하고, 외부 서버(20)와 네트워크를 통해 연결될 수 있다.
도시된 예에서, 서버(6)는 기계 학습을 통해 잠복기별 치매 예측 모델(31, 32, 33)을 생성하는 학습부(11)의 구성을 포함하고, 잠복기별 치매 예측 장치(7)는 서버(6)에서 생성된 잠복기별 치매 예측 모델(31, 32, 33)을 이용하여 입력되는 예측 대상 데이터에 대한 예측 결과를 생성하는 예측부(12)의 구성을 포함한다. 이 때, 서버(6)에 포함된 학습부(11)와 잠복기별 치매 예측 장치(7)에 포함된 예측부(12)는 도 2에 도시된 잠복기별 치매 예측 장치(1)에 포함된 학습부(11)와 예측부(12)에 각각 대응하는 구성이므로, 각 구성이 수행하는 동작에 대한 구체적인 설명은 생략하도록 한다.
서버(6)는 잠복기별 치매 예측을 위한 모델을 생성하는 동작을 수행한다. 서버(6)는 외부 서버(20)로부터 제공되는 의료기록 정보를 수집하여 잠복기별 학습 데이터(21, 22, 23)를 구성하고, 이를 이용하여 기계 학습을 수행함에 의해 잠복기별 치매 예측 모델(31, 32, 33)을 생성한다.
잠복기별 치매 예측 장치(7)는 사용자로부터 입력되는 잠복기별 치매 예측을 위한 분석 요청을 처리하고, 그 결과를 화면을 통해 제공한다.
일 실시예로서, 잠복기별 치매 예측 장치(7)는 잠복기별 치매 예측을 위한 모델의 생성 요청을 서버(6)로 전송하고, 서버(6)에서 생성되는 잠복기별 치매 예측 모델(31, 32, 33)에 관한 정보를 제공받을 수 있다. 잠복기별 치매 예측 장치(7)는 서버(6)로부터 제공된 잠복기별 치매 예측 모델(31, 32, 33)을 이용하여 사용자로부터 입력되는 예측 대상 데이터에 대한 잠복기별 치매 예측 결과를 생성하고, 이를 화면에 표시할 수 있다. 이 때, 사용자로부터 입력되는 예측 대상 데이터는, 개인의 의료기록 정보를 포함하고, 예컨대 과거에 치매 진단을 받은 기록이 없는 사람의 최근 2년간의 진료 기록 및 건강보험 관련 자격 정보를 포함할 수 있다.
상기와 같은 본 발명의 실시예에 따른 잠복기별 치매 예측 장치(7)는 잠복기별 치매 예측을 위한 예측 과정만을 수행하고, 예측을 위한 모델을 생성하는 학습 과정은 별도의 서버(6)를 통해 수행될 수 있다. 이에 따라, 잠복기별 치매 예측을 위한 학습 과정 및 예측 과정이 서로 다른 장치에서 수행되므로, 먼 미래 및 가까운 미래의 치매 발생 가능성을 예측함에 있어 지연되는 시간 없이 높은 성능으로 예측 결과를 제공해줄 수 있다.
도 4 내지 도 6은 본 발명의 다른 실시예에 따른 잠복기별 치매 예측 방법을 설명하기 위한 순서도이다. 도 4 및 도 5의 실시예에 따른 잠복기별 치매 예측 방법은 컴퓨팅 장치(100)에 의하여 실행될 수 있고, 예컨대 잠복기별 치매 예측 장치(1)에 의해 실행될 수 있다. 또한, 도 6의 실시예에 따른 잠복기별 치매 예측 방법은 컴퓨팅 장치(100)에 의하여 실행될 수 있고, 예컨대 잠복기별 치매 예측 장치(7)에 의해 실행될 수 있다.
본 실시예에 따른 방법을 실행하는 상기 컴퓨팅 장치(100)는 응용 프로그램 실행 환경을 구비한 컴퓨팅 장치일 수 있다. 본 실시예에 따른 방법에 포함되는 일부 동작의 수행 주체에 대한 기재가 생략될 수 있으며, 그러한 경우 그 주체는 상기 컴퓨팅 장치(100)임을 유의한다.
도 4 및 도 5를 참조하면, 먼저, 동작 S41에서, 치매 군 및 정상 군의 의료기록 정보를 이용하여 서로 다른 잠복기별 학습 데이터가 생성된다.
일 실시예로서, 동작 S41은, 의료기록 정보 중 기준 시점에 진단된 기록을 이용하여 분류된 치매 군 및 정상 군의 의료기록 정보가 획득되는 동작 S411과, 기준 시점으로부터 서로 다른 과거 시점까지의 의료기록 정보를 이용하여 잠복기별 학습 데이터가 생성되는 동작 S412를 포함할 수 있다. 예로서, 잠복기별 학습 데이터는 기준 시점에 치매 또는 정상으로 진단된 개인의 최근 1년, 최근 3년, 및 최근 5년에 해당하는 각 기간별 의료기록 데이터를 이용하여 생성될 수 있다.
일 실시예로서, 잠복기별 학습 데이터는, 기 설정된 전제 조건을 충족하고, 소정의 관찰 기간 동안 수집된 의료기록 데이터를 이용하여 생성될 수 있다. 예로서, 기 설정된 전제 조건으로서, 의료기록 데이터의 수집 기간 동안 치매 진단을 받은 기록이 없고, 매년 한 번 이상의 진료 기록이 있는 사람의 의료기록 데이터를 대상으로 하고, 기준 시점으로부터 최근 1년, 최근 3년, 및 최근 5년에 해당하는 각 기간별 의료기록 데이터 중 1년 전, 3년 전, 및 5년 전 시점을 기준으로 2년 동안 관찰된 데이터를 대상으로 할 수 있다.
일 실시예로서, 동작 S411은, 의료기록 정보에 포함되어 있는 복수의 질병 분류 코드 중 치매에 해당하는 분류 코드의 존재 여부에 따라 치매 군 및 정상 군을 분류하는 동작을 포함할 수 있다. 이 때, 치매에 해당하는 분류 코드는, 복수의 질병 분류 코드 중 기 설정된 일부의 분류 코드를 포함할 수 있다.
일 실시예로서, 동작 S41은, 의료기록 정보 중 약물 처방일수를 이용하여 질병의 중증도 레벨이 결정되는 동작을 포함할 수 있고, 이 때 중증도 레벨은, 급성 및 만성 질환인 경우 각각에 대해 약물 처방일수의 서로 다른 기준을 이용하여 분류될 수 있다.
일 실시예로서, 동작 S41은, 의료기록 정보를 이용하여 복수의 피처들(features)이 생성되는 동작, 및 복수의 피처들(features) 중 소정 기준에 따라 잠복기별 피처 그룹이 선정되는 동작, 및 선정된 잠복기별 피처 그룹에 기반한 학습 데이터가 구성되는 동작을 포함할 수 있다.
여기서, 잠복기별 피처 그룹이 선정되는 동작은, 피처 선택 알고리즘을 이용하여 잠복기별로 서로 다른 피처 그룹이 선정되는 동작을 포함할 수 있다. 이 때, 피처 선택 알고리즘은, 전진 선택(Forward Selection), 후방 제거(Backward Elimination), 및 단계별 선택(Stepwise Selection) 방식 중 어느 하나에 기반한 것일 수 있다.
또한, 잠복기별 피처 그룹에 포함되는 각각의 피처는, 피처 선택 알고리즘의 수행 결과 획득되는 유의확률 값(p-value)에 기반하여 결정될 수 있다.
다음으로, 동작 S42에서, 잠복기별 학습 데이터 각각을 이용한 기계 학습을 수행하여 잠복기별 치매 예측 모델이 생성된다. 예로서, 최근 1년, 최근 3년, 최근 5년에 해당하는 각 기간별 학습 데이터를 이용한 기계 학습을 통해 1년 후, 3년 후, 및 5년 후에 해당하는 각 기간별 치매 예측 모델이 생성될 수 있다.
여기서, 잠복기별 치매 예측 모델은, 잠복기별 학습 데이터 각각을 이용하여 서로 다른 기계 학습 알고리즘에 기반한 기계 학습을 수행하여 생성되는 복수의 모델 중 성능 수치가 임계치 이상인 모델로 선정될 수 있다. 이 때, 서로 다른 기계 학습 알고리즘은, 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 및 다층 퍼셉트론(MLP: MultiLayer Perceptron)을 포함할 수 있다. 여기서는 일반적으로 성능이 우수한 것으로 알려진 기계 학습 알고리즘을 기재하였으나, 본 실시예에 의해 한정되지 않고 다양한 종류의 기계 학습 알고리즘이 선택적으로 사용될 수 있다. 예로서, 결정 트리 기반의 알고리즘으로서, 앞서 기재한 알고리즘 외에도 에이다부스트(AdaBoost: Adaptive Boosting), 배깅(Bagging), 의사결정트리(Decision Tree), 더미(Dummy), ExtraTrees(Extreme Randomized Trees), HistGradientBoosting 등이 사용될 수 있다.
마지막으로, 동작 S43에서, 사용자의 의료기록 정보를 잠복기별 치매 예측 모델 각각에 입력하여, 사용자의 잠복기별 치매 예측 정보가 출력된다. 이 때, 잠복기별 치매 예측 모델로부터 출력되는 잠복기별 치매 예측 정보는, 잠복기별로 사용자의 치매 발생 가능성을 예측하는 확률 값을 포함하고, 확률 값이 임계치 이상인지 여부에 따라 치매 또는 정상 여부를 예측한 결과를 포함할 수 있다.
일 실시예로서, 상기 방법은, 잠복기별 치매 예측 모델의 생성 시 산출되는 피처 중요도(feature importance)에 기초하여 잠복기별 치매 위험 인자를 결정하는 동작, 및 결정된 잠복기별 치매 위험 인자를 이용하여 상기 잠복기별로 상이한 치매 위험 인자를 식별하는 동작을 더 포함할 수 있다.
여기서, 피처 중요도(feature importance)는, 잠복기별 치매 예측 모델로부터 출력되는 치매 예측 정보에서, 치매 발생 가능성을 예측하는 확률 값의 계산에 어떤 피처가 얼마나 중요하게 작용했는지 그 정도를 나타내는 것으로, 이로부터 치매에 영향을 미치는 치매 위험 인자를 파악할 수 있다.
일 실시예로서, 상기 방법은, 결정된 잠복기별 치매 위험 인자를 이용하여 잠복기별로 공통으로 발견되는 치매 위험 인자를 식별하는 동작을 더 포함할 수 있다. 이 때, 잠복기별로 질병의 중증도 레벨에 따른 공통 치매 위험 인자의 분포를 산출하는 동작과, 잠복기별로 산출되는 공통 치매 위험 인자의 분포 변화에 기초하여 공통 치매 위험 인자의 영향도를 평가하는 동작을 더 포함할 수 있다.
도 6을 참조하면, 먼저, 동작 S61에서, 사용자의 의료기록 정보가 잠복기별 치매 예측 모델 각각에 입력된다. 이 때, 사용자의 의료기록 정보는, 건강보험 관련 자격 정보와 진료 정보를 포함할 수 있다. 건강보험 관련 자격 정보는 예컨대 인구사회학적 정보, 사회 경제적 수준 및 기타 정보, 사망 관련 정보, 건강 보장 유형 등을 포함하고, 진료 정보는 예컨대 의료기관 이용 정보, 요양 급여 비용, 진료과목, 진료 상병 정보, 진료, 처치, 수술 등의 급여 내역, 치료 재료 등 상세 진료 내역, 의약품 처방 내역 들을 포함할 수 있다.
다음으로, 동작 S62에서, 잠복기별 치매 예측 모델 각각으로부터 상기 사용자의 잠복기별 치매 예측 정보를 출력된다. 여기서, 잠복기별 치매 예측 모델은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성된 서로 다른 잠복기별 학습 데이터를 이용한 기계 학습을 수행하여 생성된 것이다.
일 실시예로서, 잠복기별 치매 예측 모델은, 최근 1년, 최근 3년, 및 최근 5년에 해당하는 잠복기별 학습 데이터를 이용한 기계 학습을 통해 1년 후, 3년 후, 및 5년 후에 해당하는 각 기간별로 생성될 수 있다.
일 실시예로서, 잠복기별 치매 예측 모델에 기초하여 잠복기별로 상이한 제1 치매 위험 인자와, 잠복기별로 공통으로 발견되는 제2 치매 위험 인자를 식별하는 동작을 더 포함할 수 있다.
상기와 같은 본 발명의 실시예에 의하면, 머신 러닝 기반으로 의료기록 정보를 이용하여 먼 미래 및 가까운 미래의 치매 발생 가능성을 예측할 수 있다. 또한, 먼 미래와 가까운 미래의 치매 발생 가능성을 예측 시, 서로 다른 잠복기별로 치매 발생에 영향을 미치는 각각의 치매 위험 인자를 제공할 수 있다.
도 7은 본 발명의 몇몇 실시예에 따른 치매 군 및 정상 군의 의료기록 정보를 이용하여 잠복기별 학습 데이터를 생성하는 예이다. 도 7을 참조하면, 잠복기별 치매 예측 모델(31, 32, 33)을 생성하기 위해 사용되는 잠복기별 학습 데이터(71, 73, 75)를 구성하는 예를 보여준다.
도시된 표에서, 잠복기별 학습 데이터(71, 73, 75)는 2007년부터 2013년까지의 기간 동안 수집된 의료기록 데이터 중 2013년에 치매 또는 정상으로 진단되어 치매 군(701) 또는 정상 군(702)으로 분류된 데이터를 대상으로 한다. 이 때, 제1 잠복기의 제1 학습 데이터(71)는 진단된 2013년을 기준으로 1년 전 시점에 2년 동안 관찰된 의료기록 데이터를 포함할 수 있다. 즉, 제1 잠복기의 제1 학습 데이터(71)는 2011년과 2012년에 수집된 치매 군(701)과 정상 군(702)의 의료기록 데이터를 포함할 수 있다.
마찬가지로, 제2 잠복기의 제2 학습 데이터(73)는 진단된 2013년을 기준으로 3년 전 시점인 2010년에 2년 동안 관찰된 의료기록 데이터로서, 2009년과 2010년에 수집된 치매 군(701)과 정상 군(702)의 의료기록 데이터를 포함할 수 있다. 또한, 제3 잠복기의 제3 학습 데이터(75)는 진단된 2013년을 기준으로 5년 전 시점인 2008년에 2년 동안 관찰된 의료기록 데이터로서, 2007년과 2008년에 수집된 치매 군(701)과 정상 군(702)의 의료기록 데이터를 포함할 수 있다.
도 8은 본 발명의 몇몇 실시예에 따른 학습 데이터의 생성 과정을 도시한 예이다. 도 8을 참조하면, 잠복기별 학습 데이터(21, 22, 23)를 생성하기 위해, 의료기록 정보(80)가 저장되어 있는 데이터베이스로부터 자격 DB(801)과 진료 DB(802)가 추출된다. 예로서, 의료기록 정보(80)는 국민건강보험 DB에 저장되어 있는 정보이고, 이 중 기준 연도에 건강보험 및 의료급여 자격을 유지하고 있는 만 60세 이상의 노인의 자격 정보와 진료 정보가 추출될 수 있다.
도 9를 참조하면, 자격 DB(801)는 성별, 연령, 거주지역, 가입자 구분, 소득 분위, 교육수준 구분, 및 장애 중등도 구분 등 건강보험 자격 관련 데이터(91)를 포함하고, 진료 DB(802)는 주상병 및 부상병 등의 질병 정보(92), 조제투여일자와 총처방일수 등의 처방 정보(93), 질병 중증도 레벨(94), 및 질환 진단 피처(95) 등 진료 관련 데이터를 포함할 수 있다. 일 실시예로서, 질환 진단 피처(95)는 기 분류되어 있는 총 215개의 질병 변수를 포함할 수 있다.
다음으로, 자격 DB(801)와 진료 DB(802)에 저장된 데이터를 이용하여 기준 연도에 치매 진단 여부에 따라 치매 군 또는 정상 군으로 분류된 개인의 의료기록 데이터가 수집(81)된다. 이 때, 치매 진단 여부는 진료 DB(802)에 저장되어 있는 개인의 질병 분류 코드 중 치매에 해당하는 분류 코드의 존재 여부에 따라 치매 군 또는 정상 군으로 분류될 수 있다. 예로서, 치매에 해당하는 분류 코드는, 한국표준질병사인분류(KCD, Korean Standard Classification of Diseases)에 포함된 복수의 분류 코드 중 알츠하이머병, 혈관성 치매, 기타 질환 관련 치매 등과 관련된 약 25개의 코드로 사용되고 있다.
이 때, 수집된 의료기록 데이터 중에서 필수 전제 조건을 충족하고, 소정의 관찰 기간 동안 수집된 의료기록 데이터가 추출(82)될 수 있다. 예로서, 필수 전제 조건으로서, 의료기록 데이터의 수집 대상 기간 동안 치매 진단을 받은 기록이 없고, 매년 한 번 이상의 진료 기록이 있는 사람의 의료기록 데이터를 대상으로 하고, 치매 진단이 이루어진 기준 연도로부터 1년 전, 3년 전, 및 5년 전 시점을 기준으로 2년 동안 관찰된 데이터를 대상으로 할 수 있다.
다음으로, 수집된 의료기록 데이터로부터, 질병 분류 코드를 이용하여 피처가 생성(83)될 수 있다. 도 10의 예에서, 진료 DB(802)는 환자의 주상병 및 부상병 데이터를 포함하고, 주상병 및 부상병 각각은 해당되는 질병 분류 코드로 기록될 수 있다. 예로서, 한국표준질병사인분류(KCD, Korean Standard Classification of Diseases)는 22개의 대분류 코드와 263개의 중분류 코드 등으로 분류되어 있는데, 정신 및 행동 장애 질환과 관련된 대분류 코드(1001)인 'F00'-'F99'는 복수 개의 중분류 코드(1002)로 구분되어 있다. 이 때, 정신 및 행동 장애 질환과 관련된 중분류 코드(1002)를 새로운 피처로 생성하여 잠복기별 학습 데이터(21, 22, 23)에 포함시킬 수 있다.
다음으로, 수집된 의료기록 데이터로부터, 질병 분류 코드별로 약물 처방일수를 계산(84)하고, 이를 이용하여 질병의 중증도 레벨을 분류(85)함에 의해 질병 중증도와 관련한 새로운 피처를 생성할 수 있다.
도 11의 예에서, 질병 중증도 레벨의 분류를 위한 샘플 데이터(1101)로서, 최초 내원일자 및 조제투여일자에 따른 주상병 코드, 부상병 코드, 및 총처방일수 데이터를 사용할 수 있다. 이 때, 주상병 코드 및 부상병 코드는 중분류 코드를 이용하여 수정(1102)되고, 각각의 중분류 코드별로 총처방일수가 계산(1103)될 수 있다. 이에 따라, 중분류 코드별 총처방일수를 이용하여 예컨대 무증상, 경증, 중증, 및 위증과 같이 질병의 중증도 레벨이 분류(1004)될 수 있다. 이 때, 질병의 중증도 레벨(1104)은 질병이 급성인 경우와 만성인 경우 각각에 대해 서로 다른 처방일수의 기준을 적용하여 분류될 수 있다.
다음으로, 잠복기별 학습 데이터(21, 22, 23)에 포함될 최적의 피처 그룹이 소정 기준에 따라 선정(86)될 수 있다. 도 12의 예에서, 의료기록 정보로부터 추출되거나 새롭게 생성한 복수의 피처들(all features)(1201) 중 피처 선택 알고리즘(1202)에 따라 최적의 피처 그룹이 선정(1203)될 수 있다. 피처 선택 알고리즘(1202)은 머신 러닝 기반으로 가장 좋은 성능을 보여줄 수 있는 피처들의 조합을 추출하는 것으로, 전진 선택(Forward Selection), 후방 제거(Backward Elimination), 및 단계별 선택(Stepwise Selection) 방식으로 구현될 수 있고, 이 중 하나의 방식을 이용하여 잠복기별로 서로 다른 피처 그룹이 선정될 수 있다. 이 때, 피처 선택 알고리즘의 수행 결과 획득되는 유의확률 값(p-value)이 기 설정된 유의 수준보다 작은 경우의 피처만 피처 그룹에 포함될 수 있다.
일 실시예로서, 도 13을 참조하면, 피처 선택 알고리즘(1202)을 통해 세 가지 방식(131) 각각을 이용하여 선정된 각각의 피처들의 합집합을 최적의 피처 그룹(1203)으로 선정하고, 선정된 최적의 피처 그룹(1203)에 포함된 피처들을 최종 사용 피처로서 사용할 수 있다. 예로서, 잠복기 1년(132)에 해당하는 학습 데이터에 포함될 피처를 선정함에 있어, 전진 선택(Forward Selection), 후방 제거(Backward Elimination), 및 단계별 선택(Stepwise Selection) 방식 각각을 이용하여 선정된 각각의 피처의 수가 32개, 38개, 36개인 경우, 최종적으로 사용하는 피처는 각각의 방식에 의해 선정된 피처들의 합집합으로 구성되는 39개의 피처로 선정될 수 있다. 마찬가지로, 잠복기 3년(133) 및 잠복기 5년(134)에 해당하는 학습 데이터에 사용될 피처를 선정 시, 최종적으로 사용하는 피처는 세 가지 방식 각각에 의해 선정된 피처들의 합집합으로 구성되는 32개 및 25개의 피처로 선정될 수 있다.
도 14 내지 도 16을 참조하면, 피처 선택 알고리즘(1202)에 따라 최적의 피처 그룹에 포함될 피처들이 선택되는 방식을 그래프 형태로 보여주고 있다. 도 14의 예에서, 잠복기가 1년, 3년, 및 5년에 해당하는 각각의 학습 데이터에 포함된 복수의 피처들 중 전진 선택(Forward Selection) 방식을 이용하여 최적의 성능을 나타내는 피처들이 선정될 수 있다. 이 때, 피처가 없는 상태로 시작하여 중요도가 높은 피처들이 하나씩 추가되고, 더 이상 성능의 향상이 없을 때까지 이러한 과정을 반복함에 의해 최종적으로 최적의 성능을 나타내는 피처들의 조합이 선정될 수 있다.
도 15의 예에서는 잠복기가 1년, 3년, 및 5년에 해당하는 각각의 학습 데이터에 포함된 복수의 피처들 중 후방 제거(Backward Elimination) 방식을 이용하여 최적의 성능을 나타내는 피처들이 선정될 수 있다. 이 때, 모든 피처들이 포함된 상태로 시작하여 중요도가 낮은 피처들이 하나씩 제거되고, 더 이상 성능의 향상이 없을 때까지 이러한 과정을 반복함에 의해 최종적으로 최적의 성능을 나타내는 피처들의 조합이 선정될 수 있다.
도 16의 예에서는 잠복기가 1년, 3년, 및 5년에 해당하는 각각의 학습 데이터에 포함된 복수의 피처들 중 단계별 선택(Stepwise Selection) 방식을 이용하여 최적의 성능을 나타내는 피처들이 선정될 수 있다. 단계별 선택 방식은 전진 선택 방식과 후방 제거 방식을 결합하여 사용하는 방식으로, 피처가 없는 상태로 시작하여 중요도가 높은 피처의 추가 및 중요도가 낮은 피처의 삭제가 반복되고, 더 이상 성능의 향상이 없을 때까지 이러한 과정을 반복함에 의해 최종적으로 최적의 성능을 나타내는 피처들의 조합이 선정될 수 있다.
도 17 및 도 18은 본 발명의 몇몇 실시예에 따른 잠복기별 치매 예측 모델의 평가를 위해 다양한 성능 수치를 참조하는 예이다. 도 17을 참조하면, 잠복기가 1년, 3년, 5년에 해당하는 각각의 치매 예측 모델의 생성 시, 잠복기별로 복수의 기계학습 알고리즘을 통해 복수의 모델을 생성하고, 잠복기별로 생성된 복수의 모델 중 성능 수치가 가장 높은 모델이 잠복기별 최종 모델로 선택될 수 있다. 예로서, 도시된 표에서는, 잠복기별로 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 및 다층 퍼셉트론(MLP: MultiLayer Perceptron) 알고리즘을 이용한 각각의 모델을 생성하고, 잠복기별로 세 개의 모델 간 성능을 비교하기 위해 다양한 성능 수치를 제공하였다.모델의 성능 수치는, 각 모델의 생성 시 산출되는 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1 스코어, AUC(Area Under Curve), 정밀도-재현율 커브(Precision-Recall Curve) 등을 포함하고, 각각의 성능 수치가 임계치 이상이거나, 복수의 성능 수치 중 일부가 임계치 이상인 경우 최종 모델로 선택될 수 있다.
일 실시예로서, 다양한 성능 수치들 중 F1 스코어와 AUC(Area Under Curve)가 주요 평가 지표로 사용될 수 있다. AUC(Area Under Curve)는 모든 임계 값에서의 모델의 성능을 보여주는 그래프인 ROC Curve(Receiver Operation Characteristic Curve)의 아래 면적을 의미하는 지표이다. F1 스코어는 정밀도(Precision)와 재현율(Recall)을 모두 고려한 지표로서, 이 두 값을 조화 평균 내어 계산하되 두 값이 한쪽으로 치우치지 않도록 분류 결정 임계값(threshold)를 조정하여 결정될 수 있다. 이와 같이 계산되는 F1 스코어는 정밀도(Precision)와 재현율(Recall)을 이용하여 계산되므로, 정상을 치매라고 잘못 분류하거나 치매를 정상으로 잘못 분류하는 경우가 모두 고려된 지표로서 의미 있는 지표이다.
도시된 표에서 잠복기별 복수의 모델의 다양한 성능 수치들을 살펴보면, 잠복기가 1년, 3년, 5년인 모델 순으로 좋은 예측 성능을 보이고 있으며, 모든 잠복기 모델에서 랜덤 포레스트 알고리즘을 사용하였을 때 최고의 FI 스코어를 가짐을 알 수 있다. 또한, 먼 미래를 예측하기 위한 잠복기 5년 모델의 경우 랜덤 포레스트 알고리즘을 사용하였을 때 AUC는 0.8176, F1은 0.7738로 비교적 높은 성능을 보이고 있음을 알 수 있다. 즉, 치매를 예측하기 위해 5~6년 전 의료 기록 데이터를 사용하여도 높은 정확도로 예측이 가능함을 알 수 있다.
도 18의 예에서는, 잠복기가 1년, 3년, 5년인 학습 데이터를 이용하여 랜덤 포레스트 알고리즘을 통해 생성된 모델의 성능 수치를 보여주고 있다. 여기서, 잠복기가 1년, 3년, 5년에 해당하는 각각의 모델의 성능을 보여주는 F1 스코어가 모두 임계치 이상의 높은 값을 가지므로, 잠복기별 최종 치매 예측 모델로 선택될 수 있다.
도 19는 본 발명의 몇몇 실시예에 따른 치매 예측 모델에 기초하여 잠복기별 치매 위험 인자를 결정하는 예이다. 도 19를 참조하면, 잠복기별 치매 예측 모델의 생성 시 산출되는 피처 중요도(feature importance)에 기초하여 잠복기별로 치매 발생에 중요한 영향을 미치는 치매 위험 인자가 결정될 수 있다. 피처 중요도는, 잠복기별 치매 예측 모델로부터 출력되는 치매 예측 정보에서, 치매 발생 가능성을 예측하는 확률 값의 계산에 어떤 피처가 얼마나 중요하게 작용했는지 그 정도를 나타내는 것으로, 이로부터 치매 발생에 영향을 미치는 치매 위험 인자를 파악할 수 있다.
일 실시예로서, 잠복기별 치매 예측 모델의 피처 중요도를 산출하기 위해, 예컨대 순열 피처 중요도(permutation feature importance)가 사용될 수 있다. 순열 피처 중요도(permutation feature importance)는 모델에 특정 피처를 사용하지 않았을 때 이것이 성능 손실에 얼마만큼의 영향을 주는 지를 측정하여 해당 피처의 중요도를 파악할 수 있는 방법이다.
도시된 표에서, 잠복기 1년, 3년, 5년에 해당하는 각각의 치매 예측 모델에 기초하여 복수의 피처들 중 잠복기별로 피처 중요도가 높은 피처를 잠복기별 치매 위험 인자로 제시하였다. 이 때, 잠복기별 치매 애측 모델의 생성 시 랜덤 포레스트 알고리즘을 사용하였고, 각각의 잠복기별로 치매 위험 인자와 그 순위를 제공하였다. 각각의 치매 위험 인자 앞쪽에 표시된 괄호 안의 숫자는 치매 위험 인자의 순위를 의미하고, 순위가 높을수록, 즉 1에 가까울수록 중요도가 높은 피처로 판단될 수 있다.
도시된 표를 살펴보면, 잠복기가 1년에서 5년으로 갈수록 추출되는 치매 위험 인자의 수가 줄어드는 것을 알 수 있다. 이는 치매 판정을 받은 해에 가까워질수록 이상 증상이 많아 위험 요인이 많지만, 먼 미래일수록 비교적 이상 증상이 적어 의미 있는 피처가 줄어드는 것으로 해석될 수 있다.
일 실시예로서, 도 20에서는, 도 19에서 결정된 잠복기별 치매 위험 인자들 중 기존 연구들에 의해 알려져 있지 않고 새롭게 발견된 치매 위험 인자를 제공하였다. 이 때, 기존 연구에 의해 알려져 있는 위험 인자인지 여부는, 개체명 인식(NER: Named Entity Recognition) 방식을 활용하여, 의학 및 보건 관련 검색 엔진인 PubMed에 업로드 되어 있는 전체 논문을 대상으로 치매에 해당하는 용어(예컨대 'Dementia', 'Alzheimer' 등)와 도 19의 표에서 제공된 치매 위험 인자가 동일 문장 혹은 동일 단락에 함께 등장하는 지를 필터링하여 확인할 수 있다.
상기와 같이 본 발명의 실시예에 의하면, 잠복기별 치매 예측 모델을 이용하여 잠복기별로 치매를 유발할 수 있는 새로운 위험 인자를 발견함에 의해 치매의 조기 진단에 기여할 수 있다.
일 실시예로서, 도 21을 참조하면, 도 19에서 결정된 잠복기 1년에 해당하는 치매 위험 인자들과 잠복기 5년에 해당하는 치매 위엄 인자들 중 서로 상이한 치매 위험 인자들이 식별될 수 있다. 이는, 잠복기별로 치매 예측을 위한 기준이 서로 다르다는 것을 의미하므로, 시기에 맞게 유의해야 하는 치매 위험 인자와 순위를 파악하여 적절한 치료를 하도록 유도할 수 있다.
또한, 도 22를 참조하면, 도 19에서 결정된 잠복기 1년에 해당하는 치매 위험 인자들과 잠복기 5년에 해당하는 치매 위엄 인자들 중 공통으로 발견되는 치매 위험 인자들이 식별될 수 있다.
도 23 및 도 24는 본 발명의 몇몇 실시예에 따른 잠복기별로 공통인 치매 위험 인자의 분포 변화를 도시한 예이다. 도 23 및 도 24를 참조하면, 잠복기별로 공통으로 발견되는 공통 치매 위험 인자들 각각에 대해 잠복기에 따른 중증도 레벨 별 분포 변화를 분석하여, 각각의 치매 위험 인자의 영향도를 평가할 수 있다.
일 실시예로서, 잠복기 1년과 잠복기 5년에 대한 공통 치매 위험 인자 중 질병 인자만을 선택하여 질병 중증도 분류 알고리즘을 적용할 수 있다.
도 23의 예에서, 만성 질환에 해당하는 공통 치매 위험 인자로서, 증상성을 포함하는 기질성 정신장애, 급성 상기도 감염, 대사 장애, 수정체의 장애, 결막의 장애, 기분(정도) 장애 등이 식별되었다. 이 때, 공통 치매 위험 인자가 '증상성을 포함하는 기질성 정신장애'와 '기분(정동) 장애'질환인 경우, 잠복기 5년 시점에 비해 잠복기 1년 시점에 경증, 중증, 위증 환자가 증가하는 분포를 보여주고, '대사 장애' 질환의 경우 경증 환자만 증가하는 분포를 보여주고 있다. 반면, 공통 치매 위험 인자가 '급성 상기도 감염', '수정체의 장애', 및 '결막의 장애'질환인 경우, 무증상 환자가 증가하는 분포를 보여주고 있다.
도 24의 예에서는, 급성 질환에 해당하는 공통 치매 위험 인자로서, 뇌성마비 및 기타 마비증후군, 정신활성 물질의 사용에 의한 정신 및 행동장애, 이감염증, 진드기증 및 기타 감염 등이 식별되었다. 이 때, 급성 질환에 해당하는 모든 공통 치매 위험 인자에 있어, 잠복기 5년 시점에 비해 잠복기 1년 시점에 경증 및 중증 환자가 미세하게 증가하는 분포를 보여주고 있다. 이는, 급성 질환의 경우 만성 질환과 다르게 증상의 불편함이 심해져서 급히 증상을 제거하는 경우가 대부분이므로, 만성 질환처럼 증상과 약물의 이용이 다양하지 않아 분포의 변화 역시 미미하게 나타나는 것으로 볼 수 있다.
즉, 도 23 및 도 24의 예에서, 중증도 분류 알고리즘을 통해 만성 질환에 해당하는 뇌성마비 및 기타 마비 증후군이 가장 급격한 분포 변화가 일어나는 위험 인자임을 알 수 있고, 급성 질환 중에서도 치매로 이어질 수 있는 위험 인자들을 발견해낼 수 있다.
상기와 같은 본 발명의 실시예에 따라, 잠복기별로 공통으로 발견되는 공통 치매 위험 인자들 각각에 대해 잠복기에 따른 중증도 레벨 별 분포 변화를 분석하여, 각각의 치매 위험 인자의 영향도를 평가할 수 있다.
도 25는 본 발명의 몇몇 실시예에 따른 방법들을 구현할 수 있는 예시적인 컴퓨팅 장치의 하드웨어 구성도이다. 도 25에 도시된 바와 같이, 컴퓨팅 장치(100)는 하나 이상의 프로세서(101), 버스(107), 네트워크 인터페이스(102), 프로세서(101)에 의하여 수행되는 컴퓨터 프로그램(105)을 로드(load)하는 메모리(103)와, 컴퓨터 프로그램(105)를 저장하는 스토리지(104)를 포함할 수 있다. 다만, 도 25에는 본 발명의 실시예와 관련 있는 구성요소들 만이 도시되어 있다. 따라서, 본 발명이 속한 기술분야의 통상의 기술자라면 도 25에 도시된 구성요소들 외에 다른 범용적인 구성 요소들이 더 포함될 수 있음을 알 수 있다.
프로세서(101)는 컴퓨팅 장치(100)의 각 구성의 전반적인 동작을 제어한다. 프로세서(101)는 CPU(Central Processing Unit), MPU(Micro Processor Unit), MCU(Micro Controller Unit), GPU(Graphic Processing Unit) 또는 본 발명의 기술 분야에 잘 알려진 임의의 형태의 프로세서 중 적어도 하나를 포함하여 구성될 수 있다. 또한, 프로세서(101)는 본 발명의 다양한 실시예들에 따른 방법/동작을 실행하기 위한 적어도 하나의 애플리케이션 또는 프로그램에 대한 연산을 수행할 수 있다. 컴퓨팅 장치(100)는 하나 이상의 프로세서를 구비할 수 있다.
메모리(103)는 각종 데이터, 명령 및/또는 정보를 저장한다. 메모리(103)는 본 발명의 다양한 실시예들에 따른 방법/동작들을 실행하기 위하여 스토리지(104)로부터 하나 이상의 프로그램(105)을 로드(load) 할 수 있다. 예를 들어, 컴퓨터 프로그램(105)이 메모리(103)에 로드 되면, 로직(또는 모듈)이 메모리(103) 상에 구현될 수 있다. 메모리(103)의 예시는 RAM이 될 수 있으나, 이에 한정되는 것은 아니다.
버스(107)는 컴퓨팅 장치(100)의 구성 요소 간 통신 기능을 제공한다. 버스(107)는 주소 버스(Address Bus), 데이터 버스(Data Bus) 및 제어 버스(Control Bus) 등 다양한 형태의 버스로 구현될 수 있다.
네트워크 인터페이스(102)는 컴퓨팅 장치(100)의 유무선 인터넷 통신을 지원한다. 네트워크 인터페이스(102)는 인터넷 통신 외의 다양한 통신 방식을 지원할 수도 있다. 이를 위해, 네트워크 인터페이스(102)는 본 발명의 기술 분야에 잘 알려진 통신 모듈을 포함하여 구성될 수 있다.
스토리지(104)는 하나 이상의 컴퓨터 프로그램(105)을 비임시적으로 저장할 수 있다. 스토리지(104)는 플래시 메모리 등과 같은 비휘발성 메모리, 하드 디스크, 착탈형 디스크, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터로 읽을 수 있는 기록 매체를 포함하여 구성될 수 있다.
컴퓨터 프로그램(105)은 본 발명의 다양한 실시예들에 따른 방법/동작들이 구현된 하나 이상의 인스트럭션들(instructions)을 포함할 수 있다. 컴퓨터 프로그램(105)이 메모리(103)에 로드 되면, 프로세서(101)는 상기 하나 이상의 인스트럭션들을 실행시킴으로써 본 발명의 다양한 실시예들에 따른 방법/동작들을 수행할 수 있다.
예를 들어, 컴퓨터 프로그램(105)은 사용자의 의료기록 정보를 잠복기별 치매 예측 모델 각각에 입력하는 동작, 및 잠복기별 치매 예측 모델 각각으로부터 사용자의 잠복기별 치매 예측 정보를 출력하는 동작을 수행하기 위한 인스트럭션들(instructions)을 포함할 수 있다. 이 때, 잠복기별 치매 예측 모델은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성된 서로 다른 잠복기별 학습 데이터를 이용한 기계 학습을 수행하여 생성된 것일 수 있다.
지금까지 도 1 내지 도 25를참조하여 본 발명의 다양한 실시예들 및 그 실시예들에 따른 효과들을 언급하였다. 본 발명의 기술적 사상에 따른 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
지금까지 설명된 본 발명의 기술적 사상은 컴퓨터가 읽을 수 있는 매체 상에 컴퓨터가 읽을 수 있는 코드로 구현될 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체는, 예를 들어 이동형 기록 매체(CD, DVD, 블루레이 디스크, USB 저장 장치, 이동식 하드 디스크)이거나, 고정식 기록 매체(ROM, RAM, 컴퓨터 구비 형 하드 디스크)일 수 있다. 상기 컴퓨터로 읽을 수 있는 기록 매체에 기록된 상기 컴퓨터 프로그램은 인터넷 등의 네트워크를 통하여 다른 컴퓨팅 장치에 전송되어 상기 다른 컴퓨팅 장치에 설치될 수 있고, 이로써 상기 다른 컴퓨팅 장치에서 사용될 수 있다.
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명의 기술적 사상이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.
도면에서 동작들이 특정한 순서로 도시되어 있지만, 반드시 동작들이 도시된 특정한 순서로 또는 순차적 순서로 실행되어야만 하거나 또는 모든 도시 된 동작들이 실행되어야만 원하는 결과를 얻을 수 있는 것으로 이해되어서는 안 된다. 특정 상황에서는, 멀티태스킹 및 병렬 처리가 유리할 수도 있다. 더욱이, 위에 설명한 실시예들에서 다양한 구성들의 분리는 그러한 분리가 반드시 필요한 것으로 이해되어서는 안 되고, 설명된 프로그램 컴포넌트들 및 시스템들은 일반적으로 단일 소프트웨어 제품으로 함께 통합되거나 다수의 소프트웨어 제품으로 패키지 될 수 있음을 이해하여야 한다.
이상 첨부된 도면을 참조하여 본 발명의 실시예들을 설명하였지만, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 본 발명이 다른 구체적인 형태로도 실시될 수 있다는 것을 이해할 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명에 의해 정의되는 기술적 사상의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (7)

  1. 컴퓨팅 장치에 의해 수행되는 방법에 있어서,
    사용자의 의료기록 정보를 잠복기별 치매 예측 모델 각각에 입력하여, 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 단계;
    상기 의료기록 정보 중 질병 분류 코드 별로 계산된 약물 처방 일수를 이용하여 잠복기별 학습 데이터에 대해 질병의 중증도 레벨을 결정하는 단계;
    상기 잠복기별 치매 예측 모델에 기초하여 상기 잠복기별로 공통으로 발견되는 공통 치매 위험 인자를 식별하는 단계; 및
    상기 식별된 공통 치매 위험 인자 각각에 대해 상기 잠복기에 따른 중증도 레벨 별 분포 변화를 분석하여, 상기 공통 치매 위험 인자 각각의 영향도를 평가하는 단계를 포함하되,
    상기 각각의 잠복기별 치매 예측 모델은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성된 각 잠복기별 학습 데이터를 이용한 기계 학습의 결과로 생성된 것인,
    잠복기별 치매 예측 방법.
  2. 제1 항에 있어서,
    상기 중증도 레벨은, 급성 질환 및 만성 질환 각각에 대해 서로 다른 약물 처방 일수의 범위를 적용하여 결정되는,
    잠복기별 치매 예측 방법.
  3. 제1 항에 있어서,
    상기 치매 군 및 상기 정상 군은,
    상기 의료기록 정보를 이용하여 기준 시점 전에 치매로 진단되지 않은 데이터만을 대상으로 상기 기준 시점에서의 치매 진단 여부에 따라 분류되는,
    잠복기별 치매 예측 방법.
  4. 제1 항에 있어서,
    상기 잠복기별 학습 데이터는,
    상기 의료기록 정보를 이용하여 생성된 복수의 피처들(features) 중 소정 기준에 따라 선정된 잠복기별 피처 그룹에 기반하여 구성되는,
    잠복기별 치매 예측 방법.
  5. 제4 항에 있어서,
    상기 잠복기별 피처 그룹은, 피처 선택 알고리즘을 이용하여 잠복기별로 상이하게 선정되는 피처들을 포함하고,
    상기 피처 선택 알고리즘은, 전진 선택(Forward Selection), 후방 제거(Backward Elimination), 및 단계별 선택(Stepwise Selection) 방식 중 어느 하나에 기반한 것인,
    잠복기별 치매 예측 방법.
  6. 제1 항에 있어서,
    상기 잠복기별 치매 예측 모델의 생성 시 산출되는 피처 중요도(feature importance)에 기초하여 상기 잠복기별 치매 위험 인자를 결정하는 단계; 및
    상기 결정된 잠복기별 치매 위험 인자를 이용하여 상기 잠복기별로 상이한 치매 위험 인자를 식별하는 단계를 더 포함하는,
    잠복기별 치매 예측 방법.
  7. 하나 이상의 프로세서;
    외부장치와 통신하는 통신 인터페이스;
    상기 프로세서에 의하여 수행되는 컴퓨터 프로그램을 로드(load)하는 메모리; 및
    상기 컴퓨터 프로그램을 저장하는 스토리지를 포함하되,
    상기 컴퓨터 프로그램은,
    사용자의 의료기록 정보를 잠복기별 치매 예측 모델 각각에 입력하여, 상기 사용자의 잠복기별 치매 예측 정보를 출력하는 동작,
    상기 의료기록 정보 중 질병 분류 코드 별로 계산된 약물 처방 일수를 이용하여 잠복기별 학습 데이터에 대해 질병의 중증도 레벨을 결정하는 동작,
    상기 잠복기별 치매 예측 모델에 기초하여 상기 잠복기별로 공통으로 발견되는 공통 치매 위험 인자를 식별하는 동작, 및
    상기 식별된 공통 치매 위험 인자 각각에 대해 상기 잠복기에 따른 중증도 레벨 별 분포 변화를 분석하여, 상기 공통 치매 위험 인자 각각의 영향도를 평가하는 동작을 수행하기 위한 인스트럭션을 포함하되,
    상기 각각의 잠복기별 치매 예측 모델은, 치매 군 및 정상 군의 의료기록 정보를 이용하여 생성된 각 잠복기별 학습 데이터를 이용한 기계 학습의 결과로 생성된 것인,
    잠복기별 치매 예측 장치.
KR1020220081035A 2021-05-20 2022-07-01 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치 KR20220157330A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220081035A KR20220157330A (ko) 2021-05-20 2022-07-01 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210064544A KR102417448B1 (ko) 2021-05-20 2021-05-20 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치
KR1020220081035A KR20220157330A (ko) 2021-05-20 2022-07-01 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020210064544A Division KR102417448B1 (ko) 2021-05-20 2021-05-20 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치

Publications (1)

Publication Number Publication Date
KR20220157330A true KR20220157330A (ko) 2022-11-29

Family

ID=82400389

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020210064544A KR102417448B1 (ko) 2021-05-20 2021-05-20 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치
KR1020220081035A KR20220157330A (ko) 2021-05-20 2022-07-01 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020210064544A KR102417448B1 (ko) 2021-05-20 2021-05-20 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치

Country Status (1)

Country Link
KR (2) KR102417448B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102600668B1 (ko) * 2022-10-18 2023-11-10 메디컬아이피 주식회사 질병예측방법 및 그 장치

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101881731B1 (ko) 2018-02-27 2018-07-25 한국과학기술정보연구원 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101993716B1 (ko) * 2012-09-28 2019-06-27 삼성전자주식회사 카테고리별 진단 모델을 이용한 병변 진단 장치 및 방법
KR101923654B1 (ko) * 2016-11-24 2018-11-29 주식회사 셀바스에이아이 질환 발병 확률 예측 모델 학습 방법 및 장치
KR102024373B1 (ko) * 2016-12-30 2019-09-23 서울대학교 산학협력단 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법
KR102225894B1 (ko) * 2018-04-24 2021-03-11 네이버 주식회사 딥 어텐션 네트워크를 이용하여 환자 의료 기록으로부터 질병 예후를 예측하는 방법 및 시스템
KR102122976B1 (ko) * 2019-11-06 2020-06-16 국방과학연구소 조종사 정신적 과부하 상태 검출 장치 및 그 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101881731B1 (ko) 2018-02-27 2018-07-25 한국과학기술정보연구원 기계 학습을 통한 치매 예측용 데이터 처리 장치 및 그 방법, 이를 수록한 기록 매체

Also Published As

Publication number Publication date
KR102417448B1 (ko) 2022-07-06

Similar Documents

Publication Publication Date Title
Das A comparison of multiple classification methods for diagnosis of Parkinson disease
JP6988895B2 (ja) 疾病発症リスク予測システム、疾病発症リスク予測方法および疾病発症リスク予測プログラム
Ismail et al. Big data analytics in heart diseases prediction
JP2011508331A (ja) 類似事例検索を精密化するための方法及び装置
EP3382584A1 (en) A system and a method to predict patient behaviour
JP2018060529A (ja) コンテキストベースの患者類似性の方法及び装置
KR102015473B1 (ko) 신경계 질환 관리를 위한 시스템 및 방법
Fathima et al. Comparison of classification techniques-SVM and naives bayes to predict the Arboviral disease-Dengue
US11170898B2 (en) Methods and systems for prioritizing user symptom complaint inputs
Vyas et al. Identifying the presence and severity of dementia by applying interpretable machine learning techniques on structured clinical records
Keleş et al. Classification of brain volumetric data to determine Alzheimer’s disease using artificial bee colony algorithm as feature selector
KR20220157330A (ko) 머신 러닝 기반 잠복기별 치매 예측 방법, 그리고 이를 구현하기 위한 장치
Srinivasan et al. An active learning machine technique based prediction of cardiovascular heart disease from UCI-repository database
Jalamangala Shivananjaiah et al. Predicting near-term glaucoma progression: an artificial intelligence approach using clinical free-text notes and data from electronic health records
Zhu et al. Feature exploration and causal inference on mortality of epilepsy patients using insurance claims data
Bin-Hezam et al. A machine learning approach towards detecting dementia based on its modifiable risk factors
Mandava MDensNet201-IDRSRNet: Efficient cardiovascular disease prediction system using hybrid deep learning
Huang et al. Multimodal learning of clinically accessible tests to aid diagnosis of neurodegenerative disorders: a scoping review
WO2023177886A1 (en) Multi-modal patient representation
JP2021524097A (ja) 異種医用データの優先順位付け及び提示のためのシステム及び方法
Avati et al. Predicting inpatient discharge prioritization with electronic health records
Kalina et al. System for selecting relevant information for decision support
Wang et al. Imbalanced learning for hospital readmission prediction using national readmission database
KR20210142921A (ko) 안면 표정 인식을 이용한 기분장애 진단을 위한 정보 제공 방법
Qiu et al. Battling Alzheimer's Disease through Early Detection: A Deep Multimodal Learning Approach.