KR20240021635A - 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법 - Google Patents

인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법 Download PDF

Info

Publication number
KR20240021635A
KR20240021635A KR1020220100231A KR20220100231A KR20240021635A KR 20240021635 A KR20240021635 A KR 20240021635A KR 1020220100231 A KR1020220100231 A KR 1020220100231A KR 20220100231 A KR20220100231 A KR 20220100231A KR 20240021635 A KR20240021635 A KR 20240021635A
Authority
KR
South Korea
Prior art keywords
data
instances
learning
time period
diabetes complications
Prior art date
Application number
KR1020220100231A
Other languages
English (en)
Inventor
이창재
박은경
권구연
김헌성
이준엽
고태훈
Original Assignee
주식회사 대웅제약
가톨릭대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 대웅제약, 가톨릭대학교 산학협력단 filed Critical 주식회사 대웅제약
Priority to KR1020220100231A priority Critical patent/KR20240021635A/ko
Publication of KR20240021635A publication Critical patent/KR20240021635A/ko

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Pathology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Veterinary Medicine (AREA)
  • Computational Linguistics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Signal Processing (AREA)
  • Surgery (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Psychiatry (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

장치에 의해 수행되는, AI 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 방법이 개시된다. 상기 방법은, 제1 시구간 동안의 복수의 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 획득하는 단계; 제1 시구간 내에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스를 구분하고, 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득하는 단계; 특징 데이터 및 복수의 환자에 대한 환경 정보 중의 적어도 하나에 기초하여, 학습 데이터를 구성하는 단계; 및 학습 데이터에 기초하여 복수의 인스턴스의 제3 시구간 내에 당뇨병 합병증이 발병될 확률을 출력하도록 모델을 학습시키는 단계를 포함하고, 학습 데이터를 구성하는 단계는, 복수의 인스턴스 각각에 대응되는 특징 데이터에 대해, 당뇨병 합병증 발병 여부에 대한 정보를 라벨링하는 단계를 포함할 수 있다.

Description

인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법{DEVICE FOR TRAINING DIABETES COMPLICATIONS ONSET PREDICTION MODEL BASED ON ARTIFICIAL INTELLIGENCE ALGORITHM AND CONTROL METHOD THEREOF}
본 개시는 당뇨병 합병증 발병 예측 방법에 관한 것이다. 보다 상세하게는, 본 개시는 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법에 관한 것이다.
당뇨병이란 기준 혈당 수치를 초과한 상태가 오랜 기간 지속되어 발생되는 대사 질환군을 지칭하는 것으로서, 췌장에서 충분한 인슐린을 만들어 내지 못하여 정상적인 혈당 수치를 유지하지 못하거나, 신체 내에서 생성된 인슐린에 적절하게 반응하지 못하는 것이 그 발병 원인이 된다.
이러한 당뇨병은 많은 현대인들에게 발병되는 만성 질병으로 꼽히며, 심뇌혈관질환, 뇌졸중, 만성신부전, 당뇨 병케톤산증 등 각종 합병증을 유발하기도 한다. 당뇨병 예방을 위해서는 올바른 식습관 뿐만 아니라 반복적인 검강 검진이 필수적이다. 즉, 반복적인 건강 검진을 통해 자신의 당뇨병 발병 가능성을 체크하는 것은 많은 현대인들에게 필수적이다.
다만, 바쁜 현대인들이 반복적으로 건강 검진을 받는 것은 어려우며, 이에 따라 당뇨병 진행 상황 또는 발병 확률을 확인하는 것은 더욱 어려워지고 있다. 또한, 당뇨병은 유전적 요인, 환경적 요인 또는 각종 외적 요인 등에 의해 발병되는 것이 밝혀지고 있는 바, 당뇨병 발병율 또는 당뇨병 합병증 발병율을 예측하는 것은 더욱 어려워지고 있다.
따라서, 다양한 요인들을 종합적으로 고려하여 당뇨병 합병증 발병율을 예측함으로써, 당뇨병 합병증을 예방하는 방법의 필요성이 점차 대두되고 있다.
한국 등록특허공보 10-2282720 (2021.07.22) 한국 공개특허공보 10-2022-0075049 (2022.06.07)
본 개시에 개시된 실시예는 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법을 제공하는데 그 목적이 있다.
본 개시가 해결하고자 하는 과제들은 이상에서 언급된 과제로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
본 개시의 일 실시예로, 장치에 의해 수행되는, 인공 지능(artificial intelligence, AI) 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 방법은, 제1 시구간 동안의 복수의 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 획득하는 단계; 상기 제1 시구간 내에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스를 구분하고, 상기 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득하는 단계; 상기 특징 데이터 및 상기 복수의 환자에 대한 환경 정보 중의 적어도 하나에 기초하여, 학습 데이터를 구성하는 단계; 및 상기 학습 데이터에 기초하여 상기 복수의 인스턴스의 제3 시구간 내에 당뇨병 합병증이 발병될 확률을 출력하도록 상기 모델을 학습시키는 단계를 포함하고, 상기 학습 데이터를 구성하는 단계는, 상기 복수의 인스턴스 각각에 대응되는 상기 특징 데이터에 대해, 당뇨병 합병증 발병 여부에 대한 정보를 라벨링(labeling)하는 단계를 포함할 수 있다.
그리고, 상기 복수의 인스턴스 각각의 시작 시점의 간격은 제4 시구간으로 설정될 수 있다.
그리고, 상기 복수의 인스턴스는 제1 인스턴스를 포함하고, 상기 제1 인스턴스의 상기 제2 시구간은, 상기 제1 인스턴스의 시작 시점으로부터 제5 시구간을 가지는 관찰 구간, 상기 관찰 구간으로부터 제6 시구간을 가지는 버퍼(buffer) 구간 및 상기 버퍼 구간으로부터 상기 제3 시구간을 가지는 당뇨병 합병증 발병 예측 구간으로 구성될 수 있다.
그리고, 상기 제1 인스턴스에 대응되는 건강 검진 데이터 및 처방 내역 데이터는, 상기 제1 시구간 중 상기 관찰 구간에서 획득된 건강 검진 데이터 및 처방 내역 데이터이고 상기 모델은 상기 당뇨병 합병증 발병 예측 구간 내에 당뇨병 합병증 발병될 확률을 출력하도록 학습될 수 있다.
그리고, 상기 방법은, 상기 복수의 인스턴스의 시구간을 상기 제2 시구간에서 제7 시구간으로 변경하는 단계; 및 상기 제7 시구간을 가지는 상기 복수의 인스턴스에 대응되는 건강 검진 데이터 및 처방 내역 데이터에 대응되는 특징 데이터에 기초하여 상기 학습 데이터에 대한 증식(augmentation) 동작을 수행하는 단계를 더 포함할 수 있다.
그리고, 상기 복수의 환자 중 제1 환자의 건강 검진 데이터에 상기 관찰 구간 또는 상기 버퍼 구간 중의 적어도 하나 내에서 당뇨병에 의해 유발될 수 있는 합병증이 발병되었음을 나타내는 정보가 포함됨에 기반하여, 상기 제1 환자의 건강 검진 데이터 및 처방 내역 데이터를 제외할 수 있다.
그리고, 상기 제1 시구간 동안 획득된 건강 검진 데이터 및 처방 내역 데이터에서상기 복수의 환자 중 나이가 임계값 미만인 환자에 대한 건강 검진 데이터 및 처방 내역 데이터는 제외할 수 있다.
그리고, 상기 복수의 환자에 대한 환경 정보는, 상기 복수의 환자의 나이, 성별, 또는 BMI(body mass index) 중의 적어도 하나를 포함할 수 있다.
그리고, 본 개시의 일 실시예로, 인공 지능(artificial intelligence, AI) 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치는, 하나 이상의 통신 모듈; 하나 이상의 메모리(memory); 및 하나 이상의 프로세서를 포함하고, 상기 하나 이상의 프로세서는, 제1 시구간 동안 복수의 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 획득하고; 상기 제1 시구간에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스를 구분하고, 상기 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득하고; 상기 특징 데이터 및 상기 복수의 환자에 대한 환경 정보 중의 적어도 하나에 기초하여, 학습 데이터를 구성하고; 및 상기 학습 데이터에 기초하여 상기 복수의 인스턴스의 제3 시구간 내에 당뇨병 합병증이 발병될 확률을 출력하도록 상기 모델을 학습시키도록 설정되고, 상기 하나 이상의 프로세서는, 상기 학습 데이터를 구성하기 위하여, 상기 복수의 인스턴스 각각에 대응되는 상기 특징 데이터에 대해, 당뇨병 합병증 발병 여부에 대한 정보를 라벨링(labeling)할 수 있다.
이 외에도, 본 개시를 구현하기 위한 실행하기 위한 컴퓨터 판독 가능한 기록 매체에 저장된 컴퓨터 프로그램이 더 제공될 수 있다.
이 외에도, 본 개시를 구현하기 위한 방법을 실행하기 위한 컴퓨터 프로그램을 기록하는 컴퓨터 판독 가능한 기록 매체가 더 제공될 수 있다.
본 개시의 전술한 과제 해결 수단에 의하면, 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법이 제공될 수 있다.
또한, 본 개시의 전술한 과제 해결 수단에 의하면, 당뇨병 환자 임상 데이터를 활용함으로써 심혈관 합병증의 발병율을 보다 효율적으로 예측하는 인공 지능 모델이 제공될 수 있다.
본 개시의 효과들은 이상에서 언급된 효과로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 개시의 일 실시예에 따른, 당뇨병 합병증 발병 예측 모델을 학습시키는 방법을 구현하기 위한 시스템의 개략도이다.
도 2는 본 개시의 일 실시예에 따른, 당뇨병 합병증 발병 예측 모델을 학습시키는 장치의 구성을 설명하기 위한 블록도이다.
도 3은 본 개시의 일 실시예에 따른, 당뇨병 합병증 발병 예측 모델을 학습시키는 방법을 설명하기 위한 순서도이다.
도 4는 본 개시의 일 실시예에 따른, 복수의 인스턴스에 기초하여 모델을 학습시키는 방법을 설명하기 위한 도면이다.
도 5는 본 개시의 일 실시예에 따른, 학습 데이터를 구성하는 방법을 설명하기 위한 순서도이다.
본 개시 전체에 걸쳐 동일 참조 부호는 동일 구성요소를 지칭한다. 본 개시가 실시예들의 모든 요소들을 설명하는 것은 아니며, 본 개시가 속하는 기술분야에서 일반적인 내용 또는 실시예들 간에 중복되는 내용은 생략한다. 명세서에서 사용되는 '부, 모듈, 부재, 블록'이라는 용어는 소프트웨어 또는 하드웨어로 구현될 수 있으며, 실시예들에 따라 복수의 '부, 모듈, 부재, 블록'이 하나의 구성요소로 구현되거나, 하나의 '부, 모듈, 부재, 블록'이 복수의 구성요소들을 포함하는 것도 가능하다.
명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 직접적으로 연결되어 있는 경우 뿐 아니라, 간접적으로 연결되어 있는 경우를 포함하고, 간접적인 연결은 무선 통신망을 통해 연결되는 것을 포함한다.
또한 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.
명세서 전체에서, 어떤 부재가 다른 부재 "상에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
제 1, 제 2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위해 사용되는 것으로, 구성요소가 전술된 용어들에 의해 제한되는 것은 아니다.
단수의 표현은 문맥상 명백하게 예외가 있지 않는 한, 복수의 표현을 포함한다.
각 단계들에 있어 식별부호는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 실시될 수 있다.
이하 첨부된 도면들을 참고하여 본 개시의 작용 원리 및 실시예들에 대해 설명한다.
본 명세서에서 '본 개시에 따른 당뇨병 합병증 발병 예측 모델을 학습시키는 장치'는 연산처리를 수행하여 사용자에게 결과를 제공할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 본 개시에 따른 당뇨병 합병증 발병 예측 모델을 학습시키는 장치는, 컴퓨터, 서버 장치 및 휴대용 단말기를 모두 포함하거나, 또는 어느 하나의 형태가 될 수 있다.
여기에서, 상기 컴퓨터는 예를 들어, 웹 브라우저(WEB Browser)가 탑재된 노트북, 데스크톱(desktop), 랩톱(laptop), 태블릿 PC, 슬레이트 PC 등을 포함할 수 있다.
상기 서버 장치는 외부 장치와 통신을 수행하여 정보를 처리하는 서버로써, 애플리케이션 서버, 컴퓨팅 서버, 데이터베이스 서버, 파일 서버, 게임 서버, 메일 서버, 프록시 서버 및 웹 서버 등을 포함할 수 있다.
상기 휴대용 단말기는 예를 들어, 휴대성과 이동성이 보장되는 무선 통신 장치로서, PCS(Personal Communication System), GSM(Global System for Mobile communications), PDC(Personal Digital Cellular), PHS(Personal Handyphone System), PDA(Personal Digital Assistant), IMT(International Mobile Telecommunication)-2000, CDMA(Code Division Multiple Access)-2000, W-CDMA(W-Code Division Multiple Access), WiBro(Wireless Broadband Internet) 단말, 스마트 폰(Smart Phone) 등과 같은 모든 종류의 핸드헬드(Handheld) 기반의 무선 통신 장치와 시계, 반지, 팔찌, 발찌, 목걸이, 안경, 콘택트 렌즈, 또는 머리 착용형 장치(head-mounted-device(HMD) 등과 같은 웨어러블 장치를 포함할 수 있다.
도 1은 본 개시의 일 실시예에 따른, 당뇨병 합병증 발병 예측 모델을 학습시키는 방법을 구현하기 위한 시스템의 개략도이다.
도 1에 도시된 바와 같이, 당뇨병 합병증 발병 예측 (AI) 모델을 학습시키는 방법을 구현하기 위한 시스템(1000)은, AI 모델을 학습시키는 장치(100), 병원 서버(200), 데이터 베이스(300) 및 AI 모델(400)을 포함할 수 있다.
여기서, 도 1에는 장치(100)가 하나의 데스크 탑의 형태로 구현될 것으로 도시되어 있으나, 이에 한정되는 것은 아니다. 장치(100)는 상술한 바와 같이 다양한 유형의 장치 또는 하나 이상의 유형의 장치가 연결된 장치 군을 의미할 수 있다.
시스템(1000)에 포함된 장치(100), 병원 서버(200), 데이터 베이스(300), 및 인공 지능(artificial intelligence, AI) 모델(400)은 네트워크(W)를 통해 통신을 수행할 수 있다. 여기서, 네트워크(W)는 유선 네트워크와 무선 네트워크를 포함할 수 있다. 예를 들어, 네트워크는 근거리 네트워크(LAN: Local Area Network), 도시권 네트워크(MAN: Metropolitan Area Network), 광역 네트워크(WAN: Wide Area Network) 등의 다양한 네트워크를 포함할 수 있다.
또한, 네트워크(W)는 공지의 월드 와이드 웹(WWW: World Wide Web)을 포함할 수도 있다. 그러나, 본 개시의 실시예에 따른 네트워크(W)는 상기 열거된 네트워크에 국한되지 않고, 공지의 무선 데이터 네트워크나 공지의 전화 네트워크, 공지의 유무선 텔레비전 네트워크를 적어도 일부로 포함할 수도 있다.
장치(100)는 인공 지능 알고리즘 모델에 기초한 당뇨병 합병증(예로, 심혈관 합병증 등) 발병 예측 AI 모델을 학습시키는 방법을 제공할 수 있다.
예로, 장치(100)는 병원 서버(200)로부터 제1 시구간(예로, 10년) 동안의 복수의 (당뇨병) 환자에 대한 건강 검진 데이터(또는, 임상 데이터) 및 처방 내역 데이터를 획득할 수 있다. 장치는 제1 시구간에서 시작 시점이 서로 다른 제2 시구간(예로, 7년)을 가지는 복수의 인스턴스를 구분하고, 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득할 수 있다. 장치는 특징 데이터 및 복수의 환자에 대한 환경 정보 중의 적어도 하나에 기초하여 학습 데이터를 구성할 수 있다. 장치는 학습 데이터에 기초하여 복수의 인스턴스의 제3 시구간(예로, 5년) 내에 당뇨병 합병증이 발병될 확률을 출력하도록 AI 모델(400)을 학습시킬 수 있다.
장치(100)가 학습 데이터를 구성하는 과정 및 AI 모델(400)을 학습시키는 과정은 도 3 내지 도 5를 참조하여 구체적으로 설명하도록 한다.
병원 서버(200)는 복수의 환자의 건강 검진 데이터(예로, 혈액 검사 결과 등) 및 처방 내역 데이터(예로, 당뇨 관련 약의 처방 내역 데이터)를 저장하는 서버 또는 클라우드를 의미한다. AI 모델(400)이 장치(100)에 의해 학습된 후, 특정 사용자가 병원에서 건강 검진을 받은 경우, 해당 건강 검진 데이터는 병원 서버(200)로 자동 등록/업데이트될 수 있다.
여기서, 장치(100)는 병원 서버(200)에 자동/등록 업데이트된 해당 건강 검진 데이터를 획득할 수 있다. 그리고, 장치(100)는 획득된 건강 검진 데이터에 기초하여 건강 검진 데이터 생성 시점을 기준으로 특정 시구간(예로, 5년) 내에 당뇨병 합병증 발병 확률을 획득할 수 있다. 본 개시를 설명함에 있어서, 건강 검진 데이터의 생성 시점은 건강 검진을 받은 시점/건강 검진 결과가 나온 시점 등을 의미할 수 있다.
데이터 베이스(300)는 장치(100)가 병원 서버(200)로부터 획득한 각종 건강 검진 데이터 및 처방 내역 데이터를 저장하는 공간을 의미한다. 또한, 데이터 베이스(300)는 장치(100)에 의해 구성된 학습 데이터가 저장된 공간을 의미한다. 또한, 데이터 베이스(300)는 AI 모델(400)이 각종 학습 및 추론 동작을 수행하기 위해 필요한 파라미터가 저장된 공간을 의미한다.
도 1에서는 데이터 베이스(300)가 장치(100) 외부에 구현된 경우를 도시하고 있다. 이 때, 데이터 베이스(300)는 장치(100)와 유/무선으로 연결될 수 있다. 다만, 이는 일 실시예에 불과하며, 데이터 베이스(300)는 장치(100)의 일 구성 요소로 구현될 수도 있다.
AI 모델(400)은 당뇨병 합병증 발병 확률을 출력하도록 학습된 인공 지능 모델을 의미한다. AI 모델(400)은 장치(100)에 의해 구성된 학습 데이터에 기초하여 건강 검진 데이터가 생성된 시점을 기준으로 특정 시구간 내에 당뇨병 합병증이 발병할 확률을 출력하도록 학습될 수 있다.
구체적으로, 학습 단계에서 AI 모델(400)에 입력되는 학습 데이터는 건강 검진 데이터, 처방 내역 데이터, 및 환자의 환경 정보에 대해 전처리 동작이 수행됨으로써 구성된 데이터 셋을 포함하고, AI 모델(400)의 출력 데이터는 건강 검진 데이터가 생성된 시점을 기준으로 특정 시구간 내에 당뇨병 합병증이 발병할 확률을 포함할 수 있다.
그리고, 추론(inference) 단계에서, AI 모델(400)에 입력되는 데이터는 특정 사용자의 건강 검진 데이터이고, AI 모델(400)의 출력 데이터는 해당 건강 검진 데이터가 생성된 시점을 기준으로 특정 시구간 내에 해당 사용자에게 당뇨병 합병증이 발병할 확률을 포함할 수 있다. 예로, 1년 동안(즉, 관찰 구간) 획득된 사용자의 건강 검진 데이터가 입력되면, AI 모델(400)은 1년(즉, 버퍼 구간)이 경과된 후 5년 내(즉, 당뇨병 합병증 발병 예측 구간)에 당뇨병 합병증이 발명될 확률을 출력할 수 있다.
그리고, AI 모델(400)은 순환 신경망(recurrent neural network, RNN) 기반 모델(예로, GRU-ODE bayes)을 포함할 수 있다. 이에 따라, AI 모델(400)은 최근데 입력된 데이터에 보다 종속적인(dependent)한 결과를 출력할 수 있다. 해당 RNN 모델에는 불규칙한 시간 간격으로 들어오는 입력 데이터를 처리할 수 있다.
도 1은 AI 모델(400)이 장치(100) 외부에 구현(예로, 클라우드 기반(cloud-based)으로 구현)된 경우를 도시하고 있으나, 이에 한정되는 것은 아니며, 장치(100)에 일 구성 요소로 구현될 수 있다.
도 2는 본 개시의 일 실시예에 따른, 당뇨병 합병증 발병 예측 모델을 학습시키는 장치(100)의 구성을 설명하기 위한 블록도이다.
도 2에 도시된 바와 같이, 장치(100)는 메모리(110), 통신 모듈(120), 디스플레이(130), 입력 모듈(140) 및 프로세서(150)를 포함할 수 있다. 다만, 이에 국한되는 것은 아니며, 장치(100)는 필요한 동작에 따라 당업자 관점에서 자명한 범위 내에서 소프트웨어 및 하드웨어 구성이 수정/추가/생략될 수 있다.
메모리(110)는 본 장치(100)의 다양한 기능을 지원하는 데이터와, 프로세서(150)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 음악 파일, 정지영상, 동영상 등)을 저장할 있고, 본 장치에서 구동되는 다수의 응용 프로그램(application program 또는 애플리케이션(application)), 본 장치(100)의 동작을 위한 데이터들, 명령어들을 저장할 수 있다. 이러한 응용 프로그램 중 적어도 일부는, 무선 통신을 통해 외부 서버로부터 다운로드 될 수 있다.
이러한, 메모리(110)는 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), SSD 타입(Solid State Disk type), SDD 타입(Silicon Disk Drive type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(random access memory; RAM), SRAM(static random access memory), 롬(read-only memory; ROM), EEPROM(electrically erasable programmable read-only memory), PROM(programmable read-only memory), 자기 메모리, 자기 디스크 및 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다.
또한, 메모리(110)는 본 장치와는 분리되어 있으나, 유선 또는 무선으로 연결된 데이터베이스를 포함할 수 있다. 즉, 도 1에 도시된 데이터 베이스는 메모리(110)의 일 구성 요소로 구현될 수 있다.
통신 모듈(120)는 외부 장치와 통신을 가능하게 하는 하나 이상의 구성 요소를 포함할 수 있으며, 예를 들어, 방송 수신 모듈, 유선통신 모듈, 무선통신 모듈, 근거리 통신 모듈, 위치정보 모듈 중 적어도 하나를 포함할 수 있다.
유선 통신 모듈은, 지역 통신(Local Area Network; LAN) 모듈, 광역 통신(Wide Area Network; WAN) 모듈 또는 부가가치 통신(Value Added Network; VAN) 모듈 등 다양한 유선 통신 모듈뿐만 아니라, USB(Universal Serial Bus), HDMI(High Definition Multimedia Interface), DVI(Digital Visual Interface), RS-232(recommended standard232), 전력선 통신, 또는 POTS(plain old telephone service) 등 다양한 케이블 통신 모듈을 포함할 수 있다.
무선 통신 모듈은 와이파이(Wifi) 모듈, 와이브로(Wireless broadband) 모듈 외에도, GSM(global System for Mobile Communication), CDMA(Code Division Multiple Access), WCDMA(Wideband Code Division Multiple Access), UMTS(universal mobile telecommunications system), TDMA(Time Division Multiple Access), LTE(Long Term Evolution), 4G, 5G, 6G 등 다양한 무선 통신 방식을 지원하는 무선 통신 모듈을 포함할 수 있다.
디스플레이(130)는 본 장치(100)에서 처리되는 정보(예로, 각 사용자의 건강 검진 데이터, 처방 내역 데이터, 전처리된 학습 데이터, AI 모델에 의해 출력된 당뇨병 합병증 발병 확률 등)를 표시(출력)한다.
예를 들어, 디스플레이는 본 장치(100)에서 구동되는 응용 프로그램(일 예로, 어플리케이션)의 실행화면 정보, 또는 이러한 실행화면 정보에 따른 UI(User Interface), GUI(Graphic User Interface) 정보를 표시할 수 있다. 디스플레이(130)에서 출력되는 UI에 대한 종류는 후술하도록 한다.
입력 모듈(140)는 사용자로부터 정보를 입력받기 위한 것으로서, 사용자 입력부를 통해 정보가 입력되면, 프로세서(150)는 입력된 정보에 대응되도록 본 장치(100)의 동작을 제어할 수 있다.
이러한, 입력 모듈(140)은 하드웨어식 물리 키(예를 들어, 본 장치의 전면, 후면 및 측면 중 적어도 하나에 위치하는 버튼, 돔 스위치 (dome switch), 조그 휠, 조그 스위치 등) 및 소프트웨어식 터치 키를 포함할 수 있다. 일 예로서, 터치 키는, 소프트웨어적인 처리를 통해 터치스크린 타입의 디스플레이(130) 상에 표시되는 가상 키(virtual key), 소프트 키(soft key) 또는 비주얼 키(visual key)로 이루어지거나, 상기 터치스크린 이외의 부분에 배치되는 터치 키(touch key)로 이루어질 수 있다. 한편, 상기 가상키 또는 비주얼 키는, 다양한 형태를 가지면서 터치스크린 상에 표시되는 것이 가능하며, 예를 들어, 그래픽(graphic), 텍스트(text), 아이콘(icon), 비디오(video) 또는 이들의 조합으로 이루어질 수 있다.
프로세서(150)는 본 장치(100) 내의 구성요소들의 동작을 제어하기 위한 알고리즘 또는 알고리즘을 재현한 프로그램에 대한 데이터를 저장하는 메모리, 및 메모리에 저장된 데이터를 이용하여 전술한 동작을 수행하는 적어도 하나의 프로세서(미도시)로 구현될 수 있다. 이때, 메모리와 프로세서는 각각 별개의 칩으로 구현될 수 있다. 또는, 메모리와 프로세서는 단일 칩으로 구현될 수도 있다.
또한, 프로세서(150)는 이하의 도 3 내지 도 5에서 설명되는 본 개시에 따른 다양한 실시 예들을 본 장치(100) 상에서 구현하기 위하여, 위에서 살펴본 구성요소들을 중 어느 하나 또는 복수를 조합하여 제어할 수 있다.
도 3은 본 개시의 일 실시예에 따른, 당뇨병 합병증 발병 예측 모델을 학습시키는 방법을 설명하기 위한 순서도이다.
장치는 제1 시구간 동안의 복수의 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 획득할 수 있다(S310).
장치는 병원 서버로부터 제1 시구간 동안의 당뇨병 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 수집 및 획득할 수 있다. 즉, 장치는 병원 서버에 저장된 특정 당뇨병 환자의 제1 시구간 동안의 건강 검진 데이터 및 처방 내역 데이터를 수집/및 획득할 수 있다. 일 예로, 제1 시구간은 10년으로 설정될 수 있으나, 이에 제한되는 것은 아니며 다양한 값으로 설정될 수 있다.
장치는 제1 시구간 내에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스(instance)를 구분하고, 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득할 수 있다(S320). 여기서, 복수의 인스턴스 각각의 시작 시점의 간격은 제4 시구간(예로, 3개월)으로 설정될 수 있다.
도 4를 참조하면, 제1 시구간(410) 내에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스(예로, 인스턴스 1, 인스턴스 2, 인스턴스 3 등)가 구분될 수 있다. 각 인스턴스의 시작 시점 간의 간격은 3개월로 구성될 수 있다.
각 인스턴스의 제2 시구간은 관찰 구간, 버퍼 구간 및 당뇨병 합병증 발병 예측 구간으로 구성될 수 있다. 예로, 복수의 인스턴스에 제1 인스턴스가 포함된 경우를 가정한다. 제1 인스턴스의 제2 시구간은, 제1 인스턴스의 시작 시점으로부터 제5 시구간(예로, 1년)을 가지는 관찰(observation) 구간, 관찰 구간으로부터 제6 시구간(예로, 1년)을 가지는 버퍼(buffer) 구간 및 버퍼 구간으로부터 제3 시구간(예로, 5년)을 가지는 당뇨병 합병증 발병 예측 구간(또는, 결과(outcome) 구간)으로 구성될 수 있다.
장치는 제1 시구간(410) 내에 획득된 건강 검진 데이터 및 처방 내역 데이터 중 각 인스턴스에 대응되는 건강 검진 데이터 및 처방 내역 데이터를 식별할 수 있다.
그리고, 장치는 식별된 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터에 대한 특징 데이터를 추출할 수 있다. 예로, 장치는 건강 검진 데이터로서 측정된 10 종류의 혈액 검사 결과 값에 대한 특징 데이터(415-1)를 추출할 수 있다. 그리고, 장치는 18 종류의 당뇨 관련 약의 처방 내역 데이터(415-2)를 추출할 수 있다.
장치는 특징 데이터 및 복수의 환자에 대한 환경 정보(예로, 환자의 나이, 성별, BMI 수치 등) 중의 적어도 하나에 기초하여, 학습 데이터를 구성할 수 있다(S330).
학습 데이터를 구성하기 위하여, 장치는 복수의 인스턴스 각각에 대응되는 특징 데이터에 대해, 당뇨병 합병증 발병 여부에 대한 정보를 라벨링(labeling)할 수 있다. 도 4에 도시된 바와 같이, 각 복수의 인스턴스에서 당뇨병 합병증 발병 예측 구간에 대응되는 당뇨병 합병증 발병 여부에 대한 정보(예로, 당뇨병 합병증이 발병된 경우, 기 정의된 값(예로, 1)으로 설정되고, 당뇨병 합병증이 발병되지 않은 경우, 다른 정의된 값(예로, 0)이 설정됨)를 라벨링할 수 있다.
장치는 학습 데이터를 구성하는 과정에서 과적합(overfitting)을 방지하기 위하여 불필요한 데이터는 제외할 수 있다. 예를 들어, 장치는 제1 시구간 동안 획득된 건강 검진 데이터 및 처방 내역 데이터에서 복수의 환자 중 나이가 임계값 미만인 환자에 대한 건강 검진 데이터 및 처방 내역 데이터는 제외할 수 있다.
또 다른 예로, 관찰 구간 및/또는 버퍼 구간에서의 건강 검진 데이터 및 처방 내역 데이터에 당뇨병에 의해 유발될 수 있는 합병증이 발병되었음을 나타내는 정보가 포함된 경우, 해당 건강 검진 데이터 및 처방 내역 데이터는 제외할 수 있다. 관찰 구간 및/또는 버퍼 구간에 발생되는 합병증은 실제로 당뇨병 합병증이 아니거나, 모델 학습에 적절한 데이터가 아닐 수 있다. 따라서, 해당 데이터들은 학습 데이터 구성 시 제외할 수 있다.
예로, 복수의 환자 중 제1 환자의 건강 검진 데이터에 관찰 구간 또는 버퍼 구간 중의 적어도 하나 내에서 당뇨병에 의해 유발될 수 있는 합병증이 발병되었음을 나타내는 정보가 포함됨에 기반하여, 장치는 학습 데이터 구성 시 제1 환자의 건강 검진 데이터 및 처방 내역 데이터를 제외할 수 있다.
여기서, 상기 관찰 구간 및 버퍼 구간은 복수의 인스턴스 중 첫 인스턴스의 관찰 구간 및 버퍼 구간을 의미할 수 있으나, 이에 제한되는 것은 아니다. 상기 관찰 구간 및 버퍼 구간은 제1 시구간 중 특정 시구간에 대응되는 인스턴스의 관찰 구간 및 버퍼 구간을 의미할 수 있다.
그리고, 장치는 제1 시구간 내에서 획득된 건강 검진 데이터 및 처방 내역 데이터 중 최근에 획득된 데이터로부터 추출된 특징 데이터에 대해 가중치를 더 부과할 수 있다. 예로, 복수의 인스턴스에는 제1 인스턴스의 시작 시점을 기준으로 제4 시구간이 경과된 시점에서 시작하는 제2 인스턴스가 포함된 경우를 가정한다. 이 때, 장치는 제2 인스턴스에 대응되는 특징 데이터의 가중치는 제1 인스턴스에 대응되는 특징 데이터의 가중치보다 크도록 설정할 수 있다.
그리고, 장치는 데이터 확보를 위해 데이터 증식(augmentation)을 수행할 수 있다. 이와 관련된 실시예는 도 5를 참조하여 설명하도록 한다.
그리고, 장치는 적어도 하나의 검사 항목에 대응되는 데이터(즉, 결측치)가 포함되지 않는 건강 검진 데이터를 통해 추출한 특징 데이터에 기초하여 학습 데이터를 구성할 수 있다. 장치에 의해 학습되는 모델은 결측치가 있는 데이터에 기초하여 그대로 학습할 수 있으며, 결측치가 있는 데이터 기반의 학습은 모델의 성능을 감소시키지 않을 수 있다.
예를 들어, 제1 당뇨병 환자의 건강 검진 데이터에는 모든 항목(혈압, 혈액 검사 수치, 콜레스테롤 수치, 간 수치, 당화 혈색소, 공복 혈당 등)이 존재하나, 제2 당뇨병 환자의 건강 검진 데이터에는 상기 검사 항목 중 적어도 하나가 존재하지 않을 수 있다.
특정 건강 검진 데이터에 상에 특정 검사 항목이 존재하지 않은 경우(즉, 특정 항목에 대한 결측치가 존재하는 경우), 장치는 특정 건강 검진 데이터의 특정 항목에 Null 값을 삽입할 수 있다.또 다른 예로, 건강 검진 데이터 상에 적어도 하나의 검사 항목 중 임계값 이상의 기여도를 가지는 특정 검사 항목에 대응되는 데이터가 포함되지 않음에 기반하여, 장치는 특정 검사 항목에 대응되는 데이터가 누락되었음을 나타내는 메시지를 제공할 수 있다.
여기서, 검사 항목에 대응되는 기여도는 shapley 값을 포함할 수 있다. shapley 값은 특정 변수가 예측 결과를 출력하는데 기여하는 정도를 수치화한 값이다. shapley 값에 기반한 특정 검사 항목의 기여도는, 모델이 학습/추론 동작을 수행할 때 특정 검사 항목이 기여한 정도를 의미할 수 있다. 적어도 하나의 검사 항목 각각에 대한 기여도는 장치에 의해 출력될 수 있으나, 미리 계산된 값일 수도 있다. 그리고, 임계값은 통계/연구 등에 의해 미리 정의된 값일 수 있다.
예를 들어, 건강 검진 데이터 상에 임계값 이상의 기여도를 가지는 검사 항목인 당화 혈색소, 공보 혈당에 대응되는 데이터가 누락된 경우를 가정한다. 모델은 건강 검진 데이터에 기초하여 구성된 학습 데이터로 학습될 수 있다. 그리고, 장치는 당화 혈색소, 공보 혈당에 대응되는 데이터가 누락되었음을 나타내는 메시지를 제공할 수 있다. 상기 메시지는 장치를 제어하는 사용자가 이용하는 단말 장치/병원 서버 등으로 제공될 수 있다.
장치는 학습 데이터에 기초하여 복수의 인스턴스의 제3 시구간 내(즉, 당뇨병 합병증 발병 예측 구간 내)에 당뇨병 합병증이 발병될 확률을 출력하도록 모델을 학습시킬 수 있다(S340).
추후, 특정 사용자로부터 관찰 구간(예로, 1년) 내의 건강 검진 데이터가 입력되면, 기 학습된 모델은 버퍼 구간(예로, 1년)이 경과된 후 결과 예측 구간(예로, 5년) 내에 당뇨병 합병증이 발병된 확률을 출력할 수 있다.
도 5는 본 개시의 일 실시예에 따른, 학습 데이터를 구성하는 방법을 설명하기 위한 순서도이다. 즉, 도 5는 학습 데이터의 증식 동작을 수행하는 과정을 설명하기 위한 순서도이다.
장치는 복수의 인스턴스의 시구간을 기존의 제2 시구간에서 제7 시구간으로 변경할 수 있다(S510). 장치는 제7 시구간을 가지는 복수의 인스턴스에 대응되는 건강 검진 데이터 및 처방 내역 데이터를 식별할 수 있다(S520). 그리고, 장치는 식별된 데이터에 기초하여 특징 데이터를 획득할 수 있다(S530).
즉, 장치는 제1 시구간 내에서 복수의 인스턴스를 구분하기 위한 시구간을 변경할 수 있다. 장치는 복수의 인스턴스가 가지는 시구간을 변경함으로써 다양한 버전의 특징 데이터를 획득할 수 있다.
장치는 획득된 특징 데이터에 기초하여 학습 데이터에 대한 증식 동작을 수행할 수 있다(S540). 그리고, 장치는 증식 동작이 수행됨에 따라 추가 생성된 학습 데이터에 기초하여 모델을 추가 학습시킬 수 있다.
한편, 개시된 실시예들은 컴퓨터에 의해 실행 가능한 명령어를 저장하는 기록매체의 형태로 구현될 수 있다. 명령어는 프로그램 코드의 형태로 저장될 수 있으며, 프로세서에 의해 실행되었을 때, 프로그램 모듈을 생성하여 개시된 실시예들의 동작을 수행할 수 있다. 기록매체는 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.
컴퓨터가 읽을 수 있는 기록매체로는 컴퓨터에 의하여 해독될 수 있는 명령어가 저장된 모든 종류의 기록 매체를 포함한다. 예를 들어, ROM(Read Only Memory), RAM(Random Access Memory), 자기 테이프, 자기 디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있을 수 있다.
이상에서와 같이 첨부된 도면을 참조하여 개시된 실시예들을 설명하였다. 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자는 본 개시의 기술적 사상이나 필수적인 특징을 변경하지 않고도, 개시된 실시예들과 다른 형태로 본 개시가 실시될 수 있음을 이해할 것이다. 개시된 실시예들은 예시적인 것이며, 한정적으로 해석되어서는 안 된다.
100: 장치
110: 메모리
120: 통신 모듈
130: 디스플레이
140: 입력 모듈
150 : 프로세서

Claims (10)

  1. 장치에 의해 수행되는, 인공 지능(artificial intelligence, AI) 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 방법에 있어서,
    제1 시구간 동안의 복수의 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 획득하는 단계;
    상기 제1 시구간 내에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스를 구분하고, 상기 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득하는 단계;
    상기 특징 데이터 및 상기 복수의 환자에 대한 환경 정보 중의 적어도 하나에 기초하여, 학습 데이터를 구성하는 단계; 및
    상기 학습 데이터에 기초하여 상기 복수의 인스턴스의 제3 시구간 내에 당뇨병 합병증이 발병될 확률을 출력하도록 상기 모델을 학습시키는 단계를 포함하고,
    상기 학습 데이터를 구성하는 단계는,
    상기 복수의 인스턴스 각각에 대응되는 상기 특징 데이터에 대해, 당뇨병 합병증 발병 여부에 대한 정보를 라벨링(labeling)하는 단계를 포함하는, 방법.
  2. 제1항에 있어서,
    상기 복수의 인스턴스 각각의 시작 시점의 간격은 제4 시구간으로 설정되는, 방법.
  3. 제2항에 있어서,
    상기 복수의 인스턴스는 제1 인스턴스를 포함하고,
    상기 제1 인스턴스의 상기 제2 시구간은,
    상기 제1 인스턴스의 시작 시점으로부터 제5 시구간을 가지는 관찰 구간, 상기 관찰 구간으로부터 제6 시구간을 가지는 버퍼(buffer) 구간 및 상기 버퍼 구간으로부터 상기 제3 시구간을 가지는 당뇨병 합병증 발병 예측 구간으로 구성된, 방법.
  4. 제3항에 있어서,
    상기 제1 인스턴스에 대응되는 건강 검진 데이터 및 처방 내역 데이터는, 상기 제1 시구간 중 상기 관찰 구간에서 획득된 건강 검진 데이터 및 처방 내역 데이터이고,
    상기 모델은, 순환 신경망(recurrent neural network,RNN)기반 모델을 포함하며, 상기 당뇨병 합병증 발병 예측 구간 내에 당뇨병 합병증 발병될 확률을 출력하도록 학습되는, 방법.
  5. 제4항에 있어서,
    상기 복수의 인스턴스의 시구간을 상기 제2 시구간에서 제7 시구간으로 변경하는 단계; 및
    상기 제7 시구간을 가지는 상기 복수의 인스턴스에 대응되는 건강 검진 데이터 및 처방 내역 데이터에 대응되는 특징 데이터에 기초하여 상기 학습 데이터에 대한 증식(augmentation) 동작을 수행하는 단계를 더 포함하는, 방법.
  6. 제5항에 있어서,
    상기 복수의 환자 중 제1 환자의 건강 검진 데이터에 상기 관찰 구간 또는 상기 버퍼 구간 중의 적어도 하나 내에서 당뇨병에 의해 유발될 수 있는 합병증이 발병되었음을 나타내는 정보가 포함됨에 기반하여, 상기 제1 환자의 건강 검진 데이터 및 처방 내역 데이터를 제외하는, 방법.
  7. 제6항에 있어서,
    상기 학습 데이터를 구성하는 단계는,
    적어도 하나의 검사 항목에 대응되는 데이터가 포함되지 않는 상기 건강 검진 데이터를 통해 추출한 특징 데이터에 기초하여 상기 학습 데이터를 구성하는 단계를 포함하는, 방법.
  8. 제7항에 있어서,
    상기 건강 검진 데이터 상에 상기 적어도 하나의 검사 항목 중 임계값 이상의 중요도를 가지는 특정 검사 항목에 대응되는 데이터가 포함되지 않음에 기반하여, 상기 특정 검사 항목에 대응되는 데이터가 누락되었음을 나타내는 메시지를 제공하는, 방법.
  9. 인공 지능(artificial intelligence, AI) 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치에 있어서,
    하나 이상의 통신 모듈;
    하나 이상의 메모리(memory); 및
    하나 이상의 프로세서를 포함하고,
    상기 하나 이상의 프로세서는,
    제1 시구간 동안 복수의 환자에 대한 건강 검진 데이터 및 처방 내역 데이터를 획득하고,
    상기 제1 시구간에서 시작 시점이 서로 다른 제2 시구간을 가지는 복수의 인스턴스를 구분하고, 상기 복수의 인스턴스 각각에 대응되는 건강 검진 데이터 및 처방 내역 데이터 대한 특징 데이터를 획득하고,
    상기 특징 데이터 및 상기 복수의 환자에 대한 환경 정보 중의 적어도 하나에 기초하여, 학습 데이터를 구성하며,
    상기 학습 데이터에 기초하여 상기 복수의 인스턴스의 제3 시구간 내에 당뇨병 합병증이 발병될 확률을 출력하도록 상기 모델을 학습시키도록 설정되고,
    상기 하나 이상의 프로세서는,
    상기 학습 데이터를 구성하기 위하여, 상기 복수의 인스턴스 각각에 대응되는 상기 특징 데이터에 대해, 당뇨병 합병증 발병 여부에 대한 정보를 라벨링(labeling)하는, 장치.
  10. 하드웨어인 장치와 결합되어, 제1항 내지 제8항 중 어느 한 항의 인공 지능(artificial intelligence, AI) 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 방법을 실행시키기 위하여 컴퓨터 판독 가능 기록매체에 저장된 컴퓨터 프로그램.
KR1020220100231A 2022-08-10 2022-08-10 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법 KR20240021635A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220100231A KR20240021635A (ko) 2022-08-10 2022-08-10 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220100231A KR20240021635A (ko) 2022-08-10 2022-08-10 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법

Publications (1)

Publication Number Publication Date
KR20240021635A true KR20240021635A (ko) 2024-02-19

Family

ID=90055980

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220100231A KR20240021635A (ko) 2022-08-10 2022-08-10 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법

Country Status (1)

Country Link
KR (1) KR20240021635A (ko)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102282720B1 (ko) 2019-09-02 2021-07-27 가톨릭대학교 산학협력단 당뇨병 환자의 뇌졸중 위험 예측모델 설계 방법 및 장치
KR20220075049A (ko) 2020-11-26 2022-06-07 가톨릭대학교 산학협력단 빅데이터 기반의 당뇨병 발병 위험도 예측 시스템, 예측 방법, 및 프로그램

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102282720B1 (ko) 2019-09-02 2021-07-27 가톨릭대학교 산학협력단 당뇨병 환자의 뇌졸중 위험 예측모델 설계 방법 및 장치
KR20220075049A (ko) 2020-11-26 2022-06-07 가톨릭대학교 산학협력단 빅데이터 기반의 당뇨병 발병 위험도 예측 시스템, 예측 방법, 및 프로그램

Similar Documents

Publication Publication Date Title
Creutzfeldt et al. Do-not-attempt-resuscitation orders and prognostic models for intraparenchymal hemorrhage
US11361848B2 (en) Methods and systems for determining a correlation between patient actions and symptoms of a disease
EP3489957A1 (en) Accelerated clinical biomarker prediction (acbp) platform
US12087425B2 (en) Utilizing a machine learning model to identify unhealthy online user behavior and to cause healthy physical user behavior
US10262759B2 (en) Personal health operating system
WO2023278135A2 (en) Systems and methods for processing data using inference and analytics engines
EP3270337A1 (en) Method and system for managing electronic informed consent process in clinical trials
Kamalzadeh et al. An analytics‐driven approach for optimal individualized diabetes screening
Jin et al. A seamless adaptive 2-in-1 design expanding a phase 2 trial for treatment or dose selection into a phase 3 trial
KR102685550B1 (ko) 인공 지능 기반 인지 및 언어 재활 훈련 세션의 동적 최적화 방법 및 이를 위한 장치
KR20240021635A (ko) 인공 지능 알고리즘 기반의 당뇨병 합병증 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법
Li et al. Predicting Diabetes in Patients with Metabolic Syndrome Using Machine-Learning Model Based on Multiple Years’ Data
KR20230172367A (ko) 건강 기록에 기반한 생체 정보의 가용성 및 우선 순위 판단 장치 및 그 방법
CN106611595A (zh) 用于将文本转换为语音的电子装置和方法
CN112863682B (zh) 信息分析方法、装置、系统、电子设备和存储介质
KR20240022058A (ko) 인공 지능 알고리즘 기반의 당뇨병 발병 예측 모델을 학습시키는 장치 및 그의 제어 방법
Rogers et al. Optimizing the implementation of clinical predictive models to minimize national costs: Sepsis case study
Hu et al. A nationwide cohort study of the role of CHADS2 score in predicting lower extremity amputation and death among patients with peripheral arterial occlusive disease
US11526810B2 (en) System for prediction model management with treatment pathways and biomarker data
KR102720935B1 (ko) 반지도 학습에 기반한 다단계 기관 분할 방법 및 장치
CN113707255A (zh) 基于相似患者的健康指导方法、装置、计算机设备及介质
CN113312511A (zh) 用于推荐内容的方法、装置、设备和计算机可读存储介质
KR102685551B1 (ko) 환자 맞춤형 훈련 컨텐츠 추천 장치 및 방법
KR20240087912A (ko) 고밀도 지단백 콜레스테롤 수치 모니터링을 이용한 갑상선 암 진단 방법, 이를 위한 서버 및 프로그램
KR20240153964A (ko) 손실 함수를 기반으로 타겟 기관의 식별 결과를 획득하는 장치 및 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal