KR20220099759A - 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치 - Google Patents

학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치 Download PDF

Info

Publication number
KR20220099759A
KR20220099759A KR1020210002041A KR20210002041A KR20220099759A KR 20220099759 A KR20220099759 A KR 20220099759A KR 1020210002041 A KR1020210002041 A KR 1020210002041A KR 20210002041 A KR20210002041 A KR 20210002041A KR 20220099759 A KR20220099759 A KR 20220099759A
Authority
KR
South Korea
Prior art keywords
glycated hemoglobin
learning
data
predictive model
ppg signal
Prior art date
Application number
KR1020210002041A
Other languages
English (en)
Other versions
KR102472848B1 (ko
Inventor
김기두
Original Assignee
(주)한국아이티에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)한국아이티에스 filed Critical (주)한국아이티에스
Priority to KR1020210002041A priority Critical patent/KR102472848B1/ko
Publication of KR20220099759A publication Critical patent/KR20220099759A/ko
Application granted granted Critical
Publication of KR102472848B1 publication Critical patent/KR102472848B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/14546Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue for measuring analytes not otherwise provided for, e.g. ions, cytochromes
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/024Detecting, measuring or recording pulse rate or heart rate
    • A61B5/02416Detecting, measuring or recording pulse rate or heart rate using photoplethysmograph signals, e.g. generated by infrared radiation
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/14532Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue for measuring glucose, e.g. by tissue impedance measurement
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis
    • A61B5/7264Classification of physiological signals or data, e.g. using neural networks, statistical classifiers, expert systems or fuzzy systems
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/042Knowledge-based neural networks; Logical representations of neural networks
    • G06N3/0427
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Abstract

본 발명은 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치에 관한 것으로, 상기 방법은 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집하는 단계; 상기 학습 데이터를 기초로 학습 알고리즘을 이용하여 상기 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축하는 단계; 측정 대상자의 PPG 신호 데이터를 수집하는 단계; 및 상기 PPG 신호 데이터를 상기 예측 모델에 적용하여 상기 측정 대상자의 당화혈색소 레벨을 예측하는 단계를 포함한다.

Description

학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치{METHOD AND APPARATUS FOR MEASURING NON-INVASIVE HbA1c USING LEARNING ALGORITHM}
본 발명은 비침습적 당화혈색소 측정 방법 및 장치에 관한 것으로서, 더욱 상세하게는 학습 알고리즘 (Learning Algorithm)을 이용하여 정확하고 용이하게 비침습적으로 당화혈색소(HbA1c)의 농도를 측정할 수 있는 비침습적 당화혈색소 측정 방법 및 장치에 관한 것이다.
당뇨병은 신체 내에서 혈당 조절에 필요한 인슐린의 분비나 기능 장애로 인해 발생된 고혈당을 특징으로 하는 대사성 질환이다. 당뇨병으로 인한 만성적 고혈당은 신체 각 기관의 손상과 기능 부전을 초래하게 되는데 특히, 망막, 신장, 신경에 나타나는 미세혈관 합병증과 동맥경화, 심혈관, 뇌혈관질환과 같은 거대 혈관 합병증을 유발하고 이로 인한 사망률을 증가시킨다.
그러나, 당뇨병은 혈당조절, 체중 감량 및 투약으로 인해 당뇨병의 악화 또는 합병증 발생률을 저하시킬 수 있다. 따라서, 당뇨병 환자들은 혈당 관리를 위하여 수시로 자가 혈당을 측정하고, 당뇨병 환자의 혈당만큼 중요한 치료지표인 당화혈색소(HbA1C) 검사를 주기적으로 받아야 한다.
당화혈색소(HbA1c) 검사는 혈액 내에서 산소를 운반해 주는 역할을 하는 적혈구 내의 혈색소가 어느 정도로 당화(糖化)되었는지를 보는 검사이며, 적혈구의 평균 수명기간에 따라 최근 3~4개월 정도의 혈당 변화를 반영한다. 정상인에서도 당연히 포도당이 존재하므로 우리의 혈액 내에는 혈색소가 어느 정도 당화되어 있는데, 검사 방법에 따라 정상치의 차이가 있으나 대개 5.6%까지가 정상이다.
당뇨병 환자의 경우 혈액 내 포도당의 농도가 높아지므로 당화된 혈색소, 즉 당화혈색소 수치 역시 올라가게 된다. 따라서 그 동안의 혈당 관리 정도가 고스란히 드러나는 이 결과를 보고 추후 치료 방향을 결정하게 된다.
한편, 종래의 당화혈색소(HbA1c)을 측정하는 방법은 측정 대상자 팔의 정맥에서 채혈하거나 손가락 끝을 작고 뾰족한 침으로 찔러 모세혈 검체를 획득하고, 획득한 혈액을 이용하여 당화혈색소(HbA1c)의 농도를 측정하였다. 이러한 침습적 당화혈색소 측정 방법은 측정 대상자들로 하여금 채혈 부담을 가중시키고, 적혈구 수명이 짧거나 임신, 신장질환이 있는 경우에는 부정확한 수치를 제공하는 문제점이 있었다.
한국등록특허 제10-0871074호 (2008.11.24)
본 발명이 이루고자 하는 기술적 과제는, 학습 알고리즘 (Learning Algorithm)을 이용하여 정확하고 용이하게 비침습적으로 당화혈색소(HbA1c)의 농도를 측정할 수 있는 비침습적 당화혈색소 측정 방법 및 장치를 제공하는데 목적이 있다.
실시예들 중에서, 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법은 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집하는 단계; 상기 학습 데이터를 기초로 학습 알고리즘을 이용하여 상기 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축하는 단계; 측정 대상자의 PPG 신호 데이터를 수집하는 단계; 및 상기 PPG 신호 데이터를 상기 예측 모델에 적용하여 상기 측정 대상자의 당화혈색소 레벨을 예측하는 단계를 포함한다.
상기 학습 데이터를 수집하는 단계는 기 정의된 품질 메트릭(metric)들 중 적어도 하나를 이용하여 상기 PPG 신호를 필터링 하는 단계; 상기 필터링 된 PPG 신호를 정규화 시키는 단계; 및 상기 정규화 된 PPG 신호를 표준화 시키는 단계를 포함할 수 있다.
상기 예측 모델을 구축하는 단계는 CNN(Convolution Neural Network), RNN(Recursive Neural Network), CNN-RNN을 포함하는 1D 모델들 중 어느 하나를 상기 학습 알고리즘으로서 이용하는 단계를 포함할 수 있다.
상기 예측 모델을 구축하는 단계는 상기 학습 알고리즘에 대해 활성화 함수(activation function)로서 tanh, ReLu, Leaky ReLu, Logistic/Sigmoid, ELU, Linear 및 소프트맥스(Softmax) 중 어느 하나를 적용하는 단계를 포함할 수 있다.
상기 예측 모델을 구축하는 단계는 상기 학습 알고리즘에 대해 최적화 알고리즘(optimizer)으로서 Adagrad, Adadelta, Adam 및 SGD(Stochastic gradient descent) 중 어느 하나를 적용하는 단계를 포함할 수 있다.
상기 예측 모델을 구축하는 단계는 학습 알고리즘들을 기초로 후보 예측 모델들을 독립적으로 구축하는 단계; 특이성(specificity), 민감도 및 AUC(area under curve)를 포함하는 복수의 품질 메트릭들을 이용하여 상기 후보 예측 모델들을 검증하는 단계; 및 상기 검증의 결과를 기초로 가장 최적의 성능을 가진 후보 예측 모델을 최종 결정하는 단계를 포함할 수 있다.
상기 예측 모델을 구축하는 단계는 상기 학습 데이터를 기초로 혈당 레벨을 예측하기 위한 제1 예측 모델을 구축하는 단계; 및 상기 학습 데이터 및 상기 제1 예측 모델의 출력 데이터를 기초로 단위 기간 동안의 평균 혈당 레벨을 예측하기 위한 제2 예측 모델을 구축하는 단계를 포함할 수 있다.
상기 당화혈색소 레벨을 예측하는 단계는 상기 PPG 신호 데이터를 상기 제1 예측 모델에 적용하여 상기 측정 대상자의 순간 혈당 레벨을 예측하는 단계; 및 상기 PPG 신호 데이터 및 상기 순간 혈당 레벨을 상기 제2 예측 모델에 적용하여 상기 측정 대상자의 평균 혈당 레벨을 예측하는 단계를 포함할 수 있다.
실시예들 중에서, 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 장치는 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집하는 학습 데이터 수집부; 상기 학습 데이터를 기초로 학습 알고리즘을 이용하여 상기 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축하는 예측 모델 구축부; 측정 대상자의 PPG 신호 데이터를 수집하는 측정 데이터 수집부; 및 상기 PPG 신호 데이터를 상기 예측 모델에 적용하여 상기 측정 대상자의 당화혈색소 레벨을 예측하는 당화혈색소 예측부를 포함한다.
상기 학습 데이터는 상기 PPG 신호로부터 추출되는 적어도 하나의 피처, 상기 PPG 신호가 측정된 시점을 기준으로 해당 환자가 공복 상태인지에 관한 제1 생리 상태 및 상기 해당 환자가 복약 상태인지에 관한 제2 생리 상태를 포함할 수 있다.
상기 예측 모델 구축부는 CNN(Convolution Neural Network), RNN(Recursive Neural Network), CNN-RNN을 포함하는 1D 모델들 중 어느 하나를 상기 학습 알고리즘으로서 이용할 수 있다.
상기 예측 모델 구축부는 상기 학습 데이터를 기초로 각각이 독립적으로 구축된 복수의 예측 모델들 중에서 품질 메트릭에 기반한 검증 결과에 따라 가장 최적의 성능을 가진 예측 모델을 결정할 수 있다.
개시된 기술은 다음의 효과를 가질 수 있다. 다만, 특정 실시예가 다음의 효과를 전부 포함하여야 한다거나 다음의 효과만을 포함하여야 한다는 의미는 아니므로, 개시된 기술의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
본 발명의 일 실시예에 따른 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치는 학습 알고리즘 (Learning Algorithm)을 이용하여 정확하고 용이하게 비침습적으로 당화혈색소(HbA1c)의 농도를 측정할 수 있다.
도 1은 본 발명에 따른 비침습적 당화혈색소 측정 시스템을 설명하기 위한 도면이다.
도 2는 도 1의 당화혈색소 측정 장치의 시스템 구성을 설명하는 도면이다.
도 3은 도 1의 당화혈색소 측정 장치의 기능적 구성을 설명하는 도면이다.
도 4는 본 발명에 따른 비침습적 당화혈색소 측정 방법을 설명하는 순서도이다.
도 5는 학습 알고리즘으로서 1D CNN 모델을 설명하는 도면이다.
도 6은 A1c 및 혈당 간의 비교를 설명하는 도면이다.
본 발명에 관한 설명은 구조적 내지 기능적 설명을 위한 실시예에 불과하므로, 본 발명의 권리범위는 본문에 설명된 실시예에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 실시예는 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 본 발명의 권리범위는 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다. 또한, 본 발명에서 제시된 목적 또는 효과는 특정 실시예가 이를 전부 포함하여야 한다거나 그러한 효과만을 포함하여야 한다는 의미는 아니므로, 본 발명의 권리범위는 이에 의하여 제한되는 것으로 이해되어서는 아니 될 것이다.
한편, 본 출원에서 서술되는 용어의 의미는 다음과 같이 이해되어야 할 것이다.
"제1", "제2" 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하기 위한 것으로, 이들 용어들에 의해 권리범위가 한정되어서는 아니 된다. 예를 들어, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어"있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결될 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어"있다고 언급된 때에는 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 한편, 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다" 또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이며, 하나 또는 그 이상의 다른 특징이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
각 단계들에 있어 식별부호(예를 들어, a, b, c 등)는 설명의 편의를 위하여 사용되는 것으로 식별부호는 각 단계들의 순서를 설명하는 것이 아니며, 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않는 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
본 발명은 컴퓨터가 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현될 수 있고, 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있다. 또한, 컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
여기서 사용되는 모든 용어들은 다르게 정의되지 않는 한, 본 발명이 속하는 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한 이상적이거나 과도하게 형식적인 의미를 지니는 것으로 해석될 수 없다.
기계 학습(machine learning)의 첫 번째 요구 사항은 방대하고 다양한 데이터 세트에 해당할 수 있다. 이 목적을 달성하려면 매우 많은 데이터 세트를 수집할 필요가 있다(예를 들어, 약 5k가 가장 좋을 수 있다). 즉, 더 많은 데이터를 학습 과정에 적용할수록 구축되는 학습 모델은 보다 일반화된 결과를 예측할 수 있다.
기계 학습의 두 번째 요구 사항은 복잡하고 많은 연산을 수행하기 위한 충분한 하드웨어 사양에 해당할 수 있다. 딥러닝(deep learning)은 방대한 데이터 세트와 함께 작동하므로 학습을 위해 데이터를 보관하는 RAM이 매우 중요할 수 있으며, 대부분의 ML 연구에서 32/64GB RAM이 사용되고 있다.
기계 학습의 세 번째 요구 사항은 하드웨어 설정 후 선택될 수 있는 프레임워크(framework)에 해당할 수 있다. 현재 Facebook Inc.에서 개발한 Pytorch의 딥러닝 프레임워크가 인기 있다. 하드웨어, 소프트웨어 및 프레임워크 선택이 완료되면 다양한 모델들 중에서 데이터에 가장 적합한 모델을 결정하여 당화혈색소 측정에 활용할 수 있다.
도 1은 본 발명에 따른 비침습적 당화혈색소 측정 시스템을 설명하기 위한 도면이다.
도 1을 참조하면, 비침습적 당화혈색소 측정 시스템(100)은 사용자 단말(110), 당화혈색소 측정 장치(130) 및 데이터베이스(150)를 포함할 수 있다.
사용자 단말(110)은 학습 데이터를 제공하거나 또는 당화혈색소 측정 결과를 확인할 수 있는 컴퓨팅 장치에 해당할 수 있고, 스마트폰, 노트북 또는 컴퓨터로 구현될 수 있으며, 반드시 이에 한정되지 않고, 태블릿 PC 등 다양한 디바이스로도 구현될 수 있다. 사용자 단말(110)은 당화혈색소 측정 장치(130)와 네트워크를 통해 연결될 수 있고, 복수의 사용자 단말(110)들은 당화혈색소 측정 장치(130)와 동시에 연결될 수 있다.
일 실시예에서, 사용자 단말(110)은 사용자로부터 PPG 신호를 측정할 수 있다. 예를 들어, 사용자 단말(110)은 카메라 모듈을 통해 사용자의 특정 신체부위(손가락 끝)에 대한 영상을 획득할 수 있고, 해당 영상에 대해 신호 처리 과정을 수행하여 PPG 신호를 생성할 수 있다. 또한, 신호 처리 과정에서 영상으로부터 색상(color) 성분과 명도(intensity) 성분을 선택적으로 추출하여 사용할 수 있으며, 필요에 따라 카메라 모듈을 통한 영상 촬영 시 플래시 모듈을 함께 사용할 수도 있다. 이때, 색상 성분은 적색(Red), 청색(Blue), 녹색(Green) 등을 포함할 수 있다.
일 실시예에서, 사용자 단말(110)은 사용자로부터 PPG 신호 측정과 관련된 질의를 제공할 수 있고, 그 응답으로서 공복 상태인지에 관한 제1 생리 상태 및 복약 상태인지에 관한 제2 생리 상태에 관한 정보를 수신할 수 있다. 즉, 사용자는 자신의 현재 상태가 식사 전인지 또는 식사 후인지에 대한 정보와 약을 복용하기 전인지 또는 복용한 후인지에 대한 정보를 추가적으로 입력할 수 있다.
일 실시예에서, 사용자 단말(110)은 PPG 신호 측정을 위한 전용 단말들과 연동하여 PPG 신호를 수집할 수 있다. 예를 들어, PPG 신호 측정을 위한 전용 단말은 SEN, AFE(Analog Front End) 등의 센서 모듈을 포함할 수 있다. 즉, 사용자 단말(110)은 전용 단말에 의해 측정된 PPG 신호를 수집할 수 있고, 당화혈색소 측정 장치(130)에 제공할 수 있다.
당화혈색소 측정 장치(130)는 학습 알고리즘을 활용하여 당화혈색소의 농도를 예측하기 위한 학습 모델을 구축하고 이를 활용하여 당화혈색소의 농도를 비침습적으로 측정할 수 있는 컴퓨터 또는 프로그램에 해당하는 서버로 구현될 수 있다. 당화혈색소 측정 장치(130)는 사용자 단말(110)과 네트워크를 통해 연결되어 정보를 주고받을 수 있다. 일 실시예에서, 당화혈색소 측정 장치(130)는 데이터베이스(150)와 연동하여 당화혈색소의 농도를 측정하기 위해 필요한 데이터를 저장할 수 있다.
데이터베이스(150)는 당화혈색소 측정 장치(130)의 동작 과정에서 필요한 다양한 정보들을 저장하는 저장장치에 해당할 수 있다. 데이터베이스(150)는 머신러닝을 위한 학습 데이터 및 학습 모델을 각각 저장할 수 있고, 학습 과정에 사용되는 다양한 학습 알고리즘들 및 그 파라미터에 관한 정보를 저장할 수 있으며, 반드시 이에 한정되지 않고, 당화혈색소 측정 장치(130)가 비침습적인 당화혈색소 측정을 수행하는 과정에서 다양한 형태로 수집 또는 가공된 정보들을 저장할 수 있다.
도 2는 도 1의 당화혈색소 측정 장치의 시스템 구성을 설명하는 도면이다.
도 2를 참조하면, 당화혈색소 측정 장치(130)는 프로세서(210), 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)를 포함할 수 있다.
프로세서(210)는 당화혈색소 측정 장치(130)가 동작하는 과정에서의 각 단계들을 처리하는 프로시저를 실행할 수 있고, 그 과정 전반에서 읽혀지거나 작성되는 메모리(230)를 관리할 수 있으며, 메모리(230)에 있는 휘발성 메모리와 비휘발성 메모리 간의 동기화 시간을 스케줄할 수 있다. 프로세서(210)는 당화혈색소 측정 장치(130)의 동작 전반을 제어할 수 있고, 메모리(230), 사용자 입출력부(250) 및 네트워크 입출력부(270)와 전기적으로 연결되어 이들 간의 데이터 흐름을 제어할 수 있다. 프로세서(210)는 당화혈색소 측정 장치(130)의 CPU(Central Processing Unit)로 구현될 수 있다.
메모리(230)는 SSD(Solid State Drive) 또는 HDD(Hard Disk Drive)와 같은 비휘발성 메모리로 구현되어 당화혈색소 측정 장치(130)에 필요한 데이터 전반을 저장하는데 사용되는 보조기억장치를 포함할 수 있고, RAM(Random Access Memory)과 같은 휘발성 메모리로 구현된 주기억장치를 포함할 수 있다.
사용자 입출력부(250)는 사용자 입력을 수신하기 위한 환경 및 사용자에게 특정 정보를 출력하기 위한 환경을 포함할 수 있다. 예를 들어, 사용자 입출력부(250)는 터치 패드, 터치 스크린, 화상 키보드 또는 포인팅 장치와 같은 어댑터를 포함하는 입력장치 및 모니터 또는 터치스크린과 같은 어댑터를 포함하는 출력장치를 포함할 수 있다. 일 실시예에서, 사용자 입출력부(250)는 원격 접속을 통해 접속되는 컴퓨팅 장치에 해당할 수 있고, 그러한 경우, 당화혈색소 측정 장치(130)는 독립적인 서버로서 수행될 수 있다.
네트워크 입출력부(270)은 네트워크를 통해 외부 장치 또는 시스템과 연결하기 위한 환경을 포함하고, 예를 들어, LAN(Local Area Network), MAN(Metropolitan Area Network), WAN(Wide Area Network) 및 VAN(Value Added Network) 등의 통신을 위한 어댑터를 포함할 수 있다.
도 3은 도 1의 당화혈색소 측정 장치의 기능적 구성을 설명하는 도면이다.
도 3을 참조하면, 당화혈색소 측정 장치(130)는 학습 데이터 수집부(310), 예측 모델 구축부(330), 측정 데이터 수집부(350), 당화혈색소 예측부(370) 및 제어부(390)를 포함할 수 있다.
학습 데이터 수집부(310)는 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집할 수 있다. 여기에서, PPG 신호는 투과형 및 반사형 데이터를 포함할 수 있다. 즉, 학습 데이터 수집부(310)는 다양한 출처를 통해 실제 환자들 또는 정상인들의 PPG 신호와 해당 측정 당시 당화혈색소 레벨(또는 농도값)에 대한 정보를 수집할 수 있으며, 이를 기초로 인공지능 모델을 구축하기 위한 학습 데이터를 생성할 수 있다. 이때, 당화혈색소 레벨은 병원이나 상업용 의료 기기를 통해 획득할 수도 있다. 환자들 및 정상인들로부터 수집되는 정보는 다양한 생체 정보를 포함할 수 있으며, 학습 데이터 수집부(310)는 해당 데이터로부터 학습 데이터 생성에 필요한 유효 데이터를 추출하고 가공하는 전처리 연산을 수행할 수 있다.
일 실시예에서, 학습 데이터는 PPG 신호로부터 추출되는 적어도 하나의 피처(feature), PPG 신호가 측정된 시점을 기준으로 해당 환자가 공복 상태인지에 관한 제1 생리 상태 및 해당 환자가 복약 상태인지에 관한 제2 생리 상태를 포함할 수 있다. 예를 들어, PPG 신호로부터 추출되는 피처(feature)는 파장, 주파수, 피크(peak), 피크 간격(peak interval), 에너지 크기, 심박수(HR, Heart Rate), 심박 변이도 (HRV, Heart Rate Variability), 맥파 속도(PWV, Pulse Wave Velocity) 및 AC/DC 등을 포함할 수 있다. 또한, 제1 생리 상태는 환자가 PPG 신호를 측정할 당시 공복 상태인지에 관한 정보에 해당할 수 있으며, 제2 생리 상태는 환자가 PPG 신호를 측정할 당시 복약 상태인지에 관한 정보에 해당할 수 있다.
즉, 당화혈색소 측정 장치(130)는 단순히 환자의 PPG 신호만을 학습하여 예측 모델을 구축할 수도 있으나, 예측 정확도를 높이기 위하여 추가 데이터를 학습 데이터로 포함하여 예측 모델을 구축할 수 있다. 즉, 공복 상태 또는 복약 상태에 따라 측정 대상자의 혈당 레벨 또는 당화혈색소 레벨이 달라질 수 있으며, 예측 모델은 PPG 신호 외에 다양한 생리적 정보들을 추가로 학습하여 측정 대상자의 신체 상태에 따른 당화혈색소 레벨에 대해 보다 정확도 높은 예측 결과를 생성할 수 있다.
일 실시예에서, 학습 데이터 수집부(310)는 기 정의된 품질 메트릭(metric)들 중 적어도 하나를 이용하여 PPG 신호를 필터링 하고, 필터링 된 PPG 신호를 정규화 시키며, 정규화 된 PPG 신호를 표준화 시킬 수 있다. 학습 데이터 수집부(310)는 데이터 전처리 연산을 통해 필터링 연산, 정규화 연산 및 표준화 연산을 각각 독립적으로 수행할 수 있으며, 필요에 따라 특정 순서로 조합된 결과로서 복합 연산을 수행할 수 있다.
보다 구체적으로, PPG 신호에 대한 필터링 연산에는 칼만필터, 적응필터 등 다양한 필터들을 활용할 수 있으며, 기 정의된 품질 메트릭(SQM, Signal Quality Metric)을 활용할 수도 있다. 예를 들어, 품질 메트릭은 로우(raw) PPG 신호 또는 필터링된 PPG 신호에 관한 다양한 통계적(statistical) 특성 또는 스펙트럼(spectral) 특성을 포함할 수 있다. 또한, 학습 데이터 수집부(310)는 다음의 수학식 1을 통해 PPG 신호에 대한 정규화 연산을 수행할 수 있다.
[수학식 1]
Figure pat00001
여기에서, xnew1은 정규화 점수, x는 특정 PPG 신호, xmin은 PPG 신호들의 최소값, xmax는 PPG 신호들의 최대값에 해당한다.
또한, 학습 데이터 수집부(310)는 다음의 수학식 2를 통해 PPG 신호에 대한 표준화(또는 z-점수화) 연산을 수행할 수 있다.
[수학식 2]
Figure pat00002
여기에서, xnew2는 표준화 점수, x는 특정 PPG 신호, mean은 PPG 신호들의 평균, σ는 PPG 신호들의 표준편차에 해당한다.
일 실시예에서, 학습 데이터 수집부(310)는 PPG 신호로부터 적어도 하나의 피처를 추출하고 해당 적어도 하나의 피처에 대해 필터링, 정규화 및 표준화 연산을 순차적으로 수행할 수 있다. 즉, 당화혈색소 측정 장치(130)는 학습 데이터 수집부(310)에 의해 추출된 적어도 하나의 피처 신호를 기초로 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축할 수 있다.
예측 모델 구축부(330)는 학습 데이터를 기초로 학습 알고리즘을 이용하여 당화혈색소 레벨(또는 농도값)을 예측하기 위한 예측 모델을 구축할 수 있다. 즉, 예측 모델 구축부(330)는 당화혈색소의 농도 예측을 위해 딥러닝을 포함하는 인공지능 기법을 활용함으로써 측정 대상자의 당화혈색소의 농도를 비침습적이면서도 정확도 높게 측정할 수 있다. 한편, 예측 모델을 위해 다양한 학습 알고리즘이 사용될 수 있으나, 필요에 따라 복수의 학습 알고리즘들 중에서 예측 성능이 좋은 알고리즘만이 선택적으로 당화혈색소 측정에 적용될 수 있다.
일 실시예에서, 예측 모델 구축부(330)는 CNN(Convolution Neural Network), RNN(Recursive Neural Network), CNN-RNN을 포함하는 1D 모델들 중 어느 하나를 학습 알고리즘으로서 이용할 수 있다. 즉, 예측 모델 구축부(330)는 예측 모델을 선택하기 위한 동작을 수행할 수 있으며, 다양한 학습 모델 중 1D 모델을 채택할 수 있다. 또한, 예측 모델 구축부(330)는 다양한 1D 모델들 중 어느 하나를 채택할 수도 있다.
보다 구체적으로, CNN은 이미지 영역(즉, 픽셀이 공간적으로 분산된 경우)의 학습을 위해 고안되었으나 시간 영역 데이터에 대해서도 뛰어난 효율성을 제공할 수 있다. 예를 들어, 1D(Dimensional) CNN은 혈당 레벨(BGL, Blood Glucose Level)을 예측하는데 활용될 수 있으며, 필터링된 PPG 신호를 입력 데이터로서 사용할 수 있다. 또한, CNN은 PPG 신호를 기초로 당뇨 환자와 비당뇨 환자를 분류하는데 활용될 수도 있다.
RNN은 시간 영역에서 특징을 추출하기 위하여 사용될 수 있다. 즉, RNN은 시간에 따른 입력 시퀀스(time sequence)에서 시간적 동작을 추출할 수 있다. 한편, RNN에서 파생된 LSTM(Long Short-Term Memory)은 이전의 시계열 데이터를 기초로 미래 시점의 혈당 레벨(BGL)을 예측하는데 사용될 수 있다. 보다 구체적으로, LSTM은 RNN의 한 종류에 해당하지만, 정보를 기억할지 또는 망각할지를 선택할 수 있다는 점에서 가장 최근의 정보만 저장하는 RNN과 달리 장, 단기 정보를 선택적으로 저장하여 학습할 수 있고, 이에 따라 시계열 예측 성능이 좋은 장점을 가질 수 있다. 또한, RNN 대신 GRU(Gated Recurrent Unit)가 사용될 수도 있다.
CNN-RNN은 CNN과 RNN을 융합한 구조에 해당할 수 있으며, 연속적인 혈당 농도 데이터 및 다른 생리학적 데이터(예를 들어, 연령, 혈압, 식사 패턴 등)를 기초로 미래 시점의 혈당 레벨(BGL)을 예측하는데 사용될 수 있다. 또한, CNN-RNN은 RR-interval(예를 들어, 심전도(ECG)에서 파생된 심박변이도(HRV))를 기초로 당뇨병을 예측하는데 사용될 수 있다. 한편, CNN-RNN은 CNN-LSTM으로 대체되어 사용될 수 있다.
일 실시예에서, 예측 모델 구축부(330)는 학습 알고리즘에 대해 활성화 함수(activation function)로서 tanh, ReLu, Leaky ReLu, Logistic/Sigmoid, ELU, Linear 및 소프트맥스(Softmax) 중 어느 하나를 적용할 수 있다.
보다 구체적으로, 하이퍼볼릭 탄젠트(tanh)는 [-1,1] 범위의 출력을 제공할 수 있으며, 이때 출력의 중심은 0에 해당할 수 있다. 하이퍼볼릭 탄젠트의 기울기는 시그모이드(Sigmoid)보다 클 수 있다. 하이퍼볼릭 탄젠트는 주로 LSTM/RNN 아키텍처와 함께 사용될 수 있으며, 다음의 수학식 3과 같이 표현될 수 있다.
[수학식 3]
Figure pat00003
정류 선형 유닛(ReLu, Rectified Linear unit)은 입력값이 0보다 작으면 0을 출력하고, 0보다 크면 입력값 그대로 출력할 수 있으며, 다음의 수학식 4와 같이 표현될 수 있다.
[수학식 4]
Figure pat00004
Leaky ReLu는 ReLu의 변형 함수로서 입력에 음수가 포함된 경우 효과적일 수 있으며, 다음의 수학식 5와 같이 표현될 수 있다.
[수학식 5]
Figure pat00005
여기에서, α는 제어 파라미터(controlling parameter)이다.
로지스틱/시그모이드(Logistic/Sigmoid)는 [0,1] 범위의 출력을 제공할 수 있고, 회귀자(regressor)로 사용될 수 있으며, 다음의 수학식 6과 같이 표현될 수 있다.
[수학식 6]
Figure pat00006
지수 선형 유닛(ELU, Exponential Linear Unit)은 양수부분에서 입력값을 정제없이 출력하여 기울기 소실 문제를 방지할 수 있으며, 다음의 수학식 7과 같이 표현될 수 있다.
[수학식 7]
Figure pat00007
여기에서, α는 제어 파라미터(controlling parameter)이다.
선형 함수(Linear)는 출력이 입력에 비례하는 경우 사용될 수 있으며, f(x) = x와 같이 표현될 수 있다.
소프트맥스(Softmax)는 가능한 모든 대상 클래스에 대한 각 대상 클래스의 확률을 계산할 수 있고, 이후 단계에서 계산된 확률은 주어진 입력에 대한 목표 클래스를 결정하는데 사용될 수 있으며, 다음의 수학식 8과 같이 표현될 수 있다.
[수학식 8]
Figure pat00008
일 실시예에서, 예측 모델 구축부(330)는 학습 알고리즘에 대해 최적화 알고리즘(optimizer)으로서 Adagrad, Adadelta, Adam 및 SGD(Stochastic gradient descent) 중 어느 하나를 적용할 수 있다. 여기에서, 최적화 알고리즘은 실제 예측 모델의 전체 성능을 제어하는 역할을 수행할 수 있다. 따라서, 정확하고 효율적인 최적화 알고리즘을 선택하는 것은 매우 어려울 수 있다.
보다 구체적으로, 아다그라드(Adagrad)는 adaptive gradient의 약어에 해당할 수 있으며, 매개 변수 (w)는 높은 기울기를 가질수록 더 느린 학습률(learning rate)을 나타낼 수 있고, 낮은 기울기를 가질수록 더 빠른 학습률을 나타낼 수 있다. 기울기(g), 학습률(α) 및 가중치(W)는 다음의 수학식 9와 같이 t의 반복(iteration)에 의해 연결될 수 있다.
[수학식 9]
Figure pat00009
Figure pat00010
여기에서,
Figure pat00011
은 10-4 ~ 10-8정도의 작은 값으로서 0으로 나누는 것을 방지하기 위한 작은 값이다.
아다델타(Adadelta)는 Adaptive delta의 약어에 해당할 수 있고, 확률 적 경사하강법 알고리즘의 변형에 해당할 수 있다. 아다델타는 오버피팅(overfitting)을 줄이는 학습 과정에서 적응형 학습률(adaptive learning rate)을 사용할 수 있다. 아다델타는 기울기 업데이트의 윈도우(window) 움직임을 기반으로 하는 학습률 측면에서 아다그라드(Adagrad)보다 더 강력할 수 있다.
아담(Adam)은 adaptive moment estimation의 약어에 해당할 수 있다. 아담은 RMSProp과 모멘텀의 조합에 해당할 수 있으며, 각 매개 변수에 대한 적응형 학습률을 계산할 수 있다.
확률적 경사하강법(SGD, Stochastic Gradient Descent)은 거대한 데이터 집합에서 무작위로 추출한 샘플을 통해 거대한 데이터 집합에 대한 지역 최소값(local minima)을 순환하는 문제를 해결할 수 있다. 확률적 경사하강법은 전역 최소값(global minimum)에 도달할 수 있지만, 해당 프로세스는 느리고 노이즈가 많을 수 있다.
일 실시예에서, 예측 모델 구축부(330)는 학습 알고리즘에 대해 손실 함수(loss function)로서 이진 교차 엔트로피(Binary cross entropy), 범주 형 교차 엔트로피(Categorical entropy), 쿨백-라이블러(Kullback-Leibler), 평균 제곱 오차(Mean Squared Error, MSE) 및 평균 절대 오차(Mean Absolute Error, 평균 절대 오차) 중 어느 하나를 적용할 수 있다. 손실 함수는 출력 유형에 따라 달라질 수 있으며, 일반적으로 손실은 확률적 손실(출력이 0에서 1 사이 인 경우)과 회귀 손실(연속 값이 추정되는 경우)의 두 가지 유형으로 구분될 수 있다.
보다 구체적으로, 이진 교차 엔트로피(Binary cross entropy)는 오직 두개의 클래스가 존재하는 경우 사용될 수 있다. y가 이진 표시자(binary indicator)이고 p가 예측 확률(predicted probability)이면 손실은 다음의 수학식 10과 같이 표현될 수 있다.
[수학식 10]
-(ylog(p) + (1 - y)log(1 - p))
범주 형 교차 엔트로피(Categorical entropy)는 다중 클래스(M=2)가 있는 경우 교차 엔트로피(cross entropy) 손실 함수는 다음의 수학식 11과 같이 정의될 수 있다.
[수학식 11]
Figure pat00012
여기에서, o는 클래스 c의 확률 관측치(probability observation)이다.
쿨백-라이블러(Kullback-Leibler)는 주로 생성 모델(generative model) 또는 오토인코더(autoencoder)에서 사용될 수 있으며, 다음의 수학식 12와 같이 표현될 수 있다.
[수학식 12]
Figure pat00013
여기에서, ytrue는 실제 확률분포이고, ypred는 예측 확률분포이다.
평균 제곱 오차(Mean Squared Error, MSE)는 회귀(regression) 목적으로 사용될 수 있으며, loss = (ytrue - ypred)2와 같이 표현될 수 있다.
평균 절대 오차(Mean Absolute Error, 평균 절대 오차)는 회귀 분석(regression analysis)에 사용될 수 있으며, loss = |ytrue - ypred|와 같이 표현될 수 있다.
일 실시예에서, 예측 모델 구축부(330)는 학습 알고리즘들을 기초로 후보 예측 모델들을 독립적으로 구축하고, 특이도(specificity), 민감도(sensitivity) 및 AUC(area under curve)를 포함하는 복수의 품질 메트릭들을 이용하여 후보 예측 모델들을 검증하며, 검증의 결과를 기초로 가장 최적의 성능을 가진 후보 예측 모델을 최종 결정할 수 있다. 즉, 예측 모델 구축부(330)는 적어도 하나의 품질 메트릭을 특정한 후 해당 품질 메트릭에 따라 후보 예측 모델들의 성능 점수를 산출할 수 있으며, 가장 높은 성능 점수를 가진 후보 예측 모델을 최종 결정할 수 있다. 한편, 품질 메트릭은 양성율(True Positive Rate, TPR), 위양성율(False Positive Rate, FPR)을 포함할 수 있다.
특이도(specificity) 및 민감도(sensitivity)는 예측을 위한 통계적 지표에 해당할 수 있다. 즉, 특이도는 음성(negative)에 해당하는 경우 예측 결과가 음성을 나올 확률에 해당할 수 있고, 민감도는 양성(positive)에 해당하는 경우 예측 결과가 양성일 확률에 해당할 수 있다. AUC(area under curve)는 가능한 모든 분류 임계값에서 성능의 집계 측정값을 제공할 수 있다.
일 실시예에서, 예측 모델 구축부(330)는 학습 데이터를 기초로 혈당 레벨을 예측하기 위한 제1 예측 모델을 구축하고, 학습 데이터 및 제1 예측 모델의 출력 데이터를 기초로 단위 기간 동안의 평균 혈당 레벨을 예측하기 위한 제2 예측 모델을 구축할 수 있다. 즉, 예측 모델 구축부(330)는 당화혈색소 레벨을 예측하기 위한 학습 모델을 단계적으로 구성할 수 있다. 예를 들어, 예측 모델 구축부(330)에 의해 사전에 구축되는 예측 모델은 복수의 하위 모델들로 구성될 있으며, 제1 및 제2 예측 모델들을 포함할 수 있다. 제1 예측 모델은 PPG 신호를 기초로 순간 혈당 레벨을 예측할 수 있고, 제2 예측 모델은 PPG 신호와 제1 예측 모델에 의해 예측된 순간 혈당 레벨을 기초로 단위 기간 동안의 평균 혈당 레벨을 예측할 수 있다.
측정 데이터 수집부(350)는 측정 대상자의 PPG 신호 데이터를 수집할 수 있다. 측정 데이터 수집부(350)는 다양한 방법으로 측정 대상자의 PPG 신호 데이터를 수집할 수 있으며, 투과형 및 반사형 데이터를 모두 수집할 수 있다. 예를 들어, PPG 신호 데이터는 측정 대상자의 사용자 단말(110)을 통해 측정될 수 있으며, 해당 데이터는 사용자 단말로부터 측정 데이터 수집부(350)로 전송될 수 있다. 한편, 측정 데이터 수집부(350)는 측정 결과의 정확도를 향상시키기 위하여 PPG 신호 데이터에 대한 필터링, 정규화 및 표준화 연산을 수행할 수 있다.
당화혈색소 예측부(370)는 PPG 신호 데이터를 예측 모델에 적용하여 측정 대상자의 당화혈색소 레벨을 예측할 수 있다. 즉, 당화혈색소 예측부(370)는 측정 대상자의 PPG 신호 데이터를 예측 모델의 입력 데이터 형식에 맞춰 변환할 수 있고, 예측 모델의 출력을 기초로 측정 대상자의 당화혈색소 레벨(또는 농도값)을 예측할 수 있다.
일 실시예에서, 당화혈색소 예측부(370)는 PPG 신호 데이터를 제1 예측 모델에 적용하여 측정 대상자의 순간 혈당 레벨을 예측하고, PPG 신호 데이터 및 순간 혈당 레벨을 제2 예측 모델에 적용하여 측정 대상자의 평균 혈당 레벨을 예측할 수 있다. 당화혈색소 레벨 예측을 위한 예측 모델은 복수의 하위 모델들로 구성될 수 있으며, 예측 모델 구축부(330)에 의해 제1 및 제2 예측 모델들이 사전에 구축될 수 있다. 이 경우, 당화혈색소 예측부(370)는 측정 대상자로부터 획득한 PPG 신호 데이터에 대해 제1 및 제2 예측 모델들을 순차적으로 적용하여 당화혈색소 레벨을 예측할 수 있다.
제어부(390)는 당화혈색소 측정 장치(130)의 전체적인 동작을 제어하고, 학습 데이터 수집부(310), 예측 모델 구축부(330), 측정 데이터 수집부(350) 및 당화혈색소 예측부(370) 간의 제어 흐름 또는 데이터 흐름을 관리할 수 있다.
도 4는 본 발명에 따른 비침습적 당화혈색소 측정 방법을 설명하는 순서도이다.
도 4를 참조하면, 당화혈색소 측정 장치(130)는 학습 데이터 수집부(310)를 통해 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집할 수 있다(단계 S410). 당화혈색소 측정 장치(130)는 예측 모델 구축부(330)를 통해 학습 데이터를 기초로 학습 알고리즘을 이용하여 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축할 수 있다(단계 S430). 또한, 당화혈색소 측정 장치(130)는 측정 데이터 수집부(350)를 통해 측정 대상자의 PPG 신호 데이터를 수집할 수 있다(단계 S450). 당화혈색소 측정 장치(130)는 당화혈색소 예측부(370)를 통해 PPG 신호 데이터를 예측 모델에 적용하여 측정 대상자의 당화혈색소 레벨을 예측할 수 있다(단계 S470).
일 실시예에서, 당화혈색소 측정 장치(130)는 인공지능 모델과 함께 상태 모델(state model)을 활용하여 당화혈색소 레벨을 측정할 수 있다. 여기에서, 상태 모델(state model)은 측정 대상자로부터 수집된 정보(예를 들어, 생리 정보)를 활용하여 측정 대상자의 현재 상태를 기 정의된 복수의 상태들 중 어느 하나로 분류하는 동작을 수행할 수 있다. 즉, 당화혈색소 측정 장치(130)는 측정 대상자로부터 수집된 정보를 기초로 상태 모델을 통해 현재 상태를 예측할 수 있으며, 현재 상태를 기준으로 인공지능 모델을 통해 당화혈색소 레벨을 측정할 수 있다. 이를 통해, 당화혈색소 측정 장치(130)는 측정 대상자의 다양한 상태를 당화혈색소 레벨 측정에 반영할 수 있으며, 보다 정확도 높은 측정치를 제공할 수 있다.
일 실시예에서, 당화혈색소 측정 장치(130)는 상태 모델(state model)에 의해 분류되는 상태 별로 독립된 예측 모델을 구축할 수 있으며, 상태 모델을 통한 상태 분류를 수행하는 제1 분석 단계와 예측 모델을 통한 당화혈색소 측정을 수행하는 제2 분석 단계를 순차적으로 수행하여 측정 대상자의 당화혈색소 레벨을 측정할 수 있다. 이를 위하여, 당화혈색소 측정 장치(130)는 상태 모델에 의해 분류되는 상태 별로 학습 데이터들을 사전 분류할 수 있고, 분류된 학습 데이터만을 학습하여 각 상태별 예측 모델을 구축할 수 있다.
도 5는 학습 알고리즘으로서 1D CNN 모델을 설명하는 도면이다.
도 5를 참조하면, 당화혈색소 측정 장치(130)는 1D CNN 모델(510)을 이용하여 측정 대상자의 당화혈색소 레벨을 비침습적으로 측정할 수 있다. 이때, 1D CNN 모델(510)에서 입력 사이즈는 1 * k(k는 한 프레임의 샘플 수)에 해당할 수 있다. 또한, ReLu와 Adam이 활성화 함수와 모델 최적화 알고리즘으로 사용될 수 있다.
도 5에서, N은 필터(filter)들의 개수에 해당할 수 있고, 8, 16, 32, 64 등과 같이 2m으로 증가할 수 있다. m(여기서, m은 양의 정수)은 필터의 크기(size)에 해당할 수 있고, 통상적으로 윈도우의 길이에 해당할 수 있으며, 2D 모델에서는 3*3 또는 5*5에 해당할 수 있다. 1D 모델의 경우 필터의 높이를 필터의 사이즈로 간주할 수 있고, 1 내지 3 사이의 값을 가질 수 있으나, 반드시 이에 한정되지 않음은 물론이다.
s는 스트라이드(stride)의 크기에 해당할 수 있고, 통상적으로 1에 해당할 수 있다. p는 패딩(padding)의 크기에 해당할 수 있으며, 제로 패딩(zero padding) 또는 다른 패딩 기법이 사용될 수 있다. c는 밀집 레이어(dense layer)의 뉴런(neuron) 개수에 해당할 수 있고, 회귀 문제의 마지막 밀집 레이어에서 c = 1이고, 분류 문제의 마지막 밀집 레이어에서 c = 클래스 개수(no. of classes)이다.
또한, 배치 사이즈(Batch size)는 32에 해당할 수 있고, 초기 학습률(initial learning rate)은 0.001 ~ 0.01에 해당할 수 있다. 한편, 학습률은 반복 횟수에 따라 달라질 수 있다. 손실 함수(Loss function)는 회귀의 경우 MAE(mean absolute error)에 해당할 수 있고, 분류의 경우 범주 형 크로스 엔트로피(categorical cross entropy)에 해당할 수 있다. 데이터 집합의 구성은 학습용 80%, 검증용 10% 및 테스트용 10%로 구성될 수 있으며, 필요에 따라 해당 비율을 상이하게 적용될 수도 있다.
또한, 당화혈색소 측정 장치(130)는 오버피팅(Overfitting) 문제를 해결하기 위해 확률 0.2의 드롭아웃 레이어(dropout layer)를 파라미터 번호가 높은 곳에 적용할 수 있다. 당화혈색소 측정 장치(130)는 배치 정규화(BN, Batch Normalization)을 활용하여 오버피팅을 방지할 수 있다.
도 6은 A1c 및 혈당 간의 비교를 설명하는 도면이다.
도 6을 참조하면, 당화혈색소 측정 장치(130)는 기 구축된 예측 모델을 이용하여 측정 대상자의 당화혈색소 레벨을 측정할 수 있다. 한편, 당화혈색소 측정 장치(130)는 예측된 당화혈색소 레벨을 이용하여 당뇨 여부를 결정할 수 있다. 도 6의 A1c 및 혈당(blood sugar) 간의 비교표에 의하면, 4% ~ 5.6%는 정상 범위에 해당하고, 5.7% ~ 6.4%는 당뇨 전 단계에 해당하며, 6.5% 이상은 당뇨(diabetes)에 해당할 수 있다. 즉, 당화혈색소 측정 장치(130)는 예측 모델을 통해 당화혈색소 레벨을 측정할 수 있고, 당화혈색소 레벨에 따라 당뇨 여부에 관한 분류 결과를 생성할 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
100: 비침습적 당화혈색소 측정 시스템
110: 사용자 단말 130: 당화혈색소 측정 장치
150: 데이터베이스
210: 프로세서 230: 메모리
250: 사용자 입출력부 270: 네트워크 입출력부
310: 학습 데이터 수집부 330: 예측 모델 구축부
350: 측정 데이터 수집부 370: 당화혈색소 예측부
390: 제어부
510: 1D CNN 모델

Claims (12)

  1. 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집하는 단계;
    상기 학습 데이터를 기초로 학습 알고리즘을 이용하여 상기 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축하는 단계;
    측정 대상자의 PPG 신호 데이터를 수집하는 단계; 및
    상기 PPG 신호 데이터를 상기 예측 모델에 적용하여 상기 측정 대상자의 당화혈색소 레벨을 예측하는 단계를 포함하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  2. 제1항에 있어서, 상기 학습 데이터를 수집하는 단계는
    기 정의된 품질 메트릭(metric)들 중 적어도 하나를 이용하여 상기 PPG 신호를 필터링 하는 단계;
    상기 필터링 된 PPG 신호를 정규화 시키는 단계; 및
    상기 정규화 된 PPG 신호를 표준화 시키는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  3. 제1항에 있어서, 상기 예측 모델을 구축하는 단계는
    CNN(Convolution Neural Network), RNN(Recursive Neural Network), CNN-RNN을 포함하는 1D 모델들 중 어느 하나를 상기 학습 알고리즘으로서 이용하는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  4. 제3항에 있어서, 상기 예측 모델을 구축하는 단계는
    상기 학습 알고리즘에 대해 활성화 함수(activation function)로서 tanh, ReLu, Leaky ReLu, Logistic/Sigmoid, ELU, Linear 및 소프트맥스(Softmax) 중 어느 하나를 적용하는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  5. 제4항에 있어서, 상기 예측 모델을 구축하는 단계는
    상기 학습 알고리즘에 대해 최적화 알고리즘(optimizer)으로서 Adagrad, Adadelta, Adam 및 SGD(Stochastic gradient descent) 중 어느 하나를 적용하는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  6. 제1항에 있어서, 상기 예측 모델을 구축하는 단계는
    학습 알고리즘들을 기초로 후보 예측 모델들을 독립적으로 구축하는 단계;
    특이성(specificity), 민감도(sensitivity) 및 AUC(area under curve)를 포함하는 복수의 품질 메트릭들을 이용하여 상기 후보 예측 모델들을 검증하는 단계; 및
    상기 검증의 결과를 기초로 가장 최적의 성능을 가진 후보 예측 모델을 최종 결정하는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  7. 제1항에 있어서, 상기 예측 모델을 구축하는 단계는
    상기 학습 데이터를 기초로 혈당 레벨을 예측하기 위한 제1 예측 모델을 구축하는 단계; 및
    상기 학습 데이터 및 상기 제1 예측 모델의 출력 데이터를 기초로 단위 기간 동안의 평균 혈당 레벨을 예측하기 위한 제2 예측 모델을 구축하는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  8. 제7항에 있어서, 상기 당화혈색소 레벨을 예측하는 단계는
    상기 PPG 신호 데이터를 상기 제1 예측 모델에 적용하여 상기 측정 대상자의 순간 혈당 레벨을 예측하는 단계; 및
    상기 PPG 신호 데이터 및 상기 순간 혈당 레벨을 상기 제2 예측 모델에 적용하여 상기 측정 대상자의 평균 혈당 레벨을 예측하는 단계를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법.
  9. 환자들의 PPG 신호와 당화혈색소(HbA1c) 레벨을 포함하는 학습 데이터를 수집하는 학습 데이터 수집부;
    상기 학습 데이터를 기초로 학습 알고리즘을 이용하여 상기 당화혈색소 레벨을 예측하기 위한 예측 모델을 구축하는 예측 모델 구축부;
    측정 대상자의 PPG 신호 데이터를 수집하는 측정 데이터 수집부; 및
    상기 PPG 신호 데이터를 상기 예측 모델에 적용하여 상기 측정 대상자의 당화혈색소 레벨을 예측하는 당화혈색소 예측부를 포함하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 장치.
  10. 제9항에 있어서, 상기 학습 데이터는
    상기 PPG 신호로부터 추출되는 적어도 하나의 피처, 상기 PPG 신호가 측정된 시점을 기준으로 해당 환자가 공복 상태인지에 관한 제1 생리 상태 및 상기 해당 환자가 복약 상태인지에 관한 제2 생리 상태를 포함하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 장치.
  11. 제9항에 있어서, 상기 예측 모델 구축부는
    CNN(Convolution Neural Network), RNN(Recursive Neural Network), CNN-RNN을 포함하는 1D 모델들 중 어느 하나를 상기 학습 알고리즘으로서 이용하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 장치.
  12. 제11항에 있어서, 상기 예측 모델 구축부는
    상기 학습 데이터를 기초로 각각이 독립적으로 구축된 복수의 예측 모델들 중에서 품질 메트릭에 기반한 검증 결과에 따라 가장 최적의 성능을 가진 예측 모델을 결정하는 것을 특징으로 하는 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 장치.
KR1020210002041A 2021-01-07 2021-01-07 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치 KR102472848B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210002041A KR102472848B1 (ko) 2021-01-07 2021-01-07 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210002041A KR102472848B1 (ko) 2021-01-07 2021-01-07 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20220099759A true KR20220099759A (ko) 2022-07-14
KR102472848B1 KR102472848B1 (ko) 2022-12-01

Family

ID=82406994

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210002041A KR102472848B1 (ko) 2021-01-07 2021-01-07 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102472848B1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100871074B1 (ko) 2007-02-01 2008-11-28 삼성전자주식회사 비침습형 혈당 측정 장치 및 그 방법
KR20180120061A (ko) * 2017-04-26 2018-11-05 김정희 인공 신경망 모델 학습 방법 및 딥 러닝 시스템
KR20190056858A (ko) * 2017-11-17 2019-05-27 가천대학교 산학협력단 딥러닝 기반의 혈압 예측 시스템 및 방법
CN110037710A (zh) * 2018-01-16 2019-07-23 中央研究院 非侵入式估测hba1c与血糖值的系统与方法
KR20190113451A (ko) * 2018-03-28 2019-10-08 주식회사 아이센스 인공신경망 딥러닝 기법을 활용한 측정물 분석 방법, 장치, 학습 방법 및 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100871074B1 (ko) 2007-02-01 2008-11-28 삼성전자주식회사 비침습형 혈당 측정 장치 및 그 방법
KR20180120061A (ko) * 2017-04-26 2018-11-05 김정희 인공 신경망 모델 학습 방법 및 딥 러닝 시스템
KR20190056858A (ko) * 2017-11-17 2019-05-27 가천대학교 산학협력단 딥러닝 기반의 혈압 예측 시스템 및 방법
CN110037710A (zh) * 2018-01-16 2019-07-23 中央研究院 非侵入式估测hba1c与血糖值的系统与方法
KR20190113451A (ko) * 2018-03-28 2019-10-08 주식회사 아이센스 인공신경망 딥러닝 기법을 활용한 측정물 분석 방법, 장치, 학습 방법 및 시스템

Also Published As

Publication number Publication date
KR102472848B1 (ko) 2022-12-01

Similar Documents

Publication Publication Date Title
Gjoreski et al. Machine learning and end-to-end deep learning for the detection of chronic heart failure from heart sounds
Çınar et al. Classification of normal sinus rhythm, abnormal arrhythmia and congestive heart failure ECG signals using LSTM and hybrid CNN-SVM deep neural networks
Karimi Moridani et al. Non-linear feature extraction from HRV signal for mortality prediction of ICU cardiovascular patient
KR20190114694A (ko) 인공지능을 이용한 시계열 데이터 학습 및 분석 방법
WO2021017313A1 (zh) 房颤的检测方法、装置、计算机设备及存储介质
US10950352B1 (en) System, computer-readable storage medium and method of deep learning of texture in short time series
CN109171754B (zh) 血糖预测模型的训练方法、装置、终端及存储介质
CN111080643A (zh) 基于眼底图像的糖尿病及相关疾病的分类方法及设备
CN111951965B (zh) 基于时序知识图谱的全景式健康动态监测与预测系统
Li et al. Signal processing and feature selection preprocessing for classification in noisy healthcare data
CN112203582A (zh) 脉冲传播时间确定方法和系统
CN111028232A (zh) 基于眼底图像的糖尿病分类方法及设备
KR20210097511A (ko) 딥러닝 기반 심전도 분석데이터를 이용한 일반인의 간질환 보유 가능성 예측 방법
Feng et al. Building and training a deep spiking neural network for ECG classification
CN111047590A (zh) 基于眼底图像的高血压分类方法及设备
KR20210112041A (ko) 앙상블 딥러닝과 형상 융합 기반 심장병 예측을 위한 스마트 헬스케어 모니터링 방법 및 시스템
US20210361217A1 (en) Ecg-based age and sex estimation
KR102472848B1 (ko) 학습 알고리즘을 이용한 비침습적 당화혈색소 측정 방법 및 장치
CN115778403B (zh) 心电图分析方法、装置、电子设备和存储介质
CN116434979A (zh) 生理状态云监测方法、监测系统及储存介质
Upadhyay et al. Hypuc: Hyperfine uncertainty calibration with gradient-boosted corrections for reliable regression on imbalanced electrocardiograms
WO2021042372A1 (zh) 心房颤动预测模型及其预测系统
Choubey et al. Detecting heart arrhythmias using deep learning algorithms
Rao et al. Machine Learning Based Cardiovascular Disease Prediction
Jayasinghe A Real-Time Framework for Arrhythmia Classification

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant