KR20190066332A - Apparatus for generating of Potassium level determination model using ECG and method thereof - Google Patents

Apparatus for generating of Potassium level determination model using ECG and method thereof Download PDF

Info

Publication number
KR20190066332A
KR20190066332A KR1020170165967A KR20170165967A KR20190066332A KR 20190066332 A KR20190066332 A KR 20190066332A KR 1020170165967 A KR1020170165967 A KR 1020170165967A KR 20170165967 A KR20170165967 A KR 20170165967A KR 20190066332 A KR20190066332 A KR 20190066332A
Authority
KR
South Korea
Prior art keywords
potassium concentration
data
prediction model
electrocardiogram
electrocardiogram data
Prior art date
Application number
KR1020170165967A
Other languages
Korean (ko)
Other versions
KR102008196B1 (en
Inventor
윤덕용
박래웅
김태영
전종민
장종환
Original Assignee
아주대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 아주대학교산학협력단 filed Critical 아주대학교산학협력단
Priority to KR1020170165967A priority Critical patent/KR102008196B1/en
Publication of KR20190066332A publication Critical patent/KR20190066332A/en
Application granted granted Critical
Publication of KR102008196B1 publication Critical patent/KR102008196B1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/145Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
    • A61B5/0402
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/24Detecting, measuring or recording bioelectric or biomagnetic signals of the body or parts thereof
    • A61B5/316Modalities, i.e. specific diagnostic methods
    • A61B5/318Heart-related electrical modalities, e.g. electrocardiography [ECG]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Surgery (AREA)
  • Medical Informatics (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Pathology (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Optics & Photonics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Cardiology (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)

Abstract

An apparatus for generating a blood potassium concentration prediction model by using ECG data and a method thereof are disclosed. According to an embodiment of the present invention, the apparatus for generating a blood potassium concentration prediction model by using ECG data comprises: a preprocessor for dividing, by a predetermined length, each of multiple pieces of ECG data onto which the potassium concentration is mapped and generating a training data set by performing minimum-maximum normalization on each of the divided pieces of ECG data; and a prediction model generator for extracting a feature point from each piece of training data and analyzing the extracted feature point in the time series so as to generate a potassium concentration prediction model.

Description

심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치 및 그 방법{Apparatus for generating of Potassium level determination model using ECG and method thereof}[0001] The present invention relates to an apparatus and method for predicting potassium concentration in a blood using electrocardiographic data,

본 발명은 심전도(ECG) 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치 및 그 방법에 관한 것으로, 특히 칼륨농도가 맵핑된 복수의 심전도 데이터를 이용하여 트레이닝 데이터 세트를 생성하고, 딥러닝 기반으로 칼륨농도 예측모델을 생성하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치 및 그 방법에 관한 것이다. The present invention relates to an apparatus and method for predicting potassium concentration in a blood using electrocardiogram (ECG) data, and more particularly, to a method and apparatus for generating a predicted model of potassium concentration in a blood using ECG data, And a method for generating a blood potassium concentration prediction model using electrocardiogram data for generating a prediction model.

고칼륨혈증(Hyperkalemia)은 치명적인 심장 부정맥으로 이어질 수 있는 전해질 변위이다. 고칼륨혈증의 적절한 관리는 당뇨병, 관상 동맥 질환, 만성 신장 질환 등과 같은 고칼륨혈증 관련 질병 발생의 증가로 인해 더욱 중요해지고 있다. 고칼륨혈증과 저칼륨혈증 또는 칼륨 수치의 변동은 모두 사망 위험 증가 및 생명을 위협하는 부정맥과 관련이 있다. 신장 질환이나 심장 질환이 있는 환자에서 이환율, 입원 및 사망은 칼륨 수치의 완만한 변화를 따를 수 있다.Hyperkalemia is an electrolyte displacement that can lead to fatal heart arrhythmias. Proper management of hyperkalemia is becoming more important because of the increased incidence of hyperkalemia-related diseases such as diabetes, coronary artery disease, and chronic kidney disease. Hyperkalemia and changes in hypokalemia or potassium levels are all associated with increased risk of death and life-threatening arrhythmias. Mortality, hospitalization and mortality in patients with renal or cardiac disease can follow a gradual change in potassium levels.

한편, 체내 칼륨 농도를 측정하기 위해서는 혈액 샘플링이라는 침습적인 방법을 이용한다. 그렇기 때문에 고칼륨혈증 같은 칼륨 관련 질환을 앓고 있는 환자들이 칼륨농도를 측정하기 위해서는 병원을 방문하여 검사받아야 한다. 그러나, 치명적인 영향을 줄 수 있는 체내 칼륨농도는 상시적인 관리가 필요하지만 매번 병원 방문을 통한 측정은 병원과 환자 모두에게 불편한 일이며, 이로 인해 관리하기도 쉽지 않은 상황이다. On the other hand, in order to measure the potassium concentration in the body, an invasive method called blood sampling is used. Patients suffering from potassium-related diseases such as hyperkalemia should therefore visit hospitals and be examined for potassium levels. However, the potassium concentration in the body, which can have a fatal effect, needs to be constantly monitored, but the measurement through the hospital visit is inconvenient for both the hospital and the patient, which makes it difficult to manage.

이에 비침습적인 방법으로 심전도를 이용하여 체내 칼륨 농도를 예측하고자 하는 시도가 있었다. 심전도를 이용하는 경우 심전도 파형에서 크고 좁은 T파, 평평한 P파, 전도장애, 심실세동 등의 특이점을 찾아내어 칼륨농도를 예측하였다.Therefore, there has been an attempt to predict the potassium concentration in the body using an electrocardiogram in a noninvasive manner. When electrocardiogram was used, the specificity such as large and narrow T wave, flat P wave, conduction disturbance, and ventricular fibrillation were found in electrocardiogram waveform to predict potassium concentration.

기존에는 칼륨농도를 예측하기 위해 휴리스틱 모델을 이용하였는데, 이러한 휴리스틱 모델을 사용하거나 구축하려면 원시 ECG 신호 데이터에서 특징점을 추출하기 위해 문제에 대한 사전 지식과 복잡한 데이터의 전처리를 위한 파이프라인이 필요하다.Previously, a heuristic model was used to predict the potassium concentration. To use or construct such a heuristic model, a pipeline is needed for preliminary knowledge of the problem and preprocessing complex data to extract feature points from the raw ECG signal data.

그러나, 종래의 휴리스틱한 모델은 심전도의 특징점을 찾기 위한 분석파이프라인을 구성하기 쉽지 않은 문제가 있었다. 또한 특징점을 찾더라도, 목적에 맞는 특징점을 찾아낸 것인지 확실하게 판단내릴 수 없는 문제가 있었다. However, the conventional heuristic model has a problem that it is not easy to construct an analysis pipeline for finding the feature points of the electrocardiogram. Further, even if a minutiae is searched, there is a problem that it is not possible to judge whether a minutiae corresponding to the purpose has been found.

따라서, 침습적인 방법 없이 심전도 데이터를 이용하여 체내 칼륨농도를 측정할 수 있고, 인위적으로 특징점을 설정하지 않으면서 특징점을 스스로 찾을 수 있는 파이프라인에 대한 기술 개발이 요구되고 있다. Therefore, it is required to develop a technique for a pipeline capable of measuring the potassium concentration in the body using electrocardiogram data without an invasive method, and to find a characteristic point without artificially establishing a characteristic point.

이에 관련하여, 발명의 명칭이 "심전도 신호를 이용한 인증 장치 및 방법"인 한국공개특허 제 10-2017-0091318호가 존재한다.In this regard, Korean Patent Laid-open No. 10-2017-0091318 entitled " An Authentication Apparatus and Method Using an Electrocardiogram Signal "

본 발명이 해결하고자 하는 기술적 과제는 침습적인 방법없이 체내 칼륨농도를 측정할 수 있도록 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치 및 그 방법을 제공하는데 있다. It is an object of the present invention to provide an apparatus and method for predicting potassium concentration in a blood using electrocardiogram data so as to measure potassium concentration in the body without an invasive method.

본 발명의 해결하고자 하는 다른 기술적 과제는 심전도 데이터만으로 칼륨농도를 예측함으로써 칼륨관련 질환을 앓고 있는 환자들이 장소와 시간의 제약없이 체내 칼륨농도를 측정할 수 있는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치 및 그 방법을 제공하는데 있다. Another object of the present invention is to provide a method for predicting potassium concentration in blood using electrocardiogram data which can measure potassium concentration in the body without restriction of place and time by predicting potassium concentration only by electrocardiogram data Apparatus and a method thereof.

본 발명의 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급되지 않은 또 다른 기술적 과제들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The technical problems of the present invention are not limited to the above-mentioned technical problems, and other technical problems which are not mentioned can be clearly understood by those skilled in the art from the following description.

상기 기술적 과제를 해결하기 위한 본 발명의 일 실시예에 따른 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치는, 칼륨농도가 맵핑된 복수의 심전도 데이터 각각을 기 설정된 길이로 분할하고, 상기 분할된 각 심전도 데이터를 최소-최대 정규화하여 트레이닝 데이터 세트를 생성하는 전처리기, 각 트레이닝 데이터에서 특징점을 추출하고, 상기 추출된 특징점을 시계열적으로 분석하여 칼륨농도 예측모델을 생성하는 예측모델 생성기를 포함한다. According to an aspect of the present invention, there is provided an apparatus for predicting blood potassium concentration using electrocardiogram data, the apparatus comprising: a plurality of electrocardiogram data, A preprocessor for generating a training data set by minimally-normalizing the electrocardiogram data, a prediction model generator for extracting characteristic points from each training data, and analyzing the extracted characteristic points in a time-series manner to generate a potassium concentration prediction model.

바람직하게는, 상기 전처리기는, 실시간으로 측정되는 복수 사용자의 심전도 데이터를 기 설정된 일정 속도로 수집하는 수집부, 상기 수집된 각 심전도 데이터를 동일 시간대의 칼륨농도와 각각 맵핑하는 맵핑부, 상기 칼륨농도가 맵핑된 심전도 데이터들중에서 노이즈 데이터를 제거하는 필터링부. 상기 노이즈 데이터가 제거된 심전도 데이터들을 적어도 하나 이상의 박동(beat)을 포함하는 길이 단위로 분할하는 분할부, 상기 분할된 각 심전도 데이터를 기 설정된 최소값과 최대값 사이의 값이 되도록 정규화하는 정규화부, 상기 정규화된 심전도 데이터중 일부를 트레이닝 데이터 세트로 분류하는 분류부를 포함할 수 있다. Preferably, the preprocessor includes a collecting unit for collecting electrocardiogram data of a plurality of users measured in real time at a predetermined constant rate, a mapping unit for mapping the collected electrocardiogram data to potassium concentrations at the same time, And the noise data is removed from the electrocardiogram data mapped. A divider for dividing the electrocardiogram data from which the noise data has been removed into units of length including at least one beat, a normalizer for normalizing the divided electrocardiogram data to a value between a predetermined minimum value and a maximum value, And a classifier for classifying a part of the normalized ECG data into a training data set.

바람직하게는, 상기 전처리기는 칼륨농도가 일정 개수의 범주로 나누어진 카테고리에 기초하여, 각 트레이닝 데이터와 매핑된 칼륨농도에 따라 해당 트레이닝 데이터의 카테고리를 분류하고, 상기 분류된 각 카테고리별로 심전도 데이터를 샘플링하여 칼륨농도를 균형있게 분포시키는 밸런싱 처리부를 더 포함할 수 있다. Preferably, the preprocessor classifies the category of the training data according to the potassium concentration mapped to each training data, based on the category in which the potassium concentration is divided into a certain number of categories, and stores the electrocardiogram data for each classified category And may further include a balancing unit for balancing the concentration of potassium by sampling.

바람직하게는, 상기 수집부에서 수집된 심전도 데이터는 ECG lead II signals 데이터일 수 있다. Advantageously, the electrocardiogram data collected by said collector may be ECG lead II signals data.

바람직하게는, 상기 정규화부는, 상기 분할된 심전도 데이터들중에서 outlier에 해당하는 심전도 데이터를 제외할 수 있다.  Preferably, the normalizing unit may exclude electrocardiogram data corresponding to an outlier from the divided electrocardiogram data.

바람직하게는, 상기 예측모델 생성기는, 각 트레이닝 데이터에서 특징점을 추출하는 적어도 하나 이상의 CNN(Convolution Neural Network) 층, 상기 CNN층으로부터 추출된 특징점을 순차적으로 입력받아 칼륨농도를 산출하는 RNN(Recurrent Neural Network) 층으로 구성될 수 있다. Preferably, the predictive model generator includes at least one CNN (Convolution Neural Network) layer for extracting feature points from each training data, an RNN (Recurrent Neural Network) for sequentially calculating the potassium concentration by sequentially receiving the feature points extracted from the CNN layer, Network layer.

바람직하게는, 상기 예측모델 생성장치는 손실함수를 이용하여 상기 칼륨농도 예측모델의 학습의 정도를 평가하고, 오차역전법으로 상기 칼륨농도 예측모델을 학습시키는 학습 평가기를 더 포함할 수 있다. Preferably, the prediction model generation apparatus may further include a learning evaluator that evaluates the degree of learning of the potassium concentration prediction model using a loss function, and learns the potassium concentration prediction model by an error inversion method.

상기 기술적 과제를 해결하기 위한 본 발명의 다른 실시예에 따른 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성방법은, 전처리기가 칼륨농도가 맵핑된 복수의 심전도 데이터 각각을 기 설정된 길이로 분할하고, 상기 분할된 각 심전도 데이터를 최소-최대 정규화하여 트레이닝 데이터 세트를 생성하는 단계, 예측모델 생성기가 각 트레이닝 데이터에서 특징점을 추출하고, 상기 추출된 특징점을 시계열적으로 분석하여 칼륨농도 예측모델을 생성하는 단계를 포함한다. According to another aspect of the present invention, there is provided a method of predicting a blood potassium concentration prediction model using electrocardiogram data, the preprocessor dividing each of a plurality of electrocardiogram data mapped with potassium concentration into predetermined lengths, Generating a training data set by minimizing-maximum normalizing each of the electrocardiogram data, generating a training data set, extracting feature points from each training data, and analyzing the extracted feature points in a time-series manner to generate a potassium concentration prediction model .

바람직하게는, 상기 트레이닝 데이터 세트를 생성하는 단계 이후, 상기 전처리기는, 칼륨농도가 일정 개수의 범주로 나누어진 카테고리에 기초하여, 각 트레이닝 데이터와 매핑된 칼륨농도에 따라 해당 트레이닝 데이터의 카테고리를 분류하고, 상기 분류된 각 카테고리별로 심전도 데이터를 샘플링하여 칼륨농도를 균형있게 분포시키는 단계를 더 포함할 수 있다. Preferably, after generating the training data set, the preprocessor classifies the category of the training data according to the potassium concentration mapped to each training data, based on the category in which the potassium concentration is divided into a certain number of categories And sampling the electrocardiogram data for each of the classified categories to distribute the potassium concentration in a balanced manner.

바람직하게는, 상기 칼륨농도 예측모델은, 각 트레이닝 데이터에서 특징점을 추출하는 적어도 하나 이상의 CNN(Convolution Neural Network) 층, 상기 CNN층으로부터 추출된 특징점을 순차적으로 입력받아 칼륨농도를 산출하는 RNN(Recurrent Neural Network) 층으로 구성될 수 있다. Preferably, the potassium concentration prediction model includes at least one CNN (Convolution Neural Network) layer for extracting feature points from each training data, an RNN (Recurrent Neural Network) layer.

바람직하게는, 상기 칼륨농도 예측모델을 생성하는 단계 이후, 학습 평가기는, 손실함수를 이용하여 상기 칼륨농도 예측모델의 학습의 정도를 평가하고, 오차역전법으로 상기 칼륨농도 예측모델을 학습시키는 단계를 더 포함할 수 있다. Preferably, after the step of generating the potassium concentration predicting model, the learning evaluator evaluates the degree of learning of the potassium concentration predicting model using the loss function, and learns the potassium concentration predicting model by an error inversion method As shown in FIG.

본 발명에 따르면, ECG(electrocardiogram) 데이터만으로 칼륨농도를 예측함으로써 칼륨관련 질환을 앓고 있는 환자들이 장소와 시간의 제약없이 체내 칼륨농도를 측정할 수 있다. According to the present invention, patients having potassium-related diseases can measure potassium concentration in the body without restriction of time and place by predicting potassium concentration only by ECG (electrocardiogram) data.

또한, 본 발명에 따르면, 혈액 샘플링없이 혈청 칼륨농도 수치에 대한 정보를 지속적으로 제공할 수 있으므로, 이로 인해 환자의 자가 모니터링에 기여할 수 있다. Further, according to the present invention, information on the serum potassium concentration value can be continuously provided without blood sampling, thereby contributing to the self-monitoring of the patient.

또한, 본 발명에 따르면, 칼륨농도 예측모델을 이용하여 환자의 상시적인 칼륨농도 모니터링이 가능하므로, 환자들이 체내의 칼륨농도 관리를 쉽게 할 수 있고, 병원 또한 용이하게 환자를 관리할 수 있다. Also, according to the present invention, since the potassium concentration can be constantly monitored by the patient using the potassium concentration prediction model, the patient can easily manage the potassium concentration in the body, and the patient can be easily managed in the hospital.

본 발명의 효과들은 이상에서 언급한 효과들로 제한되지 않으며, 언급되지 않은 또 다른 효과들은 아래의 기재로부터 통상의 기술자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood to those of ordinary skill in the art from the following description.

도 1은 본 발명의 일 실시예에 따른 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치를 설명하기 위한 도면이다.
도 2는 심장이 1회 박동(Beat)시 심전도 데이터 파형에 대한 전기신호 세기의 변화를 나타낸 도면이다.
도 3은 본 발명의 일 실시예에 따른 칼륨농도 예측모델의 구성을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 심전도 데이터를 이용하여 칼륨농도 예측모델을 생성하는 방법을 나타낸 순서도이다.
도 5는 본 발명의 일 실시예에 따른 예측모델 생성장치가 트레이닝 데이터 세트를 생성하는 방법을 나타낸 순서도이다.
도 6은 본 발명의 일 실시예에 따른 모델 학습과 최종 모델의 성능을 나타낸 그래프이다.
도 7은 최소-최대 정규화를 수행하지 않은 트레이닝 데이터 세트를 이용하여 생성한 예측모델의 성능을 나타낸 그래프이다.
도 8은 본 발명의 일 실시예에 따른 혈청 칼륨 농도에 따른 MSE를 나타낸 그래프이다.
도 9는 본 발명의 일 실시예에 따른 칼륨농도 추정을 위한 ECG 패턴을 나타낸 그래프이다.
도 10은 본 발명의 일 실시예에 따른 칼륨농도 모니터링 장치를 설명하기 위한 도면이다.
1 is a view for explaining an apparatus for predicting blood potassium concentration in blood using electrocardiogram data according to an embodiment of the present invention.
FIG. 2 is a graph showing changes in electrical signal intensity with respect to an electrocardiogram data waveform when the heart is beat once.
3 is a diagram for explaining a configuration of a potassium concentration prediction model according to an embodiment of the present invention.
4 is a flowchart illustrating a method of generating a potassium concentration prediction model using electrocardiogram data according to an embodiment of the present invention.
5 is a flowchart illustrating a method of generating a training data set by a prediction model generating apparatus according to an embodiment of the present invention.
6 is a graph illustrating performance of model learning and final model according to an embodiment of the present invention.
FIG. 7 is a graph illustrating performance of a prediction model generated using a training data set that has not undergone minimum-maximum normalization.
FIG. 8 is a graph showing MSE according to the concentration of serum potassium according to an embodiment of the present invention. FIG.
9 is a graph showing an ECG pattern for estimating potassium concentration according to an embodiment of the present invention.
10 is a view for explaining a potassium concentration monitoring apparatus according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.While the invention is susceptible to various modifications and alternative forms, specific embodiments thereof are shown by way of example in the drawings and will herein be described in detail. It should be understood, however, that the invention is not intended to be limited to the particular embodiments, but includes all modifications, equivalents, and alternatives falling within the spirit and scope of the invention. Like reference numerals are used for like elements in describing each drawing.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.The terms first, second, A, B, etc. may be used to describe various elements, but the elements should not be limited by the terms. The terms are used only for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component. And / or < / RTI > includes any combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprises" or "having" and the like are used to specify that there is a feature, a number, a step, an operation, an element, a component or a combination thereof described in the specification, But do not preclude the presence or addition of one or more other features, integers, steps, operations, elements, components, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless defined otherwise, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries are to be interpreted as having a meaning consistent with the contextual meaning of the related art and are to be interpreted as either ideal or overly formal in the sense of the present application Do not.

이하에서는 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치를 설명하기 위한 도면이다. 도 2는 심장이 1회 박동(Beat)시 심전도 데이터 파형에 대한 전기신호 세기의 변화를 나타낸 도면, 도 3은 본 발명의 일 실시예에 따른 칼륨농도 예측모델의 구성을 설명하기 위한 도면이다. 1 is a view for explaining an apparatus for predicting blood potassium concentration in blood using electrocardiogram data according to an embodiment of the present invention. FIG. 2 is a diagram illustrating a change in electrical signal intensity with respect to an electrocardiogram data waveform at the time of one beat of a heart. FIG. 3 is a diagram illustrating a configuration of a potassium concentration prediction model according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치(100)는 전처리기(110), 예측모델 생성기(120)를 포함한다.Referring to FIG. 1, an apparatus 100 for generating a blood potassium concentration prediction model using electrocardiogram data according to an embodiment of the present invention includes a preprocessor 110 and a predictive model generator 120.

전처리기(110)는 칼륨농도수치가 매칭된 복수 사용자의 심전도 데이터 각각을 기 설정된 길이로 분할하고, 분할된 각 심전도 데이터를 최소-최대 정규화하여 트레이닝 데이터 세트를 생성한다.The preprocessor 110 divides each of the plurality of users' electrocardiogram data matched with the potassium concentration value into predetermined lengths, and generates the training data set by performing the minimum-maximum normalization on each divided electrocardiogram data.

이러한 전처리기(110)는 수집부(111), 맵핑부(112), 필터링부(113), 분할부(114), 정규화부(115), 분류부(116)를 포함한다.The preprocessor 110 includes a collecting unit 111, a mapping unit 112, a filtering unit 113, a dividing unit 114, a normalizing unit 115, and a classifying unit 116.

수집부(111)는 실시간으로 측정되는 복수 사용자의 심전도 데이터를 기 설정된 일정 속도로 수집한다. 즉, 수집부(111)는 생체신호 전용 수집기기를 통해 일정 샘플링 속도(예컨대, 250Hz)로 심전도 데이터를 수집할 수 있다. The collecting unit 111 collects the electrocardiogram data of a plurality of users measured in real time at a predetermined constant rate. That is, the collecting unit 111 can collect the electrocardiogram data at a predetermined sampling rate (for example, 250 Hz) through the bio-signal exclusive collection device.

심전도 데이터는 심전도 측정장치(미도시)에 의해 측정되며, 신체에 부착되는 전극 수에 따라 다수의 측정 채널을 통해 복수의 심전도 데이터가 측정될 수 있고, 측정된 심전도 데이터는 V3, V4, V5, All ECG(electrocardiogram) lead II signals 데이터 등을 포함할 수 있다. 따라서, 수집부(111)는 다양한 심전도 데이터들 중 적어도 하나 이상의 심전도 데이터를 수집할 수 있으나, 본 발명의 실시예에서는 All ECG lead II signals 데이터를 이용하나, 이에 제한되지 않는다. The electrocardiogram data is measured by an electrocardiogram measuring device (not shown), and a plurality of electrocardiogram data can be measured through a plurality of measurement channels according to the number of electrodes attached to the body, and the measured electrocardiogram data are stored in V3, V4, V5, All ECG (electrocardiogram) lead II signals data, and the like. Therefore, the collecting unit 111 may collect at least one electrocardiogram data among various electrocardiogram data, but in the embodiment of the present invention, all ECG lead II signals are used, but the present invention is not limited thereto.

수집부(111)는 일정 시간 단위(예컨대 10초 단위)로 심전도 데이터를 저장하고, 그 중에 칼륨농도수치가 매칭된 심전도 데이터가 분석에 이용될 수 있다. The collecting unit 111 stores the electrocardiogram data at predetermined time intervals (for example, every 10 seconds), and the electrocardiogram data in which the potassium concentration values are matched can be used for the analysis.

맵핑부(112)는 수집된 복수의 심전도 데이터를 칼륨농도와 맵핑한다. 즉, 맵핑부(112)는 연속적으로 수집되는 심전도 데이터와 불연속적으로 수집되는 칼륨농도를 칼륨 측정 시간대에 맞춰 맵핑한다. 예를 들어, 칼륨농도를 2017년 1월 10일 20:34:20에 측정했다면, 당시 분을 기준으로 2017년 1월 10일 20:30:00에서 20:40:00 사이에 수집된 심전도 데이터에 그 칼륨농도를 맵핑한다. The mapping unit 112 maps the collected plurality of electrocardiogram data with the potassium concentration. That is, the mapping unit 112 maps the electrocardiogram data collected consecutively and the potassium concentration discontinuously collected according to the potassium measurement time zone. For example, if the potassium concentration was measured at 20:34:20 on January 10, 2017, the electrocardiogram data collected between 20:30:00 and 20:40:00 on January 10, 2017, Lt; / RTI >

필터링부(113)는 칼륨농도가 맵핑된 심전도 데이터들 중에서 노이즈로 인해 해석이 불가능한 심전도 데이터를 노이즈 데이터로 제거한다. 즉, 노이즈로 인해 해석 불가능한 심전도 데이터는 주로 근육 인공물이거나 시스템 생성에 무의미한 신호이므로 제거할 필요가 있다. 이에, 필터링부(113)는 기계학습, 딥러닝 등을 기반으로 기 설정된 노이즈 제거 모델을 이용하여 심전도 데이터들 중에서 노이즈 데이터를 제거할 수 있다. 노이즈 제거 모델에는 노이즈 데이터에 대한 특징이 설정되어 있으므로, 필터링부는 노이즈 제거 모델을 이용하여 노이즈 데이터를 판별할 수 있고, 판별된 노이즈 데이터를 제거할 수 있다. The filtering unit 113 removes electrocardiogram data, which can not be analyzed due to noise, from the electrocardiogram data to which the potassium concentration is mapped, as noise data. In other words, the electrocardiogram data that can not be analyzed due to noise is mainly a muscle artifact or a meaningless signal for system generation, so it needs to be removed. Accordingly, the filtering unit 113 can remove noise data from electrocardiogram data using a predetermined noise removal model based on machine learning, deep learning, and the like. Since the characteristics of the noise data are set in the noise elimination model, the filtering section can discriminate the noise data using the noise elimination model, and can remove the discriminated noise data.

또한, 심전도 데이터에는 잡음, 베이스라인 완더링(baseline wandering) 등의 측정을 부정확하게 하는 요소들이 포함될 수 있으므로, 필터링부(113)를 통해 잡음, 베이스라인 완더링 등의 측정을 부정확하게 하는 요소들을 제거할 수도 있다. Since the ECG data may include noise, baseline wandering, and other factors that make it inaccurate, the filtering unit 113 may include elements that make inaccurate measurements such as noise and baseline wandering It can also be removed.

분할부(114)는 노이즈 데이터가 제거된 심전도 데이터들을 적어도 하나 이상의 박동(beat)를 포함하는 길이 단위로 분할한다. The division unit 114 divides the electrocardiogram data from which the noise data has been removed into units of length including at least one beat.

한 박동의 심전도 데이터 파형은 도 2에 도시된 바와 같이, P파(wave), QRS파, T파, U파를 포함하며, PR 간격(interval), QT 간격, ST 세그먼트(segment) 등의 요소를 포함하고, X 축은 시간 축(second)를 나타내며, Y 축은 심전도 신호의 진폭(mV)를 나타낼 수 있다. P파는 동방결절로부터 나온 충격이 심방으로 퍼져 발생하는 심방의 탈분극에 관련된 시그널(signal)이다. QRS파는 Q, R, S 세개의 파를 포함하고 있으며, 심실의 탈분극에 관련된 시그널이다. 심실은 심방처럼 아주 빠르게 탈분극을 일으키는데, 그 이유는 히스 푸르킨계에서 심방전도계보다 훨씬 더 빠르기 때문이다. T파는 심실의 재분극에 관련된 시그널로, 높이와 폭이 일정하지 않다. U파는 심실의 재분극 마지막 단계에서 나타나는 느린파로, 베이스 라인(baseline)에서 점차적으로 또는 갑자기 시작되거나, T파 후반 경사 부위에서 시작된다. PR 간격은 심방의 탈분극 초기에서 심실의 탈분극 초기 시간까지의 간격이다. QT 간격은 처음 심실 탈분극에서 마지막 심실 재분극까지의 간격이다. ST 세그먼트는 좌,우 심실의 초기 재분극 상태, 즉 심실 근육이 모두 탈분극된 상태를 나타낸다. ST 세그먼트는 심실 근육이 모두 탈분극된 상태이므로, 이 전압이 베이스 라인에 있지 않다는 것은 모든 심실근 세포가 동시에 탈분극되지 않다는 것을 의미하며, 심근 경색과 같은 병리적인 현상을 의미한다.The electrocardiogram data waveform of one heartbeat includes a P wave, a QRS wave, a T wave, and a U wave, and includes an element such as a PR interval, a QT interval, an ST segment, , The X axis represents the time axis (second), and the Y axis represents the amplitude (mV) of the electrocardiogram signal. The P wave is a signal related to depolarization of the atria that occurs due to the atrium from the shock coming from the east nodule. The QRS wave contains three waves of Q, R, S and is a signal related to ventricular depolarization. The ventricles cause depolarization very quickly, like the atria, because they are much faster than the atrial conduction system in the Hispurkin system. The T wave is a signal related to the repolarization of the ventricles. The height and width are not constant. The U wave begins slowly or suddenly in the baseline, or in the late T wave slope area, with the slow wave appearing at the end of the repolarization of the ventricle. The PR interval is the interval from the initial ventricular depolarization to the initial ventricular depolarization time. The QT interval is the interval from the initial ventricular depolarization to the final ventricular repolarization. The ST segment represents the initial repolarization state of the left and right ventricles, ie, the ventricular muscle is depolarized. Since the ST segment is depolarized in both ventricular muscles, the fact that this voltage is not at the baseline means that all ventricular myocytes are not depolarized at the same time, which is a pathological phenomenon such as myocardial infarction.

살핀바와 같이 한 박동의 심전도 데이터는 P파(wave), QRS파, T파, U파를 포함하며, PR 간격(interval), QT 간격, ST 세그먼트(segment) 등의 요소를 포함하므로, 심전도 데이터를 분석하기 위해서는 적어도 하나의 박동이 있어야 한다. 따라서, 분할부(114_는 노이즈 데이터가 제거된 심전도 데이터들을 적어도 하나 이상의 박동(beat)을 포함하는 길이 단위로 분할한다. 예컨대, 적어도 하나 이상의 박동을 포함하도록 2초 단위로 심전도 데이터를 분할 수 있다. As described above, the electrocardiogram data of a heartbeat includes a P wave, a QRS wave, a T wave, a U wave, and includes elements such as PR interval, QT interval, and ST segment, There must be at least one beating in order to analyze. Therefore, the division unit 114_ divides the electrocardiogram data from which noise data has been removed into units of length including at least one beat. For example, the electrocardiogram data can be divided into units of two seconds to include at least one beats have.

정규화부(115)는 분할부(114)에서 분할된 각 심전도 데이터에 대해 최소-최대 정규화를 수행한다. 즉, 정규화부(115)는 각 심전도 데이터가 최소값과 최대값 사이의 값이 되도록 Min-Max normalization를 수행한다. 예컨대, 정규화부(115)는 최소값을 '0', 최대값을 '1'로 하여 정규화할 수 있고, 이때 정규화된 데이터는 0~1까지의 값을 가질 수 있다.The normalization unit 115 performs minimum-maximum normalization on each of the electrocardiogram data obtained by the division unit 114. That is, the normalization unit 115 performs Min-Max normalization such that each electrocardiogram data has a value between a minimum value and a maximum value. For example, the normalization unit 115 may normalize the minimum value to '0' and the maximum value to '1', and the normalized data may have a value of 0 to 1.

분할부(114)에서 분할된 각 심전도 데이터는 서로 다른 사용자로부터 측정된 데이터이므로 다양한 스케일을 가지고 있으며, 이로 인해 평균 및 편차가 다 달라 값을 비교하기 어려울 수 있다. 이때 정규화를 수행하면, 각 심전도 데이터는 스케일이 동일한 데이터로 가공될 수 있고, 각 심전도 데이터의 스케일이 같아지기 때문에 심전도 데이터 특성을 쉽게 비교할 수 있다. 이처럼, 정규화는 스케일을 똑같이 분포시키는 것을 의미한다.Since each electrocardiogram data segmented by the division unit 114 is data measured by different users, it has various scales. As a result, it is difficult to compare the values with different averages and deviations. At this time, if the normalization is performed, each electrocardiogram data can be processed into data having the same scale, and the electrocardiogram data characteristics can be easily compared because the scales of the respective electrocardiogram data become the same. Thus, normalization implies equal distribution of the scale.

따라서, 정규화부(115)는 아래 기재된 수학식 1을 이용하여 최대-최소 정규화(min-max normalization)를 수행한다. Accordingly, the normalization unit 115 performs min-max normalization using Equation 1 described below.

Figure pat00001
Figure pat00001

즉, 정규화부(115)는 시계열 데이터의 최대값과 최소값을 알고 있으면 입력으로 들어온 현재 값을 가지고 정규화시켜 새로운 값으로 바로 연산할 수 있다. That is, if the maximum value and the minimum value of the time series data are known, the normalization unit 115 can normalize the current value input as input and directly calculate the new value.

한편, 정규화부(115)는 분할부(114)에서 분할된 심전도 데이터를 정규화하기 전에, outlier에 해당하는 심전도 데이터를 제외시킬 수 있다. 즉, 사용자마다 심전도 데이터는 다르므로, outlier의 심전도 데이터가 존재할 수 있다. Outlier의 심전도 데이터는 데이터 분석 결과에 오류를 발생시킬 수 있으므로, 이러한 outlier의 심전도 데이터를 데이터를 제거하여 트레이닝 데이터 세트를 생성할 수 있다.Meanwhile, the normalization unit 115 may exclude ECG data corresponding to outliers before normalizing the ECG data divided by the division unit 114. [ That is, since the electrocardiogram data is different for each user, the electrocardiogram data of the outlier may exist. Since the outlier ECG data may cause an error in the data analysis result, the training data set can be generated by removing the ECG data of these outliers.

상술한 바와 같이 분할부(116)에서 분할된 심전도 데이터들은 최소 최대 정규화에 의해 표준화될 수 있다. 이렇게 표준화된 데이터를 이용하여 예측모델을 생성하면, 최소-최대 정규화를 수행하지 않은 심전도 데이터를 이용하여 생성한 예측모델보다 손실값(예컨대, MSE)이 적어 예측모델의 성능이 더 우수하다. 두 예측모델에 대한 성능 비교는 도 6 및 도 7을 참조하기로 한다. As described above, the electrocardiogram data divided by the division unit 116 can be standardized by the minimum maximum normalization. When the prediction model is generated using the standardized data, the performance of the prediction model is superior because the loss value (for example, MSE) is smaller than that of the prediction model generated using the ECG data without performing the minimum-maximum normalization. Performance comparison for the two prediction models will be described with reference to FIGS. 6 and 7. FIG.

분류부(116)는 정규화부(115)에서 정규화된 심전도 데이터중 일부를 트레이닝 데이터 세트로 분류한다. 심전도 데이터를 이용하여 칼륨농도를 예측하기 위한 예측모델을 생성하기 위해서는 트레이닝 데이터 세트가 필요하고, 트레이닝 데이터 세트에 대한 예측모델의 오버피팅(overfitting)을 감지하고 하이퍼파라미터(hyperparameter) 설정을 위한 데이터가 필요하며, 예측모델의 일반화 가능성을 평가하기 위한 데이터가 필요하다. 이에, 분류부(116)는 정규화된 심전도 데이터들을 일정 비율(예컨대, 8:1:1)로 트레이닝 데이터 세트, 테스트 데이터 세트, 유효성 검증 데이터 세트로 분류할 수 있다. 트레이닝 데이터 세트는 예측모델 생성에 사용되고, 테스트 데이터 세트는 예측모델의 오버피팅(overfitting) 감지와 하이퍼파라미터(hyperparameter) 설정을 위해 사용되며, 유효성 검증 데이터 세트는 예측모델의 일반화 가능성을 평가하는데 사용될 수 있다.The classifying unit 116 classifies some of the electrocardiogram data normalized by the normalizing unit 115 into a training data set. In order to generate a prediction model for predicting the potassium concentration using the electrocardiogram data, a training data set is required, and overfitting of a prediction model for a training data set is detected and data for setting a hyperparameter And need data to assess the generalizability of the predictive model. The classification unit 116 may classify the normalized electrocardiogram data into a training data set, a test data set, and a validity verification data set at a predetermined ratio (e.g., 8: 1: 1). The training data set is used for prediction model generation and the test data set is used for overfitting detection and hyperparameter setting of the prediction model and the validation data set can be used to evaluate the generalization possibility of the prediction model have.

한편, 트레이닝 데이터 세트를 이용하여 예측 모델을 생성하기 위해서는 칼륨농도가 트레이닝 데이터 세트에 고르게 분포될 필요가 있다. 즉, 트레이닝 데이터 세트의 혈청 칼륨농도의 분포가 불균형하고, 불균형한 데이터를 이용하여 예측모델을 생성하면 가장 관련성이 높은 데이터에 오버피팅을 야기할 수 있기 때문에, 트레이닝 데이터 세트의 칼륨농도 분포가 균형을 이루어야 한다. On the other hand, in order to generate a prediction model using the training data set, the potassium concentration needs to be evenly distributed in the training data set. That is, if the distribution of the serum potassium concentration in the training data set is unbalanced and the prediction model is generated using the unbalanced data, over-fitting may be caused to the most relevant data, so that the potassium concentration distribution of the training data set is balanced .

이에, 전처리기(110)는 트레이닝 데이터 세트에서 혈청 칼륨농도를 균형있게 분포시키기 위한 밸런싱 처리부(미도시)를 더 포함할 수 있다. The preprocessor 110 may further include a balancing processor (not shown) for balancing the serum potassium concentration in the training data set.

밸런싱 처리부는 칼륨농도가 트레이닝 데이터 세트에 고르게 분포될 수 있도록 샘플링을 수행한다. 즉, 밸런싱 처리부는 칼륨농도가 일정 개수의 범주로 나누어진 카테고리에 기초하여, 각 트레이닝 데이터와 매핑된 칼륨농도에 따라 해당 트레이닝 데이터의 카테고리를 분류하고, 그 분류된 각 카테고리별로 심전도 데이터를 샘플링하여 칼륨농도를 균형있게 분포시킬 수 있다. 이때, 밸런싱 처리부는 각 카테고리별로 심전도 데이터를 랜덤으로 추출하여, 각 카테고리별로 심전도 데이터가 샘플링전의 수보다 증가시킬 수 있다. 예컨대, 수집부가 250kHz 속도로 심전도 데이터를 샘플링한 경우, 밸런싱 처리부는 125Hz 속도로 각 카테고리별 트레이닝 데이터를 샘플링할 수 있다. 따라서, 밸런싱 처리부는 카테고리 단위로 재샘플링 전의 심전도 데이터 수만큼 트레이닝 데이터를 증가할 수 있다.The balancing processor performs sampling so that the potassium concentration is uniformly distributed in the training data set. That is, the balancing processor classifies the category of the training data according to the potassium concentration mapped to each training data, based on the category in which the potassium concentration is divided into a certain number of categories, samples the electrocardiogram data for each of the classified categories Potassium concentration can be distributed in a balanced manner. At this time, the balancing processor may randomly extract the electrocardiogram data for each category, and the electrocardiogram data for each category may be increased from the number before the sampling. For example, if the collector samples electrocardiogram data at a 250 kHz rate, the balancing processor can sample training data for each category at a 125 Hz rate. Therefore, the balancing processor can increase the training data by the number of electrocardiogram data before re-sampling in units of categories.

예를 들어, 칼륨농도 카테고리가 3.5mmol/L이하, 3.5-4.0mmol/L, 4.0-4.5mmol/L, 4.5-5.0mmol/L, 5.0-5.5mmol/L, 5.5mmol/L이상의 총 6개로 구성되고, 총 115개의 트레이닝 데이터를 각 카테고리에 분류한 결과 3.5mmol/L이하:10, 3.5-4.0mmol/L:20, 4.0-4.5mmol/L:30, 4.5-5.0mmol/L:30, 5.0-5.5mmol/L:20, 5.5mmol/L:5 라고 가정하여 설명하기로 한다. 이 경우, 밸런싱 처리부는 3.5mmol/L이하:20, 3.5-4.0mmol/L:40, 4.0-4.5mmol/L:60, 4.5-5.0mmol/L:60, 5.0-5.5mmol/L:40, 5.5mmol/L:10의 총230개의 트레이닝 데이터로 증가시킬 수 있다. For example, in a total of six or more of the potassium concentration category of 3.5 mmol / L or less, 3.5-4.0 mmol / L, 4.0-4.5 mmol / L, 4.5-5.0 mmol / L, 5.0-5.5 mmol / L and 5.5 mmol / L: 30, 4.5-5.0mmol / L: 30, 4.5-5.0mmol / L: 10, 3.5-4.0mmol / L: 20, 4.0-4.5mmol / L: 5.0-5.5 mmol / L: 20, 5.5 mmol / L: 5. In this case, the balancing treatment portion has a concentration of 3.5 mmol / L or less: 20, 3.5-4.0 mmol / L: 40, 4.0-4.5 mmol / L: 60, 4.5-5.0 mmol / L: 60, 5.0-5.5 mmol / 5.5mmol / L: 10 total of 230 training data can be increased.

전술한 바와 구성된 전처리기(110)가 트레이닝 데이터 세트를 생성하면, 이를 이용하여 칼륨농도를 예측할 수 있는 예측모델을 생성할 수 있다.When the preprocessor 110 configured as described above generates the training data set, a prediction model capable of predicting the potassium concentration can be generated.

예측모델 생성기(120)는 트레이닝 데이터 세트내 각 트레이닝 데이터에서 특징점을 추출하고, 추출된 특징점을 시계열적으로 분석하여 칼륨농도를 예측하는 칼륨농도 예측모델을 생성한다. 이때, 예측모델 생성기(120)는 딥러닝(Deep Learning)을 기반으로 칼륨농도 예측모델을 생성할 수 있다. 딥러닝에서 도메인에 대한 사전 지식 없이도 심전도 데이터에서 특징점을 추출하는 특징점 추출기로 동작할 수 있는 구성은 CNN(Convolution Neural Network) 등일 수 있고, 시계열 문제에서 시간 종속성을 식별할 수 있는 구성은 RNN(Recurrent Neural Network) 등일 수 있다. 이러한 CNN과 RNN을 함께 사용하면 특징점 추출 및 시간 종속성을 효과적으로 캡처할 수 있다.The predictive model generator 120 extracts feature points from each training data in the training data set, and analyzes the extracted feature points in a time-series manner to generate a potassium concentration prediction model for predicting the potassium concentration. At this time, the prediction model generator 120 may generate a potassium concentration prediction model based on Deep Learning. In Deep Learning, it is possible to use CNN (Convolution Neural Network) or the like to operate as a feature point extractor for extracting feature points from ECG data without prior knowledge of the domain, and a configuration capable of identifying time dependency in the time series problem is RNN Neural Network). These CNNs and RNNs can be used together to effectively capture feature points and time dependencies.

따라서, 예측모델 생성기(120)는 각 트레이닝 데이터에서 특징점을 추출하는 적어도 하나 이상의 CNN층(122), CNN층(122)으로부터 추출된 특징점을 순차적으로 입력받아 칼륨농도를 예측하는 RNN층(124)으로 구성된 칼륨농도 예측모델을 생성할 수 있다.Therefore, the predictive model generator 120 includes at least one CNN layer 122 for extracting feature points from each training data, an RNN layer 124 for sequentially receiving the feature points extracted from the CNN layer 122 and predicting the potassium concentration, Can be generated.

구체적으로, 예측모델 생성기(120)는 적어도 하나 이상의 CNN층(122)과 RNN 층(124)으로 구성된 칼륨농도 예측모델을 생성하기 위해 DeepConvLSTM 모델을 적용할 수 있다. DeepConvLSTM 모델은 상이한 신체 부위(예컨대, 팔 및 다리)의 여러 센서를 사용하여 다양한 활동(예컨대 문 열림 등)을 감지하기 위해 개발된 것으로, 4개의 CNN층과 2개의 추가 LSTM 층으로 구성된다. 본 발명은 추상화된 부분 신호를 필요로하고 시간 경과에 따른 변화를 고려해야하기 때문에 DeepConvLSTM 모델을 적용한 것이다.Specifically, the prediction model generator 120 may apply the DeepConvLSTM model to generate a potassium concentration prediction model comprised of at least one CNN layer 122 and an RNN layer 124. The DeepConvLSTM model was developed to detect various activities (e.g., door openings) using different sensors of different body parts (e.g., arms and legs) and consists of four CNN layers and two additional LSTM layers. The present invention applies the DeepConvLSTM model since it requires an abstracted partial signal and needs to consider a change over time.

DeepConvLSTM 모델을 적용하여 구성된 칼륨농도 예측모델은 도 3에 도시된 바와 같이 5개의 CNN 층(122)과 하나의 RNN 층(124)으로 구성된다. 입력 트레이닝 데이터가 제1 CNN 층(122a)에 입력되고, 제1 CNN 층(122a)에서 출력된 데이터는 제2 CNN층(122b)의 입력으로 이용될 수 있다. 각각의 데이터가 한 CNN층(122a, 122b, 122c, 122d, 122e)의 입력 데이터로 이용되면, 그 데이터를 채널(channel)이라고도 지칭하고, 각각의 데이터들이 한 CNN층(122a, 122b, 122c, 122d, 122e)의 출력 데이터로 이용되면, 그 데이터를 특징 맵(feature map)라고도 지칭한다. 또한, 각 CNN층(122a, 122b, 122c, 122d, 122e)은 해당 층의 결과마다 CNN(122a, 122b, 122c, 122d, 122e)과 동일한 스트라이드 및 커널 사이트의 max-pooling을 적용한다. 이때 데이터의 사이즈를 동일하게 유지시키기 위해 패딩을 같게 설정할 수 있다. The potassium concentration prediction model constructed by applying the DeepConvLSTM model is composed of five CNN layers 122 and one RNN layer 124 as shown in FIG. The input training data is input to the first CNN layer 122a and the data output from the first CNN layer 122a can be used as an input to the second CNN layer 122b. When each piece of data is used as input data of one CNN layer 122a, 122b, 122c, 122d and 122e, the data is also referred to as a channel, and each piece of data is stored in one CNN layer 122a, 122b, 122c, 122d, and 122e, the data is also referred to as a feature map. Also, each CNN layer 122a, 122b, 122c, 122d, 122e applies the same stride and max-pooling of kernel sites as the CNN layers 122a, 122b, 122c, 122d, 122e for each result of that layer. At this time, the padding can be set to be the same in order to keep the data size the same.

각 CNN 층(122a, 122b, 122c, 122d, 122e)에서, 각각의 입력 데이터들은 모든 출력 데이터와 컨볼루션 기능으로 완전히 연결된다. 예를 들어, 제1 CNN 층(122a)에서, 각각의 입력 데이터는 제1 CNN 층(122a)의 모든 출력 데이터와 컨볼루션 기능으로 연결된다. 여기서 컨볼루션 기능은 입력 데이터에 n x n 크기의 커널(kernel)을 적용하여 데이터의 특징을 뽑아내는 기능이다. 구체적으로 컨볼루션 기능은 입력 데이터에 컨볼루션 연산을 적용하고, 컨볼루션 연산된 입력 데이터에 비선형 함수를 적용하여 출력 데이터를 계산하는 기능이다. 여기서 컨볼루션 연산은 입력 데이터의 전 영역에서 가능한 모든 n x n 크기의 부분 영역을 추출하고, 그 다음 입력 데이터와 출력 데이터 사이에 고유하게 지정된 필터의 각 단위요소들과 n x n 크기의 부분 영역의 각 값을 각각 곱한 후 합산하는 것(즉, 커널과 부분 영역 간의 내적의 곱의 합)을 의미한다. 비선형 함수는, 예를들어, 시그모이드(sigmoid) 함수, 정류 선형 함수(ReLU : Rectified Linear Unit)등을 의미한다. In each CNN layer 122a, 122b, 122c, 122d, 122e, each input data is fully connected to all output data by a convolution function. For example, in the first CNN layer 122a, each input data is concatenated with all output data of the first CNN layer 122a. Here, the convolution function extracts the characteristics of the data by applying an n × n kernel to the input data. Specifically, the convolution function is a function that applies a convolution operation to input data and calculates output data by applying a nonlinear function to the convolution operation input data. Here, the convolution operation extracts all possible nxn sub-regions in the entire region of the input data, and then, for each unit element of the filter uniquely specified between the input data and the output data, and each value of the nxn- (That is, the sum of the product of the inner product between the kernel and the subarea). The nonlinear function means, for example, a sigmoid function, a rectified linear function (ReLU), or the like.

예를 들어, 각 CNN층(122a, 122b, 122c, 122d, 122e)의 커널크기가 1x20이며 스트라이드가 1인 경우, 입력 데이터는 커널 크기가 1x20이고 스트라이드가 1인 5개의 CNN층(122a, 122b, 122c, 122d, 122e)을 통해 변환된다. 이때, 각 CNN층(122a, 122b, 122c, 122d, 122e)은 커널 크기가 1x20이고 스트라이드가 1인 max pooling에 의해서 풀링될 수 있다. CNN층(122) 및 풀링(pooling)층에서 커널의 스트라이드가 1이기 때문에 5개의 CNN층(122a, 122b, 122c, 122d, 122e)의 최종 출력 크기는 입력 데이터의 최종 출력 크기와 동일한다. 이때, 특징맵 상의 CNN층 연산하기 위해 정류 선형 함수(ReLU : Rectified Linear Unit)를 이용할 수 있다. For example, if the kernel size of each CNN layer 122a, 122b, 122c, 122d, 122e is 1x20 and the stride is 1, then the input data is composed of five CNN layers 122a, 122b with a kernel size of 1x20 and a stride of 1 , 122c, 122d, 122e. At this time, each CNN layer 122a, 122b, 122c, 122d, and 122e can be pooled by max pooling with a kernel size of 1x20 and stride of 1. The final output size of the five CNN layers 122a, 122b, 122c, 122d, and 122e is equal to the final output size of the input data because the stride of the kernel is 1 in the CNN layer 122 and the pooling layer. At this time, a rectified linear function (ReLU) can be used to calculate the CNN layer on the feature map.

상술한 바와 같이 CNN(120)은 데이터의 특징점을 추출하는데 용이한 모델이므로, 휴리스틱하게 해왔던 심전도의 특징 추출을 딥러닝의 CNN층(122)으로 구현할 수 있다.As described above, since CNN 120 is an easy model for extracting feature points of data, feature extraction of a heuristic electrocardiogram can be implemented in CNN layer 122 of deep learning.

한편, 심전도 데이터는 시계열적 특징을 가지므로, 시계열 데이터(time-series data)와 같이 시간의 흐름에 따라 변화하는 데이터를 학습하기 위한 딥 러닝 모델을 적용할 필요가 있다.On the other hand, since electrocardiogram data have a time-series characteristic, it is necessary to apply a deep learning model for learning data that changes with time, such as time-series data.

이에, CNN층(122)으로부터 특징점을 순차적으로 입력받아 칼륨농도를 산출하는 RNN(124)을 이용할 수 있다. RNN층(124)은 일정 개수(예컨대 500개)의 hidden nodes가 있는 GRU 셀로 구성된 순환 고밀도 계층이고, 시간 t(t=1. . . T)에서의 RNN층(124)의 입력은 시간 t에서 가장 마지막 CNN층(122)의 특징맵의 모든 요소일 수 있다. 즉, 시계열적 특징을 갖는 심전도 데이터 분석을 위해 CNN층(122)에서 추출한 일정 개수(예컨대 64개)의 특징맵을 RNN(124)의 GRU 모델에 입력값으로하여 최종적으로 칼륨농도를 산출할 수 있다. 이때, GRU 모델은 CNN층(122)의 특징맵을 순차적으로 입력받는다. Accordingly, the RNN 124 that receives the feature points sequentially from the CNN layer 122 and calculates the potassium concentration can be used. The RNN layer 124 is a circular high density layer composed of GRU cells with a certain number of (e.g., 500) hidden nodes and the input of the RNN layer 124 at time t (t = 1. May be all elements of the feature map of the last CNN layer 122. That is, a feature map of a certain number (for example, 64) extracted from the CNN layer 122 for analysis of electrocardiogram data having a time-dependent characteristic can be finally calculated as an input value to the GRU model of the RNN 124 have. At this time, the GRU model sequentially receives the feature maps of the CNN layer 122.

상술한 바와 같이 예측모델 생성기(120)는 적어도 하나 이상의 CNN층(122)과 RNN층(124)으로 구성된 칼륨농도 예측모델을 생성할 수 있다. 칼륨농도 예측모델의 최종 출력은 RNN 층(124)에서 각 타임스탬프(T)에서 산출된 값일 수 있다. As described above, the predictive model generator 120 may generate a potassium concentration prediction model composed of at least one CNN layer 122 and an RNN layer 124. The final output of the potassium concentration prediction model may be a value calculated at each timestamp T in the RNN layer 124.

예측모델 생성기(120)는 모델에 사용된 hidden 특징을 탐색하기 위해, 예측 모델의 최종 층에서 attention 모델을 적용할 수 있다. 이 attention 모델을 트레이닝 데이터 세트에서 무작위로 선택한 데이터에 적용함으로써, 심전도 패턴은 혈청 칼륨농도를 결정하는데 사용할 수 있다는 것을 평가할 수 있다. The predictive model generator 120 may apply the attention model in the final layer of the predictive model to search for hidden features used in the model. By applying this attention model to randomly selected data in the training data set, it can be assessed that the electrocardiogram pattern can be used to determine the serum potassium concentration.

이러한 예측모델 생성기(120)는 파이썬(Python)과 텐서플로(Tensorflow) 등의 프로그램을 이용하여 예측모델을 생성할 수 있다.The predictive model generator 120 may generate a predictive model using a program such as Python and Tensorflow.

한편, 칼륨농도 예측모델이 생성되면, 그 칼륨농도 예측모델이 잘 동작하는지 성능을 평가할 필요가 있다. 이에, 예측장치는 칼륨농도 예측모델의 학습의 정도를 평가하는 학습 평가기(130)를 더 포함할 수 있다. 학습 평가기(130)는 손실함수를 이용하여 칼륨농도 예측모델의 학습의 정도을 평가할 수 있다. 여기서, 손실함수는 예측모델의 학습의 정도(또는 성능) 평가를 위한 지표로, 예컨대, MSE(Mean-squared Error), 교차 엔트로피 오차 등을 포함할 수 있으나, 바람직하게는 MSE를 이용할 수 있다. On the other hand, once the potassium concentration prediction model is generated, it is necessary to evaluate the performance of the potassium concentration prediction model. Thus, the prediction device may further include a learning evaluator 130 for evaluating the degree of learning of the potassium concentration prediction model. The learning evaluator 130 can evaluate the degree of learning of the potassium concentration prediction model using the loss function. Here, the loss function is an index for evaluating the degree of learning (or performance) of the prediction model, and may include, for example, mean-squared error (MSE), cross entropy error and the like.

학습 평가기(130)는 MSE(Mean-squared Error, 평균제곱오차)를 이용하여 칼륨농도 예측모델의 학습의 정도를 평가할 수 있다. 즉, 학습 평가기(130)는 예측값과 실제검사값의 MSE를 손실값(손실함수, loss)로 정의하여 오차역전법으로 학습할 수 있다. The learning evaluator 130 can evaluate the degree of learning of the potassium concentration prediction model using MSE (Mean-Squared Error). That is, the learning evaluator 130 can learn the MSE of the predicted value and the actual check value by the error inversion method by defining the MSE as a loss value (loss function, loss).

MSE는 아래 기재된 수학식 2를 이용하여 산출할 수 있다. The MSE can be calculated using the following equation (2).

Figure pat00002
Figure pat00002

여기서,

Figure pat00003
는 예측값 벡터, Y는 실제 검사값 벡터일 수 있다. here,
Figure pat00003
Is a predicted value vector, and Y may be an actual check value vector.

학습 평가기(130)는 칼륨농도 예측모델의 학습의 정도가 혈청 칼륨농도에 따라 달라지는지의 여부를 평가하기 위해 칼륨농도에 따라 각 카테고리의 데이터에 대해 MSE을 산출할 수 있다. 이때, 학습 평가기(130)는 전처리기(110)에서 분류된 테스트 데이터 세트와 유효성 검증 데이터 세트를 이용하여 MSE를 산출할 수 있다.The learning evaluator 130 may calculate the MSE for each category of data according to the potassium concentration to evaluate whether the degree of learning of the potassium concentration prediction model varies depending on the serum potassium concentration. At this time, the learning evaluator 130 may calculate the MSE using the test data set and the validity verification data set classified by the preprocessor 110. [

학습 평가기(130)는 MSE가 최소가 되는 예측모델을 선택하기 위해, 오차역전법으로 학습할 수 있다.The learning evaluator 130 can learn the error inversion method in order to select the prediction model with the minimum MSE.

여기서는 하가습 평가기(130)를 별도의 구성으로 설명하였으나, 예측모델 생성기에 포함된 구성일 수 있다. Here, the lower humidifying unit 130 is explained as an alternative configuration, but it may be included in the prediction model generator.

한편, 예측모델 생성장치(100)는 심전도 데이터베이스(140)를 더 포함할 수 있다. 심전도 데이터베이스(140)에는 전처리기(110)에서 생성된 트레이닝 데이터 세트, 테스트 데이터 세트, 유효성 검증 데이터 세트가 저장된다. 또한, 심전도 데이터베이스(140)에는 수집부(110)에서 수집된 심전도 데이터가 저장될 수 있다.Meanwhile, the predictive model generating apparatus 100 may further include an electrocardiogram database 140. The electrocardiogram database 140 stores a training data set, a test data set, and a validity verification data set generated in the preprocessor 110. In addition, the electrocardiogram database 140 may store the electrocardiogram data collected by the collecting unit 110.

또한, 예측모델 생성장치(100)는 예측 모델 데이터베이스(150)를 더 포함할 수 있다. 예측 모델 데이터베이스(150)는 예측모델 생성기(120)에 의해 생성된 칼륨농도 예측모델을 저장한다. 예측모델 데이터베이스(150)에 저장된 칼륨농도 예측모델을 이용해 실시간으로 미래 시점의 칼륨농도를 예측하게 된다. The prediction model generation apparatus 100 may further include a prediction model database 150. [ The prediction model database 150 stores the potassium concentration prediction model generated by the prediction model generator 120. The potassium concentration in the future time point is predicted in real time using the potassium concentration prediction model stored in the prediction model database 150. [

상술한 구성의 예측모델 생성장치(100)는 딥러닝 기반의 모델(즉, CNN, RNN)을 이용하여 single-lead ECG 데이터에서 혈청 칼륨농도를 결정할 수있는 칼륨농도 예측모델을 생성함으로써, 비침습성 방법으로 칼륨농도를 예측할 수 있다. 또한, 딥러닝 기반 모델에서 사용된 심전도 패턴을 제공함으로써, 칼륨농도 예측모델의 임상적 신뢰성을 확보할 수 있다. The predictive model generation apparatus 100 having the above-described configuration generates a potassium concentration prediction model capable of determining the serum potassium concentration in single-lead ECG data using a deep learning-based model (i.e., CNN, RNN) Method can predict the potassium concentration. Also, by providing an electrocardiogram pattern used in the deep learning based model, the clinical reliability of the potassium concentration prediction model can be secured.

한편, 본 발명의 실시예에서는 전처리기(110) 및 예측모델 생성기(120)가 하나의 장치에서 구현된 것으로 설명하였으나, 전처리기(110) 및 예측모델 생성기(120)는 서로 다른 장치에서 구현될 수도 있다. Meanwhile, in the embodiment of the present invention, the preprocessor 110 and the predictive model generator 120 are implemented in one apparatus. However, the preprocessor 110 and the predictive model generator 120 may be implemented in different apparatuses It is possible.

또한, 본 발명의 실시예에서는 심전도 신호 자체를 제외한 다른 임상 변수를 사용하지 않았으나, 연령, 성별, 체질량 지수, 기저 질환, 합병증, 약물 복용 및 기타 검사 결과를 포함한 많은 임상 매개 변수를 포함시켜 칼륨농도 예측모델을 생성할 수도 있다.In addition, the present invention did not use other clinical parameters except for the electrocardiogram signal itself. However, many clinical parameters including age, sex, body mass index, underlying disease, complications, drug administration, A prediction model may be generated.

도 4는 본 발명의 일 실시예에 따른 심전도 데이터를 이용하여 칼륨농도 예측모델을 생성하는 방법을 나타낸 순서도이다. 4 is a flowchart illustrating a method of generating a potassium concentration prediction model using electrocardiogram data according to an embodiment of the present invention.

도 4를 참조하면, 예측모델 생성장치는 복수의 사용자의 심전도 데이터를 수집하고(S410), 수집된 심전도 데이터들을 이용하여 트레이닝 데이터 세트를 생성한다(S420), 트레이닝 데이터 세트를 생성하는 방법에 대한 상세한 설명은 도 5를 참조하기로 한다. Referring to FIG. 4, the predictive model generating apparatus collects a plurality of user's electrocardiogram data (S410) and generates a training data set using the collected electrocardiogram data (S420) A detailed description will be made with reference to FIG.

단계 S420이 수행되면, 예측모델 생성장치는 트레이닝 데이터 세트를 이용하여 칼륨농도를 예측하는 칼륨농도 예측모델을 생성한다(S430). 즉, 예측모델 생성장치는 각 트레이닝 데이터에서 특징점을 추출하는 적어도 하나 이상의 CNN층, CNN층으로부터 추출된 특징점을 순차적으로 입력받아 칼륨농도를 예측하는 RNN층으로 구성된 칼륨농도 예측모델을 생성할 수 있다.When step S420 is performed, the predictive model generation apparatus generates a potassium concentration prediction model for predicting the potassium concentration using the training data set (S430). That is, the predictive model generation apparatus can generate a potassium concentration prediction model composed of at least one CNN layer for extracting a feature point from each training data, and an RNN layer for sequentially receiving the feature points extracted from the CNN layer to predict the potassium concentration .

단계 S430이 수행되면, 예측모델 생성장치는 생성된 칼륨농도 예측모델의 학습의 정도를 평가한다(S440). 이때, 예측모델 생성장치는 MSE 등의 손실함수를 이용하여 칼륨농도 예측모델의 학습의 정도(성능)을 평가할 수 있다. When step S430 is performed, the predictive model generation device evaluates the degree of learning of the generated potassium concentration prediction model (S440). At this time, the prediction model generating apparatus can evaluate the degree of performance (performance) of the potassium concentration prediction model by using a loss function such as MSE.

도 5는 본 발명의 일 실시예에 따른 예측모델 생성장치가 트레이닝 데이터 세트를 생성하는 방법을 나타낸 순서도이다. 5 is a flowchart illustrating a method of generating a training data set by a prediction model generating apparatus according to an embodiment of the present invention.

도 5를 참조하면, 예측모델 생성장치는 실시간으로 측정되는 복수 사용자의 심전도 데이터를 수집하고(S510), 수집된 복수의 심전도 데이터를 칼륨농도와 맵핑한다(S520). 즉, 예측모델 생성장치는 수집된 심전도 데이터들 중에서 동일 시간대의 칼륨농도가 존재하는 심전도 데이터만을 이용할 수 있다. Referring to FIG. 5, the predictive model generation apparatus collects electrocardiogram data of a plurality of users measured in real time (S510), and maps the collected plurality of electrocardiogram data to a potassium concentration (S520). That is, the predictive model generating apparatus can use only electrocardiogram data having the potassium concentration at the same time in the collected electrocardiogram data.

단계 S520의 수행 후, 예측모델 생성장치는 칼륨농도가 맵핑된 심전도 데이터들중에서 노이즈로 인해 해석이 불가능한 노이즈 데이터를 제거한다(S530). 이때, 예측모델 생성장치는 A에 도시된 바와 같이 해석이 불가능한 심전도 데이터를 기계학습을 이용하여 제거할 수 있다. After performing step S520, the predictive model generating device removes noise data that can not be analyzed due to noise among electrocardiogram data to which the potassium concentration is mapped (S530). At this time, the predictive model generating apparatus can remove the unexplainable electrocardiogram data by using the machine learning as shown in A.

단계 S530이 수행되면, 예측모델 생성장치는 노이즈 데이터가 제거된 심전도 데이터들을 적어도 하나 이상의 박동(beat)를 포함하는 길이 단위로 분할하고(S540), 분할된 각 심전도 데이터에 대해 최소-최대 정규화를 수행한다(S550). 즉, 예측모델 생성장치는 B에 도시된 바와 같이 복수의 파형으로 구성된 심전도 데이터에서 적어도 하나의 파형이 포함되도록 심전도 데이터를 분할할 수 있다. When step S530 is performed, the predictive model generation apparatus divides the electrocardiogram data from which the noise data has been removed into units of length including at least one beat (S540), and performs minimum-maximum normalization on each divided electrocardiogram data (S550). That is, the predictive model generating apparatus can divide the electrocardiogram data so that at least one waveform is included in the electrocardiogram data composed of a plurality of waveforms, as shown in B.

단계 S550가 수행되면, 예측모델 생성장치는 정규화된 심전도 데이터중 일부를 트레이닝 데이터 세트로 분류한다(S560). 이때, 예측모델 생성장치는 정규화된 심전도 데이터들을 일정 비율로 트레이닝 데이터 세트, 테스트 데이터 세트, 유효성 검증 데이터 세트로 분류할 수 있다. When step S550 is performed, the predictive model generation apparatus classifies some of the normalized electrocardiogram data into a training data set (S560). At this time, the predictive model generation apparatus can classify the normalized electrocardiogram data into a training data set, a test data set, and a validity verification data set at a predetermined ratio.

안계 S560이 수행되면, 예측모델 생성장치는 트레이닝 데이터 세트의 혈청 칼륨농도를 균형있게 분포시킨다(S570). 즉, 예측모델 생성장치는 칼륨농도에 대한 카테고리별로 트레이닝 데이터를 샘플링하여 칼륨농도를 균형있게 분포시킬 수 있다. 그러면, C에 도시된 바와 같이 카테고리 단위로 재샘플링 전의 심전도 데이터 수만큼 트레이닝 데이터를 증가시킬 수 있다. When the anthropomorphic S560 is performed, the predictive model generation apparatus distributes the serum potassium concentration of the training data set in a balanced manner (S570). That is, the prediction model generating apparatus can sample the training data by the category for the potassium concentration and distribute the potassium concentration in a balanced manner. Then, as shown in C, the training data can be increased by the number of ECG data before re-sampling in units of categories.

이하, 표 1과 같은 특성의 531명의 환자로부터 수집된 심전도 데이터를 이용하여 칼륨농도 예측모델을 생성한 경우에 대해 설명하기로 한다. Hereinafter, the case where the potassium concentration prediction model is generated using the electrocardiographic data collected from 531 patients having the characteristics shown in Table 1 will be described.

Figure pat00004
Figure pat00004

예측모델 생성장치는 531명의 환자로부터 각각 수집된 심전도 데이터들중에서 동일 시간대에 칼륨농도가 없는 데이터, 해석 불가능한 노이즈 데이터, outlier 데이터 등을 제거하여 트레이닝 데이터 세트, 테스트 데이터 세트, 유효성 검증 데이터 세트로 분류한다. 그 결과 425명의 환자로부터의 1,071,000개의 심전도 데이터, 53명의 환자로부터의 106,615개의 심전도 데이터, 53 명의 환자로부터의 137,165개의 심전도 데이터로 분류되고, 이는 순서대로 트레이닝 데이터 세트, 테스트 데이터 세트 및 유효성 검증 데이터 세트일 수 있다. 이때, 예측모델 생성장치는 트레이닝 데이터 세트 중에서 리샘플링을 통해 칼륨농도 분포를 조절하여 425명의 환자에서 1,065,000개의 심전도 데이터가 최종으로 등록되었다고 가정한다.The predictive model generation device classifies training data sets, test data sets, and validity data sets by removing no potassium concentration data, uninterpretable noise data, and outlier data from the electrocardiogram data collected from 531 patients, respectively do. As a result, 1,071,000 electrocardiogram data from 425 patients, 106,615 ECG data from 53 patients, and 137,165 ECG data from 53 patients, which are in turn sorted into training data sets, test data sets, and validation data sets Lt; / RTI > At this time, the predictive model generation device assumes that 1,065,000 electrocardiogram data are finally registered in 425 patients by adjusting the potassium concentration distribution through resampling among the training data sets.

이러한 트레이닝 데이터 세트를 이용하여 칼륨농도 예측모델을 생성하고, 그 칼륨농도 예측모델의 성능을 측정하면, 도 6과 같다. A model of potassium concentration prediction is generated using this training data set, and the performance of the potassium concentration prediction model is measured as shown in FIG.

도 6은 본 발명의 일 실시예에 따른 모델 학습과 최종 모델의 성능을 나타낸 그래프, 도 7은 최소-최대 정규화를 수행하지 않은 트레이닝 데이터 세트를 이용하여 생성한 예측모델의 성능을 나타낸 그래프, 도 8은 본 발명의 일 실시예에 따른 혈청 칼륨 농도에 따른 MSE를 나타낸 그래프이다. FIG. 6 is a graph illustrating performance of model learning and final model according to an embodiment of the present invention. FIG. 7 is a graph illustrating performance of a prediction model generated using a training data set that has not undergone minimum- 8 is a graph showing MSE according to serum potassium concentration according to an embodiment of the present invention.

도 6에서 (a)는 학습 과정중 손실값(MSE)의 변화를 나타내고, (b)는 트레이닝 데이터 세트를 이용하여 생성된 예측모델에 의해 추정된 칼륨농도와 실제 칼륨농도간의 상관관계를 나타내며, (c)는 예측모델에서 테스트 데이터 세트에 의해 추정된 칼륨농도와 실제 칼륨농도간의 상관관계를 나타내고, (d)는 예측모델에서 유효성 검증 데이터 세트에 의해 추정된 칼륨농도와 실제 칼륨농도간의 상관관계를 나타낸다. (b), (c), (d)에서 노란색 선은 추정된 칼륨농도 값과 실제 칼륨농도 값 사이의 완벽한 일치를 나타낸다. 적색 경계선 사이의 영역은 1.0 mmol/L 절대 오차 범위내의 영역을 나타낸다. 6 (a) shows a change in the loss value (MSE) during the learning process, (b) shows a correlation between the potassium concentration and the actual potassium concentration estimated by the prediction model generated using the training data set, (c) shows the correlation between the potassium concentration and the actual potassium concentration estimated by the test data set in the predictive model, and (d) shows the correlation between the potassium concentration and the actual potassium concentration estimated by the validation data set in the prediction model . The yellow lines in (b), (c) and (d) show a perfect match between the estimated potassium concentration value and the actual potassium concentration value. The area between the red boundaries represents the area within the 1.0 mmol / L absolute error range.

(a)를 참조하면, 오버피팅이 에폭2(epoch 2)의 끝에서부터 학습 모델에서 관찰됨을 알 수 있다. 트레이닝 데이터 세트의 MSE는 지속적으로 감소하는 반면, 테스트 데이터 세트의 MSE는 증가하기 시작함을 알 수 있다. 그러므로, 학습모델은 에폭2의 끝까지 학습하기 위해 최종 모델을 선택할 수 있다. (a), it can be seen that overfitting is observed in the learning model from the end of epoch 2. It can be seen that the MSE of the training data set is continuously decreasing while the MSE of the training data set is beginning to increase. Therefore, the learning model can select the final model to learn to the end of epoch 2.

최종으로 선택된 모델에서 트레이닝 데이터 세트의 MSE는 0.14 ± 0.03, 테스트 데이터 세트의 MSE 는 0.33 ± 0.26, 유효성 검사 데이터 세트의 MSE는 0.40 ± 0.60임을 알 수 있다. 세 가지 데이터 세트 모두에서 혈청 칼륨 농도와 추정치 사이에 선형 관계가 관찰됨을 알 수 있다. 상관 계수는 트레이닝 데이터 세트, 테스트 데이터 세트 및 검증 데이터 세트에서 0.94, 0.43 및 0.31일 수 있다.In the final selected model, the MSE of the training data set is 0.14 ± 0.03, the MSE of the test data set is 0.33 ± 0.26, and the MSE of the validation data set is 0.40 ± 0.60. It can be seen that a linear relationship is observed between the serum potassium concentration and the estimate in all three data sets. The correlation coefficient may be 0.94, 0.43, and 0.31 in the training data set, the test data set, and the verification data set.

한편, 최소-최대 정규화를 수행하지 않은 트레이닝 데이터 세트를 이용하여 생성한 예측모델은 도 7과 같은 성능을 가질 수 있다. 도 7에서 (a)는 트레이닝 데이터 세트를 이용하여 생성된 예측모델에 의해 추정된 칼륨농도와 실제 칼륨농도간의 상관관계를 나타내며, (b)는 예측모델에서 테스트 데이터 세트에 의해 추정된 칼륨농도와 실제 칼륨농도간의 상관관계를 나타내고, (c)는 예측모델에서 유효성 검증 데이터 세트에 의해 추정된 칼륨농도와 실제 칼륨농도간의 상관관계를 나타낸다. 이 경우, 트레이닝 데이터 세트의 MSE는 0.12 ± 0.06, 테스트 데이터 세트의 MSE 는 0.46 ± 0.23, 유효성 검사 데이터 세트의 MSE는 0.60 ± 0.50임을 알 수 있다. 세 가지 데이터 세트 모두에서 혈청 칼륨 농도와 추정치 사이에 선형 관계가 관찰됨을 알 수 있다. 상관 계수는 트레이닝 데이터 세트, 테스트 데이터 세트 및 검증 데이터 세트에서 0.94, 0.43 및 0.31일 수 있다. 상관 계수는 트레이닝 데이터 세트, 테스트 데이터 세트 및 검증 데이터 세트에서 0.94, 0.23 및 0.13일 수 있다.On the other hand, the prediction model generated using the training data set that has not undergone the min-max normalization can have the performance as shown in FIG. 7 (a) shows the correlation between the potassium concentration and the actual potassium concentration estimated by the prediction model generated using the training data set, (b) shows the relationship between the potassium concentration estimated by the test data set and (C) shows the correlation between the actual potassium concentration and the potassium concentration estimated by the validation data set in the prediction model. In this case, it can be seen that the MSE of the training data set is 0.12 ± 0.06, the MSE of the test data set is 0.46 ± 0.23, and the MSE of the validation data set is 0.60 ± 0.50. It can be seen that a linear relationship is observed between the serum potassium concentration and the estimate in all three data sets. The correlation coefficient may be 0.94, 0.43, and 0.31 in the training data set, the test data set, and the verification data set. The correlation coefficient may be 0.94, 0.23, and 0.13 in the training data set, the test data set, and the verification data set.

도 6과 도 7의 MSE 를 비교하면, 최소-최대 정규화를 수행하지 않은 예측모델의 MSE는 최소-최대 정규화를 수행한 MSE보다 크다는 것을 알 수 있다. 예측모델은 MSE가 최소가 되어야 하므로, 예측모델 생성장치는MSE가 최소가 되는 예측모델을 생성하기 위해 최소-최대 정규화를 수행할 필요가 있다. Comparing the MSEs of FIGS. 6 and 7, it can be seen that the MSE of the predictive model that has not undergone the min-max normalization is larger than the MSE that performed the min-max normalization. Since the prediction model must have the minimum MSE, the prediction model generation device needs to perform the minimum-maximum normalization to generate the prediction model with the minimum MSE.

칼륨농도에 따른 MSE는 도 8에 도시된 바와 같이 U자 곡선을 보인다. MSE는 혈청 칼륨이 5.5 mmol / L 이상인 군에서 1.93 ± 1.12로 가장 높음을 알 수 있다. The MSE according to the potassium concentration shows a U-shaped curve as shown in FIG. MSE was the highest at 1.93 ± 1.12 in patients with serum potassium of 5.5 mmol / L or more.

도 9는 본 발명의 일 실시예에 따른 칼륨농도 추정을 위한 ECG 패턴을 나타낸 그래프이다. 이는 유효성 검증 데이터 세트에서 무작위로 선택된 다양한 심전도 데이터에서 획득된 것이고, 주황색 막대는 각 시점에서 attention 점수의 값을 나타내며, 가중치는 0.0에서 0.2사이에서 표준화된 것이다.9 is a graph showing an ECG pattern for estimating potassium concentration according to an embodiment of the present invention. This is obtained from various EKG data randomly selected from the validation data set, and the orange bar represents the value of the attention score at each time point, and the weight is normalized between 0.0 and 0.2.

도 9를 참조하면, 예측모델이 대부분의 경우에 Q파와 T파의 끝 사이의 패턴에 초점을 맞추고 있음을 알 수 있다. 그러나 각각의 경우에 따라 예측모델은 QRS 복합체와 P 파를 포함한 다른 영역에도 초점을 맞추고 있음도 알 수 있다. Referring to FIG. 9, it can be seen that the prediction model focuses on the pattern between the Q wave and the T wave end in most cases. In each case, however, the prediction model also focuses on other areas, including the QRS complex and the P wave.

한편, 본 발명은 딥 러닝 기반으로 생성된 칼륨농도 예측모델을 이용하여 single-lead 심전도 정보를 분석할 수 있고, 혈액 샘플을 채취하지 않고도 신뢰할 수 있는 혈청 칼륨농도를 추정할 수 있다. 또한, 칼륨농도 예측모델에 attention 모델을 적용할 때 혈청 칼륨농도의 변화와 관련된 ECG 특징을 사용한다는 것도 알 수 있다.Meanwhile, the present invention can analyze the single-lead electrocardiographic information using the potassium concentration prediction model generated on the basis of the deep learning, and estimate the reliable serum potassium concentration without taking a blood sample. It can also be seen that when applying the attention model to the potassium concentration prediction model, the ECG features associated with changes in serum potassium concentration are used.

의사가 심전도 정보를 이용하여 칼륨농도를 평가하는 연구가 제대로 수행되지 못하였다. 이것은 심전도 패턴의 변화가 혈청 칼륨농도의 변화와 비교하여 지속적이고 최소이므로, 인간에게는 컷오프를 결정하는 것이 다소 어려울 수 있기 때문일 수 있다. 그러나 본 발명에 따른 칼륨농도 예측모델은 심전도 데이터를 이용하여 혈청 칼륨농도 패턴의 변화를 정확하게 측정할 수 있고, 일관되게 컷오프를 결정하기 때문에 칼륨농도와 고칼륨 혈증의 정상 범위를 단순히 구별하기보다는 칼륨농도 자체를 평가할 수 있다. Doctors have failed to evaluate the potassium concentration using EKG information. This may be because it is somewhat difficult for humans to determine the cutoff because the change in ECG pattern is continuous and minimal compared to changes in serum potassium concentration. However, since the potassium concentration prediction model according to the present invention can accurately measure changes in the potassium potassium concentration pattern using electrocardiographic data and consistently determines the cutoff, the potassium concentration and the normal range of hyperkalemia are determined, The concentration itself can be evaluated.

또한 본 발명은 hidden 특징을 학습할 수 있는 충분한 ECG 데이터를 수집하여 딥러닝 기반의 모델에 적용함으로써, 종래 기계 학습 기반 모델에 비해 칼륨농도 추정치의 성능이 향상됨을 알 수 있다. 또한, 딥러닝 기반의 예측모델은 대개 Q파와 T 파 끝사이의 패턴에 초점을 맞추었지만, Q파와 T 파 외에 P, QRS 및 T 파 등의 모든 파가 혈청 칼륨농도와 관련된 새로운 특징이 있을을 알 수 있다.The present invention also shows that the performance of the potassium concentration estimate is improved compared to the conventional machine learning based model by collecting enough ECG data to learn hidden features and applying it to a deep learning based model. In addition, the deep-run-based predictive model focused on the pattern between the Q-wave and the T-wave end, but all waves such as P, QRS, and T waves in addition to the Q-wave and T- Able to know.

또한, 본 발명에 따른 딥러닝 기반의 예측모델은 72초의 ECG 데이터를 필요로 했던 종래의 모델과는 대조적으로 단지 2초의 ECG 단편만 필요로 하므로, 실시간 결과를 제공할 수 있다. In addition, the deep learning based prediction model according to the present invention can provide real-time results since only two seconds of ECG fragments are required in contrast to the conventional model, which required 72 seconds of ECG data.

또한, 본 발명에서 사용된 심전도 데이터는 종래에 사용된 V3, V4 또는 V5보다 실제 설정에서 보다 실제적인 ECG 신호인 lead II ECG 신호만을 사용함으로써, 더 중요한 임상적 함의가 있을 수 있다. 즉, 종래에는 V3, V4 또는 V5 중에서 가장 두드러진 T파를 포함하는 하나의 심전도 신호를 선택하여 사용, 즉, 3개의 lead 신호가 필요하였는데, 본 발명은 lead II 신호만을 사용하고, lead II 신호는 현실 세계에서 가장 보편적으로 사용되기 때문에 더 중요한 임상적 함의가 있다.Further, the electrocardiographic data used in the present invention may have a more important clinical implication by using only the lead II ECG signal, which is a more practical ECG signal than the conventional V3, V4 or V5 in actual setting. That is, in the related art, one electrocardiogram signal including the T wave most conspicuous among V3, V4, or V5 was selected and used, that is, three lead signals were required. The present invention uses only the lead II signal, There are more important clinical implications because they are the most commonly used in the real world.

또한, 본 발명은 피실험자 당 일정시간(예컨대 10분)의 심전도 신호를 수집하고, 학습 모델을 위해 일정시간(예컨대 2초) 단위로 분할함으로서, 2 초 ECG 단위가 하나의 혈청 칼륨 결과와 매칭되고, 모든 결과를 사용한다. 하나의 결과를 선택하기 보다는 모든 결과를 사용하기 때문에 데이터 증가 효과를 제공할 수 있다. 여기서, 데이터 증가는 overfitting을 줄이기 위해 노이즈를 추가하거나 shifting, rotating 또는 트레이닝 데이터 세트의 크기를 조정하여 트레이닝 데이터 세트의 크기를 인위적으로 늘리는 프로세스이다. 따라서, 단지 두 번의 에폭으로 모델 학습을 수행하지만, 본 발명에 따른 예측모델은 평균 한번의 혈중 칼륨 결과당 400번 이상을 학습할 수 있다.In addition, the present invention collects electrocardiogram signals of a predetermined time (e.g., 10 minutes) per subject and divides them into units of a predetermined time (for example, 2 seconds) for the learning model so that the 2-second ECG unit is matched with one serum potassium result , Use all results. It is possible to provide a data increase effect because all results are used rather than one result is selected. Here, the data increase is a process of artificially increasing the size of the training data set by adding noise or adjusting the size of a shifting, rotating or training data set to reduce overfitting. Thus, although the model learning is performed with only two epochs, the prediction model according to the present invention can learn 400 or more times per mean blood potassium result.

또한, 딥러닝 기반의 예측모델을 이용하여 single-lead ECG 해석에서 혈청 칼륨 수준을 비 침습적으로 모니터링하면, 일상 생활에 몇가지 고유한 이점이 있다. 첫째, 환자의 불필요한 혈액 채취를 피할수 있다. 둘째, 즉각적인 심전도 분석은 의사가 진료 시점에서 즉각적인 의사 결정을 내리는 데 도움이 될 수 있다. 셋째, 데이터 수집의 연속성은 혈청 칼륨의 증가 또는 감소 추세를 감지할 수 있는 실시간 모니터링 서비스를 제공할 수 있고, 이는 자동 경보 시스템으로 동작할수 있다. 넷째, 환자는 자동 보고 시스템을 통해 자가 관리에 보다 적극적으로 참여할 수 있다. 예를 들어, 유지 혈액 투석을 받는 환자가 얼마나 많은 칼륨 결합 수지를 사용해야 하는지를 결정하는데 사용될 수 있다.In addition, non-invasive monitoring of serum potassium levels in a single-lead ECG analysis using a deep learning-based prediction model has several unique advantages in daily life. First, unnecessary blood collection from the patient can be avoided. Second, immediate ECG analysis can help doctors make immediate decisions at the point of care. Third, the continuity of data collection can provide a real-time monitoring service that can detect increases or decreases in serum potassium, which can operate as an automatic alarm system. Fourth, patients can participate more actively in self-management through the automatic reporting system. For example, a patient undergoing maintenance hemodialysis can be used to determine how many potassium binding resins should be used.

한편, ECG등과 같은 생체 신호를 측정하는 모바일 장치가 많이 있으므로, 칼륨농도 예측모델을 모바일 장치에 쉽게 적용 할 수 있다. 이 경우 환자는 집에서 칼륨농도를 스스로 관리할 수 있고, 이로 인해 응급실을 방문하기 전에 심각한 부작용을 예방할 수 있다.On the other hand, since there are many mobile devices for measuring bio-signals such as ECG, the potassium concentration prediction model can be easily applied to a mobile device. In this case, the patient can manage his own potassium concentration at home, which can prevent serious side effects before visiting the emergency room.

이처럼 칼륨농도의 자가 모니터링이 가능한 장치는 도 10과 같이 구현될 수 있다. A device capable of self-monitoring of the potassium concentration as described above can be implemented as shown in FIG.

도 10은 본 발명의 일 실시예에 따른 칼륨농도 모니터링 장치를 설명하기 위한 도면이다. 10 is a view for explaining a potassium concentration monitoring apparatus according to an embodiment of the present invention.

도 10을 참조하면, 칼륨농도 모니터링 장치(1000)는 측정부(1010), 예측부(1020), 출력 처리부(1030)를 포함한다. 10, the potassium concentration monitoring apparatus 1000 includes a measuring unit 1010, a predicting unit 1020, and an output processing unit 1030.

측정부(1010)는 사용자의 심전도 데이터를 측정한다. 측정부(1010)는 신체에 부착되는 전극 수에 따라 다수의 측정 채널을 통해 복수의 심전도 데이터를 측정할 수 있다. 또한, 측정부(1010)는 심전도 측정 센서로 구현되어 측정될 수도 있다. 이때, 측정된 심전도 데이터는 single-lead ECG 신호 데이터일 수 있다. The measurement unit 1010 measures the electrocardiogram data of the user. The measuring unit 1010 can measure a plurality of electrocardiogram data through a plurality of measurement channels according to the number of electrodes attached to the body. Also, the measuring unit 1010 may be implemented and measured by an electrocardiogram measuring sensor. At this time, the measured electrocardiogram data may be single-lead ECG signal data.

측정부(1010)는 심전도를 측정하는 별도의 장치를 이용하여 측정될 수도 있다. The measurement unit 1010 may be measured using a separate apparatus for measuring electrocardiogram.

예측부(1020)는 측정부(1010)에서 측정된 심전도 데이터를 칼륨농도 예측모델에 입력하여, 칼륨농도를 예측한다. 즉, 예측부(1020)는 심전도 데이터에서 특징을 추출하고, 추출된 특징을 시계열적으로 분석하여 칼륨농도를 예측할 수 있다. The prediction unit 1020 inputs the electrocardiogram data measured by the measurement unit 1010 to the potassium concentration prediction model to predict the potassium concentration. That is, the predicting unit 1020 can extract the feature from the electrocardiogram data and analyze the extracted feature in a time-wise manner to predict the potassium concentration.

출력 처리부(1030)는 예측부(1020)에서 예측된 칼륨농도를 출력한다.The output processing unit 1030 outputs the predicted potassium concentration in the predicting unit 1020.

또한, 출력 처리부(1030)는 예측된 칼륨농도가 기 설정된 정상 수준을 벗어나는 경우, 알람을 발생시킬 수 있다. 이때, 알람은 문자, 소리 등의 형태일 수 있다. In addition, the output processing unit 1030 can generate an alarm when the predicted potassium concentration deviates from a predetermined normal level. At this time, the alarm may be in the form of a character, a sound, or the like.

또한, 출력 처리부(1030)는 예측된 칼륨농도가 기 설정된 정상 수준을 벗어나는 경우, 기 설정된 병원 또는 보호자에게 칼륨농도에 대한 정보를 알릴 수 있다. In addition, the output processor 1030 can inform the predetermined hospital or the guardian of information on the potassium concentration when the predicted potassium concentration deviates from a predetermined normal level.

한편, 칼륨농도 모니터링 장치(1000)는 휴대용 장치에 구현(또는 탑재)될 수 있다. 휴대용 전자 장치는 랩탑(laptop) 컴퓨터, 이동 전화기, 스마트 폰(smart phone), 태블릿(tablet) PC, 모바일 인터넷 디바이스(mobile internet device(MID)), PDA(personal digital assistant), EDA(enterprise digital assistant), 휴대용 게임 콘솔(handheld console), e-북(e-book), 또는 스마트 디바이스(smart device)로 구현될 수 있다. 예를 들어, 스마트 디바이스는 스마트 와치(smart watch) 또는 스마트 밴드(smart band)로 구현될 수 있다.Meanwhile, the potassium concentration monitoring apparatus 1000 may be implemented (or mounted) on a portable device. The portable electronic device may be a laptop computer, a mobile phone, a smart phone, a tablet PC, a mobile internet device (MID), a personal digital assistant (PDA), an enterprise digital assistant ), A portable game console (handheld console), an e-book, or a smart device. For example, a smart device can be implemented as a smart watch or a smart band.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.The present invention has been described with reference to the preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.

100 : 칼륨농도 예측모델 생성장치
110 : 전처리기
111 : 수집부
112 : 맵핑부
113 : 필터링부
114 : 분할부
115 : 정규화부
116 : 분류부
120 : 예측모델 생성기
130 : 학습 평가기
140 : 심전도 DB
150 : 예측모델 DB
1000 : 칼륨농도 모니터링 장치
1010 : 측정부
1020 : 예측부
1030 : 출력 처리부
100: Potassium concentration prediction model generation device
110: preprocessor
111: collecting section
112:
113: Filtering section
114: minute installment
115: normalization unit
116:
120: Predictive model generator
130: learning evaluator
140: Electrocardiogram DB
150: Predictive model DB
1000: Potassium concentration monitoring device
1010:
1020:
1030: output processor

Claims (11)

칼륨농도가 맵핑된 복수의 심전도 데이터 각각을 기 설정된 길이로 분할하고, 상기 분할된 각 심전도 데이터를 최소-최대 정규화하여 트레이닝 데이터 세트를 생성하는 전처리기;
각 트레이닝 데이터에서 특징점을 추출하고, 상기 추출된 특징점을 시계열적으로 분석하여 칼륨농도 예측모델을 생성하는 예측모델 생성기를 포함하는,
심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
A preprocessor for dividing each of the plurality of electrocardiogram data to which the potassium concentration is mapped into predetermined lengths and generating a training data set by minimizing-maximum normalizing each of the divided ECG data;
And a predictive model generator for extracting feature points from each training data and analyzing the extracted feature points in a time series to generate a potassium concentration prediction model,
An apparatus for predicting potassium concentration in blood using electrocardiogram data.
제1항에 있어서,
상기 전처리기는,
실시간으로 측정되는 복수 사용자의 심전도 데이터를 기 설정된 일정 속도로 수집하는 수집부;
상기 수집된 각 심전도 데이터를 동일 시간대의 칼륨농도와 각각 맵핑하는 맵핑부;
상기 칼륨농도가 맵핑된 심전도 데이터들중에서 노이즈 데이터를 제거하는 필터링부;
상기 노이즈 데이터가 제거된 심전도 데이터들을 적어도 하나 이상의 박동(beat)을 포함하는 길이 단위로 분할하는 분할부;
상기 분할된 각 심전도 데이터를 기 설정된 최소값과 최대값 사이의 값이 되도록 정규화하는 정규화부; 및
상기 정규화된 심전도 데이터중 일부를 트레이닝 데이터 세트로 분류하는 분류부를 포함하는 것을 특징으로 하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
The method according to claim 1,
The pre-
A collection unit for collecting the electrocardiogram data of a plurality of users measured in real time at a predetermined constant rate;
A mapping unit for mapping the collected electrocardiogram data to potassium concentrations in the same time zone;
A filtering unit for removing noise data from the electrocardiogram data to which the potassium concentration is mapped;
A divider for dividing the electrocardiogram data from which the noise data is removed into units of length including at least one beat;
A normalizing unit for normalizing each of the divided ECG data to a value between a predetermined minimum value and a maximum value; And
And a classifier for classifying a part of the normalized electrocardiogram data into a training data set. The apparatus for generating a blood potassium concentration prediction model using electrocardiogram data.
제2항에 있어서,
칼륨농도가 일정 개수의 범주로 나누어진 카테고리에 기초하여, 각 트레이닝 데이터와 매핑된 칼륨농도에 따라 해당 트레이닝 데이터의 카테고리를 분류하고, 상기 분류된 각 카테고리별로 심전도 데이터를 샘플링하여 칼륨농도를 균형있게 분포시키는 밸런싱 처리부를 더 포함하는 것을 특징으로 하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
3. The method of claim 2,
The category of the training data is classified according to the potassium concentration mapped to each training data based on the category in which the potassium concentration is divided into a certain number of categories and the electrocardiogram data is sampled for each of the classified categories to balance the potassium concentration And a balancing processor for distributing blood potassium concentration in the blood using the electrocardiogram data.
제2항에 있어서,
상기 수집부에서 수집된 심전도 데이터는 ECG lead II signals 데이터인 것을 특징으로 하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
3. The method of claim 2,
Wherein the electrocardiogram data collected by the collecting unit is ECG lead II signals data.
제2항에 있어서,
상기 정규화부는,
상기 분할된 심전도 데이터들중에서 outlier에 해당하는 심전도 데이터를 제외하는 것을 특징으로 하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
3. The method of claim 2,
The normalization unit may include:
Wherein the electrocardiogram data corresponding to the outlier is excluded from the divided electrocardiogram data.
제1항에 있어서,
상기 예측모델 생성기는,
각 트레이닝 데이터에서 특징점을 추출하는 적어도 하나 이상의 CNN(Convolution Neural Network) 층; 및
상기 CNN층으로부터 추출된 특징점을 순차적으로 입력받아 칼륨농도를 산출하는 RNN(Recurrent Neural Network) 층으로 구성된 것을 특징으로 하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
The method according to claim 1,
Wherein the prediction model generator comprises:
At least one CNN (Convolution Neural Network) layer for extracting feature points from each training data; And
And an RNN (Recurrent Neural Network) layer for sequentially receiving the minutiae extracted from the CNN layer and calculating the potassium concentration. The apparatus for generating a blood potassium concentration prediction model using electrocardiogram data.
제1항에 있어서,
손실함수를 이용하여 상기 칼륨농도 예측모델의 학습의 정도를 평가하고, 오차역전법으로 상기 칼륨농도 예측모델을 학습시키는 학습 평가기를 더 포함하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성장치.
The method according to claim 1,
Further comprising a learning evaluator for evaluating the degree of learning of the potassium concentration prediction model using a loss function and learning the potassium concentration prediction model by an error inversion method.
전처리기가 칼륨농도가 맵핑된 복수의 심전도 데이터 각각을 기 설정된 길이로 분할하고, 상기 분할된 각 심전도 데이터를 최소-최대 정규화하여 트레이닝 데이터 세트를 생성하는 단계;
예측모델 생성기가 각 트레이닝 데이터에서 특징점을 추출하고, 상기 추출된 특징점을 시계열적으로 분석하여 칼륨농도 예측모델을 생성하는 단계를 포함하는,
심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성방법.
Dividing each of the plurality of electrocardiogram data to which the pre-processor has mapped the potassium concentration into predetermined lengths, and generating a training data set by minimizing-maximizing the divided electrocardiogram data;
Wherein the prediction model generator comprises a step of extracting feature points from each training data and analyzing the extracted feature points in a time series to generate a potassium concentration prediction model,
A method for predicting blood potassium concentration in blood using electrocardiogram data.
제8항에 있어서,
상기 트레이닝 데이터 세트를 생성하는 단계 이후,
상기 전처리기는, 칼륨농도가 일정 개수의 범주로 나누어진 카테고리에 기초하여, 각 트레이닝 데이터와 매핑된 칼륨농도에 따라 해당 트레이닝 데이터의 카테고리를 분류하고, 상기 분류된 각 카테고리별로 심전도 데이터를 샘플링하여 칼륨농도를 균형있게 분포시키는 단계를 더 포함하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성방법.
9. The method of claim 8,
After generating the training data set,
The preprocessor classifies the category of the training data according to the potassium concentration mapped to each training data, based on the category in which the potassium concentration is divided into a certain number of categories, samples the electrocardiogram data for each of the classified categories, The method further comprising the step of distributing the concentration in a balanced manner.
제8항에 있어서,
상기 칼륨농도 예측모델은,
각 트레이닝 데이터에서 특징점을 추출하는 적어도 하나 이상의 CNN(Convolution Neural Network) 층; 및
상기 CNN층으로부터 추출된 특징점을 순차적으로 입력받아 칼륨농도를 산출하는 RNN(Recurrent Neural Network) 층으로 구성된 것을 특징으로 하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성방법.
9. The method of claim 8,
In the potassium concentration prediction model,
At least one CNN (Convolution Neural Network) layer for extracting feature points from each training data; And
And a RNN (Recurrent Neural Network) layer for sequentially receiving the minutiae extracted from the CNN layer and calculating the potassium concentration.
제8항에 있어서,
상기 칼륨농도 예측모델을 생성하는 단계 이후,
성능 평가기는, 손실함수를 이용하여 상기 칼륨농도 예측모델의 학습의 정도를 평가하고, 오차역전법으로 상기 칼륨농도 예측모델을 학습시키는 단계를 더 포함하는 심전도 데이터를 이용한 혈중 칼륨농도 예측모델 생성방법.
9. The method of claim 8,
After the step of generating the potassium concentration prediction model,
The performance evaluator includes a step of evaluating the degree of learning of the potassium concentration prediction model using a loss function and learning the potassium concentration prediction model by an error inversion method .
KR1020170165967A 2017-12-05 2017-12-05 Apparatus for generating of Potassium level determination model using ECG and method thereof KR102008196B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170165967A KR102008196B1 (en) 2017-12-05 2017-12-05 Apparatus for generating of Potassium level determination model using ECG and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170165967A KR102008196B1 (en) 2017-12-05 2017-12-05 Apparatus for generating of Potassium level determination model using ECG and method thereof

Publications (2)

Publication Number Publication Date
KR20190066332A true KR20190066332A (en) 2019-06-13
KR102008196B1 KR102008196B1 (en) 2019-08-07

Family

ID=66847849

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170165967A KR102008196B1 (en) 2017-12-05 2017-12-05 Apparatus for generating of Potassium level determination model using ECG and method thereof

Country Status (1)

Country Link
KR (1) KR102008196B1 (en)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021015936A1 (en) * 2019-07-24 2021-01-28 Nec Laboratories America, Inc. Word-overlap-based clustering cross-modal retrieval
CN112545501A (en) * 2020-12-10 2021-03-26 徐岩 Blood component concentration detection method and device
KR20220072231A (en) * 2020-11-25 2022-06-02 강원대학교산학협력단 Method for analyzing parameter of photoplethysmography using deep neural network filters
WO2022255852A1 (en) * 2021-06-04 2022-12-08 연세대학교 원주산학협력단 System for constructing hyperkalemia prediction algorithm through electrocardiogram, method for constructing hyperkalemia prediction algorithm through electrocardiogram by using same, and hyperkalemia prediction system using electrocardiogram
KR20220164365A (en) * 2021-06-04 2022-12-13 연세대학교 원주산학협력단 A system for constructing an algorithm for predicting hyperkalemia through an electrocardiogram and a method for constructing an algorithm for predicting hyperkalemia through an electrocardiogram using the same
KR20220164366A (en) * 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Hyperkalemia prediction system using electrocardiogram
WO2023022493A1 (en) * 2021-08-17 2023-02-23 주식회사 메디컬에이아이 Deep learning-based electrocardiogram data noise removal system
KR102619044B1 (en) * 2023-03-21 2023-12-27 쿠팡 주식회사 Recommending method based on machine-learning and system thereof
WO2024025350A1 (en) * 2022-07-29 2024-02-01 주식회사 메디컬에이아이 Method, program, and device for updating artificial intelligence model for electrocardiogram reading

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220040515A (en) 2020-09-22 2022-03-30 주식회사 바디프랜드 System for predicting degree of risk in cardiac arrest by using electrocardiogram based on deep learning
KR20220040516A (en) 2020-09-22 2022-03-30 주식회사 바디프랜드 System for predicting coronary artery disease by using electrocardiogram based on deep learning
WO2024019584A1 (en) * 2022-07-22 2024-01-25 주식회사 메디컬에이아이 Method, program, and device for diagnosing myocardial infarction using electrocardiogram

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014514110A (en) * 2011-04-20 2014-06-19 ノボ・ノルデイスク・エー/エス Regularized network-based glucose predictor with adaptively selected kernel and regularization parameters
KR20150009843A (en) * 2013-07-17 2015-01-27 건국대학교 산학협력단 System for classification electrocardiogram signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014514110A (en) * 2011-04-20 2014-06-19 ノボ・ノルデイスク・エー/エス Regularized network-based glucose predictor with adaptively selected kernel and regularization parameters
KR20150009843A (en) * 2013-07-17 2015-01-27 건국대학교 산학협력단 System for classification electrocardiogram signals

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Nicolas Pilia 외, ECG as a Tool to Estimate Potassium and Calcium Concentrations in the Extracellular Space, Computing in Cardiology 2017; VOL 44.(2017.09.24.)* *
Zachi I. Attia 외, Novel Bloodless Potassium Determination Using a Signal-Processed Single-Lead ECG, J Am Heart Assoc. 2016.(2016.01.25.)* *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021015936A1 (en) * 2019-07-24 2021-01-28 Nec Laboratories America, Inc. Word-overlap-based clustering cross-modal retrieval
KR20220072231A (en) * 2020-11-25 2022-06-02 강원대학교산학협력단 Method for analyzing parameter of photoplethysmography using deep neural network filters
CN112545501A (en) * 2020-12-10 2021-03-26 徐岩 Blood component concentration detection method and device
WO2022255852A1 (en) * 2021-06-04 2022-12-08 연세대학교 원주산학협력단 System for constructing hyperkalemia prediction algorithm through electrocardiogram, method for constructing hyperkalemia prediction algorithm through electrocardiogram by using same, and hyperkalemia prediction system using electrocardiogram
KR20220164365A (en) * 2021-06-04 2022-12-13 연세대학교 원주산학협력단 A system for constructing an algorithm for predicting hyperkalemia through an electrocardiogram and a method for constructing an algorithm for predicting hyperkalemia through an electrocardiogram using the same
KR20220164366A (en) * 2021-06-04 2022-12-13 연세대학교 원주산학협력단 Hyperkalemia prediction system using electrocardiogram
WO2023022493A1 (en) * 2021-08-17 2023-02-23 주식회사 메디컬에이아이 Deep learning-based electrocardiogram data noise removal system
WO2024025350A1 (en) * 2022-07-29 2024-02-01 주식회사 메디컬에이아이 Method, program, and device for updating artificial intelligence model for electrocardiogram reading
KR102619044B1 (en) * 2023-03-21 2023-12-27 쿠팡 주식회사 Recommending method based on machine-learning and system thereof

Also Published As

Publication number Publication date
KR102008196B1 (en) 2019-08-07

Similar Documents

Publication Publication Date Title
KR102008196B1 (en) Apparatus for generating of Potassium level determination model using ECG and method thereof
Ge et al. Cardiac arrhythmia classification using autoregressive modeling
Zhang et al. Heart sound classification based on scaled spectrogram and partial least squares regression
Merdjanovska et al. Comprehensive survey of computational ECG analysis: Databases, methods and applications
Pathinarupothi et al. Instantaneous heart rate as a robust feature for sleep apnea severity detection using deep learning
Jovic et al. Electrocardiogram analysis using a combination of statistical, geometric, and nonlinear heart rate variability features
Gambarotta et al. A review of methods for the signal quality assessment to improve reliability of heart rate and blood pressures derived parameters
US8965497B2 (en) Electrophysiological analysis system and method
Aydemir et al. Classification of decompensated heart failure from clinical and home ballistocardiography
CN105228508A (en) A kind of system and method measured for the risk score of classifying
CN110037668B (en) System for judging age, health state and malignant arrhythmia identification by combining pulse signal time-space domain with model
Shen et al. Risk prediction for cardiovascular disease using ECG data in the China Kadoorie Biobank
Bhoi et al. QRS Complex Detection and Analysis of Cardiovascular Abnormalities: A Review.
Zhang et al. Towards early detection and burden estimation of atrial fibrillation in an ambulatory free-living environment
Papadogiorgaki et al. Heart rate classification using ECG signal processing and machine learning methods
Saraswat et al. Classification of ECG signals using cross-recurrence quantification analysis and probabilistic neural network classifier for ventricular tachycardia patients
Athaya et al. An efficient fingertip photoplethysmographic signal artifact detection method: A machine learning approach
TWI688371B (en) Intelligent device for atrial fibrillation signal pattern acquisition and auxiliary diagnosis
Cuesta et al. Detection of premature ventricular contractions using the RR-interval signal: a simple algorithm for mobile devices
Tsai et al. Beat-by-beat Classification of ECG Signals with Machine Learning Algorithm for Cardiac Episodes
CN114886403A (en) Malignant arrhythmia identification and prediction system based on pulse main wave interval
Rawal et al. Adaptive correlation dimension method for analysing heart rate variability during the menstrual cycle
Caliskan et al. Nonlinear analysis of heart rate variability of healthy subjects and patients with chronic obstructive pulmonary disease
Maghawry et al. An efficient approach for paroxysmal atrial fibrillation events prediction using extreme learning machine
Vyas et al. Heartbeat abnormality detection using machine learning models and rate variability (HRV) data

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant