KR20200114975A - Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same - Google Patents

Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same Download PDF

Info

Publication number
KR20200114975A
KR20200114975A KR1020190097366A KR20190097366A KR20200114975A KR 20200114975 A KR20200114975 A KR 20200114975A KR 1020190097366 A KR1020190097366 A KR 1020190097366A KR 20190097366 A KR20190097366 A KR 20190097366A KR 20200114975 A KR20200114975 A KR 20200114975A
Authority
KR
South Korea
Prior art keywords
bacteremia
risk
data
predicting
developing
Prior art date
Application number
KR1020190097366A
Other languages
Korean (ko)
Other versions
KR102287968B1 (en
Inventor
송영구
동재준
이경화
채명훈
이병수
Original Assignee
연세대학교 산학협력단
주식회사 셀바스에이아이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단, 주식회사 셀바스에이아이 filed Critical 연세대학교 산학협력단
Publication of KR20200114975A publication Critical patent/KR20200114975A/en
Application granted granted Critical
Publication of KR102287968B1 publication Critical patent/KR102287968B1/en

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7271Specific aspects of physiological measurement analysis
    • A61B5/7275Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/01Measuring temperature of body parts ; Diagnostic temperature sensing, e.g. for malignant or inflamed tissue
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/021Measuring pressure in heart or blood vessels
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/02Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
    • A61B5/024Detecting, measuring or recording pulse rate or heart rate
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/08Detecting, measuring or recording devices for evaluating the respiratory organs
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/72Signal processing specially adapted for physiological signals or for diagnostic purposes
    • A61B5/7235Details of waveform analysis

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Surgery (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Veterinary Medicine (AREA)
  • Biomedical Technology (AREA)
  • Heart & Thoracic Surgery (AREA)
  • Medical Informatics (AREA)
  • Molecular Biology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physics & Mathematics (AREA)
  • Physiology (AREA)
  • Cardiology (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Psychiatry (AREA)
  • Signal Processing (AREA)
  • Vascular Medicine (AREA)
  • Pulmonology (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

The present specification relates to a method for predicting a risk of occurrence of bacteremia implemented by a processor and a device for predicting a risk of occurrence of bacteremia using the same. The method comprises the steps of: receiving biological test data for a subject; and predicting a risk of occurrence of bacteremia in the subject using a bacteremia prediction model configured to predict the risk of the occurrence of bacteremia in the subject based on the biological test data. The biological test data include at least one of a creatine level, an albumin level, a creactive protein (CRP) level, a white blood cell (WBC) minimum level, a WBC maximum level, platelet count and prothrombin time, and an alkaline phosphatase (ALP) level.

Description

균혈증 발병 위험도 예측 방법 및 이를 이용한 균혈증 발병 위험도 예측용 디바이스{METHOD FOR PREDICTING OF BACTEREMIA RISK AND DEVICE FOR PREDICTING OF BACTEREMIA RISK USING THE SAME}A method for predicting the risk of bacteremia and a device for predicting the risk of bacteremia using the same {METHOD FOR PREDICTING OF BACTEREMIA RISK AND DEVICE FOR PREDICTING OF BACTEREMIA RISK USING THE SAME}

본 발명은 균혈증 발병 위험도의 예측 방법 및 디바이스에 관한 것으로, 보다 구체적으로 개체로부터 획득한 다양한 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하고 제공하도록 구성된 방법 및 이를 이용한 디바이스에 관한 것이다.The present invention relates to a method and device for predicting the risk of developing bacteremia, and more particularly, to a method configured to predict and provide the risk of developing bacteremia based on various clinical data acquired from an individual, and a device using the same.

균혈증은 균이 혈액 속에 들어가서 온몸을 순환하고 있는 임상적 상태를 지칭할 수 있다. 이러한 균혈증은 세균이 세망 내피계의 제거 능력을 넘는 속도로 증식할 때 발생할 수 있다. Bacteremia can refer to a clinical condition in which bacteria enter the blood and circulate throughout the body. These bacteremia can occur when bacteria multiply at a rate that exceeds the ability of the reticulum endothelial system to clear.

이때, 균혈증은 임상적 양상에 따라, 일시적 균혈증과 간헐적 균혈증, 지속적 균혈증으로 구분될 수 있다. 보다 구체적으로, 일시적 균혈증은 전신성 또는 국소적 감염 초기에 발생하는 균혈증으로, 뇌막염, 폐렴, 화농성 관절염, 골수염, 임균 또는 수막구균 감염을 동반할 수 있다. 또한, 간헐적 균혈증은 복강, 골반강, 신장주위, 간, 전립선 등의 부위에 농양이 있을 때 발병될 수 있고, 지속적 균혈증은 세균성 심내막염과 혈관 내 카테테의 감염이 있을 때 발병될 수 있고 장티푸스, 부르셀라증을 동반할 수 있다. In this case, bacteremia can be classified into temporary bacteremia, intermittent bacteremia, and persistent bacteremia according to clinical aspects. More specifically, transient bacteremia is bacteremia occurring at the beginning of systemic or local infection, and may be accompanied by meningitis, pneumonia, purulent arthritis, osteomyelitis, gonococcal or meningococcal infection. In addition, intermittent bacteremia can occur when there is an abscess in the abdominal cavity, pelvic cavity, peri-renal, liver, prostate, etc., and persistent bacteremia can occur when there is bacterial endocarditis and infection of intravascular catheter. It may accompany cellosis.

한편, 균혈증의 치료 방법으로는 항생제의 사용이 있을 수 있으며 초기에 적절한 항생제를 경험적으로 사용하는 것이 균혈증에서 패혈증, 패혈성 쇼크로 진행하는 것을 막을 수 있다.On the other hand, as a treatment method for bacteremia, antibiotics may be used, and the empirical use of appropriate antibiotics at an early stage can prevent the progression from bacteremia to sepsis and septic shock.

따라서, 균혈증의 발병 전 균혈증을 예측하는 것은 임상적으로 매우 중요할 수 있다.Therefore, predicting bacteremia before the onset of bacteremia can be of great clinical importance.

이에, 균혈증이 발생하기 전에 이를 미리 예측하고 빠른 조치를 취할 수 있는, 새로운 균혈증 발병 위험도 예측 시스템의 개발이 지속적으로 요구되고 있는 실정이다. Accordingly, there is a constant demand for the development of a new bacteremia risk prediction system that can predict and take quick action before bacteremia occurs.

발명의 배경이 되는 기술은 본 발명에 대한 이해를 보다 용이하게 하기 위해 작성되었다. 발명의 배경이 되는 기술에 기재된 사항들이 선행기술로 존재한다고 인정하는 것으로 이해되어서는 안 된다.The technology that is the background of the present invention has been prepared to facilitate understanding of the present invention. It should not be understood as an admission that the matters described in the technology behind the invention exist as prior art.

한편, 본 발명의 발명자들은, 임상적으로 균혈증과 같은 어떠한 질환의 이환이 의심되는 상황이 도래되기 이전에 미리 인체의 생리학적 대응 반응의 일환으로 생체 신호들의 변화가 선행할 것이라는 점에 주목하였다. On the other hand, the inventors of the present invention have noted that changes in biological signals will precede the physiological response reaction of the human body before a situation in which a disease such as bacteremia is clinically suspected.

보다 구체적으로, 본 발명의 발명자들은, 일반 병실 또는 중환자실에서 획득할 수 있는 다양한 임상 데이터의 변화가 균혈증과 같은 잠재적 질환과 연관성을 가질 수 있음에 주목하였다. More specifically, the inventors of the present invention have noted that changes in various clinical data that can be obtained in a general hospital room or intensive care unit may have an association with potential diseases such as bacteremia.

특히, 본 발명의 발명자들은 균혈증이 외부적 환경에 의해 2 차적으로 야기될 수 있는 질환임에 주목하였고, 환자로부터 분리된 혈액과 같은 생물학적 시료의 분석 결과의 생물학적 시험 데이터뿐만 아니라, 다양한 생체 신호 데이터, 의료적 처치와 관련한 데이터들이 균혈증의 발병과 연관이 있음을 인지할 수 있었다.In particular, the inventors of the present invention have noted that bacteremia is a disease that can be secondaryly caused by an external environment, and not only biological test data of the analysis results of biological samples such as blood isolated from patients, but also various biological signal data However, it was possible to recognize that data related to medical treatment were associated with the onset of bacteremia.

나아가, 본 발명의 발명자들은, 혈액 속에서 균이 증식하여 발열, 저혈압 등의 중독 증상을 일으키는 패혈증과 구별되는, 균혈증의 예측의 정확도를 높이는 생물학적 특징을 탐색하고자 하였다. Further, the inventors of the present invention attempted to explore a biological feature that increases the accuracy of prediction of bacteremia, which is distinguished from sepsis, which causes intoxication symptoms such as fever and hypotension by proliferating bacteria in the blood.

그 결과, 본 발명의 발명자들은 개체로부터 획득한 생물학적 시험 데이터들 중 특히 ALP (Alkaline phosphatase) 수치와 함께 혈소판 수치가 균혈증의 발병과 연관이 있음을 발견할 수 있었다.As a result, the inventors of the present invention were able to find that among the biological test data obtained from individuals, platelet counts, especially ALP (Alkaline phosphatase) levels, are associated with the onset of bacteremia.

이에, 본 발명의 발명자들은, ALP (Alkaline phosphatase) 수치 및/또는 혈소판 수치를 포함하는 생물학적 시험 데이터와 함께 생체 신호 데이터, 임상적 특징 데이터들를 더욱 고려하여 균혈증 발병 위험도를 높은 신뢰도 및 정확도로 예측할 수 있는 균혈증 발병 위험도 예측 시스템을 개발하기에 이르렀다.Accordingly, the inventors of the present invention can predict the risk of bacteremia with high reliability and accuracy by further considering biological test data including ALP (Alkaline phosphatase) level and/or platelet level, as well as biosignal data and clinical characteristic data. It has come to develop a system for predicting the risk of developing bacteremia.

한편, 본 발명의 발명자들은, 새로운 균혈증 발병 위험도 예측 시스템에 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터들를 기초로 균혈증을 예측하도록 학습된 예측 모델을 적용할 수 있었다.On the other hand, the inventors of the present invention were able to apply a predictive model learned to predict bacteremia based on biological test data, further biosignal data, and clinical feature data to a new bacteremia risk prediction system.

관련하여, 본 발명의 발명자들은, 다양한 임상 데이터 중 균혈증임을 예측하는 것에 영향력이 큰 임상 데이터 또는, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터를 결정하도록 평가를 수행하였고, 이를 예측 모델의 학습에 적용하고자 하였다. 이를 통해, 본 발명의 발명자들은 예측 모델의 균혈증 예측의 진단 능력 향상을 기대할 수 있었다. In relation to this, the inventors of the present invention performed an evaluation to determine clinical data having a large influence on predicting bacteremia among various clinical data or clinical data having a large influence on predicting normal, not bacteremia, and this I tried to apply it to learning. Through this, the inventors of the present invention could expect to improve the diagnostic ability of predicting bacteremia of the predictive model.

결과적으로, 균혈증 예측 모델에 기초한 새로운 균혈증 발병 위험도 예측 시스템은, 개체에 대하여 정확도 및 신뢰도 높은 균혈증 진단 정보를 제공할 수 있었다.As a result, a new bacteremia risk prediction system based on a bacteremia prediction model could provide diagnostic information for bacteremia with high accuracy and reliability for an individual.

나아가, 본 발명의 발명자들은 이러한 균혈증 발병 위험도 예측 시스템 개발을 통해, 환자의 상태에 대하여 빠르게 감지하고 균혈증 발병 위험을 미리 인지하여, 환자에 대한 처치 시점을 앞당겨 균혈증의 치료 성과를 높일 수 있음을 기대할 수 있었다. 나아가, 본 발명의 발명자들은 균혈증 발병 위험도의 예측 시스템의 개발이 환자의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다는 것을 더욱 기대할 수 있었다. Furthermore, the inventors of the present invention expect that through the development of such a bacteremia risk prediction system, the patient's condition can be quickly detected and the risk of bacteremia incidence is recognized in advance, so that the treatment time for the patient can be accelerated to improve the treatment outcome of bacteremia. Could Furthermore, the inventors of the present invention could further expect that the development of a system for predicting the risk of developing bacteremia can provide an effect of increasing patient survival, preventing complications, and reducing treatment costs.

또한, 본 발명의 발명자들은, 보호자 또는 의료진이 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고 위험군을 인지할 수 있도록, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성하였다. In addition, the inventors of the present invention, so that the guardian or medical staff can more easily recognize the high-risk group of bacteremia for an individual requiring continuous monitoring, such as a critically ill patient, when bacteremia is predicted by a predictive model, an alarm It was configured to inform the risk of developing bacteremia.

이에, 본 발명이 해결하고자 하는 과제는, 수신된 개체에 대한 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터를 기초로, 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된, 균혈증 발병 위험도 예측 방법을 제공하는 것이다. Accordingly, the problem to be solved by the present invention is to use a bacteremia prediction model configured to predict the risk of bacteremia on the basis of the received biological test data, further biosignal data, and clinical feature data, for the individual. To provide a method for predicting the risk of developing bacteremia, configured to predict the risk of developing bacteremia.

본 발명이 해결하고자 하는 또 다른 과제는, 개체에 대한 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터를 수신하도록 구성된 수신부, 및 수신부와 통신하도록 연결되고 예측 모델에 기초하여 개체에 균혈증 발병 위험도를 예측하도록 구성된 프로세서를 포함하는, 균혈증 발병 위험도 예측용 디바이스를 제공하는 것이다. Another problem to be solved by the present invention is a receiving unit configured to receive biological test data for an individual, further biosignal data, and clinical feature data, and a risk of developing bacteremia in an individual based on a predictive model connected to communicate with the receiving unit. It is to provide a device for predicting the risk of developing bacteremia, including a processor configured to predict.

본 발명의 과제들은 이상에서 언급한 과제들로 제한되지 않으며, 언급되지 않은 또 다른 과제들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The problems of the present invention are not limited to the problems mentioned above, and other problems that are not mentioned will be clearly understood by those skilled in the art from the following description.

전술한 바와 같은 과제를 해결하기 위해, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법이 제공된다. 이때, 본 발명의 균혈증 예측 방법은, 프로세서에 의해 구현되는 균혈증 발병 위험도를 예측하도록 구성된 것으로, 개체에 대한 생물학적 시험 데이터를 수신하는 단계, 생물학적 시험 데이터를 기초로 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체의 균혈증 발병 위험도를 예측하는 단계를 포함한다In order to solve the above problems, a method of predicting the risk of developing bacteremia according to an embodiment of the present invention is provided. At this time, the method for predicting bacteremia of the present invention is configured to predict the risk of developing bacteremia implemented by the processor, receiving biological test data for the individual, and predicting the risk of developing bacteremia for the individual based on the biological test data. And predicting the risk of developing bacteremia in the individual using the constructed bacteremia prediction model.

이때 생물학적 시험 데이터는, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 및 ALP (Alkaline phosphatase) 수치를 포함한다. At this time, the biological test data includes creatine level, albumin level, CRP (Creactive protein) level, WBC (white blood cell) minimum level, WBC maximum level, platelet count, prothrombin time, and Includes Alkaline phosphatase (ALP) levels.

본 발명의 특징에 따르면 본 발명의 균혈증 예측 방법은, 개체에 대한 생체 신호 데이터를 수신하는 단계를 더 포함할 수 있고, 균혈층 예측 모델은 생물학적 시험 데이터 및 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 생체 신호 데이터는, SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나일 수 있다.According to a feature of the present invention, the method for predicting bacteremia of the present invention may further include receiving bio-signal data for an individual, and the bacteremia-prediction model calculates the risk of developing bacteremia based on biological test data and bio-signal data. It can be further configured to predict. At this time, the biosignal data may be at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), maximum body temperature, minimum body temperature, heart rate, and respiratory rate.

본 발명의 다른 특징에 따르면 본 발명의 균혈증 예측 방법은, 개체에 대한 임상적 특징 데이터를 수신하는 단계를 더 포함하고, 균혈층 예측 모델은 생물학적 시험 데이터 및 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 임상적 특징 데이터는, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나일 수 있다.According to another feature of the present invention, the method for predicting bacteremia of the present invention further comprises receiving clinical characteristic data for an individual, and the bacteremia predicting model is based on biological test data and clinical characteristic data, and the risk of developing bacteremia May be further configured to predict. At this time, the clinical characteristic data may be at least one of sex, age, blood culture period, whether or not to be treated with an intensive care unit (ICU), whether to insert a central venous catheter, whether to be treated with steroids, or whether to be treated with antibiotics.

본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는, 크레아틴 수치, 알부민 수치, CRP 수치, WBC 최소 수치, WBC 최고 수치, 프로트롬빈 시간, 및 혈소판 수, ALP 수치를 포함할 수 있다.According to another feature of the present invention, the biological test data may include creatine levels, albumin levels, CRP levels, WBC minimum levels, WBC peak levels, prothrombin time, and platelet count, ALP levels.

본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는 ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치 중 적어도 하나를 더 포함According to another feature of the present invention, biological test data include ALT (alanine aminotransferase) level, thromboplastin coagulation time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, FERR (ferritin) level, HMG (hemoglobin) level, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), red blood cell count, TBIL (total bilirubin) level, TCO 2 (total carbon dioxide) and white blood cell count

본 발명의 또 다른 특징에 따르면, 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 일 수 있다.According to another feature of the present invention, the bacteremia may be acute severe bacteraemia.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델일 수 있다. According to another feature of the present invention, the bacteremia prediction model includes an ensemble model composed of a combination of a multi-layer perceptron (MLP), a support vector machine (SVM), a random forest (RF), and a plurality of models, pre-trained ( It may be at least one of a pre-trained) model and an Xgboost model.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은 또는 Xgboost 모델일 수 있다. 이때, MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나, 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함할 수 있다. According to another feature of the present invention, the model for predicting bacteremia may be or an Xgboost model. In this case, the MLP model may include a single hidden layer having 128 nodes or 256 nodes, or may include a plurality of hidden layers in which a plurality of single hidden layers exist.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하는 단계, 및 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델일 수 있다. 이때, 정상의 표본 개체는, 임상적으로 균혈증 발생되지 않고 균혈증이 아닌 것으로 평가된 개체일 수 있다.According to another feature of the present invention, the bacteremia prediction model includes receiving data for learning consisting of biological experimental data, biological signal data, and clinical feature data for bacteremia-onset sample individuals and normal sample individuals, and training data. As a basis, it may be a model learned through the step of predicting bacteremia or normality. In this case, the normal sample individual may be an individual clinically evaluated as not having bacteremia and not bacteremia.

본 발명의 또 다른 특징에 따르면, 본 발명의 균혈증 예측 방법은, 학습용 데이터를 수신하는 단계 이후에 수행되는 학습용 데이터를 평가하는 단계를 더 포함할 수 있다. 이때, 학습용 데이터를 평가하는 단계는, 학습용 데이터에 대하여 균혈증과의 관련도 (relevance) 점수를 산출하는 단계, 및 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함할 수 있다.According to another feature of the present invention, the method for predicting bacteremia of the present invention may further include evaluating the learning data performed after the step of receiving the learning data. In this case, the step of evaluating the learning data includes calculating a relevance score for bacteremia with respect to the learning data, and determining the learning data related to bacteremia within a predetermined ranking based on the relevance score. Can include.

본 발명의 또 다른 특징에 따르면, 학습용 데이터를 평가하는 단계는, OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여, 학습용 데이터에 대하여 균혈증과의 관련도 점수를 산출하는 단계, 및 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함할 수 있다.According to another feature of the present invention, the step of evaluating the learning data includes: one-out search (OOS), Layer-wise Relevance Propagation (LRP), gradient input (GI), integrated gradients (IG), and saliency (SM). map) based on at least one algorithm, calculating a relevance score for bacteremia with respect to the learning data, and determining bacteremia-related learning data within a predetermined ranking based on the relevance score. I can.

본 발명의 또 다른 특징에 따르면, 본 발명의 균혈증 예측 방법은, 개체에 대하여 예측된 균혈증 발병 위험도를 제공하는 단계를 더 포함할 수 있다.According to another feature of the present invention, the method for predicting bacteremia of the present invention may further include providing a predicted risk of developing bacteremia for an individual.

본 발명의 또 다른 특징에 따르면, 균혈증 발병 위험도를 제공하는 단계는, 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우, 위험 알림을 제공하는 단계를 포함할 수 있다.According to another feature of the present invention, the step of providing the risk of developing bacteremia may include providing a risk notification when the risk of developing bacteremia for an individual is predicted by the bacteremia prediction model.

본 발명의 또 다른 특징에 따르면, 균혈증 발병 위험도를 제공하는 단계는, 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험 확률을 산출하는 단계, 및 균혈증 발병 위험 확률을 제공하는 단계를 포함할 수 있다. According to another feature of the present invention, providing a risk of developing bacteremia may include calculating a risk probability of developing bacteremia for an individual by a bacteremia prediction model, and providing a risk probability of developing bacteremia.

전술한 바와 같은 과제를 해결하기 위해, 본 발명의 다른 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스가 제공된다. 이때, 본 발명의 균혈증 예측용 디바이스는, 개체에 대한 생물학적 시험 데이터를 수신하도록 구성된 수신부, 및 수신부와 연결된 프로세서를 포함한다. 이때, 프로세서는, 생물학적 시험 데이터를 기초로 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체의 균혈증 발병 위험도를 예측하도록 구성된다. 나아가, 생물학적 시험 데이터는, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 및 ALP (Alkaline phosphatase) 수치를 포함한다.In order to solve the above-described problem, a device for predicting the risk of developing bacteremia according to another embodiment of the present invention is provided. At this time, the device for predicting bacteremia of the present invention includes a receiving unit configured to receive biological test data for an individual, and a processor connected to the receiving unit. At this time, the processor is configured to predict the risk of developing bacteremia of the individual using a bacteremia prediction model configured to predict the risk of developing bacteremia for the individual based on the biological test data. Further, biological test data include creatine levels, albumin levels, CRP (Creactive protein) levels, WBC (white blood cell) minimum levels, WBC peak levels, platelet counts, prothrombin time. And ALP (Alkaline phosphatase) levels.

본 발명의 특징에 따르면, 수신부는, 개체에 대한 생체 신호 데이터를 수신하도록 더 구성되고, 균혈층 예측 모델은, 생물학적 시험 데이터 및 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 생체 신호 데이터는, SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나일 수 있다.According to a feature of the present invention, the receiving unit is further configured to receive biosignal data for an individual, and the bacteremia layer prediction model may be further configured to predict a risk of developing bacteremia based on biological test data and biosignal data. . At this time, the biosignal data may be at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), maximum body temperature, minimum body temperature, heart rate, and respiratory rate.

본 발명의 다른 특징에 따르면, 수신부는 개체에 대한 임상적 특징 데이터를 수신하도록 더 구성되고, 균혈층 예측 모델은 생물학적 시험 데이터 및 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성될 수 있다. 이때, 임상적 특징 데이터는, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나일 수 있다.According to another feature of the present invention, the receiving unit is further configured to receive clinical feature data for the individual, and the bacteremia prediction model may be further configured to predict the risk of developing bacteremia based on biological test data and clinical feature data. have. At this time, the clinical characteristic data may be at least one of sex, age, blood culture period, whether or not to be treated with an intensive care unit (ICU), whether to insert a central venous catheter, whether to be treated with steroids, or whether to be treated with antibiotics.

본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는, 크레아틴 수치, 알부민 수치, CRP 수치, WBC 최소 수치, WBC 최고 수치, 프로트롬빈 시간, 및 혈소판 수, ALP 수치를 포함할 수 있다.According to another feature of the present invention, the biological test data may include creatine levels, albumin levels, CRP levels, WBC minimum levels, WBC peak levels, prothrombin time, and platelet count, ALP levels.

본 발명의 또 다른 특징에 따르면, 생물학적 시험 데이터는, ALT 수치, 트롬포플라스틴의 응고 시간, AST 수치, CRP 수치, 적혈구 침강 속도, 페리틴 (Ferritin) 수치, 헤모글로빈 수치, PTINR, PTPER, PTSEC, 적혈구 수치, 총 빌리루빈 수치, TCO2 수치 및 백혈구 수치 중 적어도 하나를 더 포함할 수 있다.According to another feature of the present invention, the biological test data includes ALT level, thromboplastin coagulation time, AST level, CRP level, erythrocyte sedimentation rate, ferritin level, hemoglobin level, PTINR, PTPER, PTSEC, red blood cells. It may further include at least one of a level, a total bilirubin level, a TCO 2 level, and a white blood cell level.

본 발명의 또 다른 특징에 따르면, 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 일 수 있다.According to another feature of the present invention, the bacteremia may be acute severe bacteraemia.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델일 수 있다.According to another feature of the present invention, the bacteremia prediction model includes an ensemble model composed of a combination of a multi-layer perceptron (MLP), a support vector machine (SVM), a random forest (RF), and a plurality of models, pre-trained ( It may be at least one of a pre-trained) model and an Xgboost model.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은 MLP 모델 또는 Xgboost 모델일 수 있다. 이때, MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나, 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함할 수 있다.According to another feature of the present invention, the bacteremia prediction model may be an MLP model or an Xgboost model. In this case, the MLP model may include a single hidden layer having 128 nodes or 256 nodes, or may include a plurality of hidden layers in which a plurality of single hidden layers exist.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하고, 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델일 수 있다. 이때, 정상의 표본 개체는, 임상적으로 균혈증 발생되지 않고 균혈증이 아닌 것으로 평가된 개체일 수 있다.According to another feature of the present invention, the bacteremia prediction model receives data for learning consisting of biological experimental data, biological signal data, and clinical feature data for bacteremia-onset sample individuals and normal sample individuals, and based on the training data. , It may be a model learned through the step of predicting bacteremia or normality. In this case, the normal sample individual may be an individual clinically evaluated as not having bacteremia and not bacteremia.

본 발명의 또 다른 특징에 따르면, 개체에 대하여 예측된 균혈증 발병 위험도를 제공하도록 구성된 출력부를 더 포함할 수 있다.According to another feature of the present invention, it may further include an output unit configured to provide a predicted risk of developing bacteremia for the individual.

본 발명의 또 다른 특징에 따르면, 출력부는, 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우, 위험 알림을 제공하도록 구성될 수 있다.According to another feature of the present invention, the output unit may be configured to provide a risk notification when the risk of developing bacteremia for an individual is predicted by the bacteremia prediction model.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은 개체에 대한 균혈증 발병 위험 확률을 산출하도록 더 구성될 수 있다. 나아가, 출력부는, 균혈증 발병 위험 확률을 제공하도록 더 구성될 수 있다. According to another feature of the present invention, the bacteremia prediction model may be further configured to calculate a probability of developing bacteremia for an individual. Furthermore, the output unit may be further configured to provide a probability of developing bacteremia.

이하, 실시예를 통하여 본 발명을 보다 상세히 설명한다. 다만, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것에 불과하므로 본 발명의 범위가 이들 실시예에 의해 한정되는 것으로 해석되어서는 아니 된다.Hereinafter, the present invention will be described in more detail through examples. However, these examples are for illustrative purposes only, and the scope of the present invention should not be construed as being limited by these examples.

본 발명은 개체에 대하여 약생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터를 수신하고, 수신된 데이터 기반의 균혈증 발병 위험도 예측 시스템을 제공함으로써, 개체의 균혈증 발병 위험도에 대하여 빠르게 감지하고, 이와 연관된 정보를 제공할 수 있다. The present invention receives pharmacologic test data, further biosignal data, and clinical characteristic data for an individual, and provides a system for predicting the risk of bacteremia based on the received data, thereby rapidly detecting the risk of developing bacteremia in the individual, and You can provide relevant information.

또한, 본 발명은, 생물학적 시험 데이터, 나아가 생체 신호 데이터, 임상적 특징 데이터들를 기초로 균혈증을 예측하도록 학습된 예측 모델을 적용한 예측 시스템을 제공함으로써, 정확도 및 신뢰도 높은 균혈증 발병의 예측 정보를 제공할 수 있다. In addition, the present invention provides a prediction system to which a predictive model learned to predict bacteremia based on biological test data, further biosignal data, and clinical feature data is applied, thereby providing information on predicting the onset of bacteremia with high accuracy and reliability. I can.

보다 구체적으로, 본 발명은, 다양한 임상 데이터 중 균혈증임을 예측하는 것에 영향력이 큰 임상 데이터 또는, 균혈증이 아닌 정상 상태를 예측하는 것에 영향력이 큰 임상 데이터를 결정하도록 평가를 수행하였고, 이를 예측 모델의 학습에 적용함으로써 균혈증 예측의 진단 능력 향상된 예측 시스템을 제공할 수 있다. More specifically, the present invention performed an evaluation to determine clinical data having a large influence on predicting bacteremia among various clinical data or clinical data having a large influence on predicting a normal state other than bacteremia, and this By applying it to learning, it is possible to provide a prediction system with improved diagnostic ability for bacteremia prediction.

이에, 본 발명은, 패혈증과 구별되는 또는 패혈증과는 상이한 균혈증에 대하여 높은 신뢰도 및 정확도로 발병의 위험도를 예측할 수 있는 효과가 있다. Accordingly, the present invention has the effect of predicting the risk of onset with high reliability and accuracy for bacteremia that is distinct from sepsis or different from sepsis.

또한, 본 발명은, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성됨에 따라, 보호자 또는 의료진은 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고 위험군을 인지할 수 있다.In addition, the present invention is configured to notify the risk of developing bacteremia by providing an alarm when bacteremia is predicted by a predictive model for an individual, so that a guardian or a medical staff is easier for individuals requiring continuous monitoring, such as critically ill patients. It is possible to recognize high-risk groups for developing bacteremia.

따라서, 본 발명은 균혈증에 대한 처치 시점을 앞당겨 치료에 대한 좋은 예후를 제공할 수 있다. Accordingly, the present invention can provide a good prognosis for treatment by advancing the time point of treatment for bacteremia.

나아가, 본 발명은 균혈증 발병 개체의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다.Furthermore, the present invention can provide an effect of increasing the survival rate of an individual with bacteremia, preventing complications, and reducing treatment costs.

본 발명에 따른 효과는 이상에서 예시된 내용에 의해 제한되지 않으며, 더욱 다양한 효과들이 본 명세서 내에 포함되어 있다.The effects according to the present invention are not limited by the contents exemplified above, and more various effects are included in the present specification.

도 1a는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법 및 디바이스에 기초한 균혈증 발병 위험도 예측 시스템을 예시적으로 도시한 것이다.
도 1b는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스의 구성을 예시적으로 도시한 것이다.
도 2는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법의 절차를 예시적으로 도시한 것이다.
도 3a 및 3b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 학습 데이터를 예시적으로 도시한 것이다.
도 3c는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 구성을 예시적으로 도시한 것이다.
도 3d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 평가 방법을 예시적으로 도시한 것이다.
도 4a 및 4b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제1 평가 결과를 도시한 것이다.
도 4c 및 4d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들을 도시한 것이다.
도 4e 및 4f는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들의 변화에 따른 성능 변화를 도시한 것이다.
도 5a 및 5b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 제2 평가를 위한 학습 데이터 및 평가 데이터를 도시한 것이다.
도 5c 내지 5i는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제2 평가 결과를 도시한 것이다.
1A is an exemplary diagram illustrating a system for predicting the risk of developing bacteremia based on a method and a device for predicting the risk of developing bacteremia according to an embodiment of the present invention.
1B is an exemplary configuration of a device for predicting the risk of developing bacteremia according to an embodiment of the present invention.
2 is an exemplary diagram illustrating a procedure of a method for predicting the risk of developing bacteremia according to an embodiment of the present invention.
3A and 3B exemplarily show training data of a bacteremia prediction model used in various embodiments of the present invention.
3C is an exemplary configuration diagram of a model for predicting bacteremia used in various embodiments of the present invention.
3D is an exemplary illustration of a method of evaluating a model for predicting bacteremia used in various embodiments of the present invention.
4A and 4B illustrate a first evaluation result of a model for predicting bacteremia used in various embodiments of the present invention.
4C and 4D illustrate clinical data according to the influence of bacteremia prediction for a bacteremia prediction model used in various embodiments of the present invention.
4E and 4F illustrate performance changes according to changes in clinical data according to the influence of bacteremia prediction for a bacteremia prediction model used in various embodiments of the present invention.
5A and 5B illustrate training data and evaluation data for a second evaluation of a bacteremia prediction model used in various embodiments of the present invention.
5C to 5I illustrate a second evaluation result for a bacteremia prediction model used in various embodiments of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. Advantages and features of the present invention, and a method of achieving them will become apparent with reference to the embodiments described below in detail together with the accompanying drawings. However, the present invention is not limited to the embodiments disclosed below, but will be implemented in a variety of different forms, only these embodiments make the disclosure of the present invention complete, and common knowledge in the technical field to which the present invention pertains. It is provided to completely inform the scope of the invention to those who have, and the invention is only defined by the scope of the claims.

본 발명의 실시예를 설명하기 위한 도면에 개시된 형상, 크기, 비율, 각도, 개수 등은 예시적인 것이므로 본 발명이 도시된 사항에 한정되는 것은 아니다. 또한, 본 발명을 설명함에 있어서, 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명은 생략한다. 본 명세서 상에서 언급된 '포함한다', '갖는다', '이루어진다' 등이 사용되는 경우, '~만'이 사용되지 않는 이상 다른 부분이 추가될 수 있다. 구성요소를 단수로 표현한 경우에 특별히 명시적인 기재 사항이 없는 한 복수를 포함하는 경우를 포함한다.The shapes, sizes, ratios, angles, numbers, etc. disclosed in the drawings for explaining the embodiments of the present invention are exemplary, and the present invention is not limited to the illustrated matters. In addition, in describing the present invention, when it is determined that a detailed description of related known technologies may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted. When'include','have','consists of' and the like mentioned in the present specification are used, other parts may be added unless'only' is used. In the case of expressing the constituent elements in the singular, it includes the case of including the plural unless specifically stated otherwise.

구성요소를 해석함에 있어서, 별도의 명시적 기재가 없더라도 오차 범위를 포함하는 것으로 해석한다.In interpreting the components, it is interpreted as including an error range even if there is no explicit description.

본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다.Each of the features of the various embodiments of the present invention can be partially or entirely combined or combined with each other, and as a person skilled in the art can fully understand, technically various interlocking and driving are possible, and each of the embodiments may be independently implemented with respect to each other. It may be possible to do it together in a related relationship.

본 명세서의 해석의 명확함을 위해, 이하에서는 본 명세서에서 사용되는 용어들을 정의하기로 한다.For clarity of interpretation of the present specification, terms used in the present specification will be defined below.

본 명세서에서 사용되는 용어, "균혈증"은 혈류 속에 병원균이 살아서 순환하고 있는 임상적 상태를 의미한다. 이때, 균혈증은, 혈액 속에서 균이 증식하여 발열, 저혈압등의 중독 증상을 일으키는 '패혈증'과 상이하며 본 명세서에서는 패혈증과 균혈증을 구분된다.As used herein, the term "bacteremia" refers to a clinical condition in which pathogens live and circulate in the bloodstream. At this time, bacteremia is different from'sepsis', which causes poisoning symptoms such as fever and hypotension by proliferating bacteria in the blood, and sepsis and bacteremia are classified in the present specification.

본 명세서에서 사용되는 용어, "개체"는 균혈증의 발병 위험도를 예측하고자 하는 대상을 의미할 수 있다. 한편, 본원 명세서 내에서 개체는 '환자' 또는 '중환자'일 수 있으나, 이에 제한되는 것은 아니며 균혈증 발병의 위험도를 예측하고자 하는 모든 대상을 포함할 수 있다.As used herein, the term "individual" may mean a target for predicting the risk of developing bacteremia. Meanwhile, in the present specification, an individual may be a'patient' or a'critical patient', but is not limited thereto and may include all subjects for which the risk of developing bacteremia is predicted.

이때, 균혈증 발병 개체는 바실러스 종 (Bacillus spp.), 비리단스 그룹 스트렙토코커스 (Viridans group streptococci), CNS (coagulase-negative staphylococci) 등 샘플이 오염되는 경우 주로 나타나는 균들이 혈류에 존재하는 경우의 개체와는 상이할 수 있다.At this time, the bacteremia-onset individuals include Bacillus spp. , Viridans group streptococci, CNS (coagulase-negative staphylococci), and other organisms in the bloodstream. Can be different.

본 명세서에서 사용되는 용어, "생물학적 시험 데이터"는 개체로부터 분리된 생물학적 시료, 예를 들어 혈액에 대한 임상 데이터를 의미할 수 있다.As used herein, the term "biological test data" may mean clinical data on a biological sample, for example blood, isolated from an individual.

보다 구체적으로, 본원 명세서 내에 개시된 생물학적 시험 데이터는, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 및 ALP (Alkaline phosphatase) 수치일 수 있다. More specifically, the biological test data disclosed in the present specification includes creatine (Creatinine) levels, albumin (Albumin) levels, CRP (Creactive protein) levels, WBC (white blood cell) minimum levels, WBC peak levels, and platelet counts. , Prothrombin time and Alkaline phosphatase (ALP) levels.

바람직하게 생물학적 시험 데이터는, ALP 수치, 혈소판 수치일 수 있으나, 이에 제한되는 것은 아니다. Preferably, the biological test data may be an ALP level or a platelet level, but is not limited thereto.

본 명세서에서 사용되는 용어, "생체 신호 데이터"는 활력 징후, 생명 징후로, 개체의 상태와 연관된 데이터를 의미할 수 있다. 이러한 생체 신호 데이터는, 개체의 균혈증 발병 위험도와 연관될 수 있다. As used herein, the term "biosignal data" refers to vital signs or vital signs, and may mean data related to the state of an individual. Such biosignal data may be associated with an individual's risk of developing bacteremia.

이때, 생체 신호 데이터는 생체 신호 계측 장비로부터 측정된 개체에 대한 체온, 맥박, 산소 포화도, SBP (systolic blood pressure), DBP (diastolic blood pressure), 평균 혈압 및 호흡수일 수 있다. 바람직하게, 생체 신호 데이터는, SBP, 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나일 수 있다. 그러나, 이에 제한되지 않고 생체 신호 데이터는, 개체의 건강 상태와 연관된 다양한 측정 데이터를 포함할 수 있다. In this case, the biosignal data may be body temperature, pulse, oxygen saturation, systolic blood pressure (SBP), diastolic blood pressure (DBP), average blood pressure, and respiratory rate of the individual measured by the biosignal measuring equipment. Preferably, the biosignal data may be at least one of SBP, maximum body temperature, minimum body temperature, heart rate, and respiratory rate. However, the present invention is not limited thereto, and the biosignal data may include various measurement data related to a health state of an individual.

본 명세서에서 사용되는 용어, "임상적 특징 데이터"는 개체의 특징, 예를 들어 성별, 연령과 함께 약물 투여 여부, 의료적 처치 여부에 대한 데이터를 포괄하여 의미할 수 있다. As used herein, the term "clinical characteristic data" may include data on whether or not to administer drugs, medical treatment, along with characteristics of an individual, for example, sex and age.

한편, 본원 명세서 내 개시된 임상적 특징 데이터는, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나일 수 있다. 그러나, 임상적 특징 데이터는 이에 제한되지 않고, 개체에 투여되는 약물, 개체에 대한 의료적 처치에 대한 보다 다양한 데이터를 포함할 수 있다. On the other hand, the clinical characteristic data disclosed in the present specification is at least one of sex, age, blood culture period, intensive care unit (ICU) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment. Can be However, the clinical characteristic data is not limited thereto, and may include a variety of data on drugs administered to an individual and medical treatment for the individual.

예를 들어, 임상적 특징 데이터는, 카테터 (Catheter), 폴리 (Foley), 기계환기 (Mechanical ventilator), 리스트레인트 (Restraint), 배액 기기 (Drainage) 중 적어도 하나의 의료적 처치 여부에 대한 데이터, 나아가 울트라셋 (Ultracet), 미다졸람 (Midazolam), 울티바 (ultiva), 포폴 (pofol), 아티반 (ativan), 펜타닐 (fentanyl), 프리세덱스 (precedex), IR 코돈 (IR codon), 타진 20/10 (TARGIN 20/10), 페리돌 (peridol), 리스페달 (risperdal), 자이프렉사 (zyprexa), 쎄로켈 (seroquel), 아빌리파이 (abilify), 페티딘 (pethidine), 듀로제식 패치 (durogesic patch), 모르핀 (morphine) 및 마이폴 (mypol) 의 투여 데이터를 더 포함할 수도 있다. For example, the clinical characteristic data is data on the medical treatment of at least one of Catheter, Foley, Mechanical ventilator, Restraint, and Drainage. , Furthermore, Ultraset, Midazolam, Ultiva, Popol, Ativan, Fentanyl, Precedex, IR codon, Percussion 20/10 (TARGIN 20/10), peridol, lisperdal, zyprexa, seroquel, abilify, petidine, durogesic patch, It may further include administration data of morphine and mypol.

본 명세서에서 사용되는 용어, "균혈증 예측 모델"은 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터 중 적어도 하나의 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하도록 학습된 모델일 수 있다.As used herein, the term "bacteremia prediction model" may be a model trained to predict the risk of developing bacteremia based on clinical data of at least one of biological test data, biological signal data, and clinical characteristic data.

예를 들어, 균혈증 예측 모델은, 균혈증이 발병하거나 발병하지 않은 표본 개체로부터, 미리 결정된 시간마다 획득한 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하도록 학습된 모델일 수 있다.For example, the bacteremia prediction model may be a model trained to predict the risk of developing bacteremia based on clinical data obtained at each predetermined time from a sample individual with or without bacteremia.

이때, 균혈증 예측 모델은, 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 모든 임상 데이터를 기초로 균혈증 발병 위험도를 예측하도록 학습된 모델일 수 있다. 그러나, 학습에 이용되는 데이터는, 이에 제한되지 않으며 보다 다양한 임상 데이터들의 조합이 상기 예측 모델의 학습에 이용될 수 있다. In this case, the bacteremia prediction model may be a model trained to predict the risk of developing bacteremia based on all clinical data of biological test data, biological signal data, and clinical feature data. However, the data used for learning is not limited thereto, and a combination of more diverse clinical data may be used for learning the predictive model.

한편, 본 발명의 균혈증 예측 모델은, MLP (Multi-Layer Perceptron), SVM (support vector machine), RF (random forest), 및 MLP, SVM, RF의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델에 기초할 수 있다. On the other hand, the bacteremia prediction model of the present invention is an ensemble model composed of a combination of MLP (Multi-Layer Perceptron), SVM (support vector machine), RF (random forest), and MLP, SVM, RF, and pre-trained (pre- trained) model and the Xgboost model may be based on at least one model.

바람직하게, 본 발명의 균혈증 예측 모델은, 하나인 MLP (Multi-Layer Perceptron) 에 기초한 예측 모델일 수 있다. 이때, MLP 모델이 기초한 본 발명의 균혈증 예측 모델은, 128 노드 (nodes) 또는 256 노드를 갖는 히든 레이어 (hidden layer) 를 포함할 수 있다.Preferably, the bacteremia prediction model of the present invention may be a prediction model based on one MLP (Multi-Layer Perceptron). In this case, the bacteremia prediction model of the present invention based on the MLP model may include a hidden layer having 128 nodes or 256 nodes.

예를 들어, 본 발명의 균혈증 예측 모델은, 생물학적 시험 데이터, 생체 신호 데이너 및 임상적 특징 데이터가 입력되는 입력 레이어 및 균혈증 또는 균혈증이 아닌 정상을 예측하는 출력 레이어와 이들 레이어 사이에 128 노드 또는 256 노드를 갖는 히든 레이어가 존재하는 다층 레이어 구조의 예측 모델일 수 있다.For example, the bacteremia prediction model of the present invention includes an input layer into which biological test data, biosignal data, and clinical feature data are input, and an output layer that predicts normal, not bacteremia or bacteremia, and 128 nodes or 256 nodes between these layers. It may be a prediction model of a multi-layer structure in which a hidden layer having nodes exists.

보다 구체적으로, 본 발명의 균혈증 예측 모델은 학습에 있어서 매개 변수를 갱신하는 최적화 함수로서 'rmsprop'를 이용하도록 구성될 수 있고, 다양한 임상 데이터들의 입력 값이 출력값에 전달되는 강도를 결정하는 함수로서 'relu'함수를 이용하도록 구성될 수 있다.More specifically, the bacteremia prediction model of the present invention may be configured to use'rmsprop' as an optimization function for updating a parameter in learning, and as a function that determines the intensity at which input values of various clinical data are transferred to an output value. It can be configured to use the'relu' function.

그러나, 본 발명의 균혈증 예측 모델의 구성은 이에 제한되는 것이 아니다.However, the configuration of the bacteremia prediction model of the present invention is not limited thereto.

본 발명의 다른 실시예에 따르면, 본 발명의 균혈증 예측 모델은, 128 노드의 단일 노드를 갖는 MLP 모델일 수도 있다. 나아가, 본 발명의 균혈증 예측 모델은, 128 노드를 갖는 히든 레이어가 를 갖는 2 층의 히든 레이어를 갖는 MLP 모델일 수도 있다.According to another embodiment of the present invention, the bacteremia prediction model of the present invention may be an MLP model having a single node of 128 nodes. Furthermore, the bacteremia prediction model of the present invention may be an MLP model having two layers of hidden layers having a hidden layer having 128 nodes.

본 발명의 또 다른 실시예에 따르면, 본 발명의 균혈증 예측 모델은, gbtree 레이어를 갖는 Xgbooxt 모델일 수도 있다.According to another embodiment of the present invention, the bacteremia prediction model of the present invention may be an Xgbooxt model having a gbtree layer.

그러나, 본 발명의 균혈증 예측 모델의 종류는 전술한 것에 제한되는 것이 아니다. 예를 들어, 상기 예측 모델은, 보다 다양한 ANN (Artificial Neural Network) 모델, 또는 DNN (Deep Neural Network), CNN Convolutional Neural Network), RNN (Recurrent Neural Network), DCNN (Deep Convolutional Neural Network), RBM (Restricted Boltzmann Machine), DBN (Deep Belief Network), SSD (Single Shot Detector) 모델, U-net을 기반으로 하는 예측 모델일 수도 있다.However, the types of the bacteremia prediction model of the present invention are not limited to those described above. For example, the prediction model is a more diverse ANN (Artificial Neural Network) model, or DNN (Deep Neural Network), CNN Convolutional Neural Network), RNN (Recurrent Neural Network), DCNN (Deep Convolutional Neural Network), RBM ( Restricted Boltzmann Machine), DBN (Deep Belief Network), SSD (Single Shot Detector) model, or U-net-based prediction model.

한편, 본 발명의 균혈증 예측 모델의 학습에 있어서, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터들이 결정되는 평가가 수행될 수 있다. 이때, 영향력 평가는 OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여 수행될 수 있다. Meanwhile, in the learning of the bacteremia prediction model of the present invention, an evaluation in which clinical data having a large influence on predicting normal, not bacteremia, may be determined. In this case, the influence evaluation is performed based on at least one algorithm among OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency map). I can.

예를 들어, 상기 적어도 하나의 알고리즘에 의해 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 다양한 임상 데이터 중 균혈증임을 예측하는 것에 영향력이 큰 임상 데이터 또는, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터가 결정될 수 있다. For example, clinical data having a large influence on predicting bacteremia among various clinical data of biological test data, biosignal data, and clinical feature data by the at least one algorithm or in predicting normal, not bacteremia Large clinical data can be determined.

이러한 영향력이 큰 임상 데이터들이 상기 예측 모델의 학습에 입력 데이터로서 적용될 수 있음에 따라, 예측 모델은 다른 모델들 보다 균혈증 예측 능력이 향상된 모델일 수 있다. As clinical data having a high influence can be applied as input data to the learning of the predictive model, the predictive model may be a model with improved bacteremia predictive ability than other models.

이하에서는 도 1a 및 1b를 참조하여, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스 및 이를 이용한 균혈증 발병 위험도 예측 시스템에 관하여 구체적으로 설명한다.Hereinafter, a device for predicting the risk of bacteremia and a system for predicting the risk of bacteremia using the same according to an embodiment of the present invention will be described in detail with reference to FIGS. 1A and 1B.

도 1a는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법 및 디바이스에 기초한 균혈증 발병 위험도 예측 시스템을 예시적으로 도시한 것이다. 도 1b는 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측용 디바이스의 구성을 예시적으로 도시한 것이다.1A is an exemplary diagram illustrating a system for predicting the risk of developing bacteremia based on a method and a device for predicting the risk of developing bacteremia according to an embodiment of the present invention. 1B is an exemplary configuration of a device for predicting the risk of developing bacteremia according to an embodiment of the present invention.

도 1a를 참조하면, 본 발명의 일 실시예에 따른 균혈증 발병 위험도 예측 시스템 (1000) 은, 균혈증 발병 위험도 예측용 디바이스 (100), 개체 (200) 에 대하여 획득된, 생물학적 시험 데이터 (310), 생체 신호 데이터 (320), 임상적 특징 데이터 (330) 를 포함하는 임상 데이터 (300), 의료적 처치 기구 (400) 및 의료진 디바이스 (500) 로 구성되어 있다.Referring to FIG. 1A, the system 1000 for predicting the risk of developing bacteremia according to an embodiment of the present invention includes a device 100 for predicting the risk of developing bacteremia, a biological test data 310 obtained for an individual 200, It is composed of bio-signal data 320, clinical data 300 including clinical feature data 330, medical treatment instrument 400, and medical staff device 500.

이때, 임상 데이터 (300) 는 개체 (200) 로부터, 임의의 시점에서 평가된 데이터일 수 있다. 그러나, 이에 제한되는 것은 아니다.In this case, the clinical data 300 may be data evaluated from the individual 200 at an arbitrary time point. However, it is not limited thereto.

보다 구체적으로, 균혈증 발병 위험도 예측 시스템 (1000) 에서 균혈증 발병 위험도 예측용 디바이스 (100) 는, 개체 (200) 에 대하여 측정되거나 평가된 다양한 임상 데이터 (300) 를 수신하고, 이를 기초로 균혈증 발병 위험도를 예측하도록 구성될 수 있다. More specifically, the device 100 for predicting the risk of bacteremia in the bacteremia risk prediction system 1000 receives various clinical data 300 measured or evaluated for the individual 200, and the risk of developing bacteremia based on this Can be configured to predict

이때, 의료적 처치 기구 (400) 는 개체 (200) 에 온도, 맥박, 산소 포화도, 수축기 혈압, 이완기 혈압, 평균 혈압 및 호흡수로 이루어진 그룹 중 적어도 하나의 생체 신호 데이터 (320) 를 제공할 수 있는 생체 신호 측정 디바이스일 수 있다. At this time, the medical treatment device 400 may provide at least one biosignal data 320 from the group consisting of temperature, pulse, oxygen saturation, systolic blood pressure, diastolic blood pressure, average blood pressure, and respiratory rate to the individual 200. It may be a bio-signal measuring device.

한편, 균혈증 발병 위험도 예측 시스템 (1000) 에서 생물학적 시험 데이터 (310), 나아가 임상적 특징 데이터 (330) 는 EMR (Electronic Medical Record) 시스템과 같은 외부 시스템으로부터 획득될 수도 있다.Meanwhile, the biological test data 310 and further clinical feature data 330 in the bacteremia risk prediction system 1000 may be obtained from an external system such as an Electronic Medical Record (EMR) system.

보다 구체적으로, 도 1b를 참조하면, 균혈증 발병 위험도 예측용 디바이스 (100) 는 수신부 (110), 입력부 (120), 출력부 (130), 저장부 (140) 및 프로세서 (150) 를 포함한다. More specifically, referring to FIG. 1B, the device 100 for predicting the risk of bacteremia incidence includes a receiving unit 110, an input unit 120, an output unit 130, a storage unit 140, and a processor 150.

구체적으로 수신부 (110) 는 개체 (200) 에 대한 생물학적 시험 데이터 (310), 생체 신호 데이터 (320), 임상적 특징 데이터 (330) 를 포함하는 임상 데이터 (300) 를 수신하도록 구성될 수 있다. In more detail, the receiving unit 110 may be configured to receive clinical data 300 including biological test data 310, biological signal data 320, and clinical feature data 330 for the individual 200.

본 발명의 특징에 따르면, 수신부 (110) 는 의료진 디바이스 (500) 에 대하여, 후술될 프로세서 (150) 에 의해 결정된 개체 (200) 에 대하여 예측된 결과를, 송신하도록 더 구성될 수 있다.According to a feature of the present invention, the reception unit 110 may be further configured to transmit a predicted result for the entity 200 determined by the processor 150 to be described later to the medical staff device 500.

입력부 (120) 는 키보드, 마우스, 터치 스크린 패널 등 제한되지 않는다. 입력부 (120) 는 균혈증 발병 위험도 예측용 디바이스 (100) 를 설정하고, 균혈증 발병 위험도 예측용 디바이스 (100) 의 동작을 지시할 수 있다. The input unit 120 is not limited, such as a keyboard, a mouse, and a touch screen panel. The input unit 120 may set the device 100 for predicting the risk of developing bacteremia and instruct the operation of the device 100 for predicting the risk of developing bacteremia.

한편, 출력부 (130) 는 수신부 (110) 에 의해 수신된 다양한 임상 데이터 (300) 를 표시할 수 있다. 나아가, 출력부 (130) 는 프로세서 (150) 에 의해 예측된 균혈증 진단과 연관된 정보를 디스플레이 적으로 표시할 수 있다. 나아가, 출력부 (130) 는 프로세서 (150) 에 의해 균혈증 발병 위험도가 높은 것으로 결정될 경우, 알림 소리를 출력하도록 더 구성될 수 있다. Meanwhile, the output unit 130 may display various clinical data 300 received by the receiving unit 110. Furthermore, the output unit 130 may display information related to the diagnosis of bacteremia predicted by the processor 150 on a display. Further, the output unit 130 may be further configured to output a notification sound when it is determined by the processor 150 that the risk of developing bacteremia is high.

저장부 (140) 는 수신부 (110) 를 통해 수신한 개체 (200) 에 대한 다양한 임상 데이터 (300) 를 저장하고, 입력부 (120) 를 통해 설정된 균혈증 발병 위험도 예측용 디바이스 (100) 의 지시를 저장하도록 구성될 수 있다. 나아가, 저장부 (140) 는 후술될 프로세서 (150) 에 의해 생성된 개체 (200) 에 균혈증 예측 정보를 저장하도록 구성된다. 그러나, 전술한 것에 제한되지 않고 저장부 (140) 는 균혈증 발병 위험도 예측을 위해 프로세서 (150) 에 의해 결정된 다양한 정보들을 저장할 수 있다. The storage unit 140 stores various clinical data 300 for the individual 200 received through the receiving unit 110, and stores an instruction of the device 100 for predicting the risk of bacteremia incidence set through the input unit 120 Can be configured to Further, the storage unit 140 is configured to store bacteremia prediction information in the individual 200 generated by the processor 150 to be described later. However, it is not limited to the above, and the storage unit 140 may store various pieces of information determined by the processor 150 to predict the risk of bacteremia.

프로세서 (150) 는 균혈증 발병 위험도 예측용 디바이스 (110) 의 정확한 예측 결과를 제공하기 위한 구성 요소일 수 있다. 이때, 정확한 균혈증 발병 위험도 예측을 위해 프로세서 (150) 는 다양한 임상 데이터 (300) 를 기초로 균혈증 발병 위험도를 예측하도록 구성된 예측 모델에 기초할 수 있다. The processor 150 may be a component for providing an accurate prediction result of the device 110 for predicting the risk of developing bacteremia. In this case, in order to accurately predict the risk of developing bacteremia, the processor 150 may be based on a prediction model configured to predict the risk of developing bacteremia based on various clinical data 300.

한편, 프로세서 (150) 는, 개체 (200) 가 균혈증 예측 모델에 의해 균혈증 발병 고위험군으로 예측된 경우 의료진 디바이스 (500) 에 알림을 제공하도록 구성될 수도 있다. 이에, 의료진은 개체 (200) 에 대한 빠른 조치를 취할 수 있다. Meanwhile, the processor 150 may be configured to provide a notification to the medical staff device 500 when the individual 200 is predicted to be a high risk group for developing bacteremia by the bacteremia prediction model. Thus, the medical staff can take quick action on the subject 200.

이와 같이 본 발명의 균혈증 발병 위험도 예측 시스템 (1000) 은, 개체 (200) 에 대하여 균혈증의 조기 진단 및 균혈증의 조기 치료를 제공할 수 있음에 따라, 다양한 의료 시스템에 적용될 수 있다. As described above, the system 1000 for predicting the risk of bacteremia incidence of the present invention can be applied to various medical systems as it can provide early diagnosis of bacteremia and early treatment of bacteremia for the individual 200.

이하에서는 도 2를 참조하여, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법을 구체적으로 설명한다. 도 2는, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법의 절차를 예시적으로 도시한 것이다.Hereinafter, a method of predicting the risk of developing bacteremia according to an embodiment of the present invention will be described in detail with reference to FIG. 2. 2 is a diagram illustrating a procedure of a method for predicting the risk of developing bacteremia according to an embodiment of the present invention.

도 2를 참조하면, 본 발명의 일 실시예에 따른 균혈증 발병 위험도의 예측 방법은, 먼저 개체로부터 생물학적 시험 데이터를 수신하고 (S210), 생물학적 시험 데이터를 기초로 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 개체에 대한 균혈증 발병 위험도를 예측한다 (S220). 최종적으로 개체에 대하여 예측된 균혈증 발병 위험도를 제공한다 (S230).2, the method for predicting the risk of developing bacteremia according to an embodiment of the present invention includes first receiving biological test data from an individual (S210), and predicting the risk of developing bacteremia based on the biological test data. Using the model, the risk of developing bacteremia is predicted for the individual (S220). Finally, the predicted risk of developing bacteremia is provided for the individual (S230).

보다 구체적으로, 데이터를 수신하는 단계 (S210) 에서, 크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나 및 ALP (Alkaline phosphatase) 수치의 생물학적 시험 데이터가 수신될 수 있다.More specifically, in the step of receiving data (S210), creatine (Creatinine) level, albumin (Albumin) level, CRP (Creactive protein) level, WBC (white blood cell) minimum level, WBC maximum level, platelet (Platelet) Biological test data of at least one of water, prothrombin time, and Alkaline phosphatase (ALP) levels can be received.

본 발명의 특징에 따르면, 데이터를 수신하는 단계 (S210) 에서, SBP (systolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나의 생체 신호 데이터가 더 수신될 수 있다.According to a feature of the present invention, in the step of receiving data (S210), at least one biosignal data from among systolic blood pressure (SBP), maximum body temperature, minimum body temperature, heart rate, and respiration rate may be further received.

본 발명의 다른 특징에 따르면, 데이터를 수신하는 단계 (S210) 에서, 성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나의 임상적 특징 데이터가 더 수신될 수 있다. According to another feature of the present invention, in the step of receiving data (S210), sex, age, blood culture period, whether or not to be treated with an intensive care unit (ICU), whether to insert a central venous catheter, whether to be treated with steroids, and At least one clinical characteristic data of whether or not antibiotic treatment may be further received.

본 발명의 특징에 따르면, 데이터를 수신하는 단계 (S210) 에서 수신된 생체 신호 데이터는, ALP 수치, 혈소판 수일 수 있으나, 이에 제한되는 것은 아니다.According to a feature of the present invention, the biosignal data received in the step of receiving data (S210) may be an ALP value and a platelet count, but is not limited thereto.

다음으로, 균혈증 발병 위험도를 예측하는 단계 (S220) 에서는, 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델에 의해 개체가 균혈증 또는 균혈증이 아닌 정상으로 결정될 수 있다.Next, in the step of predicting the risk of developing bacteremia (S220), the individual may be determined to be normal, not bacteremia or bacteremia, by a bacteremia prediction model configured to predict the risk of developing bacteremia.

이때, 균혈증 예측 모델은, 데이터를 수신하는 단계 (S210) 에서 수신된, 생물학적 시험 데이터, 생체 신호 데이터, 및 임상적 특징 데이터 중 적어도 하나의 임상 데이터를 기초로 균혈증 발병의 위험도를 예측하도록 학습된 모델일 수 있다.At this time, the bacteremia prediction model is trained to predict the risk of bacteremia based on at least one clinical data of biological test data, biosignal data, and clinical feature data received in the step S210 of receiving the data. It can be a model.

예를 들어, 균혈증 예측 모델은 균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 시험 데이터, 생체 신호 데이터, 및 임상적 평가 데이터 중 적어도 하나의 학습용 데이터를 수신하고, 학습용 데이터를 기초로, 균혈증 또는 정상을 예측 또는 분류하는 단계를 통해 학습된 모델일 수 있다.For example, the bacteremia prediction model receives data for learning at least one of biological test data, biosignal data, and clinical evaluation data for bacteremia-onset sample individuals and normal sample individuals, and based on the training data, bacteremia or It may be a model learned through the step of predicting or classifying the normal.

나아가, 균혈증 예측 모델은, 학습용 데이터에 대하여 균혈증과의 관련도 (relevance) 점수를 산출하고, 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 통해 결정된 균혈증 관련 학습용 데이터를 기초로, 균혈증 발병 위험도를 예측하도록 구성된 모델일 수 있다.Furthermore, the bacteremia prediction model is for learning related to bacteremia, which is determined through the step of calculating a relevance score for bacteremia with respect to the learning data, and determining learning data related to bacteremia within a predetermined ranking based on the relevance score. Based on the data, it may be a model configured to predict the risk of developing bacteremia.

본 발명의 다른 특징에 따르면, 본 발명의 균혈증 예측 모델은, MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 상기 MLP, 상기 SVM, 상기 RF의 조합으로 구성된 앙상블 모델 중 적어도 하나의 모델일 수 있다. According to another feature of the present invention, the bacteremia prediction model of the present invention comprises a multi-layer perceptron (MLP), a support vector machine (SVM), a random forest (RF), and a combination of the MLP, the SVM, and the RF. It may be at least one of the ensemble models.

본 발명의 또 다른 특징에 따르면, 균혈증 예측 모델은, 128 노드 (nodes) 또는 256 노드를 갖는 히든 레이어 (hidden layer) 로 구성된 MLP 모델일 수 있으나, 이에 제한되는 것은 아니다. According to another feature of the present invention, the bacteremia prediction model may be an MLP model composed of a hidden layer having 128 nodes or 256 nodes, but is not limited thereto.

마지막으로, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 전술한 균혈증 발병 위험도를 예측하는 단계 (S220) 에서 예측된 균혈증 진단에 관한 정보를 제공할 수 있다.Finally, in the step of providing the risk of developing bacteremia (S230), information regarding the diagnosis of bacteremia predicted in the step of predicting the risk of developing bacteremia (S220) may be provided.

본 발명의 다른 특징에 따르면, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 균혈증 발병 위험도를 예측하는 단계 (S220) 에서 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우, 개체에 대한 균혈증 발병의 위험 알림이 제공될 수 있다. According to another feature of the present invention, in the step of providing the risk of developing bacteremia (S230), when the risk of developing bacteremia is predicted by the bacteremia prediction model in the step (S220) of predicting the risk of developing bacteremia, A notification of the risk of developing bacteremia may be provided.

한편, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 전술한 것 이외에 보다 다양한 정보가 제공될 수 있다. 예를 들어, 균혈증 발병 위험도를 제공하는 단계 (S230) 에서는, 균혈증 교정에 효과적일 수 있는 추가적 처치 정보를 더 제공할 수 있다. On the other hand, in the step (S230) of providing the risk of developing bacteremia, more various information may be provided in addition to the above. For example, in the step of providing the risk of developing bacteremia (S230), additional treatment information that may be effective in correcting bacteremia may be further provided.

이상의 절차에 따라, 본 발명의 일 실시예에 따른 균혈증 발병 위험도 예측 방법은, 실시간으로 개체에 대한 균혈증 발병 여부를 결정하거나, 균혈증 발병의 위험도를 미리 예측하여, 균혈증 발병 위험도에 대한 정보, 나아가 균혈증 고위험군을 알리는 알람를 제공할 수 있다. 이에, 의료진은 개체에 대한 균혈증의 조기 진단이 가능할 수 있다. 나아가, 의료진은 균혈증 고위험군에 대한 빠른 조치를 취할 수 있다. According to the above procedure, the method for predicting the risk of developing bacteremia according to an embodiment of the present invention is to determine whether to develop bacteremia in real time or predict the risk of developing bacteremia in advance, information on the risk of developing bacteremia, and further bacteremia. It can provide an alarm for high-risk groups. Accordingly, the medical staff may be able to diagnose bacteremia early in the individual. Furthermore, medical staff can take quick action for high-risk groups for bacteremia.

이하에서는, 도 3a 내지 3d를 참조하여, 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대하여 구체적으로 설명한다. Hereinafter, a model for predicting bacteremia used in various embodiments of the present invention will be described in detail with reference to FIGS. 3A to 3D.

도 3a 및 3b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 학습 데이터를 예시적으로 도시한 것이다.3A and 3B exemplarily show training data of a bacteremia prediction model used in various embodiments of the present invention.

도 3a를 참조하면, 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 학습을 위해 강남세브란스 병원으로부터 획득한 13402 명의 환자로부터 획득한 22332 개의 혈액 배양 에피소드 (episode) 를 수집하였고, 이들 중 1260 개의 균혈증 개체에 대한 에피소드 및 1260 개의 정상의 개체에 대한 에피소드를 학습용 데이터로 설정하였다. 이에, 본 발명의 균혈증 예측 모델은, 1 : 1 비율의 양성 결과 및 음성 결과 데이터를 기초로 균혈증을 예측하도록 학습되었다. Referring to FIG. 3A, 22332 blood culture episodes obtained from 13402 patients obtained from Gangnam Severance Hospital were collected for learning of the bacteremia prediction model used in various embodiments of the present invention, and 1260 of them Episodes for bacteremia individuals and episodes for 1260 normal individuals were set as learning data. Accordingly, the bacteremia prediction model of the present invention was trained to predict bacteremia based on the positive result and negative result data of a 1:1 ratio.

도 3b를 참조하면, 균혈증 발병 개체 및 정상 개체의 표본 개체로부터 획득된 학습용 데이터는, 생체 신호 데이터, 생물학적 시험 데이터, 및 임상적 특징 데이터로 구성된다. 이들 데이터 각각의 값은, 균혈증 발병 개체 및 정상 개체에 대하여 통계적으로 유의한 수준으로 차이나는 것으로 나타난다. Referring to FIG. 3B, data for learning obtained from sample individuals of bacteremia-onset individuals and normal individuals are composed of biosignal data, biological test data, and clinical feature data. The values of each of these data appear to differ at a statistically significant level for individuals with bacteremia and for normal individuals.

보다 구체적으로, 학습용 생체 신호 데이터는 SBP, 최고 체온, 최저 체온, 심박수 및 호흡수로 구성될 수 있다. 학습용 생물학적 시험 데이터는, 크레아틴 수치, 알부민 수치, CRP 수치, WBC 최소 수치, WBC 최고 수치, 혈소판 수, 프로트롬빈 시간 및 ALP 수치로 구성될 수 있다. 나아가, 임상적 특징 데이터는, 혈액 배양 기간, ICU 치료 여부, 중심 정맥 카테터 여부, 스테로이드 치료 여부, 항생제 치료 여부, 연령 및 성별로 구성될 수 있다. More specifically, the learning biological signal data may be composed of SBP, maximum body temperature, minimum body temperature, heart rate, and respiratory rate. The study biological test data may consist of creatine levels, albumin levels, CRP levels, minimum WBC levels, maximum WBC levels, platelet counts, prothrombin time, and ALP levels. Furthermore, the clinical characteristic data may consist of blood culture period, ICU treatment, central venous catheter, steroid treatment, antibiotic treatment, age and sex.

이때, 임상적 특징 데이터 중, ICU 치료 여부 및 중심 정맥 카테터 처치 여부는 혈액 배양 당시에 평가된 데이터일 수 있고, 항생제 치료 여부는 혈액 배양 3주 이전에 평가된 데이터일 수 있으며, 스테로이드 치료 여부는 혈액 배양 2주 이전에 평가된 데이터일 수 있다. 이때, 생체 신호 데이터 및 생물학적 시험 데이터는 혈액 배양 72 시간 이전에 평가된 데이터일 수 있다. At this time, among the clinical characteristic data, whether ICU treatment and whether central venous catheter is treated may be data evaluated at the time of blood culture, and whether antibiotic treatment may be data evaluated 3 weeks before blood culture, and whether or not steroid treatment is blood It may be data evaluated 2 weeks before incubation. In this case, the biosignal data and biological test data may be data evaluated 72 hours before blood culture.

본 발명의 균혈증 예측 모델은 상기와 같은 학습용 데이터를 기초로 표본 개체에 대한 균혈증의 발병 여부를 결정하도록 학습될 수 있다.도 3c는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 구성을 예시적으로 도시한 것이다.The bacteremia prediction model of the present invention may be trained to determine whether or not bacteremia occurs in a sample individual based on the learning data as described above. FIG. 3C illustrates the configuration of a bacteremia prediction model used in various embodiments of the present invention. It is shown as an enemy.

도 3c를 참조하면, 본 발명의 균혈증 예측 모델은 다층 인공 신경망인 MLP 알고리즘에 기초한 예측 모델일 수 있다. 3C, the bacteremia prediction model of the present invention may be a prediction model based on the MLP algorithm, which is a multilayer artificial neural network.

보다 구체적으로, 본 발명의 균혈증 예측 모델은, ALP 수치 또는 혈소판 수치와 같은 생물학적 시험 데이터와 최고 체온과 같은 생체 신호 데이터, 임상적 특징 데이터가 입력되는 입력 레이어 및 균혈증 또는 균혈증이 아닌 정상을 예측하는 출력 레이어와 이들 레이어 사이에 1 개의 히든 레이어가 존재하는 다층 구조의 예측 모델일 수 있다.More specifically, the bacteremia prediction model of the present invention is an input layer into which biological test data such as ALP level or platelet count, biosignal data such as maximum body temperature, clinical characteristic data, and normal, not bacteremia or bacteremia, are predicted. It may be a multi-layered prediction model in which an output layer and one hidden layer exist between these layers.

이때, 본 발명의 균혈증 예측 모델은, 128 개 또는 256 개의 노드로 구성된 1 개의 히든 레이어를 포함하도록 구성될 수 있다. 나아가, 상기 예측 모델은, 균혈증의 예측 학습에 있어서 예측의 오차를 최소화하는 가중치를 찾기 위한 파라미터일 수 있는 학습 비율 (learning rate) 값이 0.1로 설정될 수 있다. 또한, 예측의 오차를 최소화하며 학습 속도를 증가시키기 위한 파라미터 값인 모멘텀 (momenteum) 값이 0.95로 설정될 수 있다. 또한, 본 발명의 균혈증 예측 모델은, 학습에 있어서 매개 변수를 갱신하는 최적화 함수로서 'adadelta'를 이용하도록 구성될 수 있고, 다양한 임상 데이터들의 입력 값이 출력값에 전달되는 강도를 결정하는 함수로서 'tanh'함수를 이용하도록 구성될 수 있다.At this time, the bacteremia prediction model of the present invention may be configured to include one hidden layer composed of 128 or 256 nodes. Furthermore, in the prediction model, a learning rate value, which may be a parameter for finding a weight that minimizes an error in prediction, may be set to 0.1 in predictive learning of bacteremia. In addition, a momentum value, which is a parameter value for minimizing prediction errors and increasing the learning speed, may be set to 0.95. In addition, the bacteremia prediction model of the present invention may be configured to use'adadelta' as an optimization function for updating a parameter in learning, and as a function that determines the intensity at which input values of various clinical data are transferred to the output value, ' It can be configured to use the tanh' function.

그러나, 본 발명의 균혈증 예측 모델의 종류는 이에 제한되는 것이 아니다. 예를 들어, 상기 예측 모델은, SVM (support vector machine), RF (random forest), 및 MLP, SVM, RF의 조합으로 구성된 앙상블 모델 중 적어도 하나의 모델일 수 있고, DNN, CNN, RNN, DCNN, RBM, DBN, SSD 모델 또는 U-net을 기반으로 하는 예측 모델일 수도 있다.However, the type of the bacteremia prediction model of the present invention is not limited thereto. For example, the prediction model may be at least one of an ensemble model composed of a support vector machine (SVM), a random forest (RF), and a combination of MLP, SVM, and RF, and DNN, CNN, RNN, DCNN , RBM, DBN, SSD model, or may be a prediction model based on U-net.

한편, 본 발명의 균혈증 예측 모델의 학습에 있어서, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터들이 결정되는 평가가 수행될 수 있다. 이때, 영향력 평가는 OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여 수행될 수 있다. Meanwhile, in the learning of the bacteremia prediction model of the present invention, an evaluation in which clinical data having a large influence on predicting normal, not bacteremia, may be determined. In this case, the influence evaluation is performed based on at least one algorithm among OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency map). I can.

도 3d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 평가 방법을 예시적으로 도시한 것이다.3D is an exemplary illustration of a method of evaluating a model for predicting bacteremia used in various embodiments of the present invention.

이때, LRP 알고리즘에 기초한 임상 데이터의 평가를 예로 들어 설명하나, 평가 알고리즘은 전술한 바와 같이 보다 다양한 알고리즘에 기초하여 수행될 수 있다.In this case, the evaluation of clinical data based on the LRP algorithm will be described as an example, but the evaluation algorithm may be performed based on more various algorithms as described above.

도 3d를 참조하면, 다양한 임상 데이터에 기초하여 균혈증 예측 모델에 의해 균혈증 예측 결과가 출력되면, LRP 알고리즘에 기초한 평가가 수행될 수 있다. Referring to FIG. 3D, when a bacteremia prediction result is output by a bacteremia prediction model based on various clinical data, an evaluation based on an LRP algorithm may be performed.

보다 구체적으로, 본 평가에서는, LRP 알고리즘에 의해 ALP 수치, 혈소판 수와 같은 생물학적 시험 데이터, 최고 체온과 같은 생체 신호 데이터, 나아가 임상적 특징 데이터의 다양한 임상 데이터의 입력값과 균혈증 또는 균혈증이 아닌 정상으로의 출력값의 관련도 (relevance) 가 추정될 수 있다.More specifically, in this evaluation, by the LRP algorithm, ALP level, biological test data such as platelet count, biosignal data such as peak body temperature, and further input values of various clinical data of clinical characteristic data and normal non-bacteremia or bacteremia The relevance of the output value to can be estimated.

보다 구체적으로, 다양한 임상 데이터의 입력값과 균혈증 또는 균혈증이 아닌 정상으로의 출력값의 관련도는 하기 [수학식 1]로 산출될 수 있다.More specifically, the relationship between the input value of various clinical data and the output value to normal, not bacteremia or bacteremia may be calculated by the following [Equation 1].

[수학식 1][Equation 1]

Figure pat00001
Figure pat00001

여기서, L은, 출력 레이어 값을 의미하고, Z ji l+1번째 레이어와 l번째 레이어의 가중치, 및 l번째 레이어 입력 값의 곱을 의미할 수 있다 (

Figure pat00002
). 나아가, b j 는 j번째 노드의 편향값을 의미할 수 있다.Here, L denotes an output layer value, and Z ji may denote a product of the weight of the l + 1 th layer and the l th layer, and an input value of the l th layer (
Figure pat00002
). Further, b j May mean a bias value of the j-th node.

산출된 관련도 점수에 의해 다양한 임상 데이터 중, 패혈증과 상이한 균혈증임을 예측하는 것에 관련도가 큰 임상 데이터 또는, 균혈증이 아닌 정상을 예측하는 것에 영향력이 큰 임상 데이터가 결정될 수 있다. According to the calculated relevance score, among various clinical data, clinical data having a high relevance to predicting bacteremia different from sepsis, or clinical data having a large influence on predicting normal, not bacteremia, can be determined.

이러한 영향력이 큰 임상 데이터들이 상기 예측 모델의 학습에 입력 데이터로서 적용될 수 있음에 따라, 균혈증의 예측에 있어서 본 발명의 예측 모델은 다른 모델들 보다 균혈증 예측 능력이 우수할 수 있다.As clinical data having a large influence can be applied as input data to the learning of the predictive model, the predictive model of the present invention may be superior to other models in predicting bacteremia in predicting bacteremia.

실시예 1: 본 발명의 다양한 실시예에 따른 균혈증 예측 모델의 제1 평가Example 1: First evaluation of bacteremia prediction model according to various embodiments of the present invention

이하에서는 4a 내지 4f를 참조하여 본 발명의 다양한 실시예에서 이용되는 균혈증 예측 모델의 제1 평가 결과에 대하여 구체적으로 설명한다. 도 4a 및 4b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제1 평가 결과를 도시한 것이다. Hereinafter, a first evaluation result of the bacteremia prediction model used in various embodiments of the present invention will be described in detail with reference to 4a to 4f. 4A and 4B illustrate a first evaluation result of a model for predicting bacteremia used in various embodiments of the present invention.

먼저, 도 4a를 참조하면, 생물학적 시험 데이터, 생체 신호 데이터 및 데이터를 기초로 균혈증 또는 균혈증이 아닌 정상을 예측하도록 구성된 균혈증 예측 모델의 평가 결과가 도시된다.First, referring to FIG. 4A, an evaluation result of a bacteremia prediction model configured to predict normal, not bacteremia or bacteremia, based on biological test data, biological signal data, and data is shown.

이때, 본 발명의 균혈증 예측 모델은, 128 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델 (본 발명의 균혈증 예측 모델 (A)), 256 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델 (본 발명의 균혈증 예측 모델 (B)), 랜덤 포레스트의 분류 모델 (본 발명의 균혈증 예측 모델 (C)), SVM의 분류 모델 (본 발명의 균혈증 예측 모델 (D)) 및 128 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델, 256 개의 노드를 갖는 히든 레이어로 구성된 MLP 모델 및 랜덤 포레스트 분류 모델이 결합된 앙상블 모델 (본 발명의 균혈증 예측 모델 (E)) 로 구성된다. 나아가, 각 변수가 계층화되어 섹션으로 나눈 후 균혈증에 대한 위험을 분석하도록 구성된 종래의 예측 모델 Na

Figure pat00003
ve Bayesian이 본 평가에 함께 이용되었다.At this time, the bacteremia prediction model of the present invention is an MLP model consisting of a hidden layer having 128 nodes (the bacteremia prediction model (A) of the present invention), an MLP model consisting of a hidden layer having 256 nodes (predicting bacteremia of the present invention) Model (B)), classification model of random forest (bacteremia prediction model (C) of the present invention), classification model of SVM (bacteremia prediction model (D) of the present invention), and MLP model consisting of a hidden layer having 128 nodes , An MLP model composed of a hidden layer having 256 nodes and an ensemble model in which a random forest classification model is combined (the bacteremia prediction model (E) of the present invention). Furthermore, each variable is stratified and divided into sections, and the conventional predictive model Na is configured to analyze the risk for bacteremia.
Figure pat00003
ve Bayesian was used together in this evaluation.

도 4a를 참조하면, MLP에 기초한, 본 발명의 균혈증 예측 모델 (A) 및 본 발명의 균혈증 예측 모델 (B) 의 민감도가 0.81로 나머지 모델에 비하여 가장 높은 것으로 나타난다. 나아가, 본 발명의 균혈증 예측 모델 (C) 의 특이도가 0.655로 나머지 모델에 비하여 가장 높은 것으로 나타난다. Referring to FIG. 4A, the sensitivity of the bacteremia prediction model (A) of the present invention and the bacteremia prediction model (B) of the present invention based on MLP is 0.81, which is the highest compared to the other models. Furthermore, the specificity of the bacteremia prediction model (C) of the present invention is 0.655, which is the highest compared to the other models.

특히, 도 4b를 함께 참조하면 본 발명의 균혈증 예측 모델 (A) 내지 (E) 의 진단 능력을 의미할 수 있는 AUC값은 평균 약 0.729로, 종래의 예측 모델인 Na

Figure pat00004
ve Bayesian에 비하여 높은 것으로 나타난다. 이때, AUC 값은 진단 능력과 연관이 있을 수 있다. 따라서, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 균혈증 진단 시스템에 적용될 경우, 개체에 대하여 균혈증의 발병 위험도를 높은 정확도로 미리 예측할 수 있다.In particular, referring to FIG. 4B together, the AUC value that can mean the diagnostic ability of the bacteremia prediction models (A) to (E) of the present invention is an average of about 0.729, which is a conventional prediction model Na
Figure pat00004
ve appears to be higher than Bayesian. At this time, the AUC value may be related to diagnostic ability. Accordingly, when the bacteremia prediction model according to various embodiments of the present invention is applied to a bacteremia diagnosis system, the risk of developing bacteremia in an individual can be predicted in advance with high accuracy.

이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델이 종래의 예측 모델보다 균혈증 발병의 위험도를 높은 신뢰도로 예측하는 것으로 나타난다. 특히, MLP 기반의 균혈증 예측 모델의 경우, 다른 모델들 보다 높은 민감도를 유지하면서 높은 AUC 값을 갖는 것으로 나타난다. 이에, 본 발명의 균혈증 예측 모델은, MLP 기반의 예측 모델일 수 있으나 이에 제한되는 것은 아니다. According to the above results, it appears that the bacteremia prediction model according to various embodiments of the present invention predicts the risk of bacteremia with higher reliability than the conventional prediction model. In particular, the MLP-based bacteremia prediction model appears to have a higher AUC value while maintaining higher sensitivity than other models. Accordingly, the bacteremia prediction model of the present invention may be an MLP-based prediction model, but is not limited thereto.

도 4c 및 4d는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들을 도시한 것이다. 4C and 4D illustrate clinical data according to the influence of bacteremia prediction for a bacteremia prediction model used in various embodiments of the present invention.

도 4c를 참조하면, 본 발명의 다양한 실시예에서 이용되는 임상 데이터들 (생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터) 의 영향력 (관련도) 평가 결과가 도시된다. 본 평가에서는, 'One-out search' 및 'Gini Importance'에 기초하여 균혈증의 예측에 영향력이 높은 변수들의 순위를 평가하였다. 보다 구체적으로, MLP 기반의 예측 모델에 적용될 수 있는 One-out search의 순위 평가 결과에 따르면, 생물학적 시험 데이터 중 ALP 수치 및 혈소판 수와, 생체 신호 데이터 중 최고 체온이 균혈증의 발병 위험도를 예측하는 것에 있어서 높은 영향력이 있는 것으로 나타난다. 한편, 랜덤 포레스트 기반의 예측 모델에 이용될 수 있는 Gini Importance의 순위 평가 결과에 따르면, One-out search의 순위 평가 결과와 다소 상이하지만, One-out search에 의해 영향력이 높다고 평가된 ALP 수치, 혈소판 수 및 최고 체온이 균혈증을 분류 하는 것에 높은 영향력을 갖는 것으로 나타난다. Referring to FIG. 4C, results of evaluating the influence (relevance) of clinical data (biological test data, biosignal data, and clinical feature data) used in various embodiments of the present invention are shown. In this evaluation, the ranking of variables with high influence on the prediction of bacteremia based on'One-out search' and'Gini Importance' was evaluated. More specifically, according to the ranking evaluation results of One-out search that can be applied to the MLP-based predictive model, the ALP level and platelet count among the biological test data, and the highest body temperature among the biological signal data are in predicting the risk of bacteremia. It appears to have high influence. On the other hand, according to the ranking evaluation result of Gini Importance, which can be used in the random forest-based prediction model, it is slightly different from the ranking evaluation result of One-out search, but ALP level, platelet, evaluated to have high influence by one-out search. Number and peak body temperature appear to have a high impact on classifying bacteremia.

도 4d를 더욱 참조하면, 그레디언트 기반의 방법의 LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 에 기초하여 균혈증의 예측에 영향력이 높은 변수들의 순위를 평가한 결과가 도시된다. 보다 구체적으로, LRP, GI 및 IG의 순위 평가 결과에 따르면, 전술한 One-out search의 순위 평가 결과와 유사하게 ALP 수치가 균혈증의 발명 위험도를 예측하는 것에 높은 영향력을 갖는 것으로 나타난다. 또한, 혈소판 수가 균혈증의 발명 위험도를 예측하는 것에 높은 영향력을 갖는 것으로 나타난다. SM에 따른 순위 평가 결과에서도, 혈소판 수 및 ALP 수치가 균혈증의 발명 위험도를 예측하는 것에 높은 영향력을 갖는 것으로 나타난다.4D, a variable having a high influence on the prediction of bacteremia based on a gradient-based method based on Layer-wise Relevance Propagation (LRP), gradient input (GI), integrated gradients (IG), and saliency map (SM) The results of evaluating their ranking are shown. More specifically, according to the ranking evaluation results of LRP, GI and IG, similar to the ranking evaluation results of the above-described one-out search, ALP levels appear to have a high influence on predicting the risk of invention of bacteremia. In addition, platelet counts appear to have a high influence on predicting the risk of developing bacteremia. Also in the results of ranking evaluation according to SM, it appears that platelet count and ALP level have a high influence on predicting the risk of invention of bacteremia.

이러한 결과는, 개체에 대한 임상 데이터를 기초로 균혈증을 예측 하는 것에 있어서, 생물학적 시험 데이터 중 ALP 수치 및 혈소판 수, 나아가 생체 신호 데이터 중 최고 체온이 균혈증 예측에 있어서 큰 영향력을 제공한다는 것을 의미할 수 있다. 즉, 본 발명의 균혈증 예측 모델은, 중 ALP 수치 및 혈소판 수, 나아가 최고 체온을 기초로 균혈증 발병 여부를 예측하도록 학습될 수 있어, 우수한 진단 능력으로 개체에 대한 균혈증 발병의 위험도를 예측할 수 있다. These results may mean that in predicting bacteremia based on clinical data for an individual, the ALP level and platelet count among the biological test data, and further, the highest body temperature among the biological signal data, provides a great influence in the prediction of bacteremia. have. That is, the bacteremia prediction model of the present invention can be learned to predict whether or not bacteremia occurs based on the ALP level and platelet count, and further, the highest body temperature, so that the risk of bacteremia in an individual can be predicted with excellent diagnostic ability.

도 4e 및 4f는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한, 균혈증 예측의 영향력에 따른 임상 데이터들의 변화에 따른 성능 변화를 도시한 것이다. 4E and 4F illustrate performance changes according to changes in clinical data according to the influence of bacteremia prediction for a bacteremia prediction model used in various embodiments of the present invention.

도 4e의 (a)를 참조하면, MLP의 ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 LRP, SM, OOS (one-out search), 및 교란-기반 방법의 Occlusion을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 제외했을 때의 AUC값이 도시된다. 나아가, RF 기반의 예측 모델에 대하여 변수의 평가를 위해 Gini Importance 방법으로 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 제외했을 때의 AUC값이 함께 도시된다.Referring to (a) of FIG. 4E, after applying Occlusion of LRP, SM, OOS (one-out search), and disturbance-based method for evaluating variables for the ANN machine learning algorithm of MLP, it is evaluated that the influence is high. The AUC values when the variables are accumulated and excluded in the order of influence are shown. Furthermore, for the evaluation of the variable based on the RF-based prediction model, the AUC value obtained when variables evaluated to have high influence are accumulated and excluded in the order of influence by the Gini Importance method.

보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 제외됨에 따라, 균혈증 예측에 대한 AUC값이 감소하는 것으로 나타난다. 이는 영향력이 높은 임상 데이터들의 제외에 따른, 균혈증 예측의 성능 저하를 의미할 수 있다. More specifically, it appears that the AUC value for predicting bacteremia decreases as the upper variables evaluated to be highly influential in predicting bacteremia (e.g., ALP level, platelet count, peak body temperature, etc.) are excluded. . This may mean a decrease in the performance of predicting bacteremia due to the exclusion of highly influential clinical data.

도 4e의 (b)를 참조하면, MLP의 ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 LRP, SM, OOS (one-out search), 및 교란-기반 방법의 Occlusion을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 추가했을 때의 AUC값이 도시된다. 나아가, RF 기반의 예측 모델에 대하여 변수의 평가를 위해 Gini Importance 방법으로 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 추가했을 때의 AUC값이 함께 도시된다.Referring to (b) of FIG. 4E, after applying Occlusion of LRP, SM, OOS (one-out search), and disturbance-based method for evaluating variables for the ANN machine learning algorithm of MLP, it is evaluated that the influence is high. The AUC values obtained by accumulating and adding the variables in the order of influence are shown. Furthermore, the AUC value obtained by accumulating and adding variables evaluated to have high influence in the order of influence by the Gini Importance method for evaluating the variable for the RF-based prediction model is also shown.

보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 추가됨에 따라, 균혈증 예측에 대한 AUC값이 증가하는 것으로 나타난다. 이때, 상위 10 개의 변수를 추가한 이후 AUC 값의 변화는 미미한 것으로 나타난다. 이러한 결과는, 상위 10 개의 임상 데이터들이 균혈증을 예측하는 것에 있어서 영향력이 높은 것을 의미할 수 있다. 한편, OOS의 경우, 다른 평가 모델들보다 변수 추가에 따른 현저한 AUC 값의 증가가 나타난다. 이에, 본 발명의 다양한 실시예에 따른 균혈증 발병 위험도 예측 방법에 있어서, 다양한 임상적 변수들, 즉 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 평가에 OOS 모델이 적용될 수 있으나, 이에 제한되는 것은 아니다. More specifically, it appears that the AUC value for predicting bacteremia increases as the top variables evaluated to be highly influential in predicting bacteremia (e.g., ALP level, platelet count, peak body temperature, etc.) are added. . At this time, after adding the top 10 variables, the change in AUC value appears to be insignificant. These results may mean that the top 10 clinical data are highly influential in predicting bacteremia. On the other hand, in the case of OOS, a significant increase in AUC value appears due to the addition of variables than other evaluation models. Accordingly, in the method for predicting the risk of bacteremia according to various embodiments of the present invention, the OOS model may be applied to the evaluation of various clinical variables, that is, biological test data, biosignal data, and clinical feature data, but is limited thereto. It is not.

도 4f의 (a)를 참조하면, RF 및 SVM의 비-ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 Gini Importance 방법, 또는 OOS을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 제외했을 때의 AUC값이 도시된다.Referring to (a) of FIG. 4F, after applying the Gini Importance method or OOS for the evaluation of variables for RF and SVM non-ANN machine learning algorithms, variables evaluated to have high influence are accumulated and excluded in the order of influence. The AUC value when done is shown.

보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 제외됨에 따라, 균혈증 예측에 대한 AUC값이 감소하는 것으로 나타난다. 이는 영향력이 높은 임상 데이터들의 제외에 따른, 균혈증 예측의 성능 저하를 의미할 수 있다. More specifically, it appears that the AUC value for predicting bacteremia decreases as the upper variables evaluated to be highly influential in predicting bacteremia (e.g., ALP level, platelet count, peak body temperature, etc.) are excluded. . This may mean a decrease in the performance of predicting bacteremia due to the exclusion of highly influential clinical data.

도 4f의 (b)를 참조하면, RF 및 SVM의 비-ANN 머신 러닝 알고리즘에 대하여 변수의 평가를 위해 Gini Importance 방법, 또는 OOS을 적용한 후, 영향력이 높다고 평가된 변수들을 영향력 순으로 누적하여 추가했을 때의 AUC값이 도시된다.Referring to (b) of FIG. 4F, after applying the Gini Importance method or OOS for evaluating variables for RF and SVM non-ANN machine learning algorithms, variables evaluated to have high influence are accumulated and added in order of influence. The AUC value when done is shown.

보다 구체적으로, 균혈증을 예측하는 것에 있어서 영향력이 높은 것으로 평가된 상위 변수들 (예를 들어, ALP 수치, 혈소판 수, 최고 체온 등) 이 추가됨에 따라, 균혈증 예측에 대한 AUC값이 증가하는 것으로 나타난다. 이때, 상위 10 개의 변수를 추가한 이후 AUC 값의 변화는 미미한 것으로 나타난다. 이러한 결과는, 상위 10 개의 임상 데이터들이 균혈증을 예측하는 것에 있어서 영향력이 높은 것을 의미할 수 있다. 한편, OOS의 경우, 다른 평가 모델들보다 변수 추가에 따른 현저한 AUC 값의 증가가 나타난다. 이에, 본 발명의 다양한 실시예에 따른 균혈증 발병 위험도 예측 방법에 있어서, 다양한 임상적 변수들, 즉 생물학적 시험 데이터, 생체 신호 데이터 및 임상적 특징 데이터의 평가에 OOS 모델이 적용될 수 있으나, 이에 제한되는 것은 아니다. More specifically, it appears that the AUC value for predicting bacteremia increases as the top variables evaluated to be highly influential in predicting bacteremia (e.g., ALP level, platelet count, peak body temperature, etc.) are added. . At this time, after adding the top 10 variables, the change in AUC value appears to be insignificant. These results may mean that the top 10 clinical data are highly influential in predicting bacteremia. On the other hand, in the case of OOS, a significant increase in AUC value appears due to the addition of variables than other evaluation models. Accordingly, in the method for predicting the risk of bacteremia according to various embodiments of the present invention, the OOS model may be applied to the evaluation of various clinical variables, that is, biological test data, biological signal data, and clinical characteristic data, It is not.

한편, 본 발명의 다양한 실시예에서 이용되는 균혈증 예측 모델은, 균혈증 예측에 있어서 영향력이 큰 임상 데이터를 학습 데이터로 이용하도록 구성될 수 있다. 이에, 균혈증 예측 모델은, 균혈증 예측에 있어서 다른 예측 모델보다 향상된 진단 능력으로 균혈증 예측 결과를 제공할 수 있다. 이상의 실시예 1의 결과로, 본 발명의 다양한 실시예에서 이용된 균혈증 예측 모델이 균혈증 발병 위험도를 높은 정확도로 예측하는 것을 확인할 수 있었다. 나아가, 높은 AUC 값을 갖는 것으로 나타난 결과에 따라 본 발명의 예측 모델은 우수한 진단 능력을 가지는 것으로 확인할 수 있었다. Meanwhile, the bacteremia prediction model used in various embodiments of the present invention may be configured to use clinical data having a large influence in predicting bacteremia as learning data. Accordingly, the bacteremia prediction model may provide a bacteremia prediction result with improved diagnostic ability than other prediction models in predicting bacteremia. As a result of Example 1 above, it was confirmed that the bacteremia prediction model used in various examples of the present invention predicts the risk of developing bacteremia with high accuracy. Furthermore, according to the results shown to have a high AUC value, it was confirmed that the predictive model of the present invention has excellent diagnostic ability.

이에, 본 발명은 균혈증에 대한 처치 시점을 앞당겨 치료에 대한 좋은 예후를 제공할 수 있다. 나아가, 본 발명은, 패혈증과 상이한 균혈증에 대하여 높은 신뢰도 및 정확도로 발병의 위험도를 예측할 수 있는 효과가 있다.Accordingly, the present invention can provide a good prognosis for treatment by advancing the time point of treatment for bacteremia. Furthermore, the present invention has the effect of predicting the risk of onset with high reliability and accuracy for bacteremia different from sepsis.

특히, 본 발명은 개체로부터 빠르게 획득 가능한 임상 데이터에 기초한 균혈증 발병 위험도 예측 시스템을 제공함으로써, 개체에 대하여 균혈증 발병의 조기 진단을 제공할 수 있다. In particular, the present invention provides a system for predicting the risk of developing bacteremia based on clinical data that can be quickly obtained from an individual, thereby providing early diagnosis of the onset of bacteremia in an individual.

이에, 본 발명은 균혈증 발병 개체의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다.Accordingly, the present invention can provide an effect of increasing the survival rate of an individual with bacteremia, preventing complications, and reducing treatment costs.

또한, 본 발명은, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성됨에 따라, 보호자 또는 의료진은 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고위험군을 인지할 수 있다.In addition, the present invention is configured to notify the risk of developing bacteremia by providing an alarm when bacteremia is predicted by a predictive model for an individual, so that a guardian or a medical staff is easier for individuals requiring continuous monitoring, such as critically ill patients. It is possible to recognize the high risk group for developing bacteremia.

실시예 2: 본 발명의 다양한 실시예에 따른 균혈증 예측 모델의 제2 평가 Example 2: Second evaluation of bacteremia prediction model according to various embodiments of the present invention

이하에서는 5a 내지 5i를 참조하여 본 발명의 다양한 실시예에서 이용되는 균혈증 예측 모델의 제2 평가 결과에 대하여 구체적으로 설명한다. 도 5a 및 5b는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 제2 평가를 위한 학습 데이터 및 평가 데이터를 도시한 것이다. 도 5c 내지 5i는 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델에 대한 제2 평가 결과를 도시한 것이다. Hereinafter, a second evaluation result of the bacteremia prediction model used in various embodiments of the present invention will be described in detail with reference to 5a to 5i. 5A and 5B illustrate training data and evaluation data for a second evaluation of a bacteremia prediction model used in various embodiments of the present invention. 5C to 5I illustrate a second evaluation result for a bacteremia prediction model used in various embodiments of the present invention.

이때, 도 5a를 참조하면, 본 평가에서 균혈증 예측을 위해, 임상적 특징 데이터로서 연령, 성별이 특징 파라미터로 설정 되었고, 생체 신호 데이터로서 SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수가 특징 파라미터로 설정 되었다. 나아가, 생물학적 시험 데이터로서 알부민 수치, ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치가 특징 파라미터로 설정되었다.At this time, referring to FIG. 5A, in order to predict bacteremia in this evaluation, age and sex were set as characteristic parameters as clinical characteristic data, and systolic blood pressure (SBP), diastolic blood pressure (DBP), and highest as biosignal data. Body temperature, minimum body temperature, heart rate and respiratory rate were set as characteristic parameters. Furthermore, as biological test data, albumin level, ALT (alanine aminotransferase) level, thromboplastin coagulation time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, red blood cell sedimentation rate, FERR (ferritin) Level, HMG (hemoglobin) level, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin Time (%)), PTSEC (Prothrombin Time (sec)), red blood cell count, TBIL (Total bilirubin) level, TCO 2 (total carbon) dioxide) and white blood cells were set as characteristic parameters.

이때, 생체 신호 데이터 및 생물학적 시험 데이터는, 3일 이내 측정된 최소값, 최대값, 또는 측정된 수치를 포함할 수 있다.In this case, the biosignal data and biological test data may include a minimum value, a maximum value, or a measured value measured within 3 days.

보다 구체적으로, 도 5b를 참조하면, 본 발명의 다양한 실시예에 이용되는 균혈증 예측 모델의 제2 평가를 위해 이용된 데이터 세트 A, B 및 C의 구성이 도시된다.More specifically, referring to FIG. 5B, the configuration of data sets A, B and C used for the second evaluation of the bacteremia prediction model used in various embodiments of the present invention is shown.

A 데이터 세트는, 트레이닝 및 검증을 위해 균혈증 양성 및 균혈증 음성 데이터가 1:1의 비율을 갖도록 구성되고, 테스트를 위해 균혈증 양성 및 균혈증 음성 데이터가 약 1:10의 비율을 갖도록 구성된다. 이때, A 데이터 세트는, 강남 세브란스 병원 및 신촌 세브란스 병원에서 2007년 내지 2018년 사이에 샘플링된 균혈증 양성 및 균혈증 음성 데이터로서, 트레이닝 및 검증을 위해 2007년 내지 2015년도의 데이터가, 테스트를 위해 2016년 내지 2018년 데이터가 이용될 수 있다.The A data set is constructed such that bacteremia positive and bacteremia negative data have a ratio of 1:1 for training and validation, and bacteremia positive and bacteremia negative data have a ratio of about 1:10 for testing. At this time, data set A is bacteremia positive and bacteremia negative data sampled between 2007 and 2018 at Gangnam Severance Hospital and Shinchon Severance Hospital, and data from 2007 to 2015 for training and verification, 2016 for testing. Data from year to 2018 can be used.

B 데이터 세트는, 트레이닝 및 검증을 위해 균혈증 양성 및 균혈증 음성 데이터가 1:1의 비율을 갖도록 구성되고, 테스트를 위해 균혈증 양성 및 균혈증 음성 데이터가 약 1:7의 비율을 갖도록 구성된다. 이때, C 데이터 세트는, 강남 세브란스 병원 및 신촌 세브란스 병원에서 2007년 내지 2018년 사이에 샘플링된 균혈증 양성 및 균혈증 음성 데이터를 연도별로 병합한 후 랜덤 분할된 데이터일 수 있다.The B data set is configured such that bacteremia positive and bacteremia negative data have a ratio of 1:1 for training and validation, and bacteremia positive and bacteremia negative data have a ratio of about 1:7 for testing. In this case, the C data set may be randomly divided data after merging bacteremia positive and bacteremia negative data sampled between 2007 and 2018 at Gangnam Severance Hospital and Shinchon Severance Hospital by year.

C 데이터 세트는, 트레이닝 및 검증을 위해 균혈증 양성 및 균혈증 음성 데이터가 1:1의 비율을 갖도록 구성되고, 테스트를 위해 균혈증 양성 및 균혈증 음성 데이터가 약 1:7의 비율을 갖도록 구성된다. 이때, C 데이터 세트는, 강남 세브란스 병원 및 신촌 세브란스 병원에서 2007년 내지 2018년 사이에 샘플링된 균혈증 양성 및 균혈증 음성 데이터를 연도별로 병합한 후 랜덤 분할하고, 동일 환자 샘플이 각 세트별로 중복되지 않도록 구분되고, 동일 환자의 양성/음성 샘플이 동시에 존재하는 경우 음성 샘플이 제거된 데이터일 수 있다.The C data set is constructed such that bacteremia positive and bacteremia negative data have a ratio of 1:1 for training and validation, and bacteremia positive and bacteremia negative data have a ratio of about 1:7 for testing. At this time, the C data set is randomly divided after merging the bacteremia positive and bacteremia negative data sampled between 2007 and 2018 at Gangnam Severance Hospital and Shinchon Severance Hospital by year, and then randomly divide the same patient sample for each set. Separated, if there are positive/negative samples of the same patient at the same time, the negative samples may be removed.

도 5c를 참조하면, 전술한 A 데이터에 기초하여 학습된 균혈증 예측 모델에 대한 평가 결과가 도시된다. 이때, 128 개의 노드, 64 개의 노드, 25 개의 노드 및 128 개의 노드로 구성된 4 층의 복수의 레이어로 구성된 균혈증 예측 모델에 대하여, 선행 학습여부에 따른 균혈증 예측 진단 성능에 대한 평가가 수행되었다. 한편, 선행 학습된 균혈증 예측 모델은, 스스로 라벨 값을 학습하는 오터 인코더 (AutoEncoder) 에 대하여 가중치 이니셜라이징 (weight initializing) 이 적용되었다.Referring to FIG. 5C, an evaluation result of a model for predicting bacteremia learned based on data A is shown. At this time, for a bacteremia prediction model consisting of a plurality of layers of 4 layers consisting of 128 nodes, 64 nodes, 25 nodes, and 128 nodes, evaluation of the bacteremia predictive diagnosis performance according to prior learning was performed. Meanwhile, in the pre-learned bacteremia prediction model, weight initializing was applied to an AutoEncoder that learns label values by itself.

보다 구체적으로, 선행 학습된 본 발명의 균혈증 예측 모델 (pret) 의 경우, 균혈증 양성 또는 음성 예측의 정확도가 0.759, 민감도가 0.762로, 그렇지 않은 모델의 정확도 (0.729), 민감도 (0.75) 보다 높은 것으로 나타난다. 특히, 선행 학습된 본 발명의 균혈증 예측 모델 (pret) 의 진단 능력을 의미할 수 있는 AUC 값은 0.840으로, 그렇지 않은 모델의 AUC 값인 0.818보다 높은 것으로 나타난다.More specifically, in the case of the pre-learned bacteremia prediction model (pret) of the present invention, the accuracy of predicting positive or negative bacteremia is 0.759, the sensitivity is 0.762, and the accuracy (0.729) and sensitivity (0.75) of the model without appear. In particular, the AUC value that can mean the diagnostic ability of the pre-learned bacteremia predictive model (pret) of the present invention is 0.840, which is higher than the AUC value of 0.818 of the model that does not.

이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 높은 민감도를 유지하면서 높은 AUC 값을 갖는, 오터 인코더에 대하여 가중치 이니셜라이징이 적용된 모델일 수 있다. 그러나 이에 제한되는 것은 아니다. According to the above results, the bacteremia prediction model according to various embodiments of the present invention may be a model to which weight initializing is applied to an Otter encoder having a high AUC value while maintaining high sensitivity. However, it is not limited thereto.

도 5d 및 5e를 참조하면, 전술한 B 데이터 및 C 데이터에 기초하여 학습된 균혈증 예측 모델에 대한 레이어 사이즈에 따른 평가 결과가 도시된다. Referring to FIGS. 5D and 5E, evaluation results according to layer sizes of a model for predicting bacteremia learned based on data B and C described above are shown.

먼저, 도 5d를 참조하면, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 로 구성된 예측 모델, 64 개의 노드 128 개의 노드, 128 개의 노드 및 64 개의 노드 각각으로 구성된 4 층의 복수의 레이어 (64-128-128-64) 로 구성된 예측 모델에 대하여 전술한 B 데이터를 이용한 성능 평가 결과가 도시된다.First, referring to FIG. 5D, a prediction model consisting of a plurality of layers (64-128-64) of three layers consisting of 64 nodes, 128 nodes and 64 nodes, respectively, 64 nodes, 128 nodes, 128 nodes, and A performance evaluation result using the above-described B data is shown for a prediction model composed of a plurality of layers (64-128-128-64) of 4 layers each composed of 64 nodes.

이때, 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각은, 0.5 확률의 do (drop-out) 또는, bn (batch normalization) 이 적용되었다. At this time, for each of the 64-128-64 prediction model and the 64-128-128-64 prediction model, do (drop-out) or bn (batch normalization) of 0.5 probability was applied.

보다 구체적으로, bn을 적용한 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각에 대한 균혈증 예측의 정확도는 0.735, 0.738로 레이어 사이즈의 변화에도 유사한 값을 갖는 것으로 나타난다. 또한, bn을 적용한 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각에 대한 균혈증 예측에 대한 AUC 값은 0.847, 0.859로 레이어 사이즈의 변화에도 유사한 값을 갖는 것으로 나타난다.More specifically, the accuracy of bacteremia prediction for each of the 64-128-64 prediction model and the 64-128-128-64 prediction model to which bn is applied is 0.735 and 0.738, which appears to have similar values for changes in the layer size. In addition, the AUC values for bacteremia prediction for the 64-128-64 prediction model and the 64-128-128-64 prediction model to which bn was applied were 0.847 and 0.859, indicating that they have similar values in the change of the layer size.

한편, 도 5e를 더욱 참조하면, 128 개의 노드로 구성된 단일 레이어 (128) 로 구성된 예측 모델, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 로 구성된 예측 모델, 64 개의 노드 128 개의 노드, 128 개의 노드 및 64 개의 노드 각각으로 구성된 4 층의 복수의 레이어 (64-128-128-64) 로 구성된 예측 모델에 대하여 전술한 C 데이터를 이용한 성능 평가 결과가 도시된다.Meanwhile, referring to FIG. 5E further, a prediction model composed of a single layer 128 composed of 128 nodes, a plurality of layers of three layers composed of 128 nodes of 64 nodes and 64 nodes respectively (64-128-64) Performance using the aforementioned C data for a prediction model consisting of 64 nodes, 128 nodes, 128 nodes, and multiple layers of 4 layers (64-128-128-64) each consisting of 64 nodes. The evaluation results are shown.

이때, 128 예측 모델에 대하여 0.5 확률의 do를 적용하였고, 64-128-64 예측 모델 및 64-128-128-64 예측 모델 각각에 대하여, 0.5 확률의 do 및/또는 bn이 적용되었다. In this case, do of 0.5 probability was applied to the 128 prediction models, and do and/or bn of 0.5 probability were applied to each of the 64-128-64 prediction models and 64-128-128-64 prediction models.

보다 구체적으로, 단일 레이어의 128 예측 모델의 경우 AUC 값은 0.751로 복수의 레이어를 갖는 64-128-64 예측 모델 및 64-128-128-64 예측 모델의 AUC 값보다 높은 것으로 나타난다. More specifically, in the case of a single-layer 128 prediction model, the AUC value is 0.751, which appears to be higher than that of the 64-128-64 prediction model and the 64-128-128-64 prediction model having multiple layers.

이때, 64-128-64 예측 모델 및 64-128-128-64 예측 모델의 경우, 전술한 도 5d의 결과와 유사하게 bn을 적용했을 때의 균혈증 예측의 정확도, 민감도 및 AUC 값이 높은 것으로 나타난다.At this time, in the case of the 64-128-64 prediction model and the 64-128-128-64 prediction model, it appears that the accuracy, sensitivity and AUC values of bacteremia prediction when bn are applied are high similar to the result of FIG. 5D described above. .

이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 레이어 사이즈의 변화에도 높은 민감도, 정확도 및 AUC 값을 갖는 것으로 나타난다. 이에, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 128 개의 노드로 구성된 단일 레이어를 갖거나, 64-128-64의 3층의 복수의 레이어를 갖거나, 64-128-128-64의 4층의 복수의 레이어를 갖고, bn이 적용된 모델일 수 있다. 그러나, 본 발명의 균혈증 예측 모델의 구조는 이에 제한되는 것은 아니다.According to the above results, it is shown that the bacteremia prediction model according to various embodiments of the present invention has high sensitivity, accuracy, and AUC values even when the layer size is changed. Thus, the bacteremia prediction model according to various embodiments of the present invention has a single layer composed of 128 nodes, a plurality of layers of three layers of 64-128-64, or a plurality of layers of 64-128-128-64. It may be a model having a plurality of four layers and to which bn is applied. However, the structure of the bacteremia prediction model of the present invention is not limited thereto.

도 5f 및 5g를 참조하면, 전술한 B 데이터 및 C 데이터에 기초하여 학습된 스태킹 앙상블 (stacking ensemble) 모델에 대한 평가 결과가 도시된다. Referring to FIGS. 5F and 5G, evaluation results of a stacking ensemble model learned based on the above-described B data and C data are shown.

먼저, 도 5f를 참조하면, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 를 갖고, 스태킹 모델의 수가 10 개, 15 개 및 20 개인 앙상블 모델에 대한, 전술한 B 데이터를 이용한 성능 평가 결과가 도시된다.First, referring to FIG. 5F, an ensemble of 10, 15, and 20 stacking models has a plurality of layers of 3 layers (64-128-64) consisting of 64 nodes, 128 nodes and 64 nodes, respectively. For the model, the performance evaluation results using the above-described B data are shown.

보다 구체적으로, B 데이터 세트를 적용하였을 때, 스태킹 모델의 수가 15 개인 앙상블 모델에 대한 AUC 값이 0.887로, 스태킹 모델의 수가 10 개인 앙상블 모델의 AUC 값 (0.865), 스태킹 모델의 수가 20 개인 앙상블 모델의 AUC 값 (0.873) 보다 높은 것으로 나타난다.More specifically, when the B data set is applied, the AUC value for the ensemble model with 15 stacking models is 0.887, the AUC value of the ensemble model with 10 stacking models (0.865), and the ensemble with 20 stacking models It appears to be higher than the model's AUC value (0.873).

한편, 도 5g를 함께 참조하면, 128 개의 노드로 구성된 단일 레이어를 갖고, 스태킹 모델의 수가 10 개, 15 개 및 20 개인 앙상블 모델에 대한, 전술한 C 데이터를 이용한 성능 평가 결과가 도시된다.Meanwhile, referring to FIG. 5G, a performance evaluation result using the aforementioned C data for an ensemble model having a single layer composed of 128 nodes and having 10, 15 and 20 stacking models is shown.

보다 구체적으로, C 데이터 세트를 적용하였을 때, 스태킹 모델의 수가 15 개 및 20 개인 앙상블 모델에 대한 AUC 값이 0.752로, 스태킹 모델의 수가 10 개인 앙상블 모델의 AUC 값 (0.750) 보다 높은 것으로 나타난다.More specifically, when the C data set is applied, the AUC value for the ensemble model with 15 and 20 stacking models is 0.752, which is higher than the AUC value (0.750) of the ensemble model with 10 stacking models.

이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, 스태킹 모델의 수가 15 개 내지 20 개인 앙상블 모델일 수도 있다. 그러나, 본 발명의 균혈증 예측 모델의 구조는 이에 제한되는 것은 아니다.According to the above results, the bacteremia prediction model according to various embodiments of the present disclosure may be an ensemble model in which the number of stacking models is 15 to 20. However, the structure of the bacteremia prediction model of the present invention is not limited thereto.

도 5h 및 5i를 참조하면, 전술한 B 데이터 및 C 데이터에 기초하여 학습된, MLP 기반의 예측 모델 및 Xgboost 기반의 예측 모델에 대한 평가 결과가 도시된다. 5H and 5I, evaluation results of an MLP-based prediction model and an Xgboost-based prediction model learned based on the above-described B data and C data are shown.

먼저, 도 5h를 참조하면, 64 개의 노드 128 개의 노드 및 64 개의 노드 각각으로 구성된 3 층의 복수의 레이어 (64-128-64) 를 갖고, 스태킹 모델의 수가 15 개인 MLP 모델 및 gbtree 레이어로 구성된 Xgboost 모델에 대한, 전술한 B 데이터를 이용한 성능 평가 결과가 도시된다.First, referring to FIG. 5H, it has a plurality of layers of 3 layers (64-128-64) consisting of 64 nodes, 128 nodes and 64 nodes, respectively, and consists of an MLP model with 15 stacking models and a gbtree layer. For the Xgboost model, a performance evaluation result using the above-described B data is shown.

보다 구체적으로, B 데이터 세트를 적용하였을 때, Xgboost 모델 기반의 예측 모델의 AUC 값은 0.842, 민감도는 0.745로, MLP 기반의 예측 모델의 AUC 값 (0.887) 및 민감도 (0.801) 와 유사한 수준을 갖는 것으로 나타난다. More specifically, when the B data set is applied, the AUC value of the predictive model based on the Xgboost model is 0.842 and the sensitivity is 0.745, which is similar to the AUC value (0.887) and the sensitivity (0.801) of the MLP-based predictive model. Appears to be.

한편, 도 5i를 함께 참조하면, 128 개의 노드로 구성된 단일 레이어를 갖고, 스태킹 모델의 20 개인 MLP 모델 및 gbtree 레이어로 구성된 Xgboost 모델에 대한, 전술한 C 데이터를 이용한 성능 평가 결과가 도시된다.Meanwhile, referring to FIG. 5I, a performance evaluation result using the aforementioned C data for an Xgboost model having a single layer composed of 128 nodes and composed of a 20-person MLP model of a stacking model and a gbtree layer is shown.

보다 구체적으로, C 데이터 세트를 적용하였을 때, Xgboost 모델 기반의 예측 모델의 AUC 값은 0.745, 민감도는 0.635로, MLP 기반의 예측 모델의 AUC 값 (0.752) 및 민감도 (0.664) 와 유사한 수준을 갖는 것으로 나타난다. More specifically, when the C data set is applied, the AUC value of the predictive model based on the Xgboost model is 0.745 and the sensitivity is 0.635, and the AUC value (0.752) and the sensitivity (0.664) of the MLP-based predictive model are similar. Appears to be.

이상의 결과에 따르면, 본 발명의 다양한 실시예에 따른 균혈증 예측 모델은, MLP 기반의 예측 모델 또는 Xgboost 기반의 예측 모델일 수 있다. 그러나, 본 발명의 균혈증 예측 모델은 이에 제한되지 않고 보다 다양한 예측 모델에 기초하여 균혈증 양성 또는 음성을 예측하도록 구성된 모델일 수 있다. According to the above results, the bacteremia prediction model according to various embodiments of the present invention may be an MLP-based prediction model or an Xgboost-based prediction model. However, the model for predicting bacteremia of the present invention is not limited thereto, and may be a model configured to predict positive or negative bacteremia based on more various predictive models.

이상의 실시예 2의 결과로, 본 발명의 다양한 실시예에서 이용된 균혈증 예측 모델이 균혈증 발병 위험도를 높은 정확도로 예측하는 것을 확인할 수 있었다. 나아가, 높은 AUC 값을 갖는 것으로 나타난 결과에 따라 본 발명의 예측 모델은 우수한 진단 능력을 가지는 것으로 확인할 수 있었다. As a result of Example 2 above, it was confirmed that the bacteremia prediction model used in various examples of the present invention predicts the risk of developing bacteremia with high accuracy. Furthermore, according to the results shown to have a high AUC value, it was confirmed that the predictive model of the present invention has excellent diagnostic ability.

이에, 본 발명은 균혈증에 대한 처치 시점을 앞당겨 치료에 대한 좋은 예후를 제공할 수 있다. 나아가, 본 발명은, 패혈증과 상이한 균혈증에 대하여 높은 신뢰도 및 정확도로 발병의 위험도를 예측할 수 있는 효과가 있다.Accordingly, the present invention can provide a good prognosis for treatment by advancing the time point of treatment for bacteremia. Furthermore, the present invention has the effect of predicting the risk of onset with high reliability and accuracy for bacteremia different from sepsis.

특히, 본 발명은 개체로부터 빠르게 획득 가능한 임상 데이터에 기초한 균혈증 발병 위험도 예측 시스템을 제공함으로써, 개체에 대하여 균혈증 발병의 조기 진단을 제공할 수 있다. In particular, the present invention provides a system for predicting the risk of developing bacteremia based on clinical data that can be quickly obtained from an individual, thereby providing early diagnosis of the onset of bacteremia in an individual.

이에, 본 발명은 균혈증 발병 개체의 생존률 증가, 합병증 예방, 및 치료 비용의 감소 효과를 제공할 수 있다.Accordingly, the present invention can provide an effect of increasing the survival rate of an individual with bacteremia, preventing complications, and reducing treatment costs.

또한, 본 발명은, 개체에 대하여 예측 모델에 의해 균혈증이 예측될 경우, 알람을 제공하여 균혈증 발병 위험도를 알리도록 구성됨에 따라, 보호자 또는 의료진은 중환자와 같은 지속적인 모니터링이 요구되는 개체에 대하여 보다 용이하게 균혈증 발병 고위험군을 인지할 수 있다.In addition, the present invention is configured to notify the risk of developing bacteremia by providing an alarm when bacteremia is predicted by a predictive model for an individual, so that a guardian or a medical staff is easier for individuals requiring continuous monitoring, such as critically ill patients. It is possible to recognize the high risk group for developing bacteremia.

본 발명의 여러 실시예들의 각각 특징들이 부분적으로 또는 전체적으로 서로 결합 또는 조합 가능하며, 당업자가 충분히 이해할 수 있듯이 기술적으로 다양한 연동 및 구동이 가능하며, 각 실시예들이 서로에 대하여 독립적으로 실 시 가능할 수도 있고 연관 관계로 함께 실시 가능할 수도 있다. Each of the features of the various embodiments of the present invention can be partially or totally combined or combined with each other, and as a person skilled in the art can fully understand, technically various interlocking and driving are possible, and each embodiment may be independently implemented with respect to each other. And it may be possible to do it together in a relationship

이상 첨부된 도면을 참조하여 본 발명의 실시예들을 더욱 상세하게 설명하였으나, 본 발명은 반드시 이러한 실시예로 국한되는 것은 아니고, 본 발명 의 기술사상을 벗어나지 않는 범위 내에서 다양하게 변형 실시될 수 있다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The embodiments of the present invention have been described in more detail with reference to the accompanying drawings, but the present invention is not necessarily limited to these embodiments, and various modifications may be made without departing from the spirit of the present invention. . Accordingly, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention, but to explain the technical idea, and the scope of the technical idea of the present invention is not limited by these embodiments. Therefore, it should be understood that the embodiments described above are illustrative in all respects and not limiting. The scope of protection of the present invention should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be interpreted as being included in the scope of the present invention.

100: 균혈증 발병 위험도 예측용 디바이스
110: 수신부
120: 입력부
130: 출력부
140: 저장부
150: 프로세서
200: 개체
300: 임상 데이터
310: 생물학적 시험 데이터
320: 생체 신호 데이터
330: 임상적 특징 데이터
400: 의료적 처치 기구
500: 의료진 디바이스
1000: 위험도 예측 시스템
100: device for predicting the risk of bacteremia
110: receiver
120: input
130: output
140: storage unit
150: processor
200: object
300: clinical data
310: biological test data
320: biosignal data
330: clinical characteristic data
400: medical treatment device
500: medical staff device
1000: risk prediction system

Claims (26)

프로세서에 의해 구현되는 균혈증 발병 위험도를 예측하는 방법에 있어서,
개체에 대한 생물학적 시험 데이터를 수신하는 단계;
상기 생물학적 시험 데이터를 기초로 상기 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 상기 개체의 균혈증 발병 위험도를 예측하는 단계를 포함하고,
상기 생물학적 시험 데이터는,
크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나 및 ALP (Alkaline phosphatase) 수치를 포함하는, 균혈증 발병 위험도의 예측 방법.
In the method for predicting the risk of developing bacteremia implemented by a processor,
Receiving biological test data for the subject;
Predicting the risk of developing bacteremia of the individual using a bacteremia prediction model configured to predict the risk of developing bacteremia in the individual based on the biological test data,
The biological test data,
At least one of Creatinine, Albumin, CRP (Creactive Protein), WBC (white blood cell) minimum, WBC peak, platelet count, Prothrombin time, and ALP (Alkaline) phosphatase), a method for predicting the risk of developing bacteremia.
제1항에 있어서,
상기 개체에 대한 생체 신호 데이터를 수신하는 단계를 더 포함하고,
상기 균혈층 예측 모델은,
상기 생물학적 시험 데이터 및 상기 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
싱기 생체 신호 데이터는,
SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나인, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
Receiving bio-signal data for the individual, further comprising,
The bacterial blood layer prediction model,
Further configured to predict a risk of developing bacteremia based on the biological test data and the biological signal data,
Singgi biosignal data,
A method for predicting the risk of developing bacteremia, which is at least one of systolic blood pressure (SBP), diastolic blood pressure (DBP), maximum body temperature, minimum body temperature, heart rate, and respiratory rate.
제1항에 있어서,
상기 개체에 대한 임상적 특징 데이터를 수신하는 단계를 더 포함하고,
상기 균혈층 예측 모델은,
상기 생물학적 시험 데이터 및 상기 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
싱기 임상적 특징 데이터는,
성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나인, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
Receiving clinical feature data for the individual, further comprising,
The bacterial blood layer prediction model,
Further configured to predict a risk of developing bacteremia based on the biological test data and the clinical characteristic data,
Singgi clinical characteristic data,
A method for predicting the risk of bacteremia, which is at least one of sex, age, blood culture period, intensive care unit (ICU) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment.
제1항에 있어서,
상기 생물학적 시험 데이터는,
상기 크레아틴 수치, 상기 알부민 수치, 상기 CRP 수치, 상기 WBC 최소 수치, 상기 WBC 최고 수치, 상기 프로트롬빈 시간 중 적어도 하나, 및 상기 혈소판 수, 상기 ALP 수치를 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
The biological test data,
The creatine level, the albumin level, the CRP level, the WBC minimum level, the WBC maximum level, at least one of the prothrombin time, and the platelet count, including the ALP level, a method for predicting the risk of bacteremia.
제1항에 있어서,
상기 생물학적 시험 데이터는,
ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치 중 적어도 하나를 더 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
The biological test data,
ALT (alanine aminotransferase) level, thromboplastin coagulation time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, ferritin (FERR) level, hemoglobin (HMG) level, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), red blood cell count, TBIL (total bilirubin) level, TCO 2 (total carbon dioxide) level, and white blood cell count A method for predicting the risk of developing bacteremia further comprising a.
제1항에 있어서,
상기 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 인, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
The bacteremia is acute severe bacteraemia, a method for predicting the risk of developing bacteremia.
제1항에 있어서,
상기 균혈증 예측 모델은,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델인, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
The bacteremia prediction model,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), and an ensemble model consisting of a combination of a plurality of models, a pre-trained model, at least one of the Xgboost model , How to predict the risk of developing bacteremia.
제7항에 있어서,
상기 균혈증 예측 모델은,
상기 MLP 모델 또는 상기 Xgboost 모델이고,
상기 MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나,
상기 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 7,
The bacteremia prediction model,
The MLP model or the Xgboost model,
The MLP model includes a single hidden layer having 128 nodes or 256 nodes,
A method for predicting a risk of developing bacteremia, comprising a plurality of hidden layers in which a plurality of the single hidden layers are present.
제1항에 있어서,
상기 균혈증 예측 모델은,
균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하는 단계, 및
상기 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델이고,
상기 정상의 표본 개체는,
임상적으로 균혈증 발생되지 않고 균혈증이 아닌 것으로 평가된 개체인, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
The bacteremia prediction model,
Receiving data for learning consisting of biological experimental data, biosignal data, and clinical feature data for bacteremia-onset sample individuals and normal sample individuals, and
Based on the learning data, it is a model learned through the step of predicting bacteremia or normal,
The normal sample individual,
A method of predicting the risk of developing bacteremia, which is an individual that has not been clinically evaluated as bacteremia and not bacteremia.
제9항에 있어서,
상기 학습용 데이터를 수신하는 단계 이후에 수행되는,
상기 학습용 데이터를 평가하는 단계를 더 포함하고,
상기 학습용 데이터를 평가하는 단계는,
상기 학습용 데이터에 대하여 균혈증과의 관련도 (relevance) 점수를 산출하는 단계, 및
상기 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 9,
Performed after the step of receiving the learning data,
Further comprising the step of evaluating the learning data,
Evaluating the learning data,
Calculating a relevance score for bacteremia with respect to the learning data, and
A method for predicting a risk of developing bacteremia, comprising the step of determining learning data related to bacteremia within a predetermined ranking based on the relevance score.
제10항에 있어서,
상기 학습용 데이터를 평가하는 단계는,
OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), 및 SM (saliency map) 중 적어도 하나의 알고리즘에 기초하여,
상기 학습용 데이터에 대하여 균혈증과의 관련도 점수를 산출하는 단계, 및
상기 관련도 점수를 기초로, 미리 결정된 순위 내에 있는 균혈증 관련 학습용 데이터를 결정하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 10,
Evaluating the learning data,
Based on at least one algorithm among OOS (one-out search), LRP (Layer-wise Relevance Propagation), GI (gradient input), IG (integrated gradients), and SM (saliency map),
Calculating a score for a degree of association with bacteremia with respect to the learning data, and
A method for predicting a risk of developing bacteremia, comprising the step of determining learning data related to bacteremia within a predetermined ranking based on the relevance score.
제1항에 있어서,
상기 개체에 대하여 예측된 상기 균혈증 발병 위험도를 제공하는 단계를 더 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 1,
The method of predicting the risk of developing bacteremia further comprising the step of providing the predicted risk of developing bacteremia for the individual.
제12항에 있어서,
상기 균혈증 발병 위험도를 제공하는 단계는,
상기 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우,
위험 알림을 제공하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 12,
The step of providing the risk of developing bacteremia,
When the risk of developing bacteremia in an individual is predicted by the bacteremia prediction model,
A method of predicting a risk of developing bacteremia, comprising the step of providing a risk notification.
제12항에 있어서,
상기 균혈증 발병 위험도를 제공하는 단계는,
상기 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험 확률을 산출하는 단계, 및
상기 균혈증 발병 위험 확률을 제공하는 단계를 포함하는, 균혈증 발병 위험도의 예측 방법.
The method of claim 12,
The step of providing the risk of developing bacteremia,
Calculating a risk of developing bacteremia for an individual by the bacteremia prediction model, and
A method for predicting the risk of developing bacteremia, comprising the step of providing a probability of developing the risk of bacteremia.
개체에 대한 생물학적 시험 데이터를 수신하도록 구성된 수신부, 및
상기 수신부와 연결된 프로세서를 포함하고,
상기 프로세서는, 상기 생물학적 시험 데이터를 기초로 상기 개체에 대한 균혈증 발병 위험도를 예측하도록 구성된 균혈증 예측 모델을 이용하여, 상기 개체의 균혈증 발병 위험도를 예측하도록 구성되고,
상기 생물학적 시험 데이터는,
크레아틴 (Creatinine) 수치, 알부민 (Albumin) 수치, CRP (Creactive protein) 수치, WBC (white blood cell) 최소 수치, WBC 최고 수치, 혈소판 (Platelet) 수, 프로트롬빈 (Prothrombin) 시간 중 적어도 하나 및 ALP (Alkaline phosphatase) 수치를 포함하는, 균혈증 발병 위험도의 예측용 디바이스.
A receiving unit configured to receive biological test data for an individual, and
Including a processor connected to the receiving unit,
The processor is configured to predict the risk of developing bacteremia of the subject using a bacteremia prediction model configured to predict the risk of developing bacteremia for the subject based on the biological test data,
The biological test data,
At least one of Creatinine, Albumin, CRP (Creactive Protein), WBC (white blood cell) minimum, WBC peak, platelet count, Prothrombin time, and ALP (Alkaline) A device for predicting the risk of developing bacteremia, including phosphatase) levels.
제15항에 있어서,
상기 수신부는, 개체에 대한 생체 신호 데이터를 수신하도록 더 구성되고,
상기 균혈층 예측 모델은,
상기 생물학적 시험 데이터 및 상기 생체 신호 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
싱기 생체 신호 데이터는,
SBP (systolic blood pressure), DBP (diastolic blood pressure), 최고 체온, 최저 체온, 심박수 및 호흡수 중 적어도 하나인, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The receiving unit is further configured to receive biometric signal data for the object,
The bacterial blood layer prediction model,
Further configured to predict a risk of developing bacteremia based on the biological test data and the biological signal data,
Singgi biosignal data,
SBP (systolic blood pressure), DBP (diastolic blood pressure), at least one of the highest body temperature, the lowest body temperature, heart rate and respiratory rate, a device for predicting the risk of bacteremia.
제15항에 있어서,
상기 수신부는 상기 개체에 대한 임상적 특징 데이터를 수신하도록 더 구성되고,
상기 균혈층 예측 모델은,
상기 생물학적 시험 데이터 및 상기 임상적 특징 데이터를 기초로 균혈증 발병 위험도를 예측하도록 더 구성되고,
싱기 임상적 특징 데이터는,
성별, 연령, 혈액 배양 기간, ICU (intensive care unit) 치료 여부, 중심 정맥 카테터 (Central venous catheter) 삽입 여부, 스테로이드 치료 여부 및 항생제 치료 여부 중 적어도 하나인, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The receiving unit is further configured to receive clinical feature data for the individual,
The bacterial blood layer prediction model,
Further configured to predict a risk of developing bacteremia based on the biological test data and the clinical characteristic data,
Singgi clinical characteristic data,
A device for predicting the risk of bacteremia, which is at least one of sex, age, blood culture period, intensive care unit (ICU) treatment, central venous catheter insertion, steroid treatment, and antibiotic treatment.
제15항에 있어서,
상기 생물학적 시험 데이터는,
상기 크레아틴 수치, 상기 알부민 수치, 상기 CRP 수치, 상기 WBC 최소 수치, 상기 WBC 최고 수치, 상기 프로트롬빈 시간 중 적어도 하나, 및 상기 혈소판 수, 상기 ALP 수치를 포함하는, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The biological test data,
The device for predicting the risk of bacteremia, including at least one of the creatine level, the albumin level, the CRP level, the WBC minimum level, the WBC maximum level, and the prothrombin time, and the platelet count and the ALP level.
제15항에 있어서,
상기 생물학적 시험 데이터는,
ALT (alanine aminotransferase) 수치, 트롬포플라스틴 (thromboplastin) 의 응고 시간, AST (aspartate aminotransferase) 수치, CRP (C-reactive protein) 수치, 적혈구 침강 속도, FERR (ferritin) 수치, HMG (hemoglobin) 수치, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), 적혈구 수치, TBIL (Total bilirubin) 수치, TCO2 (total carbon dioxide) 수치 및 백혈구 수치 중 적어도 하나를 더 포함하는, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The biological test data,
ALT (alanine aminotransferase) level, thromboplastin coagulation time, AST (aspartate aminotransferase) level, CRP (C-reactive protein) level, erythrocyte sedimentation rate, ferritin (FERR) level, hemoglobin (HMG) level, PTINR (Prothrombin Time International Normalized Ratio), PTPER (Prothrombin time (%)), PTSEC (Prothrombin time (sec)), red blood cell count, TBIL (total bilirubin) level, TCO 2 (total carbon dioxide) level, and white blood cell count A device for predicting the risk of developing bacteremia further comprising a.
제15항에 있어서,
상기 균혈증은, 급성 중증 균혈증 (acute severe bacteraemia) 인, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The bacteremia is acute severe bacteraemia, a device for predicting the risk of developing bacteremia.
제15항에 있어서,
상기 균혈증 예측 모델은,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), 및 복수의 모델의 조합으로 구성된 앙상블 모델, 선행 학습된 (pre-trained) 모델, Xgboost 모델 중 적어도 하나의 모델인, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The bacteremia prediction model,
MLP (multi-layer perceptron), SVM (support vector machine), RF (random forest), and an ensemble model consisting of a combination of a plurality of models, a pre-trained model, at least one of the Xgboost model , A device for predicting the risk of bacteremia.
제21항에 있어서,
상기 균혈증 예측 모델은,
상기 MLP 모델 또는 상기 Xgboost 모델이고,
상기 MLP 모델은 128 노드 (nodes) 또는 256 노드를 갖는 단일의 히든 레이어 (hidden layer) 를 포함하거나,
상기 단일의 히든 레이어가 복수로 존재하는 복수의 히든 레이어를 포함하는, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 21,
The bacteremia prediction model,
The MLP model or the Xgboost model,
The MLP model includes a single hidden layer having 128 nodes or 256 nodes,
A device for predicting the risk of bacteremia, including a plurality of hidden layers in which a plurality of the single hidden layers are present.
제15항에 있어서,
상기 균혈증 예측 모델은,
균혈증 발병 표본 개체 및 정상의 표본 개체에 대한 생물학적 실험 데이터, 생체 신호 데이터 및 임상적 특징 데이터로 구성된 학습용 데이터를 수신하고, 상기 학습용 데이터를 기초로, 균혈증 또는 정상을 예측하는 단계를 통해 학습된 모델이고,
상기 정상의 표본 개체는,
임상적으로 균혈증 발생되지 않고 균혈증이 아닌 것으로 평가된 개체인, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
The bacteremia prediction model,
A model trained by receiving data for learning consisting of biological experimental data, biosignal data, and clinical feature data for bacteremia-onset sample individuals and normal sample individuals, and predicting bacteremia or normality based on the training data ego,
The normal sample individual,
A device for predicting the risk of developing bacteremia, which is an individual that has not been clinically evaluated as bacteremia and not bacteremia.
제15항에 있어서,
상기 개체에 대하여 예측된 상기 균혈증 발병 위험도를 제공하도록 구성된 출력부를 더 포함하는, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 15,
A device for predicting the risk of developing bacteremia further comprising an output unit configured to provide the predicted risk of developing bacteremia for the individual.
제24항에 있어서,
상기 출력부는,
상기 균혈증 예측 모델에 의해 개체에 대한 균혈증 발병 위험도가 예측될 경우,
위험 알림을 제공하도록 구성된, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 24,
The output unit,
When the risk of developing bacteremia in an individual is predicted by the bacteremia prediction model,
A device for predicting the risk of developing bacteremia, configured to provide a risk notification.
제24항에 있어서,
상기 균혈증 예측 모델은,
상기 개체에 대한 균혈증 발병 위험 확률을 산출하도록 더 구성되고,
상기 출력부는,
상기 균혈증 발병 위험 확률을 제공하도록 더 구성된, 균혈증 발병 위험도의 예측용 디바이스.
The method of claim 24,
The bacteremia prediction model,
Further configured to calculate a probability of developing bacteremia for the subject,
The output unit,
A device for predicting the risk of developing bacteremia, further configured to provide a risk probability of developing bacteremia.
KR1020190097366A 2019-03-29 2019-08-09 Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same KR102287968B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20190036982 2019-03-29
KR1020190036982 2019-03-29

Publications (2)

Publication Number Publication Date
KR20200114975A true KR20200114975A (en) 2020-10-07
KR102287968B1 KR102287968B1 (en) 2021-08-09

Family

ID=72883932

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190097366A KR102287968B1 (en) 2019-03-29 2019-08-09 Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same

Country Status (1)

Country Link
KR (1) KR102287968B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117877649A (en) * 2023-12-05 2024-04-12 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) Marker group and system for predicting bacteremia of tumor patient

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522604A (en) * 2004-12-09 2008-07-03 イギリス国 Early detection of sepsis
JP2012502671A (en) * 2008-05-12 2012-02-02 アーリーセンス エルティディ Monitoring, prediction and treatment of clinical symptoms
KR20170023382A (en) * 2015-08-19 2017-03-03 한국전자통신연구원 Disease forecast device based on concentration information of biomaterial and forecasting method thereof

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008522604A (en) * 2004-12-09 2008-07-03 イギリス国 Early detection of sepsis
JP2012502671A (en) * 2008-05-12 2012-02-02 アーリーセンス エルティディ Monitoring, prediction and treatment of clinical symptoms
KR20170023382A (en) * 2015-08-19 2017-03-03 한국전자통신연구원 Disease forecast device based on concentration information of biomaterial and forecasting method thereof

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Athanasios Tsoukalas 외 2명, From Data to Optimal Decision Making: A Data-Driven, Probabilistic Machine Learning Approach to Decision Support for Patients With Sepsis, JMIR Med Inform 2015;3(1):e11 *
Bernard Hernanderz 외 7명, Supervised learning for infection risk inference using pathology data, BMC Medical Informatics and Decision Making (2017) 17:168 *
Cole Beeler, et al., Assessing patient risk of central line-associated bacteremia via machine learning, American Journal of Infection Control, Vol.46, Iss.9, September 2018, pp.986~991 *
Mical Paul, et al., Prediction of Bacteremia Using TREAT, a Computerized Decision-Support System, Clinical Infectious Diseases, Vol.42, Iss.9, 1 May 2006, pp.1274~1282 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117877649A (en) * 2023-12-05 2024-04-12 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) Marker group and system for predicting bacteremia of tumor patient
CN117877649B (en) * 2023-12-05 2024-05-31 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) Marker group and system for predicting bacteremia of tumor patient

Also Published As

Publication number Publication date
KR102287968B1 (en) 2021-08-09

Similar Documents

Publication Publication Date Title
Matthay et al. Phenotypes and personalized medicine in the acute respiratory distress syndrome
KR102183744B1 (en) Methods for pedicting risk of delirium and devices for pedicting risk of delirium using the same
KR102446376B1 (en) Method for predicting of mortality risk or sepsis risk and device for predicting of mortality risk or sepsis risk using the same
US20220323018A1 (en) Automatic prediction of blood infections
US20200113503A1 (en) Method For Predicting Of Mortality Risk Or Sepsis Risk And Device For Predicting Of Mortality Risk Or Sepsis Risk Using The Same
KR102257830B1 (en) Methods for pedicting mortality risk and devices for pedicting mortality risk using the same
US20230187067A1 (en) Use of clinical parameters for the prediction of sirs
Rodriguez et al. Supervised classification techniques for prediction of mortality in adult patients with sepsis
Schamoni et al. Leveraging implicit expert knowledge for non-circular machine learning in sepsis prediction
Hashem et al. Single stage and multistage classification models for the prediction of liver fibrosis degree in patients with chronic hepatitis C infection
Cheng et al. Machine learning models for predicting in-hospital mortality in patient with sepsis: Analysis of vital sign dynamics
Araújo et al. Prognosing the risk of COVID-19 death through a machine learning-based routine blood panel: a retrospective study in Brazil
KR102287968B1 (en) Method for predicting of bacteremia risk and device for predicting of bacteremia risk using the same
Effah et al. Machine learning-assisted prediction of pneumonia based on non-invasive measures
KR102310888B1 (en) Methods for providing information of mortality risk and devices for providing information of mortality risk using the same
Osatnik et al. Predictive performance of quick sequential organ failure assessment scoring in an Argentinian Hospital
Shakeri et al. Exploring features contributing to the early prediction of sepsis using machine learning
KR20190106004A (en) Method for predicting of mortality risk and device for predicting of mortality risk using the same
Chen et al. A retrospective observational study of the association between plasma levels of interleukin 8 in 42 patients with sepsis-induced myocardial dysfunction at a single center between 2017 and 2020
CN113017572B (en) Severe early warning method, apparatus, electronic device and storage medium
Eskandari et al. Detection of sepsis using biomarkers based on machine learning
Iqbal et al. Application of artificial intelligence to predict the sepsis in neonates admitted in neonatal intensive care unit
Chatchumni et al. Performance of the Simple Clinical Score (SCS) and the Rapid Emergency Medicine Score (REMS) to predict severity level and mortality rate among patients with sepsis in the emergency department
Umut et al. Prediction of sepsis disease by Artificial Neural Networks
Su et al. Four Biomarkers-Based Artificial Neural Network Model for Accurate Early Prediction of Bacteremia with Low-level Procalcitonin

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant