KR101955012B1 - System and method for predicting and analysis stroke - Google Patents

System and method for predicting and analysis stroke Download PDF

Info

Publication number
KR101955012B1
KR101955012B1 KR1020170039140A KR20170039140A KR101955012B1 KR 101955012 B1 KR101955012 B1 KR 101955012B1 KR 1020170039140 A KR1020170039140 A KR 1020170039140A KR 20170039140 A KR20170039140 A KR 20170039140A KR 101955012 B1 KR101955012 B1 KR 101955012B1
Authority
KR
South Korea
Prior art keywords
stroke
data
prediction
disease
class
Prior art date
Application number
KR1020170039140A
Other languages
Korean (ko)
Other versions
KR20180110310A (en
Inventor
유재학
박세진
무랄리
박홍규
유웅식
홍승희
표철식
Original Assignee
한국전자통신연구원
한국표준과학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원, 한국표준과학연구원 filed Critical 한국전자통신연구원
Priority to KR1020170039140A priority Critical patent/KR101955012B1/en
Publication of KR20180110310A publication Critical patent/KR20180110310A/en
Application granted granted Critical
Publication of KR101955012B1 publication Critical patent/KR101955012B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B45/00ICT specially adapted for bioinformatics-related data visualisation, e.g. displaying of maps or networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Pathology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Bioethics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

본 발명은 뇌졸중 조기발견 및 예측 시스템에 관한 것으로, 웨어러블 디바이스를 통해 실시간 생활 데이터를 수집하는 웨어러블 데이터 수집장치, 건강보험관리공단에서 제공하는 정보와 개인별 전자의무기록 데이터를 수집하는 이력 정보 데이터 수집장치, 상기 웨어러블 데이터 수집장치 및 상기 이력 정보 데이터 수집장치로부터 수집된 데이터를 이용하여 뇌졸중 질환을 발견 및 예측하는 뇌졸중 예측장치를 포함하며, 상기 뇌졸중 발견 및 예측장치는, 상기 웨어러블 데이터 및 상기 이력 정보 데이터를 전처리하여 통합하는 데이터 전처리부, 상기 데이터 전처리부에서 입력되는 데이터 중 앙상블 구조의 데이터를 선택하고, 선택된 데이터를 이용하여 다중의 기계학습 모델을 생성하고, 상기 다중의 기계학습 모델에 기초하여 뇌졸중을 예측하는 뇌졸중 실시간 발견 및 예측부를 포함할 수 있다.The present invention relates to an early detection and prediction system for stroke, which comprises a wearable data collection device for collecting real-time living data through wearable devices, a history information data collection device for collecting information provided by the health insurance management corporation and individual electronic medical record data And a stroke prediction device for detecting and predicting a stroke disease using data collected from the wearable data collection device and the history information data collection device, wherein the stroke detection and prediction device comprises: A data preprocessing unit for preprocessing and integrating data of an ensemble structure among the data input from the data preprocessing unit, generating multiple machine learning models using the selected data, and generating a plurality of machine learning models based on the multiple machine learning models, To predict A stroke real-time detection and prediction unit.

Figure R1020170039140
Figure R1020170039140

Description

뇌졸중 예측과 분석 시스템 및 방법{SYSTEM AND METHOD FOR PREDICTING AND ANALYSIS STROKE}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system and method for predicting stroke,

본 발명은 뇌졸중 예측 시스템 및 방법에 관한 것으로, 다중 기계학습 또는 계층적 다중 SVM을 이용하여 뇌졸중을 실시간으로 조기발견 및 예측할 수 있는 뇌졸중 예측 시스템 및 방법에 관한 것이다.The present invention relates to a stroke prediction system and method, and more particularly, to a stroke prediction system and method capable of early detection and prediction of stroke in real time using multi-machine learning or hierarchical multiple SVM.

사물인터넷(Internet of Things, 이하 IoT)보다 진보된 만물인터넷(Internet of Everything, 이하 IoE)은 우리 주변의 유형·무형의 사물들을 연결하고, 사람들에게 보다 편리하고 안전한 서비스를 제공하기 위한 기술 중 하나로 최근 다양한 분야에서 큰 관심을 받고 있다. 이러한 IoT/IoE 환경에서의 사물에 대한 범위는 일상생활을 하면서 접할 수 있는 사람, 자동차, 시계, 동·식물, 도로, 건물, 교량 등 자연 및 주변 환경을 이루는 물리적(physical) 사물들(Things)뿐만 아니라, 웹, 소셜 정보, 컴퓨터에 저장된 데이터베이스 등의 가상(Virtual)의 대상물도 광범위하게 포함될 수 있다.Internet of Things (IoT) The Internet of Everything (IoE) is one of the technologies to connect the tangible and intangible things around us and provide more convenient and safe services to people. Recently, there has been great interest in various fields. The range of things in the IoT / IoE environment is the physical things that make up the natural environment such as people, cars, clocks, plants, roads, buildings, bridges, In addition, a virtual object such as a web, a social information, a database stored in a computer, and the like can be widely included.

최근 IoT 및 IoE 기술은 기존의 인터넷 및 통신방법과 다르게, 다양한 사물들이 자율적으로 현재의 상황이나 적합한 서비스를 판단하고 상호 정보를 교환하며 새로운 방식의 서비스를 제공한다. IoT/IoE를 통해 제공되는 서비스로는 크게 사회적으로 발생할 수 있는 문제 해결을 지원하는 공공 IoT/IoE 서비스, 사람들의 편의성과 삶의 질을 위한 개인 IoT/IoE 서비스, 산업 및 제조업의 경쟁력 강화를 위한 산업 IoT/IoE 서비스 등으로 구분할 수 있으며, 그 밖에도 헬스케어, 농·수산업, 에너지 관리, 유통분야 등 다양한 분야에서 서비스 제공이 시도되고 있다.Recently, IoT and IoE technologies, unlike existing Internet and communication methods, autonomously judge current situation or appropriate services, exchange information with each other, and provide new services. Services offered through IoT / IoE include public IoT / IoE services to help solve societal problems, individual IoT / IoE services for people's convenience and quality of life, Industrial IoT / IoE service, etc. In addition, various services such as health care, agriculture / fisheries, energy management, and distribution are being provided.

한편, 세계질병부담연구(GBD)에 의하면, 1990년부터 2013년까지 20개 주요질환에 의한 사망률 분석에서 1위와 2위가 각각 허혈성 심장질환과 뇌졸중인 것으로 분석되었다. 뇌졸중 질환 발생에 따른 국내의 사회경제적 비용은 산출방식에 따라 차이가 있지만, 대략 2005년에 3조 7천억원, 2010년에는 4조 1500억원에 달하는 것으로 추산되고 있다. 특히, 뇌졸중 질환의 오진으로 골든타임 안에 적절한 조치를 하지 못하거나, 출혈성/허혈성 질환을 오진단하여 짧은 시간에 환자를 불구로 만들거나 사망에 이르게 할 가능성이 매우 크다. 이러한 오진률 관련하여 어지럼으로 발현한 후방부 뇌경색의 초기 진단 오류는 약 35% 정도로 높으며, 2009년 미국 시카고 쿡카운티 병원의 오진율 조사에 의하면 뇌졸중 질환 오진율이 상위 7위로 나타나고 있다. 따라서, 이러한 오진율 수치를 낮추고 뇌졸중 질환자의 발병 가능성을 예측하고 대비할 수 있는 기술 개발이 시급한 실정이다.According to the Global Disease Burden Study (GBD), in the analysis of mortality from 20 major diseases from 1990 to 2013, the first and second were analyzed as ischemic heart disease and stroke, respectively. It is estimated that domestic socio-economic costs due to the occurrence of stroke disease vary depending on the method of calculation, but it is estimated to reach 3,700 billion won in 2005 and 4,150 billion won in 2010. In particular, it is very likely that a stroke is misdiagnosed as a malady in the golden time, or that a hemorrhagic / ischemic disease is diagnosed as a misdiagnosis of a stroke, which leads to a patient's disability or death in a short time. Early diagnosis of posterior cerebral infarction with dizziness related to this rate of misdiagnosis is about 35%. In 2009, the rate of misdiagnosis of stroke disease was ranked in the top 7 according to the rate of misdiagnosis in the Cook County Hospital in Chicago, USA. Therefore, it is urgent to develop a technique to lower the false rate and to predict and manage the possibility of stroke patients.

국내외 연구문헌 조사에 의하면, 뇌졸중 질환에 대하여 장기적으로 발생 가능성을 예측하는 모델, 병원에서 뇌졸중의 중증도를 판단하는 모델, 뇌졸중 예후 예측 모델들에 대한 연구가 활발히 진행되고 있다. 특히, 뇌졸중 발생 장기 예측 모델은 Cox 모델(Wolf, et al., 1991), Weibull 모델(Carroll, 2003) 등이 제공되고 있으며, 기저 위험인자 정보를 이용하여 5년 또는 10년 뒤에 뇌졸중 발생 가능성을 제공하고 있다. 또한, 병원 또는 진료기관에서 뇌졸중 진단 및 치료에 소요되는 시간을 줄이기 위해 응급실 뇌졸중 인자 도구 및 선별도구 지침에 대한 연구 개발도 지속되고 있다.According to domestic and overseas research literature, studies are being actively conducted on models for predicting the long-term occurrence of stroke diseases, models for assessing the severity of stroke in hospitals, and prediction models of stroke prognosis. In particular, the long-term predictive model for stroke is provided by the Cox model (Wolf et al., 1991) and the Weibull model (Carroll, 2003) . In addition, research and development of the emergency room stroke parameterizing tool and screening tool instruction are being continued to reduce the time required for diagnosis and treatment of stroke in hospitals or medical institutions.

최근에는 환자 스스로 자각 증상을 판단하여 병원을 찾도록 하는 FAST 캠페인 등이 있지만, IoT/IoE 기술과 웨어러블 기기 또는 스마트 의료기기를 이용하여 급성 뇌졸중을 조기발견 하거나 예측하는 방법 및 그에 대한 장치는 아직 찾아보기 힘들다.In recent years, FAST campaigns have been conducted to determine patients' self-awareness symptoms and to find hospitals. However, there is still no method or method for early detection or prediction of acute stroke using IoT / IoE technology and wearable devices or smart medical devices It's hard to see.

본 발명의 일 실시예는 IoT/IoE 환경에서의 사람들의 행동과 주변 생활 환경, 개인별 진료(예를 들어, EMR) 이력 데이터 및 실시간 웨어러블 의료기기로부터 수집되는 웨어러블 데이터를 기반으로 급성 뇌졸중을 실시간으로 사전에 조기발견 및 발생 시점에 즉시 예측하여 뇌졸중 발병에 대처할 수 있는 뇌졸중 조기발견과 예측 시스템 및 방법을 제공하고자 한다.One embodiment of the present invention provides a method and system for diagnosing acute stroke in real time based on behavior of people in the IoT / IoE environment and surrounding living environment, individual medical care (e.g., EMR) history data and wearable data collected from real- The present invention provides an early detection and prediction system and method for early detection of stroke and prediction of stroke at the time of occurrence to cope with stroke.

다만, 본 실시 예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.It should be understood, however, that the technical scope of the present invention is not limited to the above-described technical problems, and other technical problems may exist.

상술한 기술적 과제를 달성하기 위한 기술적 수단으로서, 본 발명의 일 측면에 따른 뇌졸중 조기발견 및 예측 시스템은, 웨어러블 디바이스를 통해 실시간 생활 데이터를 수집하는 웨어러블 데이터 수집장치, 건강보험관리공단에서 제공하는 정보와 개인별 전자의무기록 데이터를 수집하는 이력 정보 데이터 수집장치, 상기 웨어러블 데이터 수집장치 및 상기 이력 정보 데이터 수집장치로부터 수집된 데이터를 이용하여 뇌졸중 질환을 예측하는 뇌졸중 발견 및 예측장치를 포함한다.According to one aspect of the present invention, there is provided an early detection and prediction system for stroke, comprising: a wearable data collection device for collecting real-time living data through a wearable device; A history information data collection device for collecting individual electronic medical record data, a wearable data collection device, and a stroke detection and prediction device for predicting a stroke disease using data collected from the history information data collection device.

이때, 상기 뇌졸중 발견 및 예측장치는, 상기 웨어러블 데이터 및 상기 이력 정보 데이터를 전처리하여 통합하는 데이터 전처리부, 상기 데이터 전처리부에서 입력되는 데이터 중 앙상블 구조의 데이터를 선택하고, 선택된 데이터를 이용하여 다중의 기계학습 모델을 생성하고, 상기 다중의 기계학습 모델에 기초하여 뇌졸중을 발견 및 예측하는 뇌졸중 실시간 발견 및 예측부를 포함할 수 있다.The stroke detection and prediction device may include a data preprocessing unit for preprocessing and integrating the wearable data and the hysteresis information data, a data preprocessing unit for selecting data of an ensemble structure among the data input from the data preprocessing unit, And a stroke real time detection and prediction unit for detecting and predicting a stroke based on the multiple machine learning models.

본 발명의 다른 측면에 따른 뇌졸중 조기발견 및 예측 시스템은, 웨어러블 디바이스를 통해 실시간 생활 데이터를 수집하는 웨어러블 데이터 수집장치, 건강보험관리공단에서 제공하는 정보와 개인별 전자의무기록 데이터를 수집하는 이력 정보 데이터 수집장치, 상기 웨어러블 데이터 수집장치 및 상기 이력 정보 데이터 수집장치로부터 수집된 데이터를 이용하여 뇌졸중 질환을 예측하는 뇌졸중 발견 및 예측장치를 포함한다.The system for early detection and prediction of stroke according to another aspect of the present invention includes a wearable data collection device for collecting real-time living data through a wearable device, a history information database for collecting information provided by the health insurance management corporation and individual electronic medical record data And a stroke finding and predicting device for predicting a stroke disease using the collected data, the wearable data collecting device, and the data collected from the history information data collecting device.

이때, 상기 뇌졸중 발견 및 예측장치는, 상기 웨어러블 데이터 및 상기 이력 정보 데이터를 전처리하여 통합하는 데이터 전처리부, 상기 데이터 전처리부에서 입력되는 데이터를 계층적 다중 SVM을 이용하여 뇌졸중 질환의 유형들로 자동 분류하여 뇌졸중을 예측하는 뇌졸중 실시간 발견 및 예측부를 포함할 수 있다.Here, the stroke detection and prediction apparatus may include a data preprocessing unit for preprocessing and integrating the wearable data and the history information data, and a data preprocessing unit for automatically inputting the data input from the data preprocessing unit into the types of stroke diseases using hierarchical multi- And a stroke real time detection and prediction unit for classifying and predicting a stroke.

본 발명의 다른 측면에 따른 뇌졸중 조기발견 및 예측 방법은, 웨어러블 디바이스를 통해 사용자의 일상 생활 데이터를 수집하는 단계, 클라우드 환경에 구축되어 있는 건강보험공단 및 전자의무기록의 이력 정보 데이터를 수집하는 단계, 상기 일상 생활 데이터 및 상기 이력 정보 데이터를 이용하여 뇌졸중을 발견 및 예측하는 단계, 뇌졸중 예측 결과를 분석하고, 분석 결과를 가시화하는 단계를 포함한다.According to another aspect of the present invention, there is provided a method for early detection and prediction of stroke, comprising the steps of collecting daily life data of a user through a wearable device, collecting history information data of health insurance corporation and electronic medical record established in a cloud environment , Finding and predicting a stroke using the daily life data and the history information data, analyzing a stroke prediction result, and visualizing the analysis result.

전술한 본 발명의 과제 해결 수단 중 어느 하나에 의하면, 본 발명에서는 본 발명에서는 이력 건강검진 데이터와 웨어러블 디바이스 데이터를 이용하여 다중 기계학습 기반으로 뇌졸중을 예측할 수 있을 뿐만 아니라, 계층적 다중 SVM을 이용하여 뇌졸중을 예측함으로써, 뇌졸중을 조기 발견할 수 있다.According to the present invention, in the present invention, not only can the stroke be predicted based on the multiple machine learning using the hysterical health examination data and the wearable device data, but also the hierarchical multiple SVM By predicting the stroke, it is possible to detect the stroke early.

본 발명에서의 데이터 큐브 모델인 Stroke 큐브는 시간, 장소, 질병종류, 질병원인이라는 4개의 차원으로 구성되며, 각 차원별로 추상화 정도에 따라서 다양한 OLAP 연산을 통하여 다차원적인 분석을 수행할 수 있다.The Stroke cube, which is a data cube model in the present invention, is composed of four dimensions of time, place, disease type, and disease cause. Multidimensional analysis can be performed through various OLAP operations according to the degree of abstraction for each dimension.

이러한 데이터 큐브를 기반으로, 본 발명에서는 뇌졸중 질환에 대한 다차원적인 분석 및 기간별 질환 성장도 분석을 통하여 뇌졸중 질환에 내재되어 있는 잠재적 패턴을 발견하고 제공할 수 있다.Based on such a data cube, the present invention can find and provide a potential pattern inherent in stroke disease through multidimensional analysis of stroke disease and analysis of disease growth rate by period.

더하여, 본 발명에서는 Stroke 큐브를 이용하여 보다 정확하고 신속하게 뇌졸중을 조기 발견할 수 있으며, 본 발명의 데이터 큐브는 뇌졸중 의사결정과 정책 입안의 과학적인 근거로 활용될 수 있다.In addition, according to the present invention, the stroke can be detected more quickly and accurately using the stroke cube, and the data cube of the present invention can be utilized as a scientific basis for stroke decision making and policy making.

도 1는 본 발명의 일 실시 예에 따른 뇌졸중 조기발견 및 예측 시스템의 구성도이다.
도 2는 도 1의 뇌졸중 실시간 발견 및 예측부의 다중 기계학습을 이용한 실시간 뇌졸중 조기발견 및 예측 방법을 설명하는 도면이다.
도 3은 도 1의 뇌졸중 실시간 발견 및 예측부의 계층적 다중 SVM을 이용한 실시간 뇌졸중 발견 및 예측 방법을 설명하기 위한 도면이다.
도 4는 뇌졸중을 포함한 다양한 질환에 대한 다차원 데이터 큐브인 Stroke큐브의 상세한 구성도이다.
도 5는 도 4의 데이터 큐브의 스타스키마 구성도이다.
도 6은 뇌졸중 질환의 다각적 분석을 위한 큐보이드 구성도이다.
도 7은 본 발명의 데이터 큐브 기반 뇌졸중 다각적 분석을 위한 연산 구성도이다.
도 8은 시간과 질병종류 차원에 대한 2차원 데이터 큐브 쿼리 결과도이다.
도 9는 도 8에서 Disease 차원에 대한 Drill-Down 연산 수행 결과도이다.
도 10은 Time 차원에 대한 개념계층 예시도이다.
도 11은 Location 차원에 대한 개념계층 예시도이다.
도 12는 Disease 차원에 대한 개념계층 예시도이다.
도 13은 Cause 차원에 대한 개념계층 예시도이다.
1 is a block diagram of a system for early detection and prediction of stroke according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining a real-time stroke detection and prediction method using multi-machine learning of the stroke detection and prediction unit of FIG. 1;
FIG. 3 is a diagram for explaining a real-time stroke detection and prediction method using the hierarchical multiple SVM of the stroke detection and prediction unit of FIG. 1;
Figure 4 is a detailed block diagram of a Stroke cube, which is a multidimensional data cube for various diseases, including stroke.
5 is a star schema diagram of the data cube of FIG.
6 is a QB void diagram for a multivariate analysis of stroke disease.
FIG. 7 is a block diagram of a data cube-based stroke multiscale analysis of the present invention.
Figure 8 is a two-dimensional data cube query result diagram for time and disease type dimensions.
FIG. 9 is a diagram illustrating a result of performing a Drill-Down operation on the Disease dimension in FIG.
10 is a conceptual hierarchical illustration of the Time dimension.
11 is a conceptual hierarchical illustration of a Location dimension.
Figure 12 is an exemplary conceptual hierarchy for the Disease dimension.
13 is an exemplary conceptual hierarchy for the Cause dimension.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시 예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings, which will be readily apparent to those skilled in the art. The present invention may, however, be embodied in many different forms and should not be construed as limited to the embodiments set forth herein. In order to clearly explain the present invention in the drawings, parts not related to the description are omitted.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다.Whenever a component is referred to as " including " an element throughout the specification, it is to be understood that the element may include other elements, not the exclusion of any other element, unless the context clearly dictates otherwise.

이하에서는, 도면을 참조하여 본 발명의 일 실시 예에 따른 뇌졸중 예측 시스템(1) 및 방법에 대하여 상세히 설명하도록 한다.Hereinafter, a stroke prediction system 1 and a stroke prediction method according to an embodiment of the present invention will be described in detail with reference to the drawings.

도 1는 본 발명의 일 실시 예에 따른 뇌졸중 예측 시스템(1)의 구성도이다.1 is a block diagram of a stroke prediction system 1 according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 뇌졸중 예측 시스템(1)은 웨어러블 데이터 수집장치(100), 이력 정보 데이터 수집장치(200), 뇌졸중 발견 및 예측장치(300), 뇌졸중 분석장치(400)를 포함한다.1, the stroke prediction system 1 includes a wearable data collection device 100, a history information data collection device 200, a stroke detection and prediction device 300, and a stroke analysis device 400 .

웨어러블 데이터 수집장치(100)는 웨어러블 디바이스 사용자의 일상 생활을 데이터로 수집하는 장치로서, 수면 데이터, 운전 중 데이터, 보행 데이터와 같이 일상 생활과 관련된 데이터를 웨어러블 디바이스를 통해 수집한다.The wearable data collecting apparatus 100 collects daily life of wearable device users as data. The wearable data collecting apparatus 100 collects data related to daily life such as sleep data, driving data, and walking data through a wearable device.

본 발명에서는 일상 생활 데이터를 수면, 운전, 보행으로 예시하였으나 본 발명은 이에 한정되지 않으며, 웨어러블 디바이스를 통해 수집될 수 있는 모든 데이터를 일상 생활 데이터로 수집할 수 있다.In the present invention, the daily life data is exemplified as sleeping, driving and walking, but the present invention is not limited to this, and all the data that can be collected through the wearable device can be collected as daily life data.

이력 정보 데이터 수집장치(200)는 클라우드 환경에 구축되어 있는 건강보험공단에서 제공하는 정보와 개인별 전자의무기록(EMR, Electronic Medical Record) 데이터를 수집한다.The history information data collection device 200 collects information provided by the health insurance corporation established in the cloud environment and individual electronic medical record (EMR) data.

뇌졸중 발견 및 예측 장치(300)는 실시간 생활 데이터 전처리부(310), 이력 진료 데이터 전처리부(320), 데이터 저장/관리부(330), 뇌졸중 실시간 발견 및 예측부(340), 예측모델 이력 저장부(350), 뇌졸중 예측 응급 알림부(360), 뇌졸중 예측 결과 저장부(370)를 포함한다.The stroke detection and prediction apparatus 300 includes a real-time living data preprocessing unit 310, a historical care data preprocessing unit 320, a data storage / management unit 330, a stroke real-time discovery and prediction unit 340, A stroke prediction emergency notification unit 360, and a stroke prediction result storage unit 370.

실시간 생활 데이터 전처리부(310)는 웨어러블 데이터 수집장치(100)에서 실시간으로 수집된 데이터를 전처리한 후, 데이터 저장/관리부(330) 및 뇌졸중 실시간 발견 및 예측부(340)로 전달한다.The real-time daily data preprocessing unit 310 preprocesses the data collected in real time in the wearable data collecting apparatus 100, and then transmits the preprocessed data to the data storage / management unit 330 and the stroke real-time detection and prediction unit 340.

이력 진료 데이터 전처리부(320)는 이력 정보 데이터 수집 장치(200)에서 입력된 데이터를 전처리한 후, 데이터 저장/관리부(300) 및 뇌졸중 실시간 발견 및 예측부(340)로 전달한다.The history medical care data preprocessing unit 320 preprocesses the data input from the history information data collection apparatus 200 and transmits the preprocessed data to the data storage / management unit 300 and the stroke real time detection and prediction unit 340.

이때, 전처리는 Missing Value Processing, Data Cleaning, Feature Selection, Attribute Subset Selection 등 일 수 있다.The pre-processing may be Missing Value Processing, Data Cleaning, Feature Selection, Attribute Subset Selection, and the like.

데이터 저장/관리부(330)는 실시간 생활 데이터 전처리부(310) 및 이력 진료 데이터 전처리부(320)에서 처리된 데이터를 저장하고, 저장된 데이터를 뇌졸중 데이터 분석장치(400)로 전달한다. 또한, 데이터 분석장치(400)로부터 분석 결과를 전달받아 저장할 수 있다.The data storage / management unit 330 stores the processed data in the real-time life data preprocessing unit 310 and the historical care data preprocessing unit 320, and transfers the stored data to the stroke data analysis apparatus 400. In addition, the analysis result can be received from the data analysis apparatus 400 and stored.

뇌졸중 실시간 발견 및 예측부(340)는 전처리 된 실시간 웨어러블 데이터와 이력 진료 데이터를 이용하여 뇌졸중 질환을 조기발견 및 예측하며, 질환의 예측결과는 예측모델 이력 저장부(350), 뇌졸중 예측 응급 알림부(360) 및 뇌졸중 예측결과 저장부(370)로 전달된다. 뇌졸중 실시간 발견 및 예측부(340)의 구성 및 동작에 대해서는 하기 도 2 및 도 3을 참조하여 보다 구체적으로 설명하도록 한다.The stroke real-time detection and prediction unit 340 detects and predicts a stroke disease using the preprocessed real-time wearable data and the history care data. The prediction result of the disease is stored in a predicted model history storage unit 350, (360) and the stroke prediction result storage unit (370). The construction and operation of the stroke real-time detection and prediction unit 340 will be described in more detail with reference to FIG. 2 and FIG.

예측모델 이력 저장부(350)는 기존에 저장되어 있던 복수의 예측모델을 뇌졸중 실시간 발견 및 예측부(340)로 전달하고, 뇌졸중 실시간 발견 및 예측부(340)로부터 질환의 예측결과를 모델 명세정보와 하이퍼 파라미터 등으로 전달 받아 예측모델에 대한 점증적(Incremental)/적응적(Adaptive) 업데이트를 수행한다.The prediction model history storage unit 350 delivers the plurality of prediction models that have been stored in advance to the stroke real time detection and prediction unit 340 and outputs the prediction results of the disease from the stroke real time detection and prediction unit 340 to the model specification information And hyper parameters to perform incremental / adaptive updating of the predictive model.

뇌졸중 예측 응급 알림부(360)는 뇌졸중 예측결과에 따라 병원방문 진료 또는 응급 알람 정보를 제공한다.The stroke prediction emergency notification unit 360 provides hospital visit medical care or emergency alarm information according to the stroke prediction result.

뇌졸중 예측결과 저장부(370)는 예측결과를 저장하고 이를 지식화하여 저장한다.The stroke prediction result storage unit 370 stores the prediction results, and stores the results of the prediction.

이때, 지식화는 기계학습의 연관관계규칙을 통한 규칙화, 의사결정나무를 통한 규칙화, RDF 또는 OWL 등의 시멘틱 규칙화 중 하나의 방법을 통해 구현될 수 있으며, 본 발명의 뇌졸중 예측결과 저장부(370)는 이에 한정되지 않고 다양한 방법을 통해 예측결과를 지식화할 수 있다.At this time, the knowledge can be implemented through one of the following methods: regularization through association rules of machine learning, regularization through decision tree, and semantic ruleization such as RDF or OWL. Unit 370 is not limited to this and can predict the prediction results through various methods.

뇌졸중 분석장치(400)는 뇌졸중의 예측 결과/지식 데이터와 데이터 전처리부를 통해 저장된 데이터를 뇌졸중 질환의 위험요인, 이에 대한 다각적 분석, 분석 결과에 대한 가시화 기능을 수행하여 사용자에게 제공한다.The stroke analyzer 400 provides the user with the data of the predicted stroke / knowledge data and the data stored through the data preprocessor by performing a visualization function of the risk factors of the stroke disease, various analyzes thereof, and analysis results thereof.

참고로, 본 발명의 실시 예에 따른 도 1에 도시된 구성 요소들은 소프트웨어 또는 FPGA(Field Programmable Gate Array) 또는 ASIC(Application Specific Integrated Circuit)와 같은 하드웨어 형태로 구현될 수 있으며, 소정의 역할들을 수행할 수 있다.1 may be implemented in hardware such as software or an FPGA (Field Programmable Gate Array) or ASIC (Application Specific Integrated Circuit), and may perform predetermined roles can do.

그렇지만 '구성 요소들'은 소프트웨어 또는 하드웨어에 한정되는 의미는 아니며, 각 구성 요소는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다.However, 'components' are not meant to be limited to software or hardware, and each component may be configured to reside on an addressable storage medium and configured to play one or more processors.

따라서, 일 예로서 구성 요소는 소프트웨어 구성 요소들, 객체지향 소프트웨어 구성 요소들, 클래스 구성 요소들 및 태스크 구성 요소들과 같은 구성 요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다.Thus, by way of example, an element may comprise components such as software components, object-oriented software components, class components and task components, processes, functions, attributes, procedures, Routines, segments of program code, drivers, firmware, microcode, circuitry, data, databases, data structures, tables, arrays, and variables.

구성 요소들과 해당 구성 요소들 안에서 제공되는 기능은 더 작은 수의 구성 요소들로 결합되거나 추가적인 구성 요소들로 더 분리될 수 있다.The components and functions provided within those components may be combined into a smaller number of components or further separated into additional components.

도 2는 도 1의 뇌졸중 실시간 발견 및 예측부(340)의 다중 기계학습을 이용한 실시간 뇌졸중 예측 방법을 설명하는 도면이다.FIG. 2 is a view for explaining a real-time stroke prediction method using multi-machine learning of the stroke detection and prediction unit 340 of FIG.

도 2에서 실시간 멀티모달 건강 데이터&빅데이터(Real-time Multi-modal Health Data & Big Data)는 실시간 생활 데이터 전처리부(310) 및 이력 진료 데이터 전처리부(320)에서 전처리된 데이터이다(S210). In FIG. 2, the real-time multi-modal health data and the big data are data preprocessed by the real-time life data preprocessing unit 310 and the historical care data preprocessing unit 320 (S210) .

뇌졸중 실시간 발견 및 예측부(340)는 전처리된 멀티모달 데이터 중 앙상블 구조의 다중 뇌졸중 조기발견 및 예측모델에 적합한 데이터를 선택한다. 뇌졸중 실시간 발견 및 예측부(340)는 모델 별로 학습 및 예측 가능한 데이터들이 결정되면, 해당 알고리즘은 기 구축 또는 저장해놓은 예측 모델의 하이퍼 파라미터 및 명세정보를 로드하여 Fine Tuning하게 학습하고 다중의 기계학습 모델을 생성한다(Multi-model Learning & Model Generator, S220). The stroke real time detection and prediction unit 340 selects data suitable for the multiple stroke early detection and prediction model of the ensemble structure among the preprocessed multimodal data. When learning and predictable data are determined for each model, the stroke real-time finding and predicting unit 340 loads the hyperparameter and specification information of the predictive model that has been built or stored, learns it by fine tuning, (Multi-model Learning & Model Generator, S220).

뇌졸중 실시간 발견 및 예측부(340)는 생성한 뇌졸중 질환 조기발견 및 예측모델을 취합하고, 서비스 또는 사용자 요구에 적합하게 최상의 모델 1개 또는 여러 개를 선택하여 다중 모델별 학습모델 생성과 이에 대한 결과를 통합한다(Result Combine & Majority Voting, S230). The stroke real-time detection and prediction unit 340 collects the early detection and prediction models of the stroke disease generated and selects one or more best models suitable for the service or the user's needs, (Result Combine & Majority Vote, S230).

마지막으로, 뇌졸중 실시간 발견 및 예측부(340)는 뇌졸중 예측 모델 중 최적의 모델을 선택하여 실시간으로 뇌졸중 질환 예측을 수행한다(Real-time Stroke Detection and Decision, S240). Finally, the real-time stroke detection and prediction unit 340 performs real-time stroke detection and decision (S240) by selecting an optimal model among the stroke prediction models.

여기서 선택된 모델은 예측성능이 우수하며 예측 과정이 설명될 수 없는 블랙박스(Black Box, 예시. SVM, ANN, RF, et al.) 모델일 수 있으며, 예측성능 보다는 예측 과정과 절차 설명이 가능한 화이트박스(White Box, 예시. Association Rule Mining, Decision Tree, et al.) 모델일 수 있다.The selected model may be a black box (eg, SVM, ANN, RF, et al.) Model, which has excellent prediction performance and can not be described in the prediction process. May be a model (White Box, Example, Association Rule Mining, Decision Tree, et al.).

도 2에 도시된 바와 같이, 뇌졸중 실시간 발견 및 예측부(340)는 다중 기계학습을 이용하여 실시간 뇌졸중을 조기발견 및 예측할 수 있다.As shown in FIG. 2, the stroke real-time detection and prediction unit 340 can detect and predict a real-time stroke using multi-machine learning.

도 3은 도 1의 뇌졸중 실시간 발견 및 예측부(340)의 계층적 다중 SVM을 이용한 실시간 뇌졸중 예측 방법을 설명하기 위한 도면이다.FIG. 3 is a view for explaining a real-time stroke prediction method using the hierarchical multiple SVM of the stroke detection and prediction unit 340 of FIG.

통계적 학습이론(Statistical Learning Theory)에 기반을 둔 SVM은 주어진 문제를 항상 전역적 최적해가 보장되는 Convex Quadratic Problem으로 변환하여 해를 구하기 때문에 패턴인식 분야에서 매우 우수한 성능을 보이고 있다. SVM의 기본 원리는 선형 분리가 가능한 문제에서부터 출발한다. d-차원의 입력데이터 xi 가 주어졌을 때 학습 데이터의 출력으로 {-1, +1}처럼 이진 값으로 구분되는 문제를 고려한다. 최적 경계 초평면이 학습 데이터의 분류 함수로 주어질 때, 초평면에서 학습 데이터와의 거리 r 은

Figure 112017030334072-pat00001
의 관계가 되고, 이 하한 값의 거리에 있는 데이터는 최적 경계 초평면과 가장 가까운 거리에 위치하게 된다. 이 데이터들을 Support Vector라고 부른다. 따라서, 최적 경계 초평면에 의해 분류되는 두 클래스간의 거리는
Figure 112017030334072-pat00002
가 되고, 이때 ρ를 분류 한도(Margin of Separation)라 정의한다.The SVM based on the Statistical Learning Theory (SVM) has shown excellent performance in the field of pattern recognition because it solves the problem by converting the given problem to the Convex Quadratic Problem which is always guaranteed the global optimal solution. The basic principle of SVM starts from the problem of linear separation. Given a d-dimensional input data x i , consider the problem that the output of the training data is divided into binary values such as {-1, +1}. When the optimal boundary hyperplane is given as a classification function of learning data, the distance r from the learning data to the hyperplane is
Figure 112017030334072-pat00001
And the data at the distance of the lower limit value is located at a distance closest to the optimal boundary hyperplane. These data are called Support Vector. Therefore, the distance between the two classes classified by the optimal boundary hyperplane is
Figure 112017030334072-pat00002
, Where ρ is defined as the Margin of Separation.

이진 분류기라는 SVM의 기능적 한계로 인하여, 주어진 문제가 현재 다루고자 하는 트래픽 분류와 같이 다중 분류 문제에는 SVM을 직접적으로 적용할 수가 없다. 그러므로 해당 클래스만을 독립적으로 표현하는 단일 클래스 분류기(One-class SVM)로서 결정 경계면을 선택하는 것이 다중 클래스 SVM의 설계 시 보다 유리하다. 따라서 본 발명에서는 단일 클래스 SVM의 대표적인 알고리즘인 Support Vector Data Description (SVDD)을 기반으로 다중 클래스 SVM를 설계하여 뇌졸중 질환의 유형들을 자동 분류하고 예측할 수 있는 새로운 장치를 제안한다.Due to the functional limitations of SVMs, called binary classifiers, SVMs can not be directly applied to multiple classification problems, such as the traffic classification that a given problem is currently dealing with. Therefore, it is more advantageous to design the decision boundary as a single-class SVM that independently represents the corresponding class than when designing a multi-class SVM. Accordingly, the present invention proposes a new device capable of automatically classifying and predicting types of strokes by designing a multi-class SVM based on Support Vector Data Description (SVDD), which is a typical algorithm of a single class SVM.

d-차원의 입력공간상에 존재하는 K-데이터의 집합

Figure 112017030334072-pat00003
가 주어졌을 경우, 각각의 클래스를 분류하기 위한 분류기는 각 클래스의 학습 데이터를 포함하면서 체적을 최소화하는 구체(Sphere)를 구하는 문제로 정의되며, 수학식 1의 최적화 문제를 통하여 수식화 된다.A set of K-data residing on the d-dimensional input space
Figure 112017030334072-pat00003
A classifier for classifying each class is defined as a problem of obtaining a sphere that minimizes the volume while including learning data of each class and is formulated through the optimization problem of Equation 1.

[수학식1][Equation 1]

Figure 112017030334072-pat00004
Figure 112017030334072-pat00004

여기에서,

Figure 112017030334072-pat00005
는 k-번째 클래스를 표현하는 구체의 중심이며,
Figure 112017030334072-pat00006
은 구체의 반경의 제곱,
Figure 112017030334072-pat00007
는 k-번째의 클래스에 속한 i-번째 학습 데이터가 구체에서 벗어나는 정도를 나타내는 벌점 항이며, C는 상대적 중요성을 조정하는 상수(Trade-off Constant)이다.From here,
Figure 112017030334072-pat00005
Is the center of the sphere representing the k-th class,
Figure 112017030334072-pat00006
Is the square of the radius of the sphere,
Figure 112017030334072-pat00007
Is a penalty term indicating the extent to which the i-th learning data belonging to the k-th class deviates from the sphere, and C is a constant that adjusts the relative importance.

수학식 2에서는 수학식 3에 관한 쌍대 문제(Dual Problem)을 구하기 위하여 라그랑제 함수(Lagrange Function) L을 도입한다.In Equation (2), a Lagrange Function L is introduced to obtain a dual problem (Equation 3).

[수학식 2]&Quot; (2) "

Figure 112017030334072-pat00008
Figure 112017030334072-pat00008

수학식 2는

Figure 112017030334072-pat00009
변수에 대해서는 최소값을 변수
Figure 112017030334072-pat00010
에 대해서는 최대값을 가져야하므로, 아래의 조건식인 수학식 3을 만족해야 한다.Equation (2)
Figure 112017030334072-pat00009
For the variables,
Figure 112017030334072-pat00010
, It is necessary to satisfy the following expression (3).

[수학식 3]&Quot; (3) "

Figure 112017030334072-pat00011
Figure 112017030334072-pat00011

수학식 3에서 라그랑제 함수 L에 대입하면, 아래 수학식 4의 쌍대 문제를 얻을 수 있다.Substituting into the Lagrangian function L in Equation (3), the following problem of Equation (4) can be obtained.

[수학식 4]&Quot; (4) "

Figure 112017030334072-pat00012
Figure 112017030334072-pat00012

입력 공간상에서 정의되는 구체는 매우 간단한 형태의 영역만을 나타낼 수 있다. 이러한 한계를 극복하기 위하여 커널 함수(Kernel Function) k를 통하여 정의된 고차원의 특징 공간(Feature Space) F 위에서 정의되는 구체를 사용하는 방향으로 확장될 수 있다. 각 사물 또는 서비스들의 독립적인 클래스는 각자의 특징공간에서 자신의 경계를 보다 정확하게 표현할 수 있으므로, 시스템(1)의 학습은 각각의 클래스들이 매핑되는 특징공간의 독립성을 고려하여 아래의 수학식 5에 해당되는 Convex QP(Quadratic Problem) 문제의 해답을 얻음으로써 이루어진다.Spheres defined on the input space can represent only very simple shapes. In order to overcome these limitations, it can be extended to use the sphere defined on the high dimensional feature space F defined through the kernel function k. Since the independent classes of objects or services can express their boundaries more accurately in their respective feature spaces, the learning of the system (1) can be expressed by Equation 5 below in consideration of the independence of the feature spaces to which the respective classes are mapped This is done by obtaining the corresponding Convex QP (Quadratic Problem) problem.

[수학식 5]&Quot; (5) "

Figure 112017030334072-pat00013
Figure 112017030334072-pat00013

특히 가우시안 커널(Gaussian Kernel)을 사용할 경우, k(x,x)=1 이 성립함으로 위의 수학식 5는 아래의 수학식 6과 같이 단순화 된다.Particularly, when k (x, x) = 1 is established when the Gaussian kernel is used, the above Equation (5) is simplified as shown in Equation (6) below.

[수학식 6]&Quot; (6) "

Figure 112017030334072-pat00014
Figure 112017030334072-pat00014

학습 종료 후 적용 과정에서, 각 사물 또는 서비스 클래스의 결정함수는 수학식 7과 같이 정의된다.In the application process after completion of the learning, the determination function of each object or service class is defined as shown in Equation (7).

[수학식 7]&Quot; (7) "

Figure 112017030334072-pat00015
Figure 112017030334072-pat00015

서로 다른 특징 공간상에서 정의되는 단일 SVM의 출력

Figure 112017030334072-pat00016
값은 각 클래스의 특징 공간상의 경계로부터 해당 테스트 데이터와의 절대 거리를 의미함으로, 서로 다른 특징 공간상의 절대거리를 비교하여 소속 클래스를 결정하는 것은 바람직하지 않다. 따라서 특징 공간상의 절대거리
Figure 112017030334072-pat00017
를 특징 공간상에서 정의되는 구형체의 반경
Figure 112017030334072-pat00018
로 나눔으로서 상대적 거리
Figure 112017030334072-pat00019
을 계산하고, 상대거리가 가장 큰 클래스를 입력 데이터 x의 소속 클래스로 결정한다(아래의 수학식 8 참조).Output of a single SVM defined on different feature spaces
Figure 112017030334072-pat00016
Value means the absolute distance to the test data from the boundary in the feature space of each class, so it is not preferable to determine the belonging class by comparing absolute distances on different feature spaces. Therefore, the absolute distance on the feature space
Figure 112017030334072-pat00017
The radius of the spherical body defined in the feature space
Figure 112017030334072-pat00018
As a result,
Figure 112017030334072-pat00019
And determines the class having the largest relative distance as the belonging class of the input data x (see Equation 8 below).

[수학식 8]&Quot; (8) "

Figure 112017030334072-pat00020
Figure 112017030334072-pat00020

이와 같은 과정에 따라, 도 3에서의 건강 데이터(P1)를 기반으로, SVM을 통해 먼저 정상과 뇌졸중인지 여부를 판별하게 되고(S310), 뇌졸중으로 판별된 경우 뇌졸중의 타입이 무엇인지 분류한다(S320). 그 다음 각 뇌졸중 타입 별로 구체적인 뇌졸중을 분류할 수 있다(S330). Based on the health data P1 shown in FIG. 3, the SVM determines whether the patient is normal and stroke (S310). If the stroke is determined to be normal, the type of stroke is classified S320). The specific stroke can then be categorized for each type of stroke (S330).

상기 도 2 및 도 3에 도시된 바와 같이, 본 발명에서는 이력 건강검진 데이터와 웨어러블 디바이스 데이터를 이용하여 다중 기계학습 기반으로 뇌졸중을 예측할 수 있을 뿐만 아니라, 계층적 다중 SVM을 이용하여 뇌졸중을 예측함으로써, 뇌졸중을 조기 발견할 수 있다.As shown in FIGS. 2 and 3, in the present invention, not only the stroke can be predicted based on the multi-machine learning using the history health examination data and the wearable device data, but also the stroke is predicted using the hierarchical multiple SVM , And stroke can be detected early.

또한, 본 발명에서는 뇌졸중의 조기발견 및 예측결과를 저장하고 지식화함으로써, 뇌졸중 질환에 대한 위험요인 및 다차원적 분석을 수행할 수 있다.In addition, according to the present invention, risk factors and multidimensional analysis of stroke diseases can be performed by storing and knowledge of early detection and prediction results of stroke.

뇌졸중 질환에 대한 위험요인 및 다차원적 분석은 도 1의 뇌졸중 분석장치에서 시행되며, 하기 도 4 내지 도 13을 참조하여 보다 구체적으로 설명하도록 한다.Risk factors and multidimensional analysis for the stroke disease are performed in the stroke analyzer of FIG. 1, and will be described in more detail with reference to FIGS. 4 to 13.

도 4는 뇌졸중을 포함한 다양한 질환에 대한 다차원 데이터 큐브(P2)의 구성도이고, 도 5는 도 4의 데이터 큐브(P2)의 스타스키마 구성도이다. FIG. 4 is a diagram of a multidimensional data cube P2 for various diseases including stroke, and FIG. 5 is a star schema diagram of the data cube P2 of FIG.

뇌졸중 분석장치(400)는 실시간 웨어러블 디바이스 데이터와 장기간에 걸쳐 축척 된 뇌졸중 관련 질환 데이터에 내재되어 있는 잠재적 패턴 또는 지식을 발견하여, 뇌졸중 질환의 예측 및 조기발견 정확도를 높이기 위해서 다각적 분석이 가능한 데이터 큐브 모델(P2)을 구축할 수 있다.The stroke analyzer 400 detects a potential pattern or knowledge inherent in real-time wearable device data and stroke-related disease data accumulated over a long period of time, and provides a data cube capable of performing various analyzes in order to increase the accuracy of prediction and early detection of stroke disease The model P2 can be constructed.

도 4에 도시된 바와 같이, 데이터 큐브(P2)는 뇌질환을 비롯한 다양한 질환을 대상으로 구축될 수 있으며, 개념 계층구조의 추상화 정도에 따른 다차원적 분석을 실시할 수 있다.As shown in FIG. 4, the data cube P2 can be constructed for various diseases including brain disease, and can perform multidimensional analysis according to the level of abstraction of the concept hierarchy.

데이터 큐브(P2)는 데이터들이 여러 개의 차원으로 모델링 될 수 있는 구조로서, 차원(Dimension)과 사실(Fact)로 정의된다. 본 발명에서는 일 예로서 시간(Time), 장소(Location), 질병 종류(Disease), 질병 원인(Cause)이라는 4개의 차원으로 구성되며, 각 차원의 추상화 정도에 따라 다양한 OLAP(On-Line Analytical Processing) 연산으로 분석을 수행할 수 있다. 사실 테이블은 4개의 차원들에 대하여 각각의 키(Key)로써 연결된다. 본 발명에서 새롭게 제안하는 StrokeCube로 명명된 데이터 큐브 모델(P2)은 4개의 차원 테이블과 3개의 사실 테이블로 구성하였으며, 4개 차원의 조합에 따라 사실테이블의 뇌졸중 질환 발생 수, 뇌졸중 위험도, 질병 분석 값을 척도(Measure) 값으로 분석하여 제공된다. 본 발명에서는 스타 스키마(Star Schema)를 다차원 분석 모델로 사용하였으며, 데이터 큐브(P2)를 위한 스타 스키마는 도 5와 같이 표현될 수 있다.The data cube P2 is a structure in which data can be modeled into several dimensions, and is defined as a dimension and a fact. In the present invention, as an example, it is composed of four dimensions such as Time, Location, Disease, and Cause, and various On-Line Analytical Processing (OLAP) ) Operation can be performed. The fact table is connected to each of the four dimensions by a respective key. The data cube model (P2) named as StrokeCube newly proposed in the present invention is composed of four dimension tables and three fact tables. According to the combination of four dimensions, the number of strokes of the fact table, the risk of stroke, The value is provided by analyzing as a measure value. In the present invention, a star schema is used as a multidimensional analysis model, and a star schema for the data cube P2 can be expressed as shown in FIG.

도 5에서, 척도로 정의한 stroke count는 뇌졸중 발생 건수를 계산하는 측도로 시간별, 지역별, 위험요인별 발생 빈도를 분석하여 제공한다. Level of Stroke는 뇌졸중 예측에 대한 위험도 레벨에 대한 평가 측도로, 저위험군에서 고위험군으로 위험 정도를 알려주는 척도이다(예시. 저위험군 level 1 ~ 고위험군 level 5). 마지막으로, Disease Analysis 척도는 뇌졸중 발생 원인 및 요인에 대한 분석 정보를 제공하는 척도를 의미한다.In FIG. 5, the stroke count defined as the scale is a measure for calculating the number of stroke occurrences, and is provided by analyzing the frequency of occurrence by time, region, and risk factors. Level of stroke is an assessment of the level of risk for stroke predictions and is a measure of the degree of risk from low to high risk (eg, low-risk group 1 to high-risk group 5). Finally, the Disease Analysis scale is a measure that provides information on the causes and causes of stroke.

이와 같이, 본 발명에서 제안하는 데이터 큐브(P2)는 뇌졸중 질환에 대한 예측과 조기발견을 위한 의사결정과 뇌졸중 관련 정책 입안의 과학적 근거로 활용될 수 있다.As described above, the data cube P2 proposed by the present invention can be used as a scientific basis for decision-making and stroke-related policy making for prediction and early detection of stroke disease.

도 6은 뇌졸중 질환의 다각적 분석을 위한 큐보이드 구성도이다. 6 is a QB void diagram for a multivariate analysis of stroke disease.

도 6에 도시된 바와 같이, 본 발명의 뇌졸중 분석장치(400)는 주어진 차원들(Time, Location, Disease, Cause)의 집합으로 큐보이드(Cuboid) 격자(Lattice)를 구축하였으며, 각 큐보이드는 서로 다른 단계에서 뇌졸중 발생 건수와 위험도 및 원인 분석 결과를 제공한다.As shown in FIG. 6, the stroke analyzer 400 of the present invention constructs a cubeoid lattice as a set of given dimensions (Time, Location, Disease, Cause) Provide the number of strokes, risk, and cause analysis at different stages.

가장 낮은 수준의 요약을 의미하며, 가장 높은 수준의 요약을 갖는 0차원 큐보이드를 정점 큐보이드(Apex Cuboid)라 한다.The lowest-level summary is the highest level summary, and the 0-dimensional QB void is called the Apex Cuboid.

도 7은 본 발명의 데이터 큐브 기반 뇌졸중 다각적 분석을 위한 연산 구성도이다.FIG. 7 is a block diagram of a data cube-based stroke multiscale analysis of the present invention.

도 7에서 도시된 바와 같이, 데이터 분석 장치(400)의 OLAP는 방대한 양의 이력데이터를 관리, 요약(Summarization), 집계(Aggregation)하기 위한 도구를 제공한다. 이러한 OLAP은 뇌졸중 질환의 예측 및 다각적 분석 목적에 따라 요약과 집계 결과를 선택한 차원에 따라 다양한 관점에서 보여줄 수 있다. 본 발명에서는 롤-업(Roll-Up), 드릴-다운(Drill-Down), 다이스(Dice)와 슬라이스(Slice) 등의 다양한 OLAP 연산을 이용하여 다차원적인 분석을 수행할 수 있다.As shown in FIG. 7, the OLAP of the data analysis apparatus 400 provides a tool for managing, summarizing, and aggregating a large amount of historical data. These OLAPs can be summarized and aggregated according to the selected dimension according to the purpose of prediction and multivariate analysis of stroke disease. In the present invention, a multi-dimensional analysis can be performed using various OLAP operations such as roll-up, drill-down, dice, and slice.

롤-업 연산은 선택한 차원에 대한 개념계층을 따라 올라가거나 차원 축소에 의하여 데이터 큐브에 대한 집계를 수행하는 연산이다. A roll-up operation is an operation that goes up a concept hierarchy for a selected dimension or performs an aggregation on a data cube by dimension reduction.

드릴-다운 연산은 롤-업의 반대 연산으로, 선택한 차원의 정보를 더욱 상세히 제공하는 연산을 의미한다. A drill-down operation is an operation that is an inverse operation of a roll-up, which means an operation that provides more detailed information of the selected dimension.

다이스 연산은 2개 또는 그 이상의 차원을 선택하여 부분적인 큐브를 만들어주는 연산이며, 슬라이스 연산은 주어진 큐브에서 한 차원을 선택하여 부분적인 큐브를 만드는 연산을 의미한다.A die operation is an operation that selects two or more dimensions to create a partial cube. A slice operation is an operation to select a dimension from a given cube to create a partial cube.

도 8은 시간과 질병종류 차원에 대한 2차원 데이터 큐브 쿼리 결과도이다.Figure 8 is a two-dimensional data cube query result diagram for time and disease type dimensions.

뇌졸중 분석장치(400)는 하기 쿼리식1과 같이 질의한 결과에 대해 도 8과 같은 분석 데이터를 제공할 수 있다.The stroke analyzer 400 may provide the analysis data as shown in FIG. 8 for the query result as shown in the following query equation (1).

[쿼리식 1][Query expression 1]

Dice for Time = “January 2015 ~ December 2015” AND Dice for Time = "January 2015 ~ December 2015" AND

Disease = “ALL” AND Measure = “stroke count”Disease = "ALL" AND Measure = "stroke count"

도 8은 쿼리식 1의 질의인 time, disease의 2차원에 대하여 나타내고 있으며, 도 8에서 표기된 사실, 즉 척도는 Stroke Count 값이다. FIG. 8 shows the two dimensions of time and disease, which are the queries of the query expression 1, and the fact shown in FIG. 8, that is, the scale is the stroke count value.

이때, 본 발명은 Stroke Count에 한정하지 않고 Disease Count까지 포함될 수 있다.At this time, the present invention is not limited to the stroke count but may include the Disease Count.

도 9는 도 8에서 Disease 차원에 대한 Drill-Down 연산 수행 결과도이다.FIG. 9 is a diagram illustrating a result of performing a Drill-Down operation on the Disease dimension in FIG.

뇌졸중 분석장치(400)는 도 8의 쿼리 결과에 대하여 하기 쿼리식 2와 같이 질의한 후 도 9와 같은 분석 데이터를 제공할 수 있다.The stroke analyzer 400 may query the query result of FIG. 8 as shown in the following query expression 2 and provide analysis data as shown in FIG.

[쿼리식 2][Query expression 2]

Dice for Time = “April and October and November in 2015” AND Dice for Time = "April and October and November in 2015" AND

Disease = “each disease types” AND Measure = “stroke count”Disease = "each disease types" AND Measure = "stroke count"

쿼리식 2에 따라, 뇌졸중 분석장치(400)는 Disease 차원에 대한 Drill-Down 연산을 수행하고, 질병 발생 빈도수가 많은 3월과 10월, 11월에 대하여 Dice 연산하여 도 9와 같은 분석 결과를 제공한다.According to the query equation 2, the stroke analyzer 400 performs a Drill-Down operation on the Disease dimension, calculates Dice for the March, October, and November cases in which the disease occurrence frequency is large, to provide.

도 9의 분석 결과로 인해, 계절별로 발생하는 질병 현황이 다름을 확인할 수 이으며, 특정 질환 이력자 및 발생 가능성이 높은 고령자들에게 사전 알람 및 주의 경보를 제공할 수도 있다.As a result of the analysis in FIG. 9, it can be confirmed that the disease condition occurring by the season is different, and it is also possible to provide a pre-alarm and a warning alarm for a specific disease history person and a highly likely elderly person.

데이터 분석 장치(400)의 개념계층(Concept Hierarchy)은 하위 개념 집합으로부터 상위 개념 집합까지 일반적인 개념들의 사상이 연속적으로 매핑되는 것을 의미한다(A Sequence of Mapping). 이러한 개념계층에 대해서 도 10 내지 도 13에 예시한다.The concept hierarchy of the data analysis apparatus 400 means that consecutive mappings of general concepts from a lower concept set to a higher concept set are mapped (A Sequence of Mapping). This concept hierarchy is illustrated in Figures 10-13.

도 10은 시간(Time) 차원에 대한 개념계층 예시도이고, 도 11은 장소(Location) 차원에 대한 개념계층 예시도이고, 도 12는 Disease 차원에 대한 개념계층 예시도이고, 도 13은 Cause 차원에 대한 개념계층 예시도이다.FIG. 10 is a concept hierarchy diagram for a time dimension, FIG. 11 is an concept hierarchy diagram for a location dimension, FIG. 12 is an concept hierarchy diagram for a Disease dimension, FIG.

도 10에 도시된 바와 같이, 시간 차원 테이블에서의 속성들은 부분순서(Partial Order)를 갖는 격자(lattice) 구조로서, 시간 차원에 대한 개념계층은 하위 개념인 10 분(minutes)로부터 < 시(hour) < 일(day) < {월(month), 분기(quarter); 주(week)} < 년(year)의 상위 개념을 갖는 계층으로 정의하였다.As shown in FIG. 10, the attributes in the time dimension table are lattice structures having a partial order, and the concept hierarchy for the time dimension is changed from the sub-concept 10 minutes to hour ) <Day (<month, quarter; Week (week)} <year (year).

도 11에 도시된 장소(Location) 차원에 대한 개념계층은 최하위 집(Home) 로부터 국가를 포함하는’모두(all)에 이르는 계층적 트리 구조로 정의하였다.The concept hierarchy for the location dimension shown in FIG. 11 is defined as a hierarchical tree structure ranging from the lowest hierarchical level (home) to the 'all' including the country.

도 12에 도시된 질병(Disease) 차원에 대한 개념계층은 질병 종류에 대한 개념계층으로, 질병 유형에 대한 분류 정보를 기반의 하위 개념부터 각 질병에 대한 최상위 개념인 Specific Types 계층으로 정의하였다.The concept hierarchy for the Disease dimension shown in FIG. 12 is defined as a concept hierarchy for disease types, and a subtype based on classification information for disease types and a Specific Types hierarchy for each disease.

도 13에 도시된 질병원인(Cause) 차원에 대한 개념계층은 질병 원인들에 대한 유형별 개념계층으로, 하위 개념인 ‘각 질병원인 타입(Each Cause Types)’ 레이어에서 ‘제어 타입(Control Types)’ 레이어 개념으로 매핑되는 구조를 갖도록 정의하였다.The concept hierarchy for the cause cause (Cause) dimension shown in FIG. 13 is a conceptual hierarchy for the types of disease causes, and a 'Control Types' in the subordinate concept 'Each Cause Types' Layer concept is defined.

이와 같이, 본 발명에서 StrokeCube로 명명된 데이터 큐브는 시간, 장소, 질병종류, 질병원인이라는 4개의 차원으로 구성되며, 각 차원별로 추상화 정도에 따라서 다양한 OLAP 연산을 통하여 다차원적인 분석을 수행할 수 있다.Thus, in the present invention, a data cube named StrokeCube is composed of four dimensions of time, place, disease type, and disease cause, and multidimensional analysis can be performed through various OLAP operations according to the degree of abstraction for each dimension .

이러한 데이터 큐브를 기반으로, 본 발명에서는 뇌졸중 질환에 대한 다차원적인 분석 및 기간별 질환 성장도 분석을 통하여 뇌졸중 질환에 내재되어 있는 잠재적 패턴을 발견하고 제공할 수 있다.Based on such a data cube, the present invention can find and provide a potential pattern inherent in stroke disease through multidimensional analysis of stroke disease and analysis of disease growth rate by period.

더하여, 본 발명에서는 StrokeCube로 명명된 데이터 큐브를 이용하여 보다 정확하고 신속하게 뇌졸중을 조기 발견할 수 있으며, 본 발명의 데이터 큐브는 뇌졸중 의사결정과 정책 입안의 과학적인 근거로 활용될 수 있다.In addition, according to the present invention, a stroke can be detected more accurately and quickly using a data cube named StrokeCube, and the data cube of the present invention can be used as a scientific basis for stroke decision making and policy making.

본 발명의 일 실시 예에 따른 뇌졸중 예측 방법은 컴퓨터에 의해 실행되는 매체에 저장된 컴퓨터 프로그램 또는 컴퓨터에 의해 실행 가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다. The stroke prediction method according to an embodiment of the present invention may be implemented in the form of a computer program stored in a medium executed by a computer or a recording medium including instructions executable by the computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable medium may include both computer storage media and communication media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. Communication media typically includes any information delivery media, including computer readable instructions, data structures, program modules, or other data in a modulated data signal such as a carrier wave, or other transport mechanism.

본 발명의 방법 및 장치는 특정 실시 예와 관련하여 설명되었지만, 그것들의 구성 요소 또는 동작의 일부 또는 전부는 범용 하드웨어 아키텍쳐를 갖는 컴퓨터 시스템을 사용하여 구현될 수 있다.While the methods and apparatus of the present invention have been described with reference to particular embodiments, some or all of those elements or operations may be implemented using a computer system having a general purpose hardware architecture.

전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.It will be understood by those skilled in the art that the foregoing description of the present invention is for illustrative purposes only and that those of ordinary skill in the art can readily understand that various changes and modifications may be made without departing from the spirit or essential characteristics of the present invention. will be. It is therefore to be understood that the above-described embodiments are illustrative in all aspects and not restrictive. For example, each component described as a single entity may be distributed and implemented, and components described as being distributed may also be implemented in a combined form.

본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.

100: 웨어러블 데이터 수집장치
200: 이력 정보 데이터 수집장치
300: 뇌졸중 발견 및 예측장치
310: 실시간 생활 데이터 전처리부
320: 이력 진료 데이터 전처리부
330: 데이터 저장/관리부
340: 뇌졸중 실시간 발견 및 예측부
350: 예측모델 이력 저장부
360: 뇌졸중 예측 응급 알림부
370: 뇌졸중 예측 결과 저장부
400: 뇌졸중 분석장치
100: Wearable data collecting device
200: History information data collection device
300: stroke detection and prediction device
310: Real-time daily data preprocessing unit
320: Historical care data preprocessing section
330: Data storage / management unit
340: stroke real time detection and prediction unit
350: prediction model history storage unit
360: Stroke prediction emergency notification unit
370: Stroke prediction result storage unit
400: Stroke analyzer

Claims (19)

뇌졸중 조기발견 및 예측 시스템에 있어서,
웨어러블 디바이스를 통해 실시간 생활 데이터를 수집하는 웨어러블 데이터 수집장치,
건강보험관리공단에서 제공하는 정보와 개인별 전자의무기록 데이터를 수집하는 이력 정보 데이터 수집장치, 및
상기 웨어러블 데이터 수집장치 및 상기 이력 정보 데이터 수집장치로부터 수집된 데이터를 이용하여 뇌졸중 질환을 발견 및 예측하는 뇌졸중 발견 및 예측장치를 포함하며,
상기 뇌졸중 발견 및 예측장치는,
상기 웨어러블 데이터 및 상기 이력 정보 데이터를 전처리하여 통합하는 데이터 전처리부, 및
상기 데이터 전처리부에서 입력되는 데이터 중 앙상블 구조의 데이터를 선택하고, 선택된 데이터를 이용하여 다중의 기계학습 모델을 생성하고, 상기 다중의 기계학습 모델에 기초하여 뇌졸중을 예측하는 뇌졸중 실시간 발견 및 예측부를 포함하며,
상기 뇌졸중 실시간 발견 및 예측부는 상기 다중의 기계학습 모델로 단일 클래스 SVM의 Support Vector Data Description(SVDD) 알고리즘을 기반으로 하는 다중 클래스 SVM을 적용하고,
상기 다중 클래스 SVM은 d-차원의 입력 공간 상에 존재하는 입력 데이터의 집합에 대하여 각 클래스를 분류하기 위한 분류기를 포함하되, 상기 분류기는 각 클래스의 학습 데이터를 포함하면서 체적을 최소화하며 커널 함수를 통하여 정의된 특징 공간 상에서의 구체를 정의하며,
상기 특징 공간 상의 경계로부터 해당 데이터와의 절대거리를 상기 특징 공간 상에서 정의되는 상기 구체의 반경으로 나눔으로써 산출되는 상대 거리가 가장 큰 클래스를 상기 입력 데이터의 소속 클래스로 결정하는 것인 뇌졸중 조기발견 및 예측 시스템.
In a stroke early detection and prediction system,
A wearable data collecting device for collecting real-time living data through a wearable device,
A history information data collection device for collecting information provided by the health insurance management corporation and individual electronic medical record data, and
And a stroke detection and prediction device for detecting and predicting a stroke disease using data collected from the wearable data collection device and the history information data collection device,
The stroke finding and predicting device comprises:
A data preprocessing unit for preprocessing and integrating the wearable data and the history information data,
And a stroke real time detection and prediction unit for generating a plurality of machine learning models using the selected data and predicting a stroke based on the multiple machine learning models, &Lt; / RTI &
The stroke real-time detection and prediction unit applies the multi-class SVM based on the support vector data description (SVDD) algorithm of the single class SVM as the multiple machine learning model,
The multi-class SVM includes a classifier for classifying each class with respect to a set of input data existing on a d-dimensional input space, the classifier minimizing the volume while including learning data of each class, Defines a sphere on a defined feature space,
Determining a class having the largest relative distance calculated by dividing the absolute distance from the boundary on the feature space by the radius of the sphere defined in the feature space as a belonging class of the input data; Prediction system.
제1항에 있어서,
상기 뇌졸중 발견 및 예측장치는,
복수의 예측모델이 저장되어 있으며, 상기 뇌졸중 실시간 발견 및 예측부로부터 모델 명세정보와 하이퍼 파라미터를 전달 받아 예측 모델에 대한 점증적, 적응적 업데이트를 수행하는 예측모델 이력 저장부를 더 포함하며,
상기 뇌졸중 실시간 발견 및 예측부는 상기 예측모델 이력 저장부로부터 상기 모델 명세정보와 하이퍼 파라미터를 로드하여 Fine Tuning하게 학습하여 상기 다중의 기계학습 모델을 생성하는 뇌졸중 조기발견 및 예측 시스템.
The method according to claim 1,
The stroke finding and predicting device comprises:
Further comprising a prediction model history storage unit storing a plurality of prediction models and performing cumulative and adaptive updating of the prediction models by receiving model specification information and hyper parameters from the stroke real time detection and prediction unit,
Wherein the stroke real time detection and prediction unit loads the model specification information and the hyperparameter from the prediction model history storage unit and learns fine tuning to generate the multiple machine learning models.
제2항에 있어서,
상기 뇌졸중 실시간 발견 및 예측부는 상기 다중의 기계학습 모델의 생성과 이에 대한 결과를 통합하고, 상기 다중의 기계학습 모델 중 예측 성능이 가장 높은 모델을 선택하여 실시간으로 뇌졸중 질환의 발견 및 예측을 수행하는 뇌졸중 조기발견 및 예측 시스템.
3. The method of claim 2,
The stroke real-time detection and prediction unit integrates the results of the generation of the multiple machine learning models and the results thereof, and performs the detection and prediction of the stroke disease in real time by selecting a model having the highest prediction performance among the multiple machine learning models Early detection and prediction systems for stroke.
제2항에 있어서,
상기 뇌졸중 실시간 발견 및 예측부는 상기 다중의 기계학습 모델의 생성과 이에 대한 결과를 통합하고, 상기 다중의 기계학습 모델 중 예측 과정과 절차 설명이 가능한 모델을 선택하여 실시간으로 뇌졸중 질환 예측을 수행하는 뇌졸중 조기발견 및 예측 시스템.
3. The method of claim 2,
Wherein the stroke real-time detection and prediction unit integrates the multiple machine learning models and the results thereof, selects a model capable of describing the prediction process and the procedure among the multiple machine learning models, and calculates a stroke Early detection and prediction systems.
제1항에 있어서,
상기 뇌졸중 발견 및 예측장치로부터 입력되는 데이터를 분석하여 저장하고 가시화하는 뇌졸중 분석장치를 더 포함하는 뇌졸중 조기발견 및 예측 시스템.
The method according to claim 1,
Further comprising a stroke analyzer for analyzing, storing, and visualizing data input from the stroke finding and predicting device.
제5항에 있어서,
상기 뇌졸중 분석장치는 상기 뇌졸중 발견 및 예측장치로부터 입력되는 데이터를 시간, 장소, 질병종류, 질병원인이라는 4개의 차원으로 구성되는 데이터 큐브로 생성하고, 각 차원별로 추상화 정도에 따라서 다양한 OLAP 연산을 통하여 다차원적으로 분석을 수행하는 뇌졸중 조기발견 및 예측 시스템.
6. The method of claim 5,
The stroke analyzer generates data cubes composed of the four dimensions of time, place, disease type, and cause of disease from the stroke finding and predicting device, and performs various OLAP operations according to the degree of abstraction for each dimension Stroke early detection and prediction system that performs multidimensional analysis.
제6항에 있어서,
상기 뇌졸중 분석장치는 상기 데이터 큐브의 4개 차원의 조합에 따라 사실테이블의 뇌졸중 질환 발생 수, 뇌졸중 위험도, 질병 분석 값을 척도(Measure) 값으로 분석할 수 있는 뇌졸중 조기발견 및 예측 시스템.
The method according to claim 6,
Wherein the stroke analyzer is capable of analyzing the number of strokes, the risk of stroke, and disease analysis values of a fact table according to a combination of four dimensions of the data cube as a measure value.
제6항에 있어서,
상기 뇌졸중 분석장치는 롤-업(Roll-Up), 드릴-다운(Drill-Down), 다이스(Dice), 슬라이스(Slice) 중 적어도 하나의 OLAP 연산을 이용하여 다차원적인 분석을 수행하는 뇌졸중 조기발견 및 예측 시스템.
The method according to claim 6,
Wherein the stroke analyzer is a stroke analyzer for performing a multi-dimensional analysis using at least one OLAP operation of a roll-up, a drill-down, a dice, and a slice, And prediction system.
뇌졸중 조기발견 및 예측 시스템에 있어서,
웨어러블 디바이스를 통해 실시간 생활 데이터를 수집하는 웨어러블 데이터 수집장치,
건강보험관리공단에서 제공하는 정보와 개인별 전자의무기록 데이터를 수집하는 이력 정보 데이터 수집장치, 및
상기 웨어러블 데이터 수집장치 및 상기 이력 정보 데이터 수집장치로부터 수집된 데이터를 이용하여 뇌졸중 질환을 발견 및 예측하는 뇌졸중 발견 및 예측장치를 포함하며,
상기 뇌졸중 발견 및 예측장치는,
상기 웨어러블 데이터 및 상기 이력 정보 데이터를 전처리하여 통합하는 데이터 전처리부, 및
상기 데이터 전처리부에서 입력되는 데이터를 계층적 다중 SVM을 이용하여 뇌졸중 질환의 유형들로 자동 분류하여 뇌졸중을 예측하는 뇌졸중 실시간 발견 및 예측부를 포함하되,
상기 뇌졸중 실시간 발견 및 예측부는 단일 클래스 SVM의 Support Vector Data Description(SVDD) 알고리즘을 기반으로 하는 다중 클래스 SVM를 포함하며,
상기 다중 클래스 SVM은 d-차원의 입력 공간 상에 존재하는 입력 데이터의 집합에 대하여 각 클래스를 분류하기 위한 분류기를 포함하되, 상기 분류기는 각 클래스의 학습 데이터를 포함하면서 체적을 최소화하며 커널 함수를 통하여 정의된 특징 공간 상에서의 구체를 정의하고,
상기 특징 공간 상의 경계로부터 해당 데이터와의 절대거리를 상기 특징 공간 상에서 정의되는 상기 구체의 반경으로 나눔으로써 산출되는 상대 거리가 가장 큰 클래스를 상기 입력 데이터의 소속 클래스로 결정하는 것인 뇌졸중 조기발견 및 예측 시스템.
In a stroke early detection and prediction system,
A wearable data collecting device for collecting real-time living data through a wearable device,
A history information data collection device for collecting information provided by the health insurance management corporation and individual electronic medical record data, and
And a stroke detection and prediction device for detecting and predicting a stroke disease using data collected from the wearable data collection device and the history information data collection device,
The stroke finding and predicting device comprises:
A data preprocessing unit for preprocessing and integrating the wearable data and the history information data,
And a stroke real-time finding and predicting unit for automatically classifying the data input from the data preprocessing unit into types of stroke disease using hierarchical multiple SVM to predict a stroke,
Wherein the stroke real-time detection and prediction unit includes a multi-class SVM based on a support vector data description (SVDD) algorithm of a single class SVM,
The multi-class SVM includes a classifier for classifying each class with respect to a set of input data existing on a d-dimensional input space, the classifier minimizing the volume while including learning data of each class, Defining a sphere on a defined feature space,
Determining a class having the largest relative distance calculated by dividing the absolute distance from the boundary on the feature space by the radius of the sphere defined in the feature space as a belonging class of the input data; Prediction system.
삭제delete 제9항에 있어서,
상기 뇌졸중 발견 및 예측장치로부터 입력되는 데이터를 분석하여 저장하고 가시화하는 뇌졸중 분석장치를 더 포함하는 뇌졸중 조기발견 및 예측 시스템.
10. The method of claim 9,
Further comprising a stroke analyzer for analyzing, storing, and visualizing data input from the stroke finding and predicting device.
제11항에 있어서,
상기 뇌졸중 분석장치는 상기 뇌졸중 발견 및 예측장치로부터 입력되는 데이터를 시간, 장소, 질병종류, 질병원인이라는 4개의 차원으로 구성되는 데이터 큐브를 생성하고, 각 차원별로 추상화 정도에 따라서 OLAP 연산을 통하여 다차원적으로 분석을 수행하는 뇌졸중 조기발견 및 예측 시스템.
12. The method of claim 11,
The stroke analyzer generates a data cube composed of four dimensions of time, place, type of disease, disease cause, and the data inputted from the stroke finding and predicting device, An early detection and prediction system for stroke that performs analysis as an enemy.
제12항에 있어서,
상기 뇌졸중 분석장치는 상기 데이터 큐브의 4개 차원의 조합에 따라 사실테이블의 뇌졸중 질환 발생 수, 뇌졸중 위험도, 질병 분석 값을 척도(Measure) 값으로 분석할 수 있는 뇌졸중 조기발견 및 예측 시스템.
13. The method of claim 12,
Wherein the stroke analyzer is capable of analyzing the number of strokes, the risk of stroke, and disease analysis values of a fact table according to a combination of four dimensions of the data cube as a measure value.
제11항에 있어서,
상기 뇌졸중 분석장치는 롤-업(Roll-Up), 드릴-다운(Drill-Down), 다이스(Dice), 슬라이스(Slice) 중 적어도 하나의 OLAP 연산을 이용하여 다차원적인 분석을 수행하는 뇌졸중 조기발견 및 예측 시스템.
12. The method of claim 11,
Wherein the stroke analyzer is a stroke analyzer for performing a multi-dimensional analysis using at least one OLAP operation of a roll-up, a drill-down, a dice, and a slice, And prediction system.
뇌졸중 조기발견 및 예측 시스템에서의 뇌졸중 조기발견 및 예측 방법은,
웨어러블 디바이스를 통해 사용자의 일상 생활 데이터를 수집하는 단계,
클라우드 환경에 구축되어 있는 건강보험공단 및 전자의무기록의 이력 정보 데이터를 수집하는 단계,
상기 일상 생활 데이터 및 상기 이력 정보 데이터를 이용하여 뇌졸중을 발견 및 예측하는 단계, 및
뇌졸중의 발견 및 예측 결과를 분석하고, 분석 결과를 가시화하는 단계를 포함하되,
상기 뇌졸중을 발견 및 예측하는 단계는,
상기 일상 생활 데이터 및 상기 이력 정보 데이터를 단일 클래스 SVM의 Support Vector Data Description(SVDD) 알고리즘을 기반으로 하는 다중 클래스 SVM을 이용하여 뇌졸중 질환의 유형들로 자동 분류하여 뇌졸중을 발견 및 예측하되,
상기 다중 클래스 SVM은 d-차원의 입력 공간 상에 존재하는 입력 데이터의 집합에 대하여 각 클래스를 분류하기 위한 분류기를 포함하고, 상기 분류기는 각 클래스의 학습 데이터를 포함하면서 체적을 최소화하며 커널 함수를 통하여 정의된 특징 공간 상에서의 구체를 정의하며,
상기 특징 공간 상의 경계로부터 해당 데이터와의 절대거리를 상기 특징 공간 상에서 정의되는 상기 구체의 반경으로 나눔으로써 산출되는 상대 거리가 가장 큰 클래스를 상기 입력 데이터의 소속 클래스로 결정하는 것인 뇌졸중 조기발견 및 예측 방법.
Early detection and prediction of stroke in early detection and prediction systems of stroke,
Collecting the daily life data of the user through the wearable device,
Collecting history information data of health insurance corporation and electronic medical record established in a cloud environment,
Detecting and predicting a stroke using the daily life data and the history information data, and
Analyzing the findings and prediction results of the stroke, and visualizing the results of the analysis,
Wherein the step of detecting and predicting stroke comprises:
The daily life data and the history information data are automatically classified into types of stroke diseases using a multi-class SVM based on a support vector data description (SVDD) algorithm of a single class SVM to detect and predict a stroke,
The multi-class SVM includes a classifier for classifying each class for a set of input data existing on a d-dimensional input space. The classifier minimizes the volume while including learning data of each class, Defines a sphere on a defined feature space,
Determining a class having the largest relative distance calculated by dividing the absolute distance from the boundary on the feature space by the radius of the sphere defined in the feature space as a belonging class of the input data; Prediction method.
제15항에 있어서,
상기 뇌졸중을 발견 및 예측하는 단계는,
상기 일상 생활 데이터 및 상기 이력 정보 데이터를 전처리하는 단계,
전처리된 데이터 중 앙상블 구조의 데이터를 선택하고, 선택된 데이터를 이용하여 다중의 기계학습 모델을 생성하는 단계, 및
상기 다중의 기계학습 모델의 생성과 이에 대한 결과를 통합하고, 상기 다중의 기계학습 모델 중 예측 성능이 가장 높은 모델을 선택하여 실시간으로 뇌졸중 질환의 발견 및 예측을 수행하는 단계를 포함하는 뇌졸중 조기발견 및 예측 방법.
16. The method of claim 15,
Wherein the step of detecting and predicting stroke comprises:
Pre-processing the daily life data and the history information data,
Selecting data of an ensemble structure among the preprocessed data and generating multiple machine learning models using the selected data, and
The method comprising the steps of: generating the multiple machine learning models and integrating the results; and selecting a model having the highest prediction performance among the multiple machine learning models to perform detection and prediction of the stroke disease in real time, And prediction method.
제15항에 있어서,
상기 뇌졸중을 발견 및 예측하는 단계는,
상기 일상 생활 데이터 및 상기 이력 정보 데이터를 전처리하는 단계,
전처리된 데이터 중 앙상블 구조의 데이터를 선택하고, 선택된 데이터를 이용하여 다중의 기계학습 모델을 생성하는 단계, 및
상기 다중의 기계학습 모델의 생성과 이에 대한 결과를 통합하고, 상기 다중의 기계학습 모델 중 예측 과정과 절차 설명이 가능한 모델을 선택하여 실시간으로 뇌졸중 질환 발견 및 예측을 수행하는 단계를 포함하는 뇌졸중 조기발견 및 예측 방법.
16. The method of claim 15,
Wherein the step of detecting and predicting stroke comprises:
Pre-processing the daily life data and the history information data,
Selecting data of an ensemble structure among the preprocessed data and generating multiple machine learning models using the selected data, and
A step of integrating the results of the multi-machine learning model and the results thereof, and performing a stroke stroke diagnosis and prediction in real time by selecting a model capable of predicting a procedure and a procedure among the multiple machine learning models, Discovery and Forecasting Methods.
삭제delete 제15항에 있어서,
상기 뇌졸중의 발견 및 예측 결과를 분석하고, 분석 결과를 가시화하는 단계는,
상기 뇌졸중의 발견 및 예측 결과를 시간, 장소, 질병종류, 질병원인이라는 4개의 차원으로 구성되는 데이터 큐브로 생성하는 단계, 및
상기 데이터 큐브를 각 차원별로 추상화 정도에 따라서 OLAP 연산하여 다차원적으로 분석하는 단계를 포함하는 뇌졸중 조기발견 및 예측 방법.
16. The method of claim 15,
Analyzing the findings and prediction results of the stroke, and visualizing the analysis results,
Generating a data cube consisting of four dimensions of the stroke and the prediction result of time, place, disease type, disease cause; and
And performing an OLAP operation on the data cubes according to the level of abstraction for each dimension to analyze the data cubes in a multidimensional manner.
KR1020170039140A 2017-03-28 2017-03-28 System and method for predicting and analysis stroke KR101955012B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170039140A KR101955012B1 (en) 2017-03-28 2017-03-28 System and method for predicting and analysis stroke

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170039140A KR101955012B1 (en) 2017-03-28 2017-03-28 System and method for predicting and analysis stroke

Publications (2)

Publication Number Publication Date
KR20180110310A KR20180110310A (en) 2018-10-10
KR101955012B1 true KR101955012B1 (en) 2019-03-08

Family

ID=63875840

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170039140A KR101955012B1 (en) 2017-03-28 2017-03-28 System and method for predicting and analysis stroke

Country Status (1)

Country Link
KR (1) KR101955012B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220017593A (en) 2020-08-05 2022-02-14 정슬기 A method to derive artery blood flow using MRA signal intensity gradient (SIG-BF) and prediction system for cerebrovascular diseases including stroke using SIG-BF

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102403924B1 (en) * 2019-12-16 2022-05-30 아주대학교 산학협력단 Apparatus and method for evaluating well-being based on digital phenotype
KR102160390B1 (en) * 2019-12-31 2020-09-29 (주)제이엘케이 Method and system for artificial intelligence based user medical information analysis
KR102421172B1 (en) * 2020-03-04 2022-07-14 인하대학교 산학협력단 Smart Healthcare Monitoring System and Method for Heart Disease Prediction Based On Ensemble Deep Learning and Feature Fusion
KR102464422B1 (en) * 2020-10-08 2022-11-07 가톨릭대학교 산학협력단 Apparatus, method for providing information needed, and recording medium for diagnosing lung damage
CN117116475A (en) * 2023-06-27 2023-11-24 开滦总医院 Method, system, terminal and storage medium for predicting risk of ischemic cerebral apoplexy

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218869A (en) * 2015-05-22 2016-12-22 富士通株式会社 Setting method, setting program, and setting device

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090059656A (en) * 2007-12-07 2009-06-11 최성욱 Career management and development system
KR20130082551A (en) * 2011-12-08 2013-07-22 한국전자통신연구원 Clinical data analysis apparatus and clinical data analysis method thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016218869A (en) * 2015-05-22 2016-12-22 富士通株式会社 Setting method, setting program, and setting device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220017593A (en) 2020-08-05 2022-02-14 정슬기 A method to derive artery blood flow using MRA signal intensity gradient (SIG-BF) and prediction system for cerebrovascular diseases including stroke using SIG-BF

Also Published As

Publication number Publication date
KR20180110310A (en) 2018-10-10

Similar Documents

Publication Publication Date Title
KR101955012B1 (en) System and method for predicting and analysis stroke
Li et al. Research on orthopedic auxiliary classification and prediction model based on XGBoost algorithm
Saru et al. Analysis and prediction of diabetes using machine learning
CN110957015B (en) Missing value filling method for electronic medical record data
CN110534190A (en) System and method for automatic Clinical Decision Support Systems
Chadaga et al. Predicting cervical cancer biopsy results using demographic and epidemiological parameters: a custom stacked ensemble machine learning approach
Ozsahin et al. Impact of outliers and dimensionality reduction on the performance of predictive models for medical disease diagnosis
Vaz et al. Urban habitats and the injury landscape
Gopi et al. IoT based disease prediction using mapreduce and LSQN 3 techniques
Shan et al. COVID‐19 patient diagnosis and treatment data mining algorithm based on association rules
Patil et al. An Adaptive parameter free data mining approach for healthcare application
Sudharson et al. Performance analysis of enhanced adaboost framework in multifacet medical dataset
CN117370565A (en) Information retrieval method and system
Ghosh et al. a Neuro-fuzzy based Classification Method
Vankara et al. PAELC: Predictive Analysis by Ensemble Learning and Classification heart disease detection using beat sound
Theron The use of data mining for predicting injuries in professional football players
Saturi Development of prediction and forecasting model for Dengue disease using machine learning algorithms
Othman et al. Early prediction of hemodialysis complications employing ensemble techniques
Alkobaisi et al. Predictive and exposome analytics: A case study of asthma exacerbation management
CN115359917A (en) Patient identification method and system based on space-time multi-attention residual error mechanism
Yan et al. Cost-sensitive selection of variables by ensemble of model sequences
Yin Prediction and analysis of time series data based on granular computing
Thangamayan et al. Comparative Study on Different Machine Learning Algorithms for Neonatal Diabetes Detection
Iris Punitha et al. A Novel Two Tier Missing at Random Type Missing Data Imputation using Enhanced Linear Interpolation Technique on Internet of Medical Things
Prajapati et al. An Empirical Study of Machine Learning (ML) Algorithms in the Perspective of Cardiovascular Disease (CVD) Prediction

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right