KR20150048302A - System for qualifying chronic heart disease prediction model - Google Patents

System for qualifying chronic heart disease prediction model Download PDF

Info

Publication number
KR20150048302A
KR20150048302A KR1020130127871A KR20130127871A KR20150048302A KR 20150048302 A KR20150048302 A KR 20150048302A KR 1020130127871 A KR1020130127871 A KR 1020130127871A KR 20130127871 A KR20130127871 A KR 20130127871A KR 20150048302 A KR20150048302 A KR 20150048302A
Authority
KR
South Korea
Prior art keywords
cardiovascular disease
fuzzy
variables
input
disease prediction
Prior art date
Application number
KR1020130127871A
Other languages
Korean (ko)
Inventor
전진옥
소재영
김종탁
판희준
김현
Original Assignee
주식회사 비트컴퓨터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 비트컴퓨터 filed Critical 주식회사 비트컴퓨터
Priority to KR1020130127871A priority Critical patent/KR20150048302A/en
Publication of KR20150048302A publication Critical patent/KR20150048302A/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/04Endocrine or metabolic disorders
    • G01N2800/044Hyperlipemia or hypolipemia, e.g. dyslipidaemia, obesity
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/32Cardiovascular disorders
    • G01N2800/321Arterial hypertension
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/32Cardiovascular disorders
    • G01N2800/324Coronary artery diseases, e.g. angina pectoris, myocardial infarction

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Mathematical Physics (AREA)
  • Public Health (AREA)
  • General Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Epidemiology (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pathology (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

According to the present invention, a system for verifying a chronic heart disease prediction model may include: a training set storage unit that stores a training set consisting of input and output variables, which are selected from raw data and are planned to be applied to a chronic heart disease prediction modeling device; a test set storage unit that stores a test set consisting of input and output variables, which are selected from raw data and are planned to be applied to verify effectiveness of the chronic heart disease prediction modeling device; and an effectiveness determination unit. The effectiveness determination unit compares a risk rate of chronic heart disease, which is a result value obtained by applying the input variables of the test set stored in the test set storage unit to the chronic heart disease prediction modeling device, with occurrence of the heart disease included in an actual test set; calculates sensitivity, specificity, and accuracy; and then verifies effectiveness of the chronic heart disease prediction modeling device.

Description

만성 심혈관 질환 예측 모델 검증 시스템{SYSTEM FOR QUALIFYING CHRONIC HEART DISEASE PREDICTION MODEL}BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a system for evaluating a cardiovascular disease,

본 발명은 질환 예측 모델링 기법에 관한 것으로, 더욱 상세하게는, 만성 심혈관 질환 예측 모델링 기법에 관한 것이다.The present invention relates to disease prediction modeling techniques, and more particularly, to a modeling technique for predicting chronic cardiovascular disease.

만성 심혈관 질환(CHD, Chronic Heart Disease)은 비전염성 질환 중에서 높은 사망률을 보이는 질환으로서, 만성 심혈관 질환의 예측은 심장 질환을 관리하기 위한 개인적 내지 사회적 비용을 줄일 수 있는 좋은 수단이다.Chronic Heart Disease (CHD) is a disease with a high mortality rate among non-communicable diseases. Prediction of chronic cardiovascular disease is a good way to reduce the personal and social costs of managing heart disease.

만성 심혈관 질환의 예측 모델에 대한 연구가 진행되고 있는데, 특히 데이터 마이닝(data mining) 기법, 인공 지능(artificial intelligence), 기계 학습(machine learning) 등에 기반하는 질환 예측 모델들이 연구되고 있다.Studies on the prediction model of chronic cardiovascular disease are under way. In particular, disease prediction models based on data mining techniques, artificial intelligence, and machine learning are being studied.

데이터 마이닝 기법에 기반한 질환 예측 모델 중에서는, 인공 신경망(ANN, artificial neural network), 의사 결정 나무(decision tree), 베이즈 이론(Bayes Theory), 유전자 최적화 알고리즘(Genetic Algorithm) 등의 알고리즘들이 시도되고 있다.Among the disease prediction models based on data mining techniques, algorithms such as ANN, artificial neural network, decision tree, Bayes theory, and genetic algorithm have been attempted have.

기존에 외국의 조사 데이터를 기반으로 하는 만성 심혈관 질환 예측 모델들은 한국인들을 위한 만성 심혈관 질환의 예측에 잘 맞지 않지만 국내에서 조사된 데이터가 미비하다. Previously, chronic cardiovascular disease prediction models based on foreign survey data are not well suited to the prediction of chronic cardiovascular disease in Koreans, but data available in Korea are scarce.

예를 들어, 대표적인 심혈관 예측 질환 모델링 방법으로서 심혈관 질환 발병 위험 정도를 예측하는 방법에는, FRS(Framingham Risk Score)와 PROCAM(Prospective Cardiovascular Munster) 등이 있지만, FRS와 PROCAM은 한국인들을 대상으로 하지 않았고 실제로 한국인 환자들의 심혈관 질환 발병 예측 정확도가 떨어진다.For example, there are FRS (Framingham Risk Score) and PROCAM (Prospective Cardiovascular Munster) methods to predict the risk of cardiovascular disease as a representative cardiovascular disease modeling method. FRS and PROCAM, however, Korean patients are less accurate in predicting the onset of cardiovascular disease.

따라서, 예측 모델의 미비와 원천 데이터셋의 미비라는 문제가 있기 때문에, 현재 이용가능한 데이터셋으로부터 적응적으로 예측 가능한 한국인에게 적합한 새로운 만성 심혈관 질환 예측 모델을 구축할 필요가 있다.Therefore, there is a need for constructing a new model of chronic cardiovascular disease prediction suitable for Koreans who are adaptively predictable from the currently available datasets, due to the lack of predictive models and inadequate source data sets.

나아가, 질환 예측 모델의 정확도를 검증하기 위한 만성 심혈관 질환 예측 모델 검증 시스템이 필요하다.Furthermore, a system for verifying the predictive model of chronic cardiovascular disease is needed to verify the accuracy of the disease prediction model.

본 발명이 해결하고자 하는 과제는 만성 심혈관 질환 예측 모델 검증 시스템을 제공하는 데에 있다.A problem to be solved by the present invention is to provide a system for verifying a model of a chronic cardiovascular disease.

본 발명이 해결하고자 하는 과제는 한국인들을 위한 만성 심혈관 질환 예측 모델 검증 시스템을 제공하는 데에 있다.A problem to be solved by the present invention is to provide a system for verifying a model for predicting chronic cardiovascular disease for Koreans.

본 발명이 해결하고자 하는 과제는 이용가능한 데이터셋으로부터 적응적으로 만성 심혈관 질환을 예측할 수 있는 만성 심혈관 질환 예측 모델을 검증하기 위한 만성 심혈관 질환 예측 모델 검증 시스템을 제공하는 데에 있다.The problem to be solved by the present invention is to provide a system for verifying a chronic cardiovascular disease prediction model for verifying a chronic cardiovascular disease prediction model capable of predicting chronic cardiovascular disease adaptively from available data sets.

본 발명의 해결과제는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 해결과제들은 아래의 기재로부터 당업자에게 명확히 이해될 수 있을 것이다.The solution to the problem of the present invention is not limited to those mentioned above, and other solutions not mentioned can be clearly understood by those skilled in the art from the following description.

본 발명의 일 측면에 따른 적응적 만성 심혈관 질환 예측 모델링 시스템은,An adaptive chronic cardiovascular disease prediction modeling system according to an aspect of the present invention includes:

원천 데이터 중에서 선별되어 적응적 만성 심혈관 질환 예측 모델링 장치에 인가될 입력 변수들 및 출력 변수로 구성된 트레이닝 셋을 저장하는 트레이닝 셋 저장부;A training set storage unit for storing a training set selected from source data and configured of input variables and output variables to be applied to an adaptive chronic cardiovascular disease prediction modeling apparatus;

상기 원천 데이터 중에서 선별되어 상기 적응적 만성 심혈관 질환 예측 모델링 장치의 유효성을 검증하기 위해 인가될 입력 변수들 및 출력 변수들로 구성된 테스트 셋을 저장하는 테스트 셋 저장부; 및A test set storage unit for storing a test set selected from the source data and configured to include input parameters and output parameters to be applied to validate the adaptive cardiovascular disease prediction modeling device; And

상기 적응적 만성 심혈관 질환 예측 모델링 장치가 상기 트레이닝 셋 저장부에 저장된 트레이닝 셋에 기초하여 생성된 추론 규칙들 및 퍼지 파라미터들을 가지고 모델링이 완료되면, 상기 테스트 셋 저장부에 저장된 테스트 셋의 입력 변수들을 상기 적응적 만성 심혈관 질환 예측 모델링 장치에 인가하여 얻은 결과 값인 만성 심혈관 질환 위험도를 실제 테스트 셋에 포함된 심혈관 유병 여부와 비교하고, 민감도, 특이도 및 정확도를 산출하여 상기 적응적 만성 심혈관 질환 예측 모델링 장치의 유효성을 검증하는 유효성 판정부를 포함할 수 있다.When the modeling of the adaptive cardiovascular disease prediction modeling apparatus is completed with inference rules and fuzzy parameters generated based on the training set stored in the training set storage unit, the input variables of the test set stored in the test set storage unit The risk of chronic cardiovascular disease, which is the result obtained by applying the device to the adaptive chronic cardiovascular disease prediction modeling apparatus, is compared with the presence of cardiovascular disease included in the actual test set, and the sensitivity, specificity and accuracy are calculated to determine the adaptive chronic cardiovascular disease prediction modeling And a validity judgment unit for verifying the validity of the apparatus.

일 실시예에 따라, 상기 적응적 만성 심혈관 질환 예측 모델링 장치는According to one embodiment, the adaptive chronic cardiovascular disease prediction modeling device

복수의 범주형 건강 관련 항목들 및 연속 수치형 신체 지수 항목들을 입력 변수로 가지고 심혈관 유병 여부 항목을 출력 변수로 가지는 데이터셋으로부터, 입력 변수들로부터 출력 변수가 유도될 수 있는 적어도 하나의 추론 규칙들을 생성하는 규칙 유도부;From the data set having a plurality of categorical health-related items and continuous numerical body index items as input variables and having a cardiovascular disease item as an output variable, at least one inference rule from which the output variable can be derived from the input variables A rule inducing unit for generating a rule;

상기 입력 변수들 중 각각의 연속형 입력 변수들에 대해, 상기 생성된 추론 규칙들에 기초하여, 퍼지 변수들에 상응하는 소속 함수들의 개수 및 각 소속 함수의 배치와 형태에 관한 퍼지 파라미터들을 결정하는 퍼지 파라미터 생성부; 및For each continuous input variable among the input variables, the number of belonging functions corresponding to the fuzzy variables and the fuzzy parameters related to the arrangement and type of each belonging function are determined based on the generated reasoning rules A fuzzy parameter generation unit; And

상기 입력 변수들에 대해, 상기 생성된 추론 규칙들과 소속 함수들을 기초로 퍼지 추론하여 만성 심혈관 질환 위험도를 결과 값을 출력하는 질환 위험 추론부를 포함할 수 있다.And a disease risk inferencing unit for fuzzy-inferring the input parameters based on the generated inference rules and membership functions to output a result of the chronic cardiovascular disease risk.

일 실시예에 따라,According to one embodiment,

상기 입력 변수들은 범주형 건강 관련 항목들 중에서 성별, 흡연 여부, 당뇨 여부는 범주형 입력 변수와 연속 수치형 신체 지수 항목들 중에서 나이, 총 콜레스테롤 수치, LDL 콜레스테롤 수치, HDL 콜레스테롤 수치, 최고 혈압 수치 및 최저 혈압 수치는 연속형 입력 변수를 포함하고,Among the categorical health-related items, the above-mentioned input variables were age, total cholesterol level, LDL cholesterol level, HDL cholesterol level, systolic blood pressure level, The lowest blood pressure value includes a continuous input variable,

상기 출력 변수는 심혈관 유병 여부 항목들 중에서 고혈압, 고지혈증, 뇌졸증, 심근경색, 협심증의 5개 질환 발병율일 수 있다.The output variable may be the incidence of five diseases such as hypertension, hyperlipidemia, stroke, myocardial infarction, and angina, among the items of cardiovascular disease.

일 실시예에 따라, 상기 추론 규칙들은 의사 결정 나무 알고리즘을 통해 도출될 수 있다.According to one embodiment, the reasoning rules may be derived through a decision trees algorithm.

일 실시예에 따라, 상기 퍼지 파라미터 생성부는,According to one embodiment, the fuzzy parameter generator comprises:

상기 생성된 추론 규칙들에서 나타나는 연속형 입력 변수들 각각의 수치 범위들에 대해, 수치 범위들의 개수에 따라 퍼지 변수들 및 소속 함수들의 개수를 정하고, 수치 범위들의 분포에 따라 퍼지 변수들에 상응하는 소속 함수들의 배치와 형태에 관한 퍼지 파라미터들을 결정하도록 동작할 수 있다.For each numerical range of successive input variables appearing in the generated inference rules, the number of fuzzy variables and the belonging functions is determined according to the number of numeric ranges, and the number of the belonging functions corresponding to the fuzzy variables And to determine fuzzy parameters on the placement and type of membership functions.

일 실시예에 따라, 상기 질환 위험 추론부는,According to one embodiment, the disease risk inferring unit comprises:

상기 퍼지 파라미터들에 의해 배치와 형태가 정의된 소속 함수들 및 데이터셋에 포함된 연속형 입력 변수들을 기초로 퍼지 입력 값들을 생성하고, 생성된 퍼지 입력 값들, 데이터셋에 포함된 범주형 입력 변수 값들 및 추론 규칙들에 따라 퍼지 출력들을 생성하며, 생성된 퍼지 출력들을 출력 변수의 소속 함수에 기초하여 통합한 결과 값을 만성 심혈관 질환 위험도로서 생성하도록 동작할 수 있다.Generating fuzzy input values based on successive input variables included in the data set and belonging functions whose placement and shape are defined by the fuzzy parameters and generating the fuzzy input values based on the generated fuzzy input values, Values and inference rules, and to generate the resulting fuzzy outputs as a chronic cardiovascular risk profile based on the membership function of the output variable.

본 발명의 만성 심혈관 질환 예측 모델 검증 시스템에 따르면, 현재 이용가능한 데이터셋으로부터 적응적으로 만성 심혈관 질환을 예측하는 모델을 검증할 수 있다.According to the chronic cardiovascular disease prediction model verification system of the present invention, a model for adaptively predicting chronic cardiovascular disease can be verified from currently available data sets.

본 발명의 만성 심혈관 질환 예측 모델 검증 시스템에 따르면, 적응적으로 규칙 베이스를 생성하고 생체정보 항목들의 불확실성을 해결하면서 만성 심혈관 질환을 예측하는 모델의 정확도를 향상시킬 수 있다.According to the chronic cardiovascular disease prediction model verification system of the present invention, the accuracy of a model for predicting chronic cardiovascular disease can be improved while generating an adaptive rule base and resolving uncertainties of bioinformation items.

본 발명의 효과는 이상에서 언급된 것들에 한정되지 않으며, 언급되지 아니한 다른 효과들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.The effects of the present invention are not limited to those mentioned above, and other effects not mentioned can be clearly understood by those skilled in the art from the following description.

도 1은 본 발명의 일 실시예에 따른 만성 심혈관 질환 예측 모델 검증 시스템에 의해 검증될 적응적 만성 심혈관 질환 예측 모델링 장치를 예시한 개념도이다.
도 2는 본 발명의 일 실시예에 따른 만성 심혈관 질환 예측 모델 검증 시스템에 의해 검증될 적응적 만성 심혈관 질환 예측 모델링 장치를 위한 퍼지 소속 함수들을 예시한 도면들이다.
도 3은 본 발명의 일 실시예에 따른 만성 심혈관 질환 예측 모델 검증 시스템을 예시한 블록도이다.
1 is a conceptual diagram illustrating an apparatus for predicting an adaptive chronic cardiovascular disease to be verified by a system for verifying the predictive model of a chronic cardiovascular disease according to an embodiment of the present invention.
FIG. 2 is a diagram illustrating fuzzy membership functions for an adaptive chronic cardiovascular disease prediction modeling apparatus to be verified by a system for verifying the predictive model of a chronic cardiovascular disease according to an embodiment of the present invention.
3 is a block diagram illustrating a system for verifying a model for predicting a cardiovascular disease according to an embodiment of the present invention.

본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.For the embodiments of the invention disclosed herein, specific structural and functional descriptions are set forth for the purpose of describing an embodiment of the invention only, and it is to be understood that the embodiments of the invention may be practiced in various forms, The present invention should not be construed as limited to the embodiments described in Figs.

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The same reference numerals are used for the same constituent elements in the drawings and redundant explanations for the same constituent elements are omitted.

도 1은 본 발명의 일 실시예에 따른 만성 심혈관 질환 예측 모델 검증 시스템에 의해 검증될 적응적 만성 심혈관 질환 예측 모델링 장치를 예시한 개념도이다.1 is a conceptual diagram illustrating an apparatus for predicting an adaptive chronic cardiovascular disease to be verified by a system for verifying the predictive model of a chronic cardiovascular disease according to an embodiment of the present invention.

도 1을 참조하면, 적응적 만성 심혈관 질환 예측 모델링 장치(10)는 크게 규칙 유도부(11), 퍼지 파라미터 생성부(12) 및 질환 위험 추론부(13)를 포함할 수 있다.Referring to FIG. 1, the adaptive chronic cardiovascular disease prediction modeling apparatus 10 may include a rule inducing unit 11, a fuzzy parameter generating unit 12, and a disease risk inferring unit 13.

구체적으로 설명하면, 규칙 유도부(11)는 복수의 범주형 건강 관련 항목들 및 연속 수치형 신체 지수 항목들을 입력 변수로 가지고 심혈관 유병 여부 항목을 출력 변수로 가지는 데이터셋으로부터, 입력 변수들로부터 출력 변수가 유도될 수 있는 적어도 하나의 추론 규칙들을 생성한다.Specifically, the rule inducing unit 11 extracts, from the input variables, the output variable from the data set having a plurality of categorical health-related items and the continuous numerical body index items as input variables and having the item of whether or not the cardiovascular disease is an output variable Lt; / RTI > can be derived.

이를 위해, 규칙 유도부(11)는 데이터셋 DB(111), 의사 결정 나무 기반 규칙 생성부(112) 및 추론 규칙 저장부(113)를 포함할 수 있다.To this end, the rule inducing unit 11 may include a data set DB 111, a decision tree-based rule generating unit 112, and an inference rule storing unit 113.

신뢰성 있는 데이터셋을 확보하기 위하여, 건강 관련 설문 조사는 질병관리본부에서 조사한 제5기 국가건강영양조사(KNHANES-V, the Fifth Korean National Health and Nutrition Examination Survey)의 데이터셋을 이용할 수 있다. 제5기 국민건강영양조사는 국가기간통계로서 국민의 건강 및 영양 수준을 파악하고 국민건강증진종합계획 등의 정책 수립 및 평가의 근거를 위해 2010년부터 2012년에 걸쳐 연중 조사로 이루어졌으며, 주요 만성 질환 등에 관한 193 개 설문 항목들과 생활 건강에 관한 80 개 설문 항목을 가지고 조사되었다.To obtain a reliable data set, a health survey can use a data set from the Fifth National Health and Nutrition Examination Survey (KNHANES-V) surveyed by the CDC. The 5th National Health and Nutrition Survey was conducted as a nation-wide periodic statistical survey to identify the health and nutritional status of the people and to establish the basis for evaluation and evaluation of the National Health Promotion Comprehensive Plan, etc. from 2010 to 2012, And 193 questionnaires on chronic diseases and 80 questionnaires on health.

만성 심혈관 질환의 유병을 추론하기 위한 입력 변수로서, 설문 항목들 중에서 특히 성별, 흡연 여부, 당뇨 여부를 범주형 입력 변수로 선정하고, 나이, 총 콜레스테롤 수치, LDL 콜레스테롤 수치, HDL 콜레스테롤 수치, 최고 혈압 수치 및 최저 혈압 수치를 연속형 입력 변수로 선정하였다.The age, total cholesterol level, LDL cholesterol level, HDL cholesterol level, and systolic blood pressure were used as the input variables to infer the prevalence of chronic cardiovascular disease among the questionnaire items, Numerical and baseline blood pressure values were selected as continuous input variables.

또한, 이들 설문 항목들 중에서 만성 심혈관 질환의 추론을 위한 출력 변수를 결정하기 위해, 고혈압, 고지혈증, 뇌졸증, 심근경색, 협심증의 5 개 질환 중 어느 하나라도 유병할 경우 만성 심혈관 질환을 가지고 있다고 정의하고, 5개 질환의 유병 여부를 출력 변수로 선정한다.In order to determine the output parameters for the inference of chronic cardiovascular disease among these items, it is defined as having a chronic cardiovascular disease when any one of 5 diseases such as hypertension, hyperlipidemia, stroke, myocardial infarction and angina is diagnosed , And the presence or absence of five diseases are selected as output variables.

따라서, 국가건강영양조사의 전체 데이터셋 중에서 위에서 예시한 9 개의 입력 변수들과 하나의 출력 변수로 된 데이터셋이 데이터셋 DB(111)에 저장된다.Thus, among the entire data set of the National Health and Nutrition Examination Survey, the nine input variables and the one data set of the output variables illustrated above are stored in the data set DB 111.

이러한 데이터셋에 대하여, 예를 들어 어떤 남성들이 흡연을 하고 총 콜레스테롤 수치와 HDL 콜레스테롤 수치가 어떠한 범위 이내이고 또한 최고 및 최저 혈압 수치가 어떠한 범위 이내일 때에 특정 질환을 가지고 있는 빈도가 어느 정도라는 관계가 존재한다면, 그러한 입력 변수들과 출력 변수 사이에 소정의 추론 규칙이 도출될 수 있다.For these data sets, for example, how often men smoke and have a certain degree of disease when their total cholesterol and HDL cholesterol levels are within a certain range and their maximum and minimum blood pressure values are within a certain range A predetermined reasoning rule can be derived between such input variables and output variables.

이를 위해, 의사 결정 나무 기반 규칙 생성부(112)는 의사 결정 나무(decision tree) 기법에 기반하여, 예를 들어 CHAID(Chi-Squared Automatic Interaction Detection), CART(Classification and Regression Trees), ID3, C4.5, C5.0 알고리즘 등 주지의 의사 결정 나무 알고리즘들을 통해 IF-THEN 추론 규칙들을 도출할 수 있다.For this purpose, the decision tree-based rule generation unit 112 generates a decision tree based on a decision tree, for example, CHAID (Chi-Squared Automatic Interaction Detection), Classification and Regression Trees (CART) It is possible to derive IF-THEN inference rules through well-known decision tree algorithms such as .5 and C5.0 algorithms.

특히 연속형 입력 변수들에 복수의 수치 범위들을 가질 수 있는데, 이러한 복수의 수치 범위들은 연속형 입력 변수들 각각의 퍼지 변수들에 상응할 수 있다.In particular, continuous input variables may have a plurality of numeric ranges, which may correspond to the fuzzy variables of each of the continuous input variables.

도출된 추론 규칙들은 추론 규칙 저장부(113)에 저장된다.The derived inference rules are stored in the inference rule storage unit 113.

퍼지 파라미터 생성부(12)는 생성된 추론 규칙들에 기초하여, 각각의 연속형 입력 변수들에 대해, 퍼지 변수들에 상응하는 소속 함수들의 개수 및 각 소속 함수의 배치와 형태를 결정하도록, 소속 함수 결정부(121) 및 퍼지 파라미터 저장부(122)를 포함한다.The fuzzy parameter generation unit 12 calculates the number of belonging functions corresponding to the fuzzy variables and the arrangement and type of each belonging function for each continuous input variable based on the generated reasoning rules, A function determination unit 121 and a fuzzy parameter storage unit 122. [

소속 함수 결정부(121)는 생성된 추론 규칙들에서 나타나는 연속형 입력 변수들 각각의 수치 범위들에 대해, 수치 범위들의 개수에 따라 퍼지 변수들 및 소속 함수들의 개수를 정하고, 수치 범위들의 분포에 따라 퍼지 변수들에 상응하는 소속 함수들의 배치와 형태에 관한 퍼지 파라미터들을 결정할 수 있다.The belonging function determining unit 121 determines the number of fuzzy variables and the belonging functions according to the number of numerical ranges for each numerical range of continuous input variables appearing in the generated inference rules, It is possible to determine fuzzy parameters related to the arrangement and type of belonging functions corresponding to the fuzzy variables.

소속 함수들을 예시하기 위해 잠시 도 2를 참조하면, 도 2는 본 발명의 일 실시예에 따른 만성 심혈관 질환 예측 모델 검증 시스템에 의해 검증될 적응적 만성 심혈관 질환 예측 모델링 장치를 위한 퍼지 소속 함수들을 예시한 도면들이다.FIG. 2 is a flow chart illustrating an example of fuzzy membership functions for an adaptive chronic cardiovascular disease prediction modeling apparatus to be verified by a system for verifying the predictive model of a chronic cardiovascular disease according to an embodiment of the present invention. These are the drawings.

도 2에서, 예를 들어, 연속형 입력 변수 중 나이(Age), 총 콜레스테롤 수치(Total Cholesterol), HDL 콜레스테롤 수치(HDL Cholesterol) 및 LDL 콜레스테롤 수치(LDL Cholesterol)는 세 개의 퍼지 변수들, 즉 낮음, 중간, 높음 등으로 표현되고, 최고 혈압(Systolic BP) 및 최소 혈압(Diastolic BP)은 다섯 개의 퍼지 변수들, 즉 매우 낮음, 낮음, 중간, 높음, 매우 높음으로 표현될 수 있다.In FIG. 2, for example, Age, Total Cholesterol, HDL Cholesterol and LDL Cholesterol among the continuous input variables are three fuzzy variables, that is, low , Systolic BP and diastolic BP can be expressed as five fuzzy variables: very low, low, medium, high, and very high.

각 퍼지 변수에 대한 소속 함수는 예를 들어 이등변삼각형 또는 잘린 이등변 삼각형의 형태를 가지고, 등간격으로 배치될 수 있다.The membership functions for each fuzzy variable are, for example, in the form of an isosceles triangle or a truncated isosceles triangle, and can be arranged at regular intervals.

이러한 입력 변수들에 대해, 출력 변수인 5개 질환 발병 여부, 즉 고혈압, 고지혈증, 뇌졸증, 심근경색, 협심증의 발병 여부에 대한 추론 결과는 만성 심혈관 질환 위험도(Heart Risk Level)로서 예시적으로 네 개의 퍼지 변수들, 즉 안전함(safety), 보통임(normal), 우려스러움(warning), 위험함(danger)으로써 표현될 수 있다.For these input variables, the inferring outcome of five disease outbreaks: hypertension, hyperlipidemia, stroke, myocardial infarction, and angina pectoris is a chronic cardiovascular risk (Heart Risk Level) It can be expressed as fuzzy variables: safety, normal, warning, and danger.

다시 도 1로 돌아와서, 퍼지 파라미터 저장부(122)는 이러한 퍼지 변수들 및 소속 함수들을 정의하는 퍼지 파라미터들을 저장한다.Referring again to FIG. 1, the fuzzy parameter storage 122 stores fuzzy parameters that define these fuzzy variables and their associated functions.

질환 위험 추론부(13)는 데이터셋에 내재된 불확실성을 처리할 수 있도록, 앞서 생성된 추론 규칙들과 소속 함수들을 기초로 입력 변수들에 대해 퍼지 추론한 결과 값을 만성 심혈관 질환 위험도로서 출력할 수 있다.The disease risk inferring unit 13 outputs a result of fuzzy inference on the input parameters as a chronic cardiovascular disease risk based on the inference rules and the membership functions generated in advance so as to deal with the uncertainty inherent in the data set .

이를 위해 질환 위험 추론부(13)는 추론 규칙 베이스(131), 소속 함수 저장부(132), 퍼지화부(fuzzifier)(133), 퍼지 추론부(fuzzy inference engine)(134) 및 역퍼지화부(defuzzifier)(135)를 포함할 수 있다.The disease risk inferring unit 13 includes an inference rule base 131, a belonging function storage unit 132, a fuzzifier 133, a fuzzy inference engine 134, a defuzzifier 135 may be included.

추론 규칙 베이스(131)는 추론 규칙 저장부(113)로부터 입력 변수들과 출력 변수에 대한 추론 규칙들을 읽어들여 저장한다.The inference rule base 131 reads inference rules for input variables and output variables from the inference rule storage unit 113 and stores the inference rules.

소속 함수 저장부(132)는 퍼지 파라미터 저장부(122)로부터 퍼지 변수들 및 소속 함수들을 정의하는 퍼지 파라미터들을 읽어들여 저장한다.The belonging function storage unit 132 reads fuzzy parameters defining the fuzzy variables and the belonging functions from the fuzzy parameter storage unit 122 and stores the read fuzzy parameters.

퍼지화부(133)는 데이터셋 DB(111)로부터 연속형 입력 변수들을 입력받고, 소속 함수 저장부(132)에서 참조된 퍼지 파라미터들에 의한 소속 함수들을 기초로 퍼지 입력 값들을 생성한다.The fuzzification unit 133 receives continuous input variables from the data set DB 111 and generates fuzzy input values based on the membership functions based on the fuzzy parameters referenced in the membership function storage unit 132. [

퍼지 추론부(134)는 퍼지화부(133)에서 생성된 퍼지 입력 값들 및 데이터셋 DB(111)에서 제공된 범주형 입력 변수 값들과 추론 규칙 베이스(131)에서 제공된 추론 규칙들에 따라 퍼지 출력들을 생성한다.The fuzzy inference unit 134 generates fuzzy outputs according to the fuzzy input values generated in the fuzzy unit 133 and the categorical input variable values provided in the data set DB 111 and the inference rules provided in the inference rule base 131 do.

역퍼지화부(135)는 퍼지 추론부(134)에서 생성된 퍼지 출력들을 출력 변수의 소속 함수에 기초하여 통합한 결과 값을 만성 심혈관 질환 위험도로서 생성한다.The inverse fuzzification unit 135 generates the result of integrating the fuzzy outputs generated in the fuzzy inference unit 134 based on the membership function of the output variable as a risk of chronic cardiovascular disease.

역퍼지화부(135)는 예를 들어 무게 중심법과 같은 주지의 통합 방법을 이용할 수 있다.The de-spreading unit 135 may use a well-known integrated method such as a gravity center method.

도 3은 본 발명의 일 실시예에 따른 만성 심혈관 질환 예측 모델 검증 시스템을 예시한 블록도이다.3 is a block diagram illustrating a system for verifying a model for predicting a cardiovascular disease according to an embodiment of the present invention.

도 3을 참조하면, 만성 심혈관 질환 예측 모델 검증 시스템(30)은 원천 데이터셋 DB(31), 트레이닝 셋(traning set) 저장부(32), 테스트 셋(test set) 저장부(33), 유효성 판정부(34)를 포함할 수 있다.3, the system 30 for verifying the prediction of a cardiovascular disease model includes a source data set DB 31, a training set storage 32, a test set storage 33, And a determination unit 34. [

원천 데이터셋 DB(31)는 도 1의 적응적 만성 심혈관 질환 예측 모델링 장치(10)에 인가될 입력 변수들과 출력 변수의 원천 데이터로서, 예를 들어 제5기 국가건강영양조사 데이터셋을 포함할 수 있다.The source dataset DB 31 includes, for example, the 5th National Health and Nutrition Survey data set as source data of input variables and output variables to be applied to the adaptive chronic cardiovascular disease prediction modeling apparatus 10 of FIG. can do.

트레이닝 셋 저장부(32)는 원천 데이터 중에서 선별되어 적응적 만성 심혈관 질환 예측 모델링 장치(10)에 인가될 입력 변수들 및 출력 변수로 구성된 트레이닝 셋을 저장한다.The training set storage unit 32 stores a training set composed of input variables and output variables to be selected from the source data and applied to the adaptive chronic cardiovascular disease prediction modeling apparatus 10. [

테스트 셋 저장부(33)는 원천 데이터 중에서 선별되어 적응적 만성 심혈관 질환 예측 모델링 장치(10)의 유효성을 검증하기 위해 인가될 입력 변수들 및 출력 변수들로 구성된 테스트 셋을 저장한다.The test set storage unit 33 stores a test set composed of input variables and output variables to be selected in order to validate the adaptive chronic cardiovascular disease prediction modeling apparatus 10 from the source data.

도 1의 적응적 만성 심혈관 질환 예측 모델링 장치(10)가 트레이닝 셋 저장부(32)에 저장된 트레이닝 셋에 기초하여 생성된 추론 규칙들 및 퍼지 파라미터들을 가지고 모델링이 완료되면, 유효성 판정부(34)는, 테스트 셋 저장부(33)에 저장된 테스트 셋의 입력 변수들을 적응적 만성 심혈관 질환 예측 모델링 장치(10)에 인가하여 얻은 결과 값인 만성 심혈관 질환 위험도를 실제 테스트 셋에 포함된 심혈관 유병 여부와 비교하고, 다음 수학식과 같이, 민감도(sensitivity), 특이도(specificity) 및 정확도(accuracy)를 산출하여 적응적 만성 심혈관 질환 예측 모델링 장치(10)의 유효성(validity)을 검증할 수 있다.When the adaptive chronic cardiovascular disease prediction modeling device 10 of FIG. 1 completes modeling with inference rules and fuzzy parameters generated based on the training set stored in the training set storage 32, The risk of chronic cardiovascular disease, which is the result obtained by applying the input variables of the test set stored in the test set storage unit 33 to the adaptive chronic cardiovascular disease prediction modeling apparatus 10, is compared with the cardiovascular disease included in the actual test set The validity of the adaptive chronic cardiovascular disease prediction modeling device 10 can be verified by calculating the sensitivity, specificity and accuracy as shown in the following equation.

Figure pat00001
Figure pat00001

여기서, TP(True Positive)는 심혈관 질환이 있는 사례에서 심혈관 질환이 있다고 제대로 예측한 경우이고, TN(True Negative)는 심혈관 질환이 없는 사례에서 심혈관 질환이 없다고 제대로 예측한 경우이며, FP(False Positive)는 심혈관 질환이 없는 사례에서 심혈관 질환이 있다고 잘못 예측한 경우이고, FN(False Negative)는 심혈관 질환이 있는 사례에서 심혈관 질환이 없다고 잘못 예측한 경우이다.True Positive (TP) is a true predictor of cardiovascular disease in patients with cardiovascular disease. TN (True Negative) is a well-predicted absence of cardiovascular disease in patients without cardiovascular disease. FP (False Positive) ) Were misdiagnosed as having cardiovascular disease in the absence of cardiovascular disease, and FN (false negative) was a misdiagnosis that there was no cardiovascular disease in a patient with cardiovascular disease.

이 경우에, 수학식 1에 따라, 민감도는 심혈관 질환이 있는 사례들 중에 심혈관 질환을 제대로 예측한 비율이고, 특이도는 심혈관 질환이 없는 사례들 중에 심혈관 질환이 없음을 제대로 예측한 비율이다. 정확도는 전체 사례들 중에 정확하게 예측한 사례들의 비율이다.In this case, according to Equation (1), the sensitivity is the ratio of accurately predicting cardiovascular disease among the cases with cardiovascular disease, and the specificity is the ratio of correctly predicted absence of cardiovascular disease among cases without cardiovascular disease. Accuracy is the percentage of accurately predicted cases among all cases.

이러한 만성 심혈관 질환 예측 모델 검증 시스템(30)에 의해 도 1에서 제안된 적응적 만성 심혈관 질환 예측 모델링 장치(10)를 검증한 결과는 표 1과 같다.Table 1 shows the results of verifying the adaptive chronic cardiovascular disease prediction modeling apparatus 10 proposed in FIG. 1 by the system for verifying the predicted model of chronic cardiovascular diseases (30).

모델Model 민감도responsiveness 특이도Specificity 정확도accuracy 인공신경망Artificial neural network 0.8310.831 0.5560.556 0.8190.819 로지스틱 회귀분석Logistic regression analysis 0.8320.832 0.50.5 0.8170.817 C&R 트리C & R tree 0.9430.943 0.250.25 0.8150.815 C5.0C5.0 0.8550.855 0.5220.522 0.8190.819 제안된 모델링Proposed Modeling 0.8380.838 0.5830.583 0.8240.824

표 1을 참조하면, 도 1의 제안된 적응적 만성 심혈관 질환 예측 모델링 장치(10)는 인공신경망 기법, 로지스틱 회귀 분석 기법, C&R 트리 및 C5.0 등의 기존 기법들에 비해 민감도는 비슷하지만 특이도와 정확도는 개선되었음을 알 수 있다.Referring to Table 1, the proposed adaptive chronic cardiovascular disease prediction modeling apparatus 10 of FIG. 1 is similar in sensitivity to conventional techniques such as artificial neural network technique, logistic regression technique, C & R tree and C5.0, The accuracy of the correction is improved.

본 실시예 및 본 명세서에 첨부된 도면은 본 발명에 포함되는 기술적 사상의 일부를 명확하게 나타내고 있는 것에 불과하며, 본 발명의 명세서 및 도면에 포함된 기술적 사상의 범위 내에서 당업자가 용이하게 유추할 수 있는 변형예와 구체적인 실시예는 모두 본 발명의 권리범위에 포함되는 것이 자명하다고 할 것이다.It is to be understood that both the foregoing general description and the following detailed description of the present invention are exemplary and explanatory and are intended to provide further explanation of the invention as claimed. It will be understood that variations and specific embodiments which may occur to those skilled in the art are included within the scope of the present invention.

또한, 본 발명에 따른 장치는 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 기록매체의 예로는 ROM, RAM, 광학 디스크, 자기 테이프, 플로피 디스크, 하드 디스크, 비휘발성 메모리 등을 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.Further, the apparatus according to the present invention can be implemented as a computer-readable code on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the recording medium include ROM, RAM, optical disk, magnetic tape, floppy disk, hard disk, nonvolatile memory and the like. The computer-readable recording medium may also be distributed over a networked computer system so that computer readable code can be stored and executed in a distributed manner.

10 적응적 만성 심혈관 질환 예측 모델링 장치
11 규칙 유도부
111 데이터셋 DB
112 의사 결정 나무 기반 규칙 생성부
113 추론 규칙 저장부
12 퍼지 파라미터 생성부
121 소속 함수 결정부
122 퍼지 파라미터 저장부
13 질환 위험 추론부
131 추론 규칙 베이스
132 소속 함수 저장부
133 퍼지화부
134 퍼지 추론부
135 역퍼지화부
30 만성 심혈관 질환 예측 모델 검증 시스템
31 원천 데이터셋 DB
32 트레이닝 셋 저장부
33 테스트 셋 저장부
34 유효성 판정부
10 Adaptive chronic cardiovascular disease prediction modeling device
11 rule guide
111 Dataset DB
112 decision tree-based rule generation unit
113 Reasoning rule storage unit
12 fuzzy parameter generator
121 belonging function determining unit
122 Purge parameter storage unit
13 Disease Risk Inference Department
131 Inference rule base
132 belonging function storage unit
133 fuzzifier
134 Fuzzy reasoning
135 station fuzzifier
30 Chronic cardiovascular disease prediction model validation system
31 Source Data Set DB
32 Training Set Storage Unit
33 Test Set Storage Section
34 validity judgment section

Claims (6)

원천 데이터 중에서 선별되어 적응적 만성 심혈관 질환 예측 모델링 장치에 인가될 입력 변수들 및 출력 변수로 구성된 트레이닝 셋을 저장하는 트레이닝 셋 저장부;
상기 원천 데이터 중에서 선별되어 상기 적응적 만성 심혈관 질환 예측 모델링 장치의 유효성을 검증하기 위해 인가될 입력 변수들 및 출력 변수들로 구성된 테스트 셋을 저장하는 테스트 셋 저장부; 및
상기 적응적 만성 심혈관 질환 예측 모델링 장치가 상기 트레이닝 셋 저장부에 저장된 트레이닝 셋에 기초하여 생성된 추론 규칙들 및 퍼지 파라미터들을 가지고 모델링이 완료되면, 상기 테스트 셋 저장부에 저장된 테스트 셋의 입력 변수들을 상기 적응적 만성 심혈관 질환 예측 모델링 장치에 인가하여 얻은 결과 값인 만성 심혈관 질환 위험도를 실제 테스트 셋에 포함된 심혈관 유병 여부와 비교하고, 민감도, 특이도 및 정확도를 산출하여 상기 적응적 만성 심혈관 질환 예측 모델링 장치의 유효성을 검증하는 유효성 판정부를 포함하는 만성 심혈관 질환 예측 모델 검증 시스템.
A training set storage unit for storing a training set selected from source data and configured of input variables and output variables to be applied to an adaptive chronic cardiovascular disease prediction modeling apparatus;
A test set storage unit for storing a test set selected from the source data and configured to include input parameters and output parameters to be applied to validate the adaptive cardiovascular disease prediction modeling device; And
When the modeling of the adaptive cardiovascular disease prediction modeling apparatus is completed with inference rules and fuzzy parameters generated based on the training set stored in the training set storage unit, the input variables of the test set stored in the test set storage unit The risk of chronic cardiovascular disease, which is the result obtained by applying to the adaptive chronic cardiovascular disease prediction modeling apparatus, is compared with the presence of cardiovascular disease included in the actual test set, and the sensitivity, specificity, and accuracy are calculated to determine the adaptive chronic cardiovascular disease prediction modeling And a validity judgment unit for verifying validity of the device.
청구항 1에 있어서, 상기 적응적 만성 심혈관 질환 예측 모델링 장치는
복수의 범주형 건강 관련 항목들 및 연속 수치형 신체 지수 항목들을 입력 변수로 가지고 심혈관 유병 여부 항목을 출력 변수로 가지는 데이터셋으로부터, 입력 변수들로부터 출력 변수가 유도될 수 있는 적어도 하나의 추론 규칙들을 생성하는 규칙 유도부;
상기 입력 변수들 중 각각의 연속형 입력 변수들에 대해, 상기 생성된 추론 규칙들에 기초하여, 퍼지 변수들에 상응하는 소속 함수들의 개수 및 각 소속 함수의 배치와 형태에 관한 퍼지 파라미터들을 결정하는 퍼지 파라미터 생성부; 및
상기 입력 변수들에 대해, 상기 생성된 추론 규칙들과 소속 함수들을 기초로 퍼지 추론하여 만성 심혈관 질환 위험도를 결과 값을 출력하는 질환 위험 추론부를 포함하는 것을 특징으로 하는 만성 심혈관 질환 예측 모델 검증 시스템.
The device of claim 1, wherein the adaptive chronic cardiovascular disease prediction modeling device
From the data set having a plurality of categorical health-related items and continuous numerical body index items as input variables and having a cardiovascular disease item as an output variable, at least one inference rule from which the output variable can be derived from the input variables A rule inducing unit for generating a rule;
For each continuous input variable among the input variables, the number of belonging functions corresponding to the fuzzy variables and the fuzzy parameters related to the arrangement and type of each belonging function are determined based on the generated reasoning rules A fuzzy parameter generation unit; And
And a disease risk inferring unit for performing fuzzy inference on the input parameters based on the generated inference rules and membership functions to output a result of the risk assessment of chronic cardiovascular disease.
청구항 2에 있어서,
상기 입력 변수들은 범주형 건강 관련 항목들 중에서 성별, 흡연 여부, 당뇨 여부는 범주형 입력 변수와 연속 수치형 신체 지수 항목들 중에서 나이, 총 콜레스테롤 수치, LDL 콜레스테롤 수치, HDL 콜레스테롤 수치, 최고 혈압 수치 및 최저 혈압 수치는 연속형 입력 변수를 포함하고,
상기 출력 변수는 심혈관 유병 여부 항목들 중에서 고혈압, 고지혈증, 뇌졸증, 심근경색, 협심증의 5개 질환 발병율인 것을 특징으로 하는 만성 심혈관 질환 예측 모델 검증 시스템.
The method of claim 2,
Among the categorical health-related items, sex, smoking status, and diabetes were classified as age, total cholesterol, LDL cholesterol, HDL cholesterol, systolic blood pressure, The lowest blood pressure value includes a continuous input variable,
Wherein the output parameter is an incidence rate of five diseases of hypertension, hyperlipidemia, stroke, myocardial infarction, and angina pectoris among the items of cardiovascular disease.
청구항 2에 있어서, 상기 추론 규칙들은 의사 결정 나무 알고리즘을 통해 도출되는 것을 특징으로 하는 만성 심혈관 질환 예측 모델 검증 시스템.The system of claim 2, wherein the inference rules are derived through a decision tree algorithm. 청구항 2에 있어서, 상기 퍼지 파라미터 생성부는,
상기 생성된 추론 규칙들에서 나타나는 연속형 입력 변수들 각각의 수치 범위들에 대해, 수치 범위들의 개수에 따라 퍼지 변수들 및 소속 함수들의 개수를 정하고, 수치 범위들의 분포에 따라 퍼지 변수들에 상응하는 소속 함수들의 배치와 형태에 관한 퍼지 파라미터들을 결정하도록 동작하는 것을 특징으로 하는 만성 심혈관 질환 예측 모델 검증 시스템.
The apparatus of claim 2, wherein the fuzzy parameter generator comprises:
For each numerical range of successive input variables appearing in the generated inference rules, the number of fuzzy variables and the belonging functions is determined according to the number of numeric ranges, and the number of the belonging functions corresponding to the fuzzy variables And to determine fuzzy parameters related to the placement and type of membership functions.
청구항 2에 있어서, 상기 질환 위험 추론부는,
상기 퍼지 파라미터들에 의해 배치와 형태가 정의된 소속 함수들 및 데이터셋에 포함된 연속형 입력 변수들을 기초로 퍼지 입력 값들을 생성하고, 생성된 퍼지 입력 값들, 데이터셋에 포함된 범주형 입력 변수 값들 및 추론 규칙들에 따라 퍼지 출력들을 생성하며, 생성된 퍼지 출력들을 출력 변수의 소속 함수에 기초하여 통합한 결과 값을 만성 심혈관 질환 위험도로서 생성하도록 동작하는 것을 특징으로 하는 만성 심혈관 질환 예측 모델 검증 시스템.
[Claim 3] The method according to claim 2,
Generating fuzzy input values based on successive input variables included in the data set and belonging functions whose placement and shape are defined by the fuzzy parameters and generating the fuzzy input values based on the generated fuzzy input values, And generates the fuzzy outputs according to the values and inference rules, and operates to generate the result of the integration based on the membership function of the output variable as the risk of chronic cardiovascular disease, system.
KR1020130127871A 2013-10-25 2013-10-25 System for qualifying chronic heart disease prediction model KR20150048302A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130127871A KR20150048302A (en) 2013-10-25 2013-10-25 System for qualifying chronic heart disease prediction model

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130127871A KR20150048302A (en) 2013-10-25 2013-10-25 System for qualifying chronic heart disease prediction model

Publications (1)

Publication Number Publication Date
KR20150048302A true KR20150048302A (en) 2015-05-07

Family

ID=53386819

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130127871A KR20150048302A (en) 2013-10-25 2013-10-25 System for qualifying chronic heart disease prediction model

Country Status (1)

Country Link
KR (1) KR20150048302A (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292853A (en) * 2020-01-15 2020-06-16 长春理工大学 Cardiovascular disease risk prediction network model based on multiple parameters and construction method thereof
WO2022119327A1 (en) * 2020-12-02 2022-06-09 (주)지놈오피니언 Method for measuring risk of cardio-cerebrovascular disease using congenital metabolic disease risk score

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111292853A (en) * 2020-01-15 2020-06-16 长春理工大学 Cardiovascular disease risk prediction network model based on multiple parameters and construction method thereof
WO2022119327A1 (en) * 2020-12-02 2022-06-09 (주)지놈오피니언 Method for measuring risk of cardio-cerebrovascular disease using congenital metabolic disease risk score

Similar Documents

Publication Publication Date Title
CN108351862B (en) Method and apparatus for determining developmental progress using artificial intelligence and user input
Einav et al. Screening and selection: The case of mammograms
US20180184960A1 (en) Method and system for monitoring stress conditions
US20180211727A1 (en) Automated Evidence Based Identification of Medical Conditions and Evaluation of Health and Financial Benefits Of Health Management Intervention Programs
Attallah et al. Bayesian neural network approach for determining the risk of re-intervention after endovascular aortic aneurysm repair
JP6379199B2 (en) Data analysis apparatus, data analysis apparatus control method, and data analysis apparatus control program
Ekong et al. A fuzzy inference system for predicting depression risk levels
Mamun et al. Mlheartdis: Can machine learning techniques enable to predict heart diseases?
Srivastav et al. Predictive Machine Learning Approaches for Chronic Kidney Disease
Semogan et al. A rule-based fuzzy diagnostics decision support system for tuberculosis
Vitianingsih et al. Spatial data modeling on GIS for classification of measles-prone region using multiple attribute decision making
KR20150048302A (en) System for qualifying chronic heart disease prediction model
Govindamoorthi et al. A likelihood swarm whale optimization based LeNet classifier approach for the prediction and diagnosis of patients with atherosclerosis disease
KR101464587B1 (en) Apparatus and method for chronic heart disease prediction modeling
Haraldsson et al. Predicting changes in quality of life for patients in vocational rehabilitation
Wojtusiak et al. C-LACE2: computational risk assessment tool for 30-day post hospital discharge mortality
KR20190104713A (en) Self-adaptive medical data analysis apparatus and method thereof
Raju et al. Chronic kidney disease prediction using ensemble machine learning
KR20220014242A (en) Prediction method and system of hypertension using machine learning, computer program for the same
Saleh et al. Handling varying amounts of missing data when classifying mental-health risk levels
Chowdhury et al. Incorporating an Integrated Software System for Stroke Prediction using Machine Learning Algorithms and Artificial Neural Network
Jage et al. Predicting Mental Health Illness using Machine Learning
Rajalakshmi et al. Inducement of Multivariate factors in Cardiac Disease Prediction with Machine Learning Techniques substantiated with Analytics
Khurana et al. Mental health prognosis using machine learning
Taspinar et al. Prediction of Sleep health status, visualization and analysis of data

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right