WO2022114791A1 - 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램 - Google Patents
빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램 Download PDFInfo
- Publication number
- WO2022114791A1 WO2022114791A1 PCT/KR2021/017434 KR2021017434W WO2022114791A1 WO 2022114791 A1 WO2022114791 A1 WO 2022114791A1 KR 2021017434 W KR2021017434 W KR 2021017434W WO 2022114791 A1 WO2022114791 A1 WO 2022114791A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- disease
- big data
- metabolic syndrome
- risk
- learning
- Prior art date
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 144
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 144
- 238000000034 method Methods 0.000 title claims abstract description 49
- 208000001145 Metabolic Syndrome Diseases 0.000 claims abstract description 116
- 201000000690 abdominal obesity-metabolic syndrome Diseases 0.000 claims abstract description 116
- 238000004458 analytical method Methods 0.000 claims description 56
- 238000013135 deep learning Methods 0.000 claims description 23
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 claims description 20
- 208000032928 Dyslipidaemia Diseases 0.000 claims description 18
- 208000017170 Lipid metabolism disease Diseases 0.000 claims description 18
- 230000002159 abnormal effect Effects 0.000 claims description 18
- 206010012601 diabetes mellitus Diseases 0.000 claims description 18
- 206010020772 Hypertension Diseases 0.000 claims description 17
- 102000015779 HDL Lipoproteins Human genes 0.000 claims description 15
- 108010010234 HDL Lipoproteins Proteins 0.000 claims description 15
- 208000029078 coronary artery disease Diseases 0.000 claims description 15
- 208000020832 chronic kidney disease Diseases 0.000 claims description 14
- 239000008280 blood Substances 0.000 claims description 11
- 210000004369 blood Anatomy 0.000 claims description 11
- 230000003187 abdominal effect Effects 0.000 claims description 10
- 235000012000 cholesterol Nutrition 0.000 claims description 10
- 230000036772 blood pressure Effects 0.000 claims description 9
- 230000001684 chronic effect Effects 0.000 claims description 9
- 208000030159 metabolic disease Diseases 0.000 claims description 9
- 208000016097 disease of metabolism Diseases 0.000 claims description 8
- 208000023516 stroke disease Diseases 0.000 claims description 7
- 150000003626 triacylglycerols Chemical class 0.000 claims description 7
- 208000006011 Stroke Diseases 0.000 claims description 5
- 238000007477 logistic regression Methods 0.000 claims description 5
- 238000013480 data collection Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000011176 pooling Methods 0.000 description 7
- 230000010354 integration Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 230000002265 prevention Effects 0.000 description 3
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000035487 diastolic blood pressure Effects 0.000 description 2
- 238000010191 image analysis Methods 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- 230000035488 systolic blood pressure Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002490 cerebral effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 231100000517 death Toxicity 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008506 pathogenesis Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 230000002792 vascular Effects 0.000 description 1
Images
Classifications
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/02—Detecting, measuring or recording pulse, heart rate, blood pressure or blood flow; Combined pulse/heart-rate/blood pressure determination; Evaluating a cardiovascular condition not otherwise provided for, e.g. using combinations of techniques provided for in this group with electrocardiography or electroauscultation; Heart catheters for measuring blood pressure
- A61B5/021—Measuring pressure in heart or blood vessels
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/145—Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/145—Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue
- A61B5/14532—Measuring characteristics of blood in vivo, e.g. gas concentration, pH value; Measuring characteristics of body fluids or tissues, e.g. interstitial fluid, cerebral tissue for measuring glucose, e.g. by tissue impedance measurement
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/20—Measuring for diagnostic purposes; Identification of persons for measuring urological functions restricted to the evaluation of the urinary system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/20—Measuring for diagnostic purposes; Identification of persons for measuring urological functions restricted to the evaluation of the urinary system
- A61B5/201—Assessing renal or kidney functions
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61B—DIAGNOSIS; SURGERY; IDENTIFICATION
- A61B5/00—Measuring for diagnostic purposes; Identification of persons
- A61B5/72—Signal processing specially adapted for physiological signals or for diagnostic purposes
- A61B5/7271—Specific aspects of physiological measurement analysis
- A61B5/7275—Determining trends in physiological measurement data; Predicting development of a medical condition based on physiological measurements, e.g. determining a risk factor
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Definitions
- the present invention relates to a big data-based disease risk prediction system, prediction method, and program.
- Metabolic syndrome which can be expressed as a collection of adult diseases, has steadily increased over the past 10 years.
- CAD Coronary Artery Disease
- CVA Cerebral Vascular Accident
- CKD chronic kidney disease
- the present invention generates and analyzes big data based on the onset factors of metabolic syndrome accumulated over time, and recognizes or predicts the occurrence and risk of a specific disease, thereby predicting a risk situation in advance.
- the big data-based disease risk prediction system for achieving the above-described technical problem is composed of one or more computers, and collects the input metabolic syndrome onset factor values for the metabolic syndrome onset factors over time.
- An analysis server that forms data and analyzes the big data to predict the disease risk of a specific disease, and a client connected to the analysis server, wherein the client receives the input metabolic syndrome onset factor value, the Provided to the analysis server, receive and output the disease risk from the analysis server, the input metabolic syndrome onset factor value includes abdominal circumference, blood pressure, blood sugar, HDL (High-Density Lipoprotein) cholesterol and triglycerides,
- HDL High-Density Lipoprotein
- the analysis server uses the deep learning learning model to learn the input metabolic syndrome onset factor value and the disease risk of the specific disease as a dataset, and predict the disease risk with the deep learning learning model. have.
- the analysis server generates learning data by accumulating the input metabolic syndrome onset factor value, calculates a normal metabolic syndrome onset factor value within a normal range through analysis of the learning data, and the input metabolic syndrome onset factor value It may be determined whether a specific range formed based on the normal metabolic syndrome onset factor value is exceeded.
- the analysis server may generate learning data by accumulating the input metabolic syndrome onset factor values, and extract the disease risk from the learning data.
- the analysis server accumulates specific situation data by matching the abnormal characteristic information, recognizes specific abnormal characteristic information within the input metabolic syndrome onset factor value, and generates situation data corresponding to the recognized abnormal characteristic information. can be sent to the client.
- the analysis server may analyze the big data by logistic regression analysis.
- the specific disease may include at least one of hypertension, dyslipidemia, diabetes, coronary artery disease, stroke, and chronic kidney disease.
- the analysis server predicts the risk of metabolic syndrome including at least one of the hypertension, the dyslipidemia, and the diabetes based on the big data, and the big data and the predicted risk of the metabolic syndrome Based on , the risk of chronic metabolic disease including at least one of the coronary artery disease, the stroke, and the chronic kidney disease may be predicted.
- the risk of developing the disease may include at least one of an onset time of the specific disease and an incidence rate of the specific disease.
- the client may include an input device that receives the input metabolic syndrome onset factor value and provides it to the analysis server, and an output device that receives and outputs the disease risk from the analysis server.
- the big data-based disease risk prediction method includes the steps of: obtaining an input metabolic syndrome onset factor value for a metabolic syndrome onset factor; and collecting the input metabolic syndrome onset factor value over time A big data collection step of forming data, and a disease risk prediction step of predicting the disease risk of a specific disease by analyzing the big data, wherein the input metabolic syndrome onset factor values are abdominal circumference, blood pressure, blood sugar, Including high-density lipoprotein (HDL) cholesterol and triglycerides, and in the step of predicting the risk of developing the disease, when at least three of the input metabolic syndrome onset factor values exceed a reference value set based on the big data, the specific disease It is characterized in that the risk of developing the disease is predicted.
- HDL high-density lipoprotein
- the disease risk prediction step is a learning step of learning the input metabolic syndrome onset factor value and the disease risk of the specific disease as a dataset using a deep learning learning model by one or more computers, and the deep learning It may include predicting the risk of developing the disease with a learning model.
- the learning step includes generating learning data by accumulating the input metabolic syndrome onset factor values, calculating a normal metabolic syndrome onset factor value within a normal range through analysis of the learning data, and the input metabolic syndrome
- the method may include determining whether the onset factor value exceeds a specific range formed based on the normal metabolic syndrome onset factor value.
- the learning step may include generating learning data by accumulating the input metabolic syndrome onset factor values, and extracting the disease risk from the learning data.
- the learning step includes accumulating specific situation data by matching abnormal characteristic information, recognizing specific abnormal characteristic information within the input metabolic syndrome onset factor value, and a situation corresponding to the recognized abnormal characteristic information.
- the method may further include transmitting the data to the client.
- the step of predicting the risk of developing the disease may analyze the big data by logistic regression analysis.
- the specific disease may include at least one of hypertension, dyslipidemia, diabetes, coronary artery disease, stroke, and chronic kidney disease.
- the disease risk prediction step includes predicting the risk of metabolic syndrome including at least one of the hypertension, dyslipidemia, and diabetes based on the big data, and the big data and the predicted risk.
- the method may include predicting the risk of chronic metabolic disease including at least one of the coronary artery disease, the stroke, and the chronic kidney disease.
- the risk of developing the disease may include at least one of an onset time of the specific disease and an incidence rate of the specific disease.
- the present invention includes a big data-based disease risk prediction program stored in a computer-readable recording medium to execute the big data-based disease risk prediction method of claims 11 to 19 in combination with a computer that is hardware. can do.
- big data based on generating and analyzing big data based on the metabolic syndrome onset factors accumulated over time, recognizing or predicting the occurrence and risk of a specific disease, thereby preventing dangerous situations in advance It is possible to provide a system for predicting the risk of developing a disease, a method for predicting, and a program.
- FIG. 1 is a block diagram schematically illustrating a big data-based disease risk prediction system according to an embodiment of the present invention.
- FIG. 2 is a flowchart schematically illustrating a method for predicting the risk of disease onset based on big data according to an embodiment of the present invention.
- the computer includes all of various devices capable of visually presenting a result to a user by performing arithmetic processing.
- computers include desktop PCs and notebooks (Note Books) as well as smart phones, tablet PCs, cellular phones, PCS phones (Personal Communication Service phones), synchronous/asynchronous A mobile terminal of International Mobile Telecommunication-2000 (IMT-2000), a Palm Personal Computer (PC), a Personal Digital Assistant (PDA), and the like may also be applicable.
- the computer may be a medical device for acquiring or observing a medical image.
- the computer may correspond to a server computer connected to various client computers.
- FIG. 1 is a block diagram schematically illustrating a big data-based disease risk prediction system according to an embodiment of the present invention.
- the big data-based disease risk prediction system 10 includes an analysis server 100 and a client 200 .
- the analysis server 100 is composed of one or more computers.
- the analysis server 100 forms the big data 110 by collecting the input metabolic syndrome onset factor values according to the metabolic syndrome onset factors over time.
- the analysis server 100 analyzes the big data 110 to predict the disease risk of a specific disease.
- metabolic syndrome in the pathogenesis of metabolic syndrome may include, for example, at least one of hypertension, dyslipidemia, and diabetes.
- selection over time may mean that the input metabolic syndrome onset factor value is provided before receiving the current input metabolic syndrome onset factor value, for example, at least once or more.
- the collection over time may mean collecting the input metabolic syndrome onset factor values provided in the past 3 years.
- the big data 110 may be the National Health Insurance Corporation big data.
- Factors in the development of metabolic syndrome include, for example, abdominal circumference, blood pressure, blood sugar, HDL cholesterol, and triglycerides.
- the analysis server 100 may accumulate and collect values of input metabolic syndrome onset factors for a specific period. For example, the analysis server 100 may accumulate and collect values of input metabolic syndrome onset factors for 5 years. For example, the analysis server 100 may accumulate and collect values of input metabolic syndrome onset factors for the past 3 years. For example, the analysis server 100 may accumulate and collect values of input metabolic syndrome onset factors for the past 5 years.
- the analysis server 100 analyzes the big data 110 .
- the analysis server 100 may analyze the big data 110 by, for example, logistic regression analysis.
- the analysis server 100 may predict the disease risk when at least three of the input metabolic syndrome onset factor values exceed a reference value set based on big data.
- the reference value may be, for example, a reference for evaluating the absolute value of the input metabolic syndrome onset factor value, or a reference for evaluating the difference between the input metabolic syndrome onset factor value and a normal value set based on big data.
- the analysis server 100 determines whether the input metabolic syndrome onset factor value, for example, at least three of abdominal circumference, blood pressure, blood sugar, HDL cholesterol, and triglyceride exceeds a reference value set based on big data By determining whether to exceed or not to exceed, the risk of developing a disease can be predicted.
- the input metabolic syndrome onset factor value for example, at least three of abdominal circumference, blood pressure, blood sugar, HDL cholesterol, and triglyceride exceeds a reference value set based on big data
- the specific disease for which the risk is predicted from the risk of developing the disease may include, for example, at least one of hypertension, dyslipidemia, diabetes, coronary artery disease, stroke, and chronic kidney disease.
- the analysis server 100 may predict the risk of metabolic syndrome including at least one of hypertension, dyslipidemia, and diabetes based on the big data 110 . For example, when at least three of the input metabolic syndrome onset factor values exceed the reference value set based on the big data 110 , the analysis server 100 determines metabolic syndrome including at least one of hypertension, dyslipidemia, and diabetes. risk can be predicted.
- the analysis server 100 may predict the risk of chronic metabolic disease including at least one of coronary artery disease, stroke, and chronic kidney disease, based on the big data 110 and the risk of metabolic syndrome. . For example, when at least one of hypertension, dyslipidemia, and diabetes for which the risk is predicted exceeds a reference value set based on the big data 110, the risk of developing a chronic metabolic disease in which the metabolic syndrome has developed can be predicted. .
- the risk of stroke may be predicted.
- the risk of coronary artery disease may be predicted.
- the risk of chronic kidney disease may be predicted.
- the risk of coronary artery disease may be predicted.
- the risk of developing a disease may include, for example, at least one of an onset time of a specific disease and an incidence rate of the specific disease.
- the deep learning learning model 120 will be described.
- the analysis server 100 is composed of one or more computers to form the deep learning learning model 120, and serves to determine the level of the risk of disease onset by the input metabolic syndrome onset factor value.
- the deep learning learning model 120 refers to a system or network that builds one or more layers in one or more computers and performs judgment based on a plurality of data.
- the deep learning learning model 120 is implemented as a set of layers including a convolutional pooling layer, a locally-connected layer, and a fully-connected layer.
- a convolutional pooling layer or a local access layer may be configured to extract features in an image.
- the fully connected layer can determine the correlation between features of the image.
- the overall structure of the deep learning learning model 120 may be formed in a form in which a local access layer is connected to a convolutional pooling layer, and a fully connected layer is formed in the local access layer.
- the deep learning learning model 120 may include various judgment criteria (ie, parameters), and may add new judgment criteria (ie, parameters) through input image analysis.
- the parameters may include, for example, abdominal circumference, blood pressure, blood sugar, high-density lipoprotein (HDL) cholesterol and triglycerides.
- the parameters may further include at least one of drinking, smoking, exercise, family history, past medical history, current medical history, BMI, age, height, weight, and living environment.
- the parameter includes abdominal circumference and gender, if male, for example, abdominal circumference greater than 90 cm , it may be normal if it is less than .
- the risk of metabolic syndrome when the parameter includes blood pressure, if the systolic blood pressure (SBP) value is, for example, 130 mmHg or more, or the diastolic blood pressure (DBP) value is, for example, 80 mmHg or more, the risk of metabolic syndrome may be, and when it is outside the above range, it may be normal.
- SBP systolic blood pressure
- DBP diastolic blood pressure
- the parameter when the parameter includes blood sugar, if the blood sugar level is, for example, 100 mg/dL or more, it may be a risk of metabolic syndrome, and if it is less than it, it may be normal.
- the parameter includes HDL cholesterol
- the HDL cholesterol value is, for example, 240 mg/dL or higher, it may be a metabolic syndrome risk, and if it is lower, it may be normal.
- the parameter includes triglycerides
- the triglyceride value is, for example, 150 mg/dL or more, it may be a metabolic syndrome risk, and if it is less than it, it may be normal.
- the deep learning learning model 120 is a structure called a convolutional neural network suitable for image analysis, and a feature extraction layer that learns by itself the feature with the greatest discriminative power from the given image data. (Feature Extraction Layer) and a prediction layer that learns a prediction model to obtain the highest prediction performance based on the extracted features may have an integrated structure.
- the feature extraction layer spatially integrates the convolution layer, which creates a feature map by applying a plurality of filters to each area of the image, and the feature map to obtain features that are invariant to changes in position or rotation. It may be formed in a structure in which a pooling layer that can be extracted is alternately repeated several times. Through this, various level features can be extracted from low-level features such as points, lines, and planes to complex and meaningful high-level features.
- the convolutional layer obtains a feature map by taking a nonlinear activation function on the dot product of the filter and the local receptive field for each patch of the input image. Therefore, CNNs are characterized by using filters with sparse connectivity and shared weights. This connection structure reduces the number of parameters to be learned, makes learning through the backpropagation algorithm efficient, and consequently improves prediction performance.
- the integration layer (Pooling Layer or Sub-sampling Layer) generates a new feature map by using local information of the feature map obtained from the previous convolutional layer.
- the newly created feature map by the integration layer is reduced to a smaller size than the original feature map.
- Representative integration methods include Max Pooling, which selects the maximum value of the corresponding region in the feature map, and the corresponding feature map in the feature map. There is an average pooling method that obtains the average value of a region.
- the feature map of the integrated layer may be less affected by the position of an arbitrary structure or pattern existing in the input image than the feature map of the previous layer. That is, the integration layer can extract features that are more robust to regional changes such as noise or distortion in the input image or previous feature map, and these features can play an important role in classification performance. Another role of the integration layer is to reflect the characteristics of a wider area as you go up to the upper learning layer in the deep structure. It is possible to generate features that reflect the characteristics of the abstract image as a whole.
- the features finally extracted through repetition of the convolutional layer and the integration layer are fully connected to the classification model such as multi-layer perception (MLP) or support vector machine (SVM). -connected layer) and can be used for classification model training and prediction.
- MLP multi-layer perception
- SVM support vector machine
- the structure of the deep learning learning model 120 is not limited thereto, and may be formed of a neural network of various structures.
- the client 200 receives the input metabolic syndrome onset factor value and provides it to the analysis server 100 .
- the client 200 receives the disease risk from the analysis server 100 and outputs it.
- the client 200 may include an input device 210 and an output device 220 .
- the input device 210 and the output device 220 may be implemented as one device or as separate devices.
- the input device 210 may be a device that receives the metabolic syndrome onset factor and transmits the corresponding input metabolic syndrome onset factor value to the analysis server 100 .
- the input device 210 may receive the blood of a user who needs to analyze the risk of developing a disease, and may calculate factors for developing metabolic syndrome.
- the output device 220 may receive the disease onset risk result from the analysis server 100 and provide the determination result to the user in various ways.
- the output device 220 may include a display unit to visually display the risk of disease onset and provide it to the user.
- the output device 220 may generate a vibration to notify the user that the risk of developing a disease is high.
- the method in which the output device 220 provides the result of determining the risk of disease to the user is not limited thereto, and various output methods that can be provided to the user, such as sound output, may be used.
- the output device 220 according to an embodiment of the present invention may include a mobile terminal.
- FIG. 2 is a flowchart schematically illustrating a method for predicting the risk of disease onset based on big data according to an embodiment of the present invention.
- the big data-based disease risk prediction method includes the steps of obtaining an input metabolic syndrome onset factor value for the metabolic syndrome onset factor (S100), big data It includes a collection step (S200), and a disease risk prediction step (S300).
- An input metabolic syndrome onset factor value for the metabolic syndrome onset factor is acquired (S100).
- the input metabolic syndrome onset factor value may be input from the client 200 and provided to the analysis server 100 .
- the input metabolic syndrome onset factor value may be input to the input device 210 and provided to the analysis server 100 .
- the input metabolic syndrome onset factor values are collected over time to form big data (S200).
- the big data collection step ( S200 ) may be performed in the analysis server 100 .
- the disease risk of a specific disease is predicted (S300).
- the disease risk may be provided from the analysis device 100 to the output device 220 .
- the output device 220 may be implemented as a single device with the input device 210 , or may be implemented as separate devices.
- the disease risk prediction step (S300) is a learning step of learning the input metabolic syndrome onset factor value and the disease risk of a specific disease as a dataset by one or more computers, using a deep learning learning model, and predicting the risk of developing a disease with the deep learning learning model 120 .
- the disease risk prediction step ( S300 ) is based on the big data 110 , predicting the risk of metabolic syndrome including at least one of hypertension, dyslipidemia, and diabetes, and big data ( 110) and predicting the risk of chronic metabolic disease, including at least one of coronary artery disease, stroke, and chronic kidney disease, based on the predicted risk of metabolic syndrome.
- the disease risk prediction step (S300) is performed by using one or more computers, using a deep learning learning model, input metabolic syndrome onset factor value, metabolic syndrome onset risk, and disease onset risk of a specific disease as a dataset It may include a learning step of learning with the method, and a step of predicting the risk of onset of the target syndrome and the risk of onset of the disease with the deep learning learning model 120 .
- the disease risk may be determined by parameters of the deep learning learning model 120 mentioned above.
- the learning step may include generating learning data by accumulating input metabolic syndrome onset factor values. Through the analysis of the learning data, the normal metabolic syndrome onset factor values are calculated. It may be determined whether the input metabolic syndrome onset factor value exceeds a specific range formed based on the normal metabolic syndrome onset factor value.
- the learning step may include generating learning data by accumulating input metabolic syndrome onset factor values corresponding to tissues provided from one or more tissue analysis apparatuses 200 . It is possible to extract abnormal feature information from the training data.
- the learning step may include accumulating specific situation data by matching it with abnormal characteristic information.
- the abnormal characteristic information may mean having a value less than a normal range based on, for example, abdominal circumference, blood pressure, blood sugar, HDL cholesterol, and triglyceride. It is possible to recognize specific abnormal characteristic information within the input metabolic syndrome onset factor value. Context data corresponding to the recognized abnormal characteristic information may be transmitted to the client.
- the situational data corresponding to the abnormal characteristic information may be, for example, a disease risk.
- the big data-based disease risk prediction method is implemented as a program (or application) to be executed in combination with a computer, which is hardware. can be saved.
- a program is a code coded in a computer language such as C, C++, JAVA, or machine language that the computer's processor (CPU) can read through the computer's device interface in order for the computer to read the program and execute the methods implemented as the program.
- code may be included. Such code may include functional code related to a function defining functions necessary for executing the methods, etc. .
- the code may further include additional information necessary for the processor of the computer to execute functions or code related to memory reference for which location (address address) in the internal or external memory of the computer should be referenced.
- the code uses the computer's communication module to determine how to communicate with any other remote computer or server. , may further include a communication-related code for which information or media should be transmitted/received during communication.
- the storage medium is not a medium that stores data for a short moment, such as a register, a cache, a memory, etc., but a medium that stores data semi-permanently and can be read by a device.
- examples of the storage medium include, but are not limited to, ROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage device. That is, the program may be stored in various recording media on various servers that the computer can access or in various recording media on the user's computer.
- the medium may be distributed in a network-connected computer system, and computer-readable codes may be stored in a distributed manner.
- the big data-based disease risk prediction system, prediction method, and program according to an embodiment of the present invention generate and analyze big data based on the metabolic syndrome onset factors accumulated over time, By recognizing or predicting the degree of risk, dangerous situations can be prevented in advance.
- the big data-based disease risk prediction system, prediction method, and program according to an embodiment of the present invention are based on the big data generated based on the metabolic syndrome onset factors accumulated over time, Risk can be recognized or predicted with deep learning technology.
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Pathology (AREA)
- Physics & Mathematics (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Primary Health Care (AREA)
- Animal Behavior & Ethology (AREA)
- Veterinary Medicine (AREA)
- Molecular Biology (AREA)
- Surgery (AREA)
- Heart & Thoracic Surgery (AREA)
- Biophysics (AREA)
- Databases & Information Systems (AREA)
- Physiology (AREA)
- Cardiology (AREA)
- Urology & Nephrology (AREA)
- Optics & Photonics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Psychiatry (AREA)
- Emergency Medicine (AREA)
- Vascular Medicine (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
본 발명은 시간에 따라 누적된 대사 증후군의 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램에 관한 것이다.
Description
본 발명은 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램에 관한 것이다.
전 세계적으로 가장 빠른 속도로 초고령화 시대에 접어들면서 기대수명은 늘어나고 있지만 건강수명은 오히려 조금씩 줄어드는 추세로서 "건강한 백세시대”를 위해서는 둘의 간극을 줄이는 것이 최대 관건이다,
성인병의 집합체로 표현할 수 있는 대사 증후군은 지난 10년간 꾸준히 증가추세로 1998년 성인 4명 중 1명꼴이었던 대사 증후군 유병률은 최근 3명 중 1명꼴로 증가한 상태이다.
건강 수명을 늘리기 위한 방안은 대사 증후군 중 핵심 3개 만성 대사 질환인 고혈압, 이상지질혈증 및 당뇨병을 예방하고 관리하는 것이 관상 동맥 질환(CAD: Coronary Artery Disease), 뇌졸중(CVA: Cerebral Vascular Accident) 및 만성 신장 질환(CKD: Chronic Kidney Disease)의 발생을 막고 이들에 의한 사망을 줄일 수 있는 최선이다.
다만, 성별, 연령별로 대사 증후군의 발생 현황이 매우 상이하며 서구인과도 다른 한국형 대사 증후군 예방 및 관리를 위한 적정관리지표가 필요하다.
만성 대사 질환의 예방 및 관리 지침을 수립하기 위한 가장 높은 근거 수준의 연구는 무작위 대조 임상 연구 (RCT: Randomized Control Trial)이다. 다만 무작위 대조 임상 연구는 많은 연구 대상자와 오랜 추적 기간을 필요로 하는 문제점이 있다.
상기와 같은 문제점을 해결하기 위해 본 발명은 시간에 따라 누적된 대사 증후군의 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램을 제공하고자 한다.
상술한 기술적 과제를 달성하기 위한 본 발명에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템은, 하나 이상의 컴퓨터로 구성되고, 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하고, 상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도는 예측하는 분석 서버와, 상기 분석 서버와 연결된 클라이언트를 포함하고, 상기 클라이언트는 상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하고, 상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하고, 상기 입력 대사 증후군 발병 요인 값은 복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고, 상기 분석 서버는 상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 것을 특징으로 한다.
이때, 상기 분석 서버는 딥러닝 학습 모델을 이용하여, 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하고, 상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측할 수 있다. 또한, 상기 분석 서버는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고, 상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하고, 상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단할 수 있다.
또한, 상기 분석 서버는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고, 상기 학습 데이터에서 상기 질환 발병 위험도를 추출할 수 있다. 이때, 상기 분석 서버는 특정한 상황 데이터를 상기 이상 특징 정보에 매칭하여 누적하고, 상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하고, 상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 상기 클라이언트로 전송할 수 있다.
또한, 상기 분석 서버는 상기 빅데이터를 로지스틱 회귀 분석으로 분석할 수 있다.
또한, 상기 특정 질환은 고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함할 수 있다. 이 경우, 상기 분석 서버는 상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하고, 상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측할 수 있다.
또한, 상기 질환 발병 위험도는 상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함할 수 있다.
또한, 상기 클라이언트는 상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하는 입력 장치 및 상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하는 출력 장치를 포함할 수 있다.
또한, 본 발명에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법은, 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득하는 단계와, 상기 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하는 빅데이터 수집 단계와, 상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도를 예측하는 질환 발병 위험도 예측 단계를 포함하고, 상기 입력 대사 증후군 발병 요인 값은 복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고, 상기 질환 발병 위험도 예측 단계는 상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 것을 특징으로 한다.
이때, 상기 질환 발병 위험도 예측 단계는 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계 및 상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측하는 단계를 포함할 수 있다.
이때, 상기 학습 단계는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계와, 상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하는 단계와, 상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단하는 단계를 포함할 수 있다.
또한, 상기 학습 단계는 상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계와, 상기 학습 데이터에서 상기 질환 발병 위험도를 추출하는 단계를 포함할 수 있다.
이때, 상기 학습 단계는 특정한 상황 데이터를 이상 특징 정보에 매칭하여 누적하는 단계와, 상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하는 단계와, 상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 클라이언트로 전송하는 단계를 더 포함할 수 있다.
또한, 상기 질환 발병 위험도 예측 단계는 상기 빅데이터를 로지스틱 회귀 분석으로 분석할 수 있다.
또한, 상기 특정 질환은 고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함할 수 있다. 이때, 상기 질환 발병 위험도 예측 단계는 상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하는 단계와, 상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 단계를 포함할 수 있다.
또한, 상기 질환 발병 위험도는 상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함할 수 있다.
또한, 본 발명은 하드웨어인 컴퓨터와 결합되어, 제11항 내지 제19항의 빅데이터 기반의 질환 발병 위험도 예측 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된 빅데이터 기반의 질환 발병 위험도 예측 프로그램을 포함할 수 있다.
본 발명에 따르면, 시간에 따라 누적된 대사 증후군 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램을 제공할 수 있다.
본 발명에 따르면, 무작위 대조 임상 연구 결과에 버금가고, 한국인의 대사 증후군을 관리할 수 있는 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램을 제공할 수 있다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템를 개략적으로 나타낸 블록도이다.
도 2는 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법을 개략적으로 나타낸 순서도이다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나, 본 발명은 이하에서 개시되는 실시예들에 제한되는 것이 아니라 서로 다른 다양한 형태로, 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술 분야의 통상의 기술자에게 본 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성요소 외에 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다. 명세서 전체에 걸쳐 동일한 도면 부호는 동일한 구성 요소를 지칭하며, "및/또는"은 언급된 구성요소들의 각각 및 하나 이상의 모든 조합을 포함한다. 비록 "제1", "제2" 등이 다양한 구성요소들을 서술하기 위해서 사용되나, 이들 구성요소들은 이들 용어에 의해 제한되지 않음은 물론이다. 이들 용어들은 단지 하나의 구성요소를 다른 구성요소와 구별하기 위하여 사용하는 것이다. 따라서, 이하에서 언급되는 제1 구성요소는 본 발명의 기술적 사상 내에서 제2 구성요소일 수도 있음은 물론이다.
본 명세서에서 컴퓨터는 연산처리를 수행하여 사용자에게 결과를 시각적으로 제시할 수 있는 다양한 장치들이 모두 포함된다. 예를 들어, 컴퓨터는 데스크 탑 PC, 노트북(Note Book) 뿐만 아니라 스마트폰(Smart phone), 태블릿 PC, 셀룰러폰(Cellular phone), 피씨에스폰(PCS phone; Personal Communication Service phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000)의 이동 단말기, 팜 PC(Palm Personal Computer), 개인용 디지털 보조기(PDA; Personal Digital Assistant) 등도 해당될 수 있다. 또한, 컴퓨터는 의료영상을 획득하거나 관찰하는 의료장비도 해당될 수 있다. 또한, 컴퓨터는 다양한 클라이언트 컴퓨터와 연결되는 서버 컴퓨터가 해당될 수 있다.
다른 정의가 없다면, 본 명세서에서 사용되는 모든 용어(기술 및 과학적 용어를 포함)는 본 발명이 속하는 기술분야의 통상의 기술자에게 공통적으로 이해될 수 있는 의미로 사용될 수 있을 것이다. 또한, 일반적으로 사용되는 사전에 정의되어 있는 용어들은 명백하게 특별히 정의되어 있지 않는 한 이상적으로 또는 과도하게 해석되지 않는다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템를 개략적으로 나타낸 블록도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템(10)은 분석 서버(100), 및 클라이언트(200)를 포함한다.
분석 서버(100)는 하나 이상의 컴퓨터로 구성된다. 분석 서버(100)는 대사 증후군의 발병 요인에 따른 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여, 빅데이터(110)를 형성한다. 분석 서버(100)는 빅데이터(110)를 분석하여, 특정 질환의 질환 발병 위험도를 예측한다.
본 명세서에서 대사 증후군의 발병 요인에서 "대사 증후군"이란 예를 들어, 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함할 수 있다.
본 명세서에서 "시간에 따라 수집"은 예를 들어, 적어도 1회 이상, 현재 입력 대사 증후군 발병 요인 값을 제공 받기 전에 입력 대사 증후군 발병 요인 값을 제공받은 것을 의미하는 것일 수 있다. 예를 들어, 시간에 따른 수집은 과거 3년간에 제공된 입력 대사 증후군 발병 요인 값을 수집한 것을 의미하는 것일 수 있다.
일 실시예로, 빅데이터(110)는 국민건강보험공단 빅데이터일 수 있다.
대사 증후군 발병 요인은 예를 들어, 복부 둘레, 혈압, 혈당, HDL 콜레스테롤, 및 중성 지방을 포함한다.
분석 서버(100)는 특정 기간동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다. 예를 들어, 분석 서버(100)는 5년동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다. 예를 들어, 분석 서버(100)는 과거 3년동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다. 예를 들어, 분석 서버(100)는 과거 5년동안 입력 대사 증후군 발병 요인들의 값을 누적하여 수집할 수 있다.
분석 서버(100)는 빅데이터(110)를 분석한다. 분석 서버(100)는 예를 들어, 로지스틱 회귀 분석으로 빅데이터(110)를 분석할 수 있다.
분석 서버(100)는 입력 대사 증후군 발병 요인 값들 중 적어도 세 개가 빅데이터를 기반으로 설정된 기준값을 초과하면, 질환 발병 위험도를 예측할 수 있다.
상기 기준값은 예를 들어, 입력 대사 증후군 발병 요인 값의 절대값을 평가할 수 있는 기준일 수도 있고, 입력 대사 증후군 발병 요인 값과 빅데이터 기반으로 설정된 정상값과의 차이값을 평가할 수 있는 기준일 수도 있다.
일 실시예로, 분석 서버(100)는 입력 대사 증후군 발병 요인 값이, 예를 들어, 복부 둘레, 혈압, 혈당, HDL 콜레스테롤, 및 중성 지방 중 적어도 세 개가 빅데이터를 기반으로 설정된 기준값을 초과하였는지 여부를 초과 또는 초과하지 않음으로 판단하여, 질환 발병 위험도를 예측할 수 있다.
질환 발병 위험도에서 위험도가 예측되는 특정 질환은 예를 들어, 고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함할 수 있다.
일 실시예로, 분석 서버(100)는 빅데이터(110)를 기반으로 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측할 수 있다. 예를 들어, 분석 서버(100)는 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 빅데이터(110) 기반으로 설정된 기준값을 초과할 경우, 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측할 수 있다.
일 실시예로, 분석 서버(100)는 빅데이터(110) 및 대사 증후군의 위험도를 기반으로, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측할 수 있다. 예를 들어, 위험도가 예측된 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나가, 빅데이터(110) 기반으로 설정된 기준값을 초과할 경우, 대사 증후군이 발전한, 만성 대사 질환의 발병 위험도를 예측할 수 있다.
일 실시예로, 고혈압 및 당뇨병의 위험도가 예측되면, 뇌졸증의 위험도가 예측될 수 있다.
일 실시예로, 고혈압, 이상지질혈증, 및 당뇨병의 위험도가 예측되면 관상 동맥 질환의 위험도가 예측될 수 있다.
일 실시예로, 이상지질혈증 및 당뇨병의 위험도가 예측되면, 만성 신장 질환의 위험도가 예측될 수 있다.
일 실시예로, 이상지질혈증의 위험도가 예측되면, 관상 동맥 질환의 위험도가 예측될 수 있다.
질환 발병 위험도는 예를 들어, 특정 질환의 발병 시기 및 특정 질환의 발병률 중 적어도 하나를 포함할 수 있다.
본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템(10)은 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델(120)을 이용하여, 질환 발병 위험도를 예측할 수 있다.
이하에서는 딥러닝 학습 모델(120)에 대하여 설명한다.
분석 서버(100)는 하나 이상의 컴퓨터로 구성되어 딥러닝 학습 모델(120)을 형성하여, 입력 대사 증후군 발병 요인 값이 질환 발병 위험도가 어느 정도인지 판단하는 역할을 수행한다.
본 발명의 실시예들에 따른 딥러닝 학습 모델(120)은, 하나 이상의 컴퓨터 내에 하나 이상의 레이어(Layer)를 구축하여 복수의 데이터를 바탕으로 판단을 수행하는 시스템 또는 네트워크를 의미한다.
예를 들어, 딥러닝 학습 모델(120)은 컨볼루션 풀링층(Convolutional Pooling Layer), 로컬 접속층(a locally-connected layer) 및 완전 연결층(fully-connected layer)을 포함하는 층들의 세트로 구현될 수 있다. 컨볼루션 풀링층 또는 로컬 접속층은 영상 내 특징들을 추출하도록 구성 될 수 있다. 완전 연결층은 영상의 특징 간의 상관 관계를 결정할 수 있다. 일부 실시예에서, 딥러닝 학습 모델(120)의 전체적인 구조는 컨볼루션 풀링층에 로컬 접속층이 이어지고, 로컬 접속층에 완전 연결층이 이러지는 형태로 이루어질 수 있다.
딥러닝 학습 모델(120)은 다양한 판단 기준(즉, 파라미터(Parameter))를 포함할 수 있고, 입력되는 영상 분석을 통해 새로운 판단 기준(즉, 파라미터)를 추가할 수 있다. 파라미터들은 예를 들어, 복부 둘레, 혈압, 혈당, HDL (High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함할 수 있다. 파라미터들은 음주 여부, 흡연 여부, 운동 여부, 가족력, 과거 병력, 현재 병력, BMI, 나이, 키, 체중, 및 거주 환경 중 적어도 하나를 더 포함할 수 있다.
일 실시예로, 파라미터가 복부 둘레 및 성별을 포함하면, 남성일 경우 예를 들어, 복부 둘레가 90 cm 이상, 여성일 경우 예를 들어, 복부 둘레가 85 cm 이상일 경우, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.
일 실시예로, 파라미터가 혈압을 포함하면, 수축기 혈압(SBP: Systolic blood pressure)값이 예를 들어 130mmHg 이상 또는 확장기 혈압(DBP: Diastolic blood pressure)값이 예를 들어 80 mmHg 이상이면 대사 증후군 위험일 수 있고, 상기 범위를 벗어나면 정상일 수 있다.
일 실시예로, 파라미터가 혈당을 포함하면, 혈당값이 예를 들어, 100 mg/dL 이상이면, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.
일 실시예로, 파라미터가 HDL 콜레스테롤을 포함하면, HDL 콜레스테롤 값이 예를 들어, 240 mg/dL 이상이면, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.
일 실시예로, 파라미터가 중성 지방을 포함하면, 중성 지방값이 예를 들어 150 mg/dL 이상이면, 대사 증후군 위험일 수 있고, 미만이면 정상일 수 있다.
본 발명의 실시예들에 따른 딥러닝 학습 모델(120)은 영상 분석에 적합한 콘볼루셔널 신경망이라고 부르는 구조로서, 주어진 영상 데이터들로부터 가장 분별력(Discriminative Power)가 큰 특징을 스스로 학습하는 특징 추출층(Feature Extraction Layer)와 추출된 특징을 기반으로 가장 높은 예측 성능을 내도록 예측 모델을 학습하는 예측층(Prediction Layer)이 통합된 구조로 구성될 수 있다.
특징 추출층은 영상의 각 영역에 대해 복수의 필터를 적용하여 특징 지도(Feature Map)를 만들어 내는 콘볼루션층(Convolution Layer)과 특징 지도를 공간적으로 통합함으로써 위치나 회전의 변화에 불변하는 특징을 추출할 수 있도록 하는 통합층(Pooling Layer)을 번갈아 수 차례 반복하는 구조로 형성될 수 있다. 이를 통해, 점, 선, 면 등의 낮은 수준의 특징에서부터 복잡하고 의미 있는 높은 수준의 특징까지 다양한 수준의 특징을 추출해낼 수 있다.
콘볼루션층은 입력 영상의 각 패치에 대하여 필터와 국지 수용장(Local Receptive Field)의 내적에 비선형 활성 함수(Activation Function)을 취함으로 서 특징 지도(Feature Map)를 구하게 되는데, 다른 네트워크 구조와 비교하여, CNN은 희소한 연결성 (Sparse Connectivity)과 공유된 가중치(Shared Weights)를 가진 필터를 사용하는 특징이 있다. 이러한 연결 구조는 학습할 모수의 개수를 줄여주고, 역전파 알고리즘을 통한 학습을 효율적으로 만들어 결과적으로 예측 성능을 향상 시킨다.
통합층(Pooling Layer 또는 Sub-sampling Layer)은 이전 콘볼루션층에서 구해진 특징 지도의 지역 정보를 활용하여 새로운 특징 지도를 생성한다. 일반적으로 통합층에 의해 새로 생성된 특징 지도는 원래의 특징 지도보다 작은 크기로 줄어드는데, 대표적인 통합 방법으로는 특징 지도 내 해당 영역의 최대값을 선택하는 최대 통합(Max Pooling)과 특징 지도 내 해당 영역의 평균값을 구하는 평균 통합(Average Pooling) 등이 있다.
통합층의 특징 지도는 일반적으로 이전층의 특징 지도보다 입력 영상에 존재하는 임의의 구조나 패턴의 위치에 영향을 적게 받을 수 있다. 즉, 통합층은 입력 영상 혹은 이전 특징 지도에서의 노이즈나 왜곡과 같은 지역적 변화에 보다 강인한 특징을 추출할 수 있게 되고, 이러한 특징은 분류 성능에 중요한 역할을 할 수 있다. 또 다른 통합층의 역할은, 깊은 구조상에서 상위의 학습층으로 올라갈수록 더 넓은 영역의 특징을 반영할 수 있게 하는 것으로서, 특징 추출층이 쌓이면서, 하위층에서는 지역적인 특징을 반영하고 상위층으로 올라 갈수록 보다 추상적인 전체 영상의 특징을 반영하는 특징 생성할 수 있다.
이와 같이, 콘볼루션층과 통합층의 반복을 통해 최종적으로 추출된 특징은 다중 신경망(MLP: Multi-layer Perception)이나 서포트 벡터 머신(SVM: Support Vector Machine)과 같은 분류 모델이 완전 연결층(Fully-connected Layer)의 형태로 결합되어 분류 모델 학습 및 예측에 사용될 수 있다.
다만, 본 발명의 실시예들에 따른 딥러닝 학습 모델(120)의 구조는 이에 한정되지 아니하고, 다양한 구조의 신경망으로 형성될 수 있다.
클라이언트(200)는 입력 대사 증후군 발병 요인 값을 입력받아, 분석 서버(100)에 제공한다. 클라이언트(200)는 분석 서버(100)로부터 질환 발병 위험도를 제공받아 출력한다.
클라이언트(200)는 입력 장치(210) 및 출력 장치(220)를 포함할 수 있다. 입력 장치(210) 및 출력 장치(220)는 하나의 장치로 구현될 수도 있고, 서로 별개의 장치로 구현될 수도 있다.
입력 장치(210)는 대사 증후군 발병 요인을 입력받아, 이에 대응하는 입력 대사 증후군 발병 요인 값을 분석 서버(100)로 전송하는 장치일 수 있다.
일 실시예로 입력 장치(210)는 질환 발병 위험도를 분석해야하는 사용자의 혈액을 제공받아, 대사 증후군 발병 요인들을 산출할 수도 있다.
입력 장치(210)는 한 개일 수도 있고, 복수 개일 수도 있다.
출력 장치(220)는 분석 서버(100)로부터 질환 발병 위험도 결과를 수신하여, 다양한 방식으로 사용자에게 판단 결과를 제공할 수 있다. 예를 들어, 출력 장치(220)는 디스플레이부를 구비하여, 질환 발병 위험도를 시각적으로 표시하여 사용자에게 제공할 수 있다. 또한, 질환 발병 위험도가 높다는 판단 결과를 수신하는 경우, 출력 장치(220)는 진동을 발생하여 사용자에게 질환 발병 위험도가 높음을 알릴 수도 있다. 다만, 출력 장치(220)가 사용자에게 질환 발병 위험도의 판단 결과를 제공하는 방식은 이에 한정되지 아니하고, 음향 출력 등의 사용자에게 제공할 수 있는 다양한 출력 방식을 활용할 수 있다. 또한, 본 발명의 일실시예에 따른 출력 장치(220)는 이동 단말기를 포함할 수 있다.
출력 장치(220)는 한 개일 수도 있고, 복수 개일 수도 있다.
이하에서는 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법에 대하여 설명한다. 이하에서는 앞서 언급한 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템와의 차이점에 대하여 구체적으로 설명하고, 설명하지 않은 부분은 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템와 동일할 수 있다.
도 2는 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법을 개략적으로 나타낸 순서도이다.
도 1 및 도 2를 참조하면, 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법은 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득하는 단계(S100), 빅데이터 수집 단계(S200), 및 질환 발병 위험도 예측 단계(S300)를 포함한다.
대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득한다(S100). 입력 대사 증후군 발병 요인 값은 클라이언트(200)에서 입력되어, 분석 서버(100)로 제공될 수 있다. 입력 대사 증후군 발병 요인 값은 입력 장치(210)에 입력되어, 분석 서버(100)로 제공될 수 있다.
입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성한다(S200). 빅데이터 수집 단계(S200)는 분석 서버(100)에서 수행될 수 있다.
빅데이터를 분석하여, 특정 질환의 질환 발병 위험도를 예측한다(S300). 질환 발병 위험도는 분석 장치(100)에서 출력 장치(220)로 제공될 수 있다. 출력 장치(220)는 입력 장치(210)와 하나의 장치로 구현될 수도 있고, 서로 별개의 장치로 구현될 수도 있다.
일 실시예로, 질환 발병 위험도 예측 단계(S300)는 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여, 입력 대사 증후군 발병 요인 값 및 특정 질환의 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계, 및 딥러닝 학습 모델(120)로 질환 발병 위험도를 예측하는 단계를 포함할 수 있다.
일 실시예로, 질환 발병 위험도 예측 단계(S300)는 빅데이터(110)를 기반으로, 고혈압, 이상지질혈증, 및 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하는 단계, 및 빅데이터(110) 및 예측된 대사 증후군의 위험도를 기반으로, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 단계를 포함할 수 있다.
일 실시예로, 질환 발병 위험도 예측 단계(S300)는 하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여, 입력 대사 증후군 발병 요인 값, 대사 증후군 발병 위험도, 및 특정 질환의 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계, 및 딥러닝 학습 모델(120)로 대상 증후군 발병 위험도 및 질환 발병 위험도를 예측하는 단계를 포함할 수 있다.
질환 발병 위험도는 앞서 언급한 딥러닝 학습 모델(120)의 파라미터들로 판단될 수 있다.
일 실시예로, 학습 단계는 입력 대사 증후군 발병 요인 값을 누적하여, 학습 데이터를 생성하는 단계를 포함할 수 있다. 학습 데이터의 분석을 통해 정상 대사 증후군 발병 요인 값을 산출한다. 입력 대사 증후군 발병 요인 값이 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단할 수 있다.
일 실시예로, 학습 단계는 하나 이상의 조직 분석 장치(200)로부터 제공받은 조직에 대응하는 입력 대사 증후군 발병 요인 값을 누적하여, 학습 데이터를 생성하는 단계를 포함할 수 있다. 학습 데이터에서 이상 특징 정보를 추출할 수 있다.
일 실시예로, 학습 단계는 특정한 상황 데이터를 이상 특징 정보에 매칭하여 누적하는 단계를 포함할 수 있다. 이상 특징 정보란 예를 들어, 복부 둘레, 혈압, 혈당, HDL 콜레스테롤 및 중성 지방 등을 기준으로 정상의 범위에 미치지 못하는 값을 갖는 것을 의미할 수 있다. 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식할 수 있다. 인식된 이상 특징 정보에 상응하는 상황 데이터를 클라이언트로 전송할 수 있다. 이상 특징 정보에 상응하는 상황 데이터는 예를 들어, 질환 발병 위험도일 수 있다.
본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 방법은, 하드웨어인 컴퓨터와 결합되어 실행되기 위해 프로그램(또는 어플리케이션)으로 구현되어 빅데이터 기반의 질환 발병 위험도 예측 시스템에 포함되는 매체에 저장될 수 있다.
프로그램은, 컴퓨터가 프로그램을 읽어 들여 프로그램으로 구현된 방법들을 실행시키기 위하여, 컴퓨터의 프로세서(CPU)가 컴퓨터의 장치 인터페이스를 통해 읽힐 수 있는 C, C++, JAVA, 기계어 등의 컴퓨터 언어로 코드화된 코드(Code)를 포함할 수 있다. 이러한 코드는 방법들을 실행하는 필요한 기능들을 정의한 함수 등과 관련된 기능적인 코드(Functional Code)를 포함할 수 있고, 기능들을 컴퓨터의 프로세서가 소정의 절차대로 실행시키는데 필요한 실행 절차 관련 제어 코드를 포함할 수 있다. 또한, 이러한 코드는 기능들을 컴퓨터의 프로세서가 실행시키는데 필요한 추가 정보나 미디어가 컴퓨터의 내부 또는 외부 메모리의 어느 위치(주소 번지)에서 참조되어야 하는지에 대한 메모리 참조관련 코드를 더 포함할 수 있다. 또한, 컴퓨터의 프로세서가 기능들을 실행시키기 위하여 원격(Remote)에 있는 어떠한 다른 컴퓨터나 서버 등과 통신이 필요한 경우, 코드는 컴퓨터의 통신 모듈을 이용하여 원격에 있는 어떠한 다른 컴퓨터나 서버 등과 어떻게 통신해야 하는지, 통신 시 어떠한 정보나 미디어를 송수신해야 하는지 등에 대한 통신 관련 코드를 더 포함할 수 있다.
저장되는 매체는, 레지스터, 캐쉬, 메모리 등과 같이 짧은 순간 동안 데이터를 저장하는 매체가 아니라 반영구적으로 데이터를 저장하며, 기기에 의해 판독(reading)이 가능한 매체를 의미한다. 구체적으로는, 저장되는 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있지만, 이에 제한되지 않는다. 즉, 프로그램은 컴퓨터가 접속할 수 있는 다양한 서버 상의 다양한 기록매체 또는 사용자의 컴퓨터상의 다양한 기록매체에 저장될 수 있다. 또한, 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장될 수 있다.
본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램은 시간에 따라 누적된 대사 증후군 발병 요인들을 기반으로 빅데이터를 생성 및 분석하여, 특정한 질환에 대한 발생 및 위험도를 인식 또는 예측함에 따라, 위험 상황을 사전에 예방할 수 있다. 본 발명의 일 실시예에 따른 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램은 시간에 따라 누적된 대사 증후군 발병 요인들을 기반으로 생성된 빅데이터를 바탕으로, 특정한 질환에 대한 발생 및 위험도를 딥러닝 기술로 인식 또는 예측할 수 있다.
이상, 첨부된 도면을 참조로 하여 본 발명의 실시예를 설명하였지만, 본 발명이 속하는 기술분야의 통상의 기술자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로, 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로, 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며, 제한적이 아닌 것으로 이해해야만 한다.
Claims (20)
- 하나 이상의 컴퓨터로 구성되고, 대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하고, 상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도는 예측하는 분석 서버; 및상기 분석 서버와 연결된 클라이언트;를 포함하고,상기 클라이언트는,상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하고, 상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하고,상기 입력 대사 증후군 발병 요인 값은,복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고,상기 분석 서버는,상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제1항에 있어서,상기 분석 서버는,딥러닝 학습 모델을 이용하여, 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하고,상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제2항에 있어서,상기 분석 서버는,상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고,상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하고,상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제2항에 있어서,상기 분석 서버는,상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하고,상기 학습 데이터에서 상기 질환 발병 위험도를 추출하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제4항에 있어서,상기 분석 서버는,특정한 상황 데이터를 상기 이상 특징 정보에 매칭하여 누적하고,상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하고,상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 상기 클라이언트로 전송하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제1항에 있어서,상기 분석 서버는,상기 빅데이터를 로지스틱 회귀 분석으로 분석하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제1항에 있어서,상기 특정 질환은,고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제7항에 있어서,상기 분석 서버는,상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하고,상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제1항에 있어서,상기 질환 발병 위험도는,상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 제1항에 있어서,상기 클라이언트는,상기 입력 대사 증후군 발병 요인 값을 입력받아, 상기 분석 서버에 제공하는 입력 장치; 및상기 분석 서버로부터 상기 질환 발병 위험도를 제공받아 출력하는 출력 장치를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 시스템.
- 빅데이터 기반의 질환 발병 위험도 예측 시스템에 의해 수행되는 방법에 있어서,대사 증후군의 발병 요인에 대한 입력 대사 증후군 발병 요인 값을 획득하는 단계;상기 입력 대사 증후군 발병 요인 값을 시간에 따라 수집하여 빅데이터를 형성하는 빅데이터 수집 단계; 및상기 빅데이터를 분석하여, 특정 질환의 질환 발병 위험도를 예측하는 질환 발병 위험도 예측 단계;를 포함하고,상기 입력 대사 증후군 발병 요인 값은,복부 둘레, 혈압, 혈당, HDL(High-Density Lipoprotein) 콜레스테롤 및 중성 지방을 포함하고,상기 질환 발병 위험도 예측 단계는,상기 입력 대사 증후군 발병 요인 값 중 적어도 세 개가 상기 빅데이터를 기반으로 설정된 기준값을 초과하는 경우, 상기 특정 질환의 상기 질환 발병 위험도를 예측하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제11항에 있어서,상기 질환 발병 위험도 예측 단계는,하나 이상의 컴퓨터에 의해, 딥러닝 학습 모델을 이용하여 상기 입력 대사 증후군 발병 요인 값 및 상기 특정 질환의 상기 질환 발병 위험도를 데이터셋으로 학습하는 학습 단계; 및상기 딥러닝 학습 모델로 상기 질환 발병 위험도를 예측하는 단계;를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제12항에 있어서,상기 학습 단계는,상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계;상기 학습 데이터의 분석을 통해 정상 범위의 정상 대사 증후군 발병 요인 값을 산출하는 단계; 및상기 입력 대사 증후군 발병 요인 값이 상기 정상 대사 증후군 발병 요인 값을 기준으로 형성된 특정 범위를 초과하였는지 판단하는 단계;를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제12항에 있어서,상기 학습 단계는,상기 입력 대사 증후군 발병 요인 값을 누적하여 학습 데이터를 생성하는 단계; 및상기 학습 데이터에서 상기 질환 발병 위험도를 추출하는 단계;를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제14항에 있어서,상기 학습 단계는,특정한 상황 데이터를 이상 특징 정보에 매칭하여 누적하는 단계;상기 입력 대사 증후군 발병 요인 값 내에서 특정한 이상 특징 정보를 인식하는 단계; 및상기 인식된 이상 특징 정보에 상응하는 상황 데이터를 클라이언트로 전송하는 단계;를 더 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제12항에 있어서,상기 질환 발병 위험도 예측 단계는,상기 빅데이터를 로지스틱 회귀 분석으로 분석하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제12항에 있어서,상기 특정 질환은,고혈압, 이상지질혈증, 당뇨병, 관상 동맥 질환, 뇌졸증, 및 만성 신장 질환 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제17항에 있어서,상기 질환 발병 위험도 예측 단계는,상기 빅데이터를 기반으로, 상기 고혈압, 상기 이상지질혈증, 및 상기 당뇨병 중 적어도 하나를 포함하는 대사 증후군의 위험도를 예측하는 단계; 및상기 빅데이터 및 상기 예측된 대사 증후군의 위험도를 기반으로, 상기 관상 동맥 질환, 상기 뇌졸증, 및 상기 만성 신장 질환 중 적어도 하나를 포함하는 만성 대사 질환의 위험도를 예측하는 단계를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 제12항에 있어서,상기 질환 발병 위험도는,상기 특정 질환의 발병 시기 및 상기 특정 질환의 발병률 중 적어도 하나를 포함하는 빅데이터 기반의 질환 발병 위험도 예측 방법.
- 하드웨어인 컴퓨터와 결합되어, 제11항 내지 제19항의 빅데이터 기반의 질환 발병 위험도 예측 방법을 실행시키기 위하여 컴퓨터 판독 가능한 기록매체에 저장된, 빅데이터 기반의 질환 발병 위험도 예측 프로그램.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2020-0161704 | 2020-11-26 | ||
KR1020200161704A KR102599132B1 (ko) | 2020-11-26 | 2020-11-26 | 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2022114791A1 true WO2022114791A1 (ko) | 2022-06-02 |
Family
ID=81754873
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2021/017434 WO2022114791A1 (ko) | 2020-11-26 | 2021-11-24 | 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램 |
Country Status (2)
Country | Link |
---|---|
KR (2) | KR102599132B1 (ko) |
WO (1) | WO2022114791A1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20240023874A (ko) | 2022-08-16 | 2024-02-23 | 가톨릭대학교 산학협력단 | 수술 후 급성신손상 발생 예측 방법 및 그 시스템 |
KR20240052503A (ko) | 2022-10-14 | 2024-04-23 | 한국 한의학 연구원 | 질환 위험도 평가 및 시각화 장치 및 방법 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101510600B1 (ko) * | 2014-11-11 | 2015-04-08 | 국민건강보험공단 | 빅데이터 개인 건강 기록 시스템 |
KR20160039770A (ko) * | 2014-10-01 | 2016-04-12 | 재단법인 아산사회복지재단 | 빅데이터 기반 실시간 위험도 모니터링 |
KR102003412B1 (ko) * | 2017-12-22 | 2019-07-24 | 주식회사 데이터젠 | 심뇌혈관질환 위험도 데이터 예측 방법 및 시스템 |
KR20200054745A (ko) * | 2018-11-12 | 2020-05-20 | 한림대학교 산학협력단 | 질병 예측 시스템 |
KR20200084807A (ko) * | 2019-01-03 | 2020-07-13 | 서울대학교산학협력단 | 만성신장 질환 발생 예측 장치 및 방법 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018124831A1 (ko) * | 2016-12-30 | 2018-07-05 | 서울대학교 산학협력단 | 대사이상 질환의 질병 위험도를 예측하는 장치 및 방법 |
KR102124249B1 (ko) | 2018-06-29 | 2020-06-17 | 계명대학교 산학협력단 | 건강 관련 앱과 웨어러블 기기를 이용한 성인초기 대상자를 위한 대사증후군 예방 프로그램 |
-
2020
- 2020-11-26 KR KR1020200161704A patent/KR102599132B1/ko active IP Right Grant
-
2021
- 2021-11-24 WO PCT/KR2021/017434 patent/WO2022114791A1/ko active Application Filing
-
2023
- 2023-11-01 KR KR1020230149426A patent/KR102680761B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20160039770A (ko) * | 2014-10-01 | 2016-04-12 | 재단법인 아산사회복지재단 | 빅데이터 기반 실시간 위험도 모니터링 |
KR101510600B1 (ko) * | 2014-11-11 | 2015-04-08 | 국민건강보험공단 | 빅데이터 개인 건강 기록 시스템 |
KR102003412B1 (ko) * | 2017-12-22 | 2019-07-24 | 주식회사 데이터젠 | 심뇌혈관질환 위험도 데이터 예측 방법 및 시스템 |
KR20200054745A (ko) * | 2018-11-12 | 2020-05-20 | 한림대학교 산학협력단 | 질병 예측 시스템 |
KR20200084807A (ko) * | 2019-01-03 | 2020-07-13 | 서울대학교산학협력단 | 만성신장 질환 발생 예측 장치 및 방법 |
Non-Patent Citations (1)
Title |
---|
KOH EUN SIL, HAN KYUNG DO, KIM MEE KYOUNG, KIM EUN SOOK, LEE MIN-KYUNG, NAM GA EUN, KWON HYUK-SANG: "Weight change and microvascular outcomes in patients with new-onset diabetes: a nationwide cohort study", KOREAN JOURNAL OF INTERNAL MEDICINE, vol. 36, no. 4, 1 July 2021 (2021-07-01), pages 932 - 941, XP055934176, ISSN: 1226-3303, DOI: 10.3904/kjim.2020.121 * |
Also Published As
Publication number | Publication date |
---|---|
KR102599132B1 (ko) | 2023-11-09 |
KR20230167748A (ko) | 2023-12-11 |
KR102680761B1 (ko) | 2024-07-03 |
KR20220075046A (ko) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022114791A1 (ko) | 빅데이터 기반의 질환 발병 위험도 예측 시스템, 예측 방법, 및 프로그램 | |
WO2017022908A1 (ko) | 심층신경망을 이용한 골 연령 산출방법 및 프로그램 | |
WO2022114793A1 (ko) | 빅데이터 기반의 당뇨병 발병 위험도 예측 시스템, 예측 방법, 및 프로그램 | |
WO2021015381A1 (en) | Pulmonary function estimation | |
WO2015008936A1 (ko) | 습관을 이용한 진단 장치 및 진단 관리 장치와 그를 이용한 진단 방법 | |
WO2019035639A1 (ko) | 딥러닝 기반의 패혈증 조기 감지방법 및 프로그램 | |
WO2019103416A1 (ko) | 스마트장치를 이용한 심혈관 질환의 진단정보 제공방법 및 이를 위한 심음 애플리케이션 | |
WO2022145782A2 (ko) | 빅데이터 및 클라우드 시스템 기반 인공지능 응급의료 의사결정 및 응급환자 이송 시스템과 그 방법 | |
WO2019031794A1 (ko) | 피검체의 치명적 증상의 발생을 조기에 예측하기 위한 예측 결과를 생성하는 방법 및 이를 이용한 장치 | |
WO2021040327A1 (ko) | 심혈관 질환 위험 인자 예측 장치 및 방법 | |
WO2021091066A1 (en) | System and method for passive subject specific monitoring | |
WO2022010282A1 (ko) | 음성 특성 기반 알츠하이머병 예측 방법 및 장치 | |
Gupta | StrokeSave: a novel, high-performance mobile application for stroke diagnosis using deep learning and computer vision | |
WO2024005542A1 (ko) | 주름 검출을 통해 질환을 예측하는 방법 및 장치 | |
WO2022169149A1 (ko) | 당뇨병 발병 위험도 산출 시스템, 산출 방법 및 프로그램 | |
WO2023058946A1 (ko) | 시계열 기침음, 호흡음, 낭독음, 발성음 측정을 통한 호흡기 질환 예후 예측시스템 및 방법 | |
WO2023038254A1 (ko) | 기계학습을 이용한 비침습적 당화혈색소 또는 혈당 추정 방법 및 장치 | |
WO2021210460A1 (ja) | 認知症兆候判別プログラム | |
JP7427451B2 (ja) | 情報処理装置、発症確率判定方法および発症確率判定プログラム | |
KR20220021805A (ko) | 조직 검사 방법 및 조직 검사 장치 | |
WO2024147472A1 (ko) | 복수의 인공지능 모델을 이용하여 환자의 조기 신경학적 악화를 예측하는 방법 및 장치 | |
WO2022177045A1 (ko) | 심장질환의 유무를 분류하는 장치 및 방법 | |
WO2022196944A1 (ko) | 조기 발작의 재발 예측 방법 및 장치 | |
WO2023243824A1 (ko) | 만성 폐쇄성 폐질환을 예측하는 장치 및 방법과 이를 위한 시스템 | |
WO2024049234A1 (ko) | 타액 기반 인공지능 딥러닝 기법을 활용한 혈당 예측 시스템 및 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 21898617 Country of ref document: EP Kind code of ref document: A1 |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 21898617 Country of ref document: EP Kind code of ref document: A1 |