KR102590308B1 - SYstem and method for predicting the possibility of disease pathogen incubation - Google Patents
SYstem and method for predicting the possibility of disease pathogen incubation Download PDFInfo
- Publication number
- KR102590308B1 KR102590308B1 KR1020210092919A KR20210092919A KR102590308B1 KR 102590308 B1 KR102590308 B1 KR 102590308B1 KR 1020210092919 A KR1020210092919 A KR 1020210092919A KR 20210092919 A KR20210092919 A KR 20210092919A KR 102590308 B1 KR102590308 B1 KR 102590308B1
- Authority
- KR
- South Korea
- Prior art keywords
- analysis result
- result data
- data
- microbial analysis
- microbial
- Prior art date
Links
- 244000052769 pathogen Species 0.000 title claims abstract description 32
- 230000001717 pathogenic effect Effects 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 title claims abstract description 23
- 201000010099 disease Diseases 0.000 title claims abstract description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 17
- 238000011534 incubation Methods 0.000 title description 2
- 238000004458 analytical method Methods 0.000 claims abstract description 105
- 230000000813 microbial effect Effects 0.000 claims abstract description 88
- 244000005700 microbiome Species 0.000 claims abstract description 86
- 238000004364 calculation method Methods 0.000 claims abstract description 16
- 238000010219 correlation analysis Methods 0.000 claims abstract description 16
- 239000008280 blood Substances 0.000 claims abstract description 12
- 210000004369 blood Anatomy 0.000 claims abstract description 12
- 210000003296 saliva Anatomy 0.000 claims abstract description 12
- 210000002700 urine Anatomy 0.000 claims abstract description 12
- 238000012543 microbiological analysis Methods 0.000 claims abstract description 9
- 238000001514 detection method Methods 0.000 claims description 9
- 238000012886 linear function Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 7
- 238000012952 Resampling Methods 0.000 claims description 6
- 238000013434 data augmentation Methods 0.000 claims description 6
- 241000700605 Viruses Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 241000701024 Human betaherpesvirus 5 Species 0.000 description 2
- 208000032420 Latent Infection Diseases 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 208000037771 disease arising from reactivation of latent virus Diseases 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 208000007514 Herpes zoster Diseases 0.000 description 1
- 241000701027 Human herpesvirus 6 Species 0.000 description 1
- 241000829111 Human polyomavirus 1 Species 0.000 description 1
- 241000701460 JC polyomavirus Species 0.000 description 1
- 241000726445 Viroids Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 241000701161 unidentified adenovirus Species 0.000 description 1
- 241001529453 unidentified herpesvirus Species 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Biomedical Technology (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
본 발명은 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 있어서, 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치; 및 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈,을 포함하는 서버;를 포함하는 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한 것이다. 본 발명에 따르면, 검진자에게 채취한 혈액, 타액 및 소변 중 어느 하나의 미생물 분석 결과와 상관관계 분석 후 빅데이터화된 미생물 분석 결과를 서로 비교하여 가장 유사한 미생물 분석결과를 검출하여 발병가능 성을 예측함으로써, 보다 저렴한 비용으로 빠르고 정확하게 잠복병원체를 검출하는 것이 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공할 수 있다.The present invention provides a system and method for predicting the possibility of developing a latent pathogen, comprising: a microbiological analysis device that analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmits it to a server; And receiving the examination information prepared by the examiner through the client, classifying and storing the received examination information according to the personal information included in the examination information, and matching and storing the microbial analysis result data received from the microbial analysis device to the relevant examination information. Representative microorganisms are selected through correlation analysis with the storage module and the microbial analysis result data stored in the storage module, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. It relates to a system and method for predicting the possibility of developing a latent pathogen, including a server including a calculation module that generates prediction data about the possibility of developing an outbreak through representative microorganisms in the microbial analysis result data. According to the present invention, after correlation analysis with the microbial analysis results of any one of blood, saliva, and urine collected from the examinee, the big data microbial analysis results are compared with each other to detect the most similar microbial analysis results to predict the possibility of disease. , it is possible to provide a system and method for predicting the likelihood of developing a latent pathogen that can detect latent pathogens quickly and accurately at a lower cost.
Description
본 발명은 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한 것으로, 보다 상세하게는 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치; 및 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈,을 포함하는 서버;를 포함하는 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for predicting the possibility of developing a latent pathogen, and more specifically, to a microbiological analysis device that analyzes one or more of the examinee's blood, saliva, and urine to generate microbiological analysis result data and transmits it to the server. ; And receiving the examination information prepared by the examiner through the client, classifying and storing the received examination information according to the personal information included in the examination information, and matching and storing the microbial analysis result data received from the microbial analysis device to the relevant examination information. Representative microorganisms are selected through correlation analysis with the storage module and the microbial analysis result data stored in the storage module, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. It relates to a system and method for predicting the possibility of developing a latent pathogen, including a server including a calculation module that generates prediction data about the possibility of developing an outbreak through representative microorganisms in the microbial analysis result data.
본 발명은 미생물을 분석하여 발병가능성을 예측하는 서버에 관한 것이다.The present invention relates to a server that analyzes microorganisms and predicts the likelihood of an outbreak.
미생물이란, 육안의 가시한계를 넘어선 0.1mm이하의 크기를 이루고, 주로 단일세포 또는 균사로써 몸을 이루는 생물 입자를 통틀어 의미한다.Microorganisms collectively refer to biological particles that exceed the visual limit of the naked eye and are less than 0.1 mm in size and are mainly composed of single cells or hyphae.
상기 미생물은 보이지 않는 영역에서 우리 생활 전반에 많은 영향을 주고 있는데, 이러한 영향은 유익한 것에서 유해한 것까지 다양하게 존재한다.The above-mentioned microorganisms have a great influence on our overall life in an invisible area, and these influences range from beneficial to harmful.
따라서, 우리 몸의 안과 밖에 박테리아, 곰팡이, 바이러스, 바이로이드(Viroid) 및 미생물 유래 유전자 분자들을 해독 및 검형하여 미생물에 대한 종 동정정보, 미생물의 개체수, 각기 다른 미생물의 분포비율, 분포비율을 이미 알려진 건강하거나, 질병이 있는 사람들의 정보를 통해 유추된 주석화가 된 미생물 군체에 대한 표준적 데이터베이스 정보를 비교하고, 파악함으로써 질병 발생 및 건강을 예측할 수 있으며 유전자 검사를 통해 이러한 미생물의 양과 타입을 파악하는 다양한 방법들이 제시되고 있다.Therefore, by deciphering and detecting bacteria, fungi, viruses, viroids, and genetic molecules derived from microorganisms inside and outside of our bodies, we can already know the species identification information for microorganisms, the population of microorganisms, the distribution ratio of different microorganisms, and the distribution ratio. Disease occurrence and health can be predicted by comparing and identifying standard database information on annotated microbial communities inferred through information on healthy or diseased people, and identifying the amount and type of these microorganisms through genetic testing. Various methods are being proposed.
인체는 미생물에 감염되면 질병을 나타내는 증상과 증후가 나타날때까지 수일 또는 그 이상에 해당하는 잠복기가 있다.When the human body is infected with a microorganism, there is an incubation period of several days or more until signs and symptoms indicating disease appear.
병원체의 유전자는 존재하지만 무증상으로 존재하다가 면역 상태의 변화에 따라서 상시 발병으로 이행하는 위험성을 가지고 있다.Although the pathogen's genes exist, there is a risk of existing asymptomatically and transitioning to regular outbreaks depending on changes in immune status.
잠복 감염이 가능한 대표적인 병원체는 허피스바이러스에 속하는 단순포진 바이러스(HSV), 앱스타인-바 바이러스(EBV), 사람 거대세포 바이러스(HCMV), 대상포진 바이러스(VZV), HHV-6가 있으며, 그 외 바이러스에 아데노 바이러스, JC바이러스, BK 바이러스 등이 있다.Representative pathogens capable of latent infection include herpes simplex virus (HSV), Apstein-Barr virus (EBV), human cytomegalovirus (HCMV), herpes zoster virus (VZV), and HHV-6, which belong to the herpes virus family. Viruses include adenovirus, JC virus, and BK virus.
이들 바이러스들은 잠복 감염을 이루고 있다가 특정 환경이 되면 다시 재발현화 되어 바이러스 증식을 다시 시작하면서 다양한 질병에 관여한다.These viruses form a latent infection, but in a specific environment, they re-express and begin to multiply again, contributing to various diseases.
상술한 바와 같은 같은 문제점을 해결하기 위해 안출된 본 발명의 목적은, 검진자에게 채취한 혈액, 타액 및 소변 중 어느 하나의 미생물 분석 결과와 상관관계 분석 후 빅데이터화된 미생물 분석 결과를 서로 비교하여 가장 유사한 미생물 분석결과를 검출하여 발병가능 성을 예측함으로써, 보다 저렴한 비용으로 빠르고 정확하게 잠복병원체를 검출하는 것이 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공하기 위함이다.The purpose of the present invention, which was devised to solve the same problems as described above, is to compare the microbial analysis results of any one of blood, saliva, and urine collected from the examinee with the big data microbial analysis results after correlation analysis. The purpose is to provide a system and method for predicting the possibility of developing a latent pathogen that can detect latent pathogens quickly and accurately at a lower cost by predicting the possibility of outbreak by detecting similar microbial analysis results.
또한, 본 발명의 다른 목적은, 빅데이터를 통해 비선형 함수관계를 찾아냄으로써 개인의 잠복감염체 발현 가능성을 쉽게 예측가능하고 예측된 결과값을 블록체인을 통해 전파하기 때문에 개인키를 갖고있는 개인만이 조회 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공하기 위함이다.In addition, another purpose of the present invention is to easily predict the possibility of an individual's latent infectious agent by finding a non-linear functional relationship through big data, and to disseminate the predicted result through the blockchain, so that only the individual with the private key can use it. The purpose is to provide a system and method for predicting the possibility of outbreak of latent pathogens that can be viewed.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명인 잠복병원체의 발병가능성을 예측하는 시스템은, 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치; 및 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈을 포함하는 서버를 포함하고, 상기 산출모듈은 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 검출모듈; 상기 검출모듈을 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 데이터분류모듈; 및 상기 데이터분류모듈을 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 데이터균형화모듈;을 더 포함하는 것을 특징으로 한다.According to the features of the present invention for achieving the above-described object, the system for predicting the possibility of developing a latent pathogen according to the present invention analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data. Microorganism analysis device transmitting to the server; And receiving the examination information prepared by the examiner through the client, classifying and storing the received examination information according to the personal information included in the examination information, and matching and storing the microbial analysis result data received from the microbial analysis device to the relevant examination information. Representative microorganisms are selected through correlation analysis with the storage module and the microbial analysis result data stored in the storage module, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. A server including a calculation module that generates disease probability prediction data through representative microorganisms of the microbial analysis result data, wherein the calculation module performs a correlation analysis of the examination information of one or more examinees and the microbial analysis result data stored in big data. A detection module that detects one or more microorganisms through; A data classification module that detects representative microorganisms by performing Min-Max Normalization if the microorganisms detected through the detection module are in the form of a continuous variable, and performs One Hot Encoding if the microorganism is in the form of a categorical variable and classifies them according to the values of the representative microorganisms. ; And a data balancing module that improves the accuracy of the microbial analysis result data by performing data augmentation or resampling when there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through the data classification module. It is characterized by further including ;.
삭제delete
또한, 상기 산출모듈은, 상기 저장모듈에 저장된 미생물분석결과데이터를 상기 데이터균형화모듈을 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 함수생성모듈; 및 상기 함수생성모듈을 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 데이터생성모듈;을 더 포함하는 것을 특징으로 한다.In addition, the calculation module includes a function generation module that generates a non-linear function by matching the microbial analysis result data stored in the storage module with the microbial analysis result data with improved accuracy through the data balancing module; And a data generation module that generates disease probability prediction data of representative microorganisms through a non-linear function generated through the function generation module.
또한, 상기 서버는, 상기 산출모듈을 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 전파모듈;을 더 포함하는 것을 특징으로 한다.In addition, the server generates encrypted data by encrypting the disease probability prediction data generated through the calculation module and the personal information of the examinee using a preset public key, and disseminates the generated encrypted data on the blockchain network. It is characterized in that it further includes a radio wave module.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 또 다른 특징에 따르면, 본 발명인 잠복병원체의 발병가능성을 예측하는 방법은, (a) 미생물 분석장치가 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 단계; (b) 서버가 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 (a)단계로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 단계; 및 (c) 상기 (b)단계에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 단계;를 포함하고, 상기 (c)단계는 (c1) 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 단계; (c2) 상기 (c1)단계를 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 단계; 및 (c3) 상기 (c2)단계를 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 단계;를 더 포함하는 것을 특징으로 한다.According to another feature of the present invention for achieving the above-described object, the method of predicting the possibility of developing a latent pathogen according to the present invention includes (a) a microorganism analysis device measuring at least one of the examinee's blood, saliva, and urine; Analyzing and generating microbial analysis result data and transmitting it to the server; (b) The server receives the examination information written by the examiner through the client, stores the received examination information separately according to the personal information included in the examination information, and stores the microbial analysis result data received from step (a) above as the relevant examination information. matching and storing; and (c) representative microorganisms are selected through correlation analysis with the microbial analysis result data stored in step (b), and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. Generating disease probability prediction data through representative microorganisms of the detected microorganism analysis result data; Step (c) includes (c1) correlating the examination information of one or more examinees and the microbiological analysis result data stored in the big data. Detecting one or more microorganisms through relationship analysis; (c2) If the microorganism detected through step (c1) above is in the form of a continuous variable, Min-Max Normalization is performed, and if the microorganism is in the form of a categorical variable, One Hot Encoding is performed to detect representative microorganisms and categorize the values of representative microorganisms by performing One Hot Encoding. Classifying step; And (c3) if there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through step (c2), data augmentation or resampling is performed to improve the accuracy of the microbial analysis result data. It is characterized in that it further includes a step of allowing.
삭제delete
또한, 상기 (c)단계는, (c4) 상기 (b)단계에 저장된 미생물분석결과데이터를 상기 (c3)단계를 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 단계; 및 (c5) 상기 (c4)단계를 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 한다.In addition, step (c) includes: (c4) matching the microbial analysis result data stored in step (b) with microbial analysis result data with improved accuracy through step (c3) to generate a non-linear function; and (c5) generating prediction data on the likelihood of occurrence of representative microorganisms using the nonlinear function generated in step (c4).
또한, 본 발명인, 잠복병원체의 발병가능성을 예측하는 방법은, (d) 상기 (c)단계를 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 단계;를 더 포함하는 것을 특징으로 한다.In addition, the present inventor's method of predicting the likelihood of developing a latent pathogen is (d) encrypting the disease likelihood prediction data generated through step (c) and the personal information of the examinee using a preset public key. It is characterized in that it further includes the step of generating data and disseminating the generated encrypted data on the blockchain network.
이상 살펴본 바와 같은 본 발명에 따르면, 검진자에게 채취한 혈액, 타액 및 소변 중 어느 하나의 미생물 분석 결과와 상관관계 분석 후 빅데이터화된 미생물 분석 결과를 서로 비교하여 가장 유사한 미생물 분석결과를 검출하여 발병가능 성을 예측함으로써, 보다 저렴한 비용으로 빠르고 정확하게 잠복병원체를 검출하는 것이 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공할 수 있다.According to the present invention as discussed above, the most similar microbial analysis results can be detected by comparing the big data microbial analysis results after correlation analysis with the microbial analysis results of any one of blood, saliva, and urine collected from the examinee. By predicting the sex, it is possible to provide a system and method for predicting the likelihood of developing a latent pathogen that can detect latent pathogens quickly and accurately at a lower cost.
또한, 본 발명에 따르면, 빅데이터를 통해 비선형 함수관계를 찾아냄으로써 개인의 잠복감염체 발현 가능성을 쉽게 예측가능하고 예측된 결과값을 블록체인을 통해 전파하기 때문에 개인키를 갖고있는 개인만이 조회 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공할 수 있다.In addition, according to the present invention, the possibility of an individual's latent infectious agent can be easily predicted by finding a non-linear functional relationship through big data, and since the predicted result is propagated through the blockchain, only the individual who has the private key can view it. A system and method for predicting the likelihood of occurrence of a possible latent pathogen can be provided.
도 1은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템을 나타낸 예시도
도 2는 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템의 구성을 나타낸 블록도
도 3은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 방법을 나타낸 순서도이다.Figure 1 is an exemplary diagram showing a system for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.
Figure 2 is a block diagram showing the configuration of a system for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.
Figure 3 is a flowchart showing a method for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다.The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail below along with the accompanying drawings.
그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.However, the present invention is not limited to the embodiments disclosed below and may be implemented in various different forms. The present embodiments are merely provided to ensure that the disclosure of the present invention is complete and to be understood by those skilled in the art. It is provided to fully inform those who have the scope of the invention, and the present invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout the specification.
이하, 본 발명의 실시예들에 의하여 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 설명하기 위한 도면들을 참고하여 본 발명에 대해 설명하도록 한다.Hereinafter, the present invention will be described with reference to the drawings for explaining a system and method for predicting the possibility of developing a latent pathogen according to embodiments of the present invention.
본 발명은 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한것이다.The present invention relates to a system and method for predicting the likelihood of developing a latent pathogen.
본 발명에 기재된 미생물 분석장치(10)와 서버(100)는 유선 또는 무선으로 서로 연결되어 미생물분석장치(10)를 통해 생성된 분석결과데이터를 서버(100)가 수신하는 것이 가능하다.The microorganism analysis device 10 and the server 100 described in the present invention are connected to each other by wire or wirelessly, allowing the server 100 to receive analysis result data generated through the microorganism analysis device 10.
또한, 본 발명에 기재된 클라이언트(20)와 서버(100)는 블록체인 네트워크를 통해 서로 연결되어 서버(100)를 통해 생성된 암호화데이터를 클라이언트(20)가 수신하여 개인키를 통해 복호화하여 조회하기 때문에 데이터를 안전하게 검진자에게 전달 가능하다.In addition, the client 20 and the server 100 described in the present invention are connected to each other through a blockchain network, so that the client 20 receives the encrypted data generated through the server 100, decrypts it through a private key, and queries it. Therefore, the data can be safely delivered to the examiner.
도 1은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템을 나타낸 예시도이고, 도 2는 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템의 구성을 나타낸 블록도이다.Figure 1 is an exemplary diagram showing a system for predicting the possibility of developing a latent pathogen according to an embodiment of the present invention, and Figure 2 is a block diagram showing the configuration of a system for predicting the possibility of developing a latent pathogen according to an embodiment of the present invention. am.
도 1 및 도 2를 참고하면, 본 발명인 잠복병원체의 발병가능성을 예측하는 시스템은, 미생물 분석장치(10), 서버(100) 및 클라이언트(20)를 포함한다.Referring to Figures 1 and 2, the system for predicting the possibility of occurrence of a latent pathogen according to the present invention includes a microorganism analysis device 10, a server 100, and a client 20.
미생물 분석장치(10)는, 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버(100)로 송신한다.The microbiological analysis device 10 analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmits it to the server 100.
여기서, 미생물 분석장치(10)는 혈액, 타액 및 소변을 분석하여 각 시료에 포함된 변수별로 평균, 분산, 표준편차, 최대값, 최소값을 추출하고 이 결과를 통해 미생물 분석결과데이터를 생성하는 것이 바람직하다.Here, the microbial analysis device 10 analyzes blood, saliva, and urine to extract the mean, variance, standard deviation, maximum, and minimum values for each variable included in each sample, and generates microbial analysis result data through these results. desirable.
미생물 분석장치(10)를 통해 분석결과데이터를 생성하는 기술은 현재 널리 이용되고 있는 기술로 이에 대한 자세한 설명은 생략한다.The technology for generating analysis result data through the microbial analysis device 10 is currently widely used, and detailed description thereof will be omitted.
서버(100)는, 저장모듈(110), 산출모듈(120) 및 전파모듈(130)을 포함한다.The server 100 includes a storage module 110, a calculation module 120, and a propagation module 130.
저장모듈(110)은, 클라이언트(20)를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치(10)로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장한다.The storage module 110 receives examination information prepared by the examiner through the client 20, classifies and stores the received examination information according to personal information included in the examination information, and stores the microorganisms received from the microorganism analysis device 10. The analysis result data is matched to the relevant examination information and stored.
산출모듈(120)은, 상기 저장모듈(110)에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성한다.The calculation module 120 selects representative microorganisms through correlation analysis with the microbial analysis result data stored in the storage module 110, then compares one or more groups of labeled and pre-stored microbial analysis result data to obtain the most similar microbial analysis result. Data is detected and outbreak probability prediction data is generated through representative microorganisms in the detected microorganism analysis result data.
즉, 산출모듈(120)을 통해 수신된 미생물분석결과데이터와 빅데이터에 저장된 가장 유사한 미생물분석결과데이터를 검출함으로써 빅데이터에 저장된 미생물분석결과데이터의 대표 미생물을 통해 보다 저렴한 비용으로 쉽고 빠르게 발병가능성을 검출하는 것이 가능하다.In other words, by detecting the most similar microbial analysis result data received through the calculation module 120 and the microbial analysis result data stored in big data, it is possible to develop an outbreak easily and quickly at a lower cost through representative microorganisms of the microbial analysis result data stored in big data. It is possible to detect.
여기서, 산출모듈(120)은, 검출모듈(121), 데이터분류모듈(122), 데이터균형화모듈(123), 함수생성모듈(124) 및 데이터생성모듈(125)을 포함한다.Here, the calculation module 120 includes a detection module 121, a data classification module 122, a data balancing module 123, a function generation module 124, and a data generation module 125.
검출모듈(121)은, 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출한다.The detection module 121 detects one or more microorganisms through correlation analysis of the examination information of one or more examinees and microbial analysis result data stored in big data.
즉, 미생물분석결과데이터를 수신하여 미생물분석결과데이터의 각종 변수간의 상관관계를 분석하고 해당 변수들을 t-SNE(t-distributed Stochastic Neighbor Emnedding)를 이용하여 2차원으로 차원축소 후 시각화하고, 선정된 독립변수에 대한 종속변수 값을 할당하는 것이 바람직하다.In other words, the microbial analysis result data is received, the correlation between various variables of the microbial analysis result data is analyzed, the variables are reduced to two dimensions using t-SNE (t-distributed Stochastic Neighbor Emnedding), and then visualized. It is desirable to assign dependent variable values to independent variables.
데이터분류모듈(122)은, 상기 검출모듈(121)을 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류한다.The data classification module 122 performs Min-Max Normalization when the microorganism detected through the detection module 121 is in the form of a continuous variable, and performs One Hot Encoding when the microorganism is in the form of a categorical variable to detect representative microorganisms. and classified according to the values of representative microorganisms.
즉, 검출모듈(121)을 통해 할당된 종속변수값이 연속형 변수인지 범주형변수인지를 파악한 후 연속형 변수인 경우에는 최소값과 최대값으로 정규화를 수행하고 범주형 변수인 경우 칼럼으로 만들어 데이터를 단순화 한 후 미생물의 값 별로 분류하는 것이 바람직하다.That is, after determining whether the assigned dependent variable value is a continuous variable or a categorical variable through the detection module 121, normalization is performed to the minimum and maximum values in the case of a continuous variable, and data is created into a column in the case of a categorical variable. It is desirable to simplify and then classify by microorganism value.
데이터균형화모듈(123)은, 상기 데이터분류모듈(122)을 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시킨다.The data balancing module 123 performs data augmentation or resampling when there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through the data classification module 122 to analyze the microorganism. Improves the accuracy of result data.
함수생성모듈(124)은, 상기 저장모듈(110)에 저장된 미생물분석결과데이터를 상기 데이터균형화모듈(123)을 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성한다.The function generation module 124 generates a non-linear function by matching the microbial analysis result data stored in the storage module 110 with the microbial analysis result data with improved accuracy through the data balancing module 123.
즉, 저장모듈(110)을 통해 입력한 데이터와 빅데이터에 포함된 미생물분석결과데이터를 매칭시켜 비선형 데이터를 생성하게 되는 것이 바람직하다.In other words, it is desirable to generate non-linear data by matching the data input through the storage module 110 with the microbial analysis result data included in the big data.
데이터생성모듈(125)은, 상기 함수생성모듈(124)을 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성한다.The data generation module 125 generates data predicting the likelihood of occurrence of representative microorganisms through the nonlinear function generated through the function generation module 124.
즉, 비선형 함수 관계를 찾아냄으로써 개인의 잠복감연체 발현 가능성의 높고 낮음을 예측하는 것이 가능하다.In other words, it is possible to predict whether an individual's likelihood of developing latent delinquency is high or low by finding a non-linear functional relationship.
전파모듈(130)은 상기 산출모듈(120)을 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파한다.The propagation module 130 generates encrypted data by encrypting the disease probability prediction data generated through the calculation module 120 and the personal information of the examinee using a preset public key, and transmits the generated encrypted data to the blockchain network. Spread it out on the table.
여기서, 전파모듈(130)을 통해 암호화데이터가 블록체인 네트워크 상에 전파되면 상기 공개키에 해당하는 개인키를 갖는 검진자가 해당 암호화데이터를 복호화하여 조회하는 것이 가능하다.Here, when the encrypted data is spread on the blockchain network through the propagation module 130, an examiner with a private key corresponding to the public key can decrypt and inquire the encrypted data.
이를 통해 검진자 본인만이 발병가능성예측데이터를 조회하는 것이 가능하다.Through this, only the examinee can check the disease probability prediction data.
도 3은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 방법을 나타낸 순서도이다.Figure 3 is a flowchart showing a method for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.
도 3을 참고하면, 우선 미생물 분석장치(10)가 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버(100)로 송신한다(S110).Referring to FIG. 3, first, the microbiological analysis device 10 analyzes one or more of the examinee's blood, saliva, and urine to generate microbiological analysis result data and transmits it to the server 100 (S110).
그 다음, 서버(100)가 클라이언트(20)를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 (S110)단계로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장한다(S120).Next, the server 100 receives the examination information written by the examiner through the client 20, stores the received examination information separately according to the personal information included in the examination information, and analyzes the microorganisms received from the step (S110). The result data is matched to the corresponding examination information and stored (S120).
그 다음, (S120)단계에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성한다(S130).Next, representative microorganisms are selected through correlation analysis with the microbial analysis result data stored in step (S120), and then the most similar microbial analysis result data is detected by comparing one or more groups of labeled and pre-stored microbial analysis result data. Infection probability prediction data is generated using representative microorganisms in the microbial analysis result data (S130).
여기서, (S130)단계는, 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출한다(S131).Here, in step (S130), one or more microorganisms are detected through correlation analysis of the examination information and microorganism analysis result data of one or more examinees stored in big data (S131).
그리고, (S130)단계는 상기 (S131)단계를 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류한다(S132).In step (S130), if the microorganism detected through step (S131) is in the form of a continuous variable, Min-Max Normalization is performed, and if the microorganism is in the form of a categorical variable, One Hot Encoding is performed to detect representative microorganisms to represent the microorganism. Classify by microorganism value (S132).
그리고, (S130)단계는 상기 (S132)단계를 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시킨다(S133).And, in step (S130), if there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through step (S132), data augmentation or resampling is performed to obtain the microbial analysis result data. Improve accuracy (S133).
그리고, (S130)단계는, 상기 (S120)단계에 저장된 미생물분석결과데이터를 상기 (S133)단계를 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성한다(S134).And, in step (S130), a non-linear function is generated by matching the microbial analysis result data stored in step (S120) with the microbial analysis result data with improved accuracy through step (S133) (S134).
그리고, (S130)단계는, 상기 (S134)단계를 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성한다(S135).And, in step (S130), prediction data on the likelihood of occurrence of representative microorganisms is generated through the nonlinear function generated in step (S134) (S135).
마지막으로, 상기 (S130)단계를 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파한다(S140).Finally, the disease probability prediction data and the personal information of the examinee generated through the step (S130) are encrypted using a preset public key to generate encrypted data, and the generated encrypted data is disseminated on the blockchain network. (S140).
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Those skilled in the art to which the present invention pertains will understand that the present invention can be implemented in other specific forms without changing its technical idea or essential features. Therefore, the embodiments described above should be understood in all respects as illustrative and not restrictive. The scope of the present invention is indicated by the scope of the claims described below rather than the detailed description above, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts are included in the scope of the present invention. must be interpreted.
10: 미생물분석장치 20: 클라이언트
100: 서버 110: 저장모듈
120: 산출모듈 121: 검출모듈
122: 데이터분류모듈 123: 데이터균형화모듈
124: 함수생성모듈 125: 데이터생성모듈
130: 전파모듈10: Microbial analysis device 20: Client
100: Server 110: Storage module
120: Calculation module 121: Detection module
122: Data classification module 123: Data balancing module
124: Function creation module 125: Data creation module
130: Radio wave module
Claims (8)
클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈,을 포함하는 서버;를 포함하고,
상기 산출모듈은,
빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 검출모듈;
상기 검출모듈을 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 데이터분류모듈; 및
상기 데이터분류모듈을 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 데이터균형화모듈;을 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 시스템.A microbiological analysis device that analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmits it to the server;
The examination information written by the examiner is received through the client, the received examination information is classified and stored according to the personal information included in the examination information, and the microbial analysis result data received from the microorganism analysis device is matched and stored to the relevant examination information. Representative microorganisms are selected through correlation analysis with the microorganism analysis result data stored in the module and the storage module, and then the most similar microorganism analysis result data is detected by comparing one or more groups of labeled and pre-stored microorganism analysis result data. A server including a calculation module that generates disease probability prediction data through representative microorganisms of the analysis result data,
The calculation module is,
A detection module that detects one or more microorganisms through correlation analysis of one or more examiner's examination information and microbiological analysis result data stored in big data;
A data classification module that detects representative microorganisms by performing Min-Max Normalization if the microorganisms detected through the detection module are in the form of a continuous variable, and performs One Hot Encoding if the microorganism is in the form of a categorical variable and classifies them according to the values of the representative microorganisms. ; and
A data balancing module that improves the accuracy of the microbial analysis result data by performing data augmentation or resampling when the microbial analysis result data collected for each value of the representative microorganism classified through the data classification module is severely imbalanced; A system for predicting the likelihood of developing a latent pathogen, further comprising:
상기 저장모듈에 저장된 미생물분석결과데이터를 상기 데이터균형화모듈을 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 함수생성모듈; 및
상기 함수생성모듈을 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 데이터생성모듈;을 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 시스템.The method of claim 1, wherein the calculation module:
a function generation module that generates a non-linear function by matching the microbial analysis result data stored in the storage module with the microbial analysis result data with improved accuracy through the data balancing module; and
A system for predicting the likelihood of developing a latent pathogen, further comprising a data generation module that generates prediction data on the likelihood of developing a representative microorganism using a non-linear function generated through the function generating module.
상기 산출모듈을 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 전파모듈;을 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 시스템.The method of claim 1, wherein the server:
A propagation module that generates encrypted data by encrypting the disease probability prediction data generated through the calculation module and the personal information of the examinee using a preset public key and disseminates the generated encrypted data on the blockchain network; A system for predicting the likelihood of developing a latent pathogen, comprising:
(b) 서버가 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 (a)단계로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 단계; 및
(c) 상기 (b)단계에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 단계;를 포함하고,
상기 (c)단계는,
(c1) 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 단계;
(c2) 상기 (c1)단계를 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 단계; 및
(c3) 상기 (c2)단계를 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 단계;를 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 방법.(a) a step in which a microbial analysis device analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmit it to the server;
(b) The server receives the examination information written by the examiner through the client, stores the received examination information separately according to the personal information included in the examination information, and stores the microbial analysis result data received from step (a) above as the relevant examination information. matching and storing; and
(c) Representative microorganisms are selected through correlation analysis with the microbial analysis result data stored in step (b) above, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. A step of generating disease probability prediction data through representative microorganisms of the microbial analysis result data,
In step (c),
(c1) detecting one or more microorganisms through correlation analysis of the examination information of one or more examinees and microbial analysis result data stored in big data;
(c2) If the microorganism detected through step (c1) above is in the form of a continuous variable, Min-Max Normalization is performed, and if the microorganism is in the form of a categorical variable, One Hot Encoding is performed to detect representative microorganisms and categorize the values of representative microorganisms by performing One Hot Encoding. Classifying step; and
(c3) If there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through step (c2), data augmentation or resampling is performed to improve the accuracy of the microbial analysis result data. A method for predicting the likelihood of developing a latent pathogen, further comprising:
(c4) 상기 (b)단계에 저장된 미생물분석결과데이터를 상기 (c3)단계를 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 단계; 및
(c5) 상기 (c4)단계를 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 방법.The method of claim 5, wherein step (c) is,
(c4) generating a non-linear function by matching the microbial analysis result data stored in step (b) with the microbial analysis result data with improved accuracy through step (c3); and
(c5) generating prediction data on the likelihood of occurrence of representative microorganisms using the non-linear function generated in step (c4).
(d) 상기 (c)단계를 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 단계;를 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 방법.
According to clause 5,
(d) Encrypting the disease probability prediction data and the personal information of the examinee generated through step (c) using a preset public key to generate encrypted data and disseminating the generated encrypted data on the blockchain network. A method for predicting the likelihood of developing a latent pathogen, further comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210092919A KR102590308B1 (en) | 2021-07-15 | 2021-07-15 | SYstem and method for predicting the possibility of disease pathogen incubation |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210092919A KR102590308B1 (en) | 2021-07-15 | 2021-07-15 | SYstem and method for predicting the possibility of disease pathogen incubation |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230013665A KR20230013665A (en) | 2023-01-27 |
KR102590308B1 true KR102590308B1 (en) | 2023-10-18 |
Family
ID=85101824
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210092919A KR102590308B1 (en) | 2021-07-15 | 2021-07-15 | SYstem and method for predicting the possibility of disease pathogen incubation |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102590308B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102030800B1 (en) * | 2019-03-21 | 2019-10-10 | 주식회사 마크로젠 | Bio data providing method, bio data encryption method and apparatus for processing bio data |
KR102179850B1 (en) * | 2019-12-06 | 2020-11-17 | 주식회사 클리노믹스 | System and method for predicting health using analysis device for intraoral microbes (bacteria, virus, viroid, and/or fungi) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102367564B1 (en) * | 2019-11-01 | 2022-02-28 | 주식회사 피씨티 | Method and system for predicting colon cancer related information based on lifestyle information |
-
2021
- 2021-07-15 KR KR1020210092919A patent/KR102590308B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102030800B1 (en) * | 2019-03-21 | 2019-10-10 | 주식회사 마크로젠 | Bio data providing method, bio data encryption method and apparatus for processing bio data |
KR102179850B1 (en) * | 2019-12-06 | 2020-11-17 | 주식회사 클리노믹스 | System and method for predicting health using analysis device for intraoral microbes (bacteria, virus, viroid, and/or fungi) |
Also Published As
Publication number | Publication date |
---|---|
KR20230013665A (en) | 2023-01-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sperling et al. | Comparison of bacterial 16S rRNA variable regions for microbiome surveys of ticks | |
Ali et al. | Spike2vec: An efficient and scalable embedding approach for covid-19 spike sequences | |
Gonzalez-Dias et al. | Methods for predicting vaccine immunogenicity and reactogenicity | |
Bzhalava et al. | Machine Learning for detection of viral sequences in human metagenomic datasets | |
Leo et al. | Machine learning model for imbalanced cholera dataset in Tanzania | |
CN102007407A (en) | Genome identification system | |
US20130325771A1 (en) | New classification method for spectral data | |
Villani et al. | A machine learning approach to identify NIH-funded applied prevention research | |
Rawat et al. | A study on cervical cancer prediction using various machine learning approaches | |
Zhu et al. | OGUs enable effective, phylogeny-aware analysis of even shallow metagenome community structures | |
Gao et al. | Early indicators of human activity during COVID-19 period using digital trace data of population activities | |
Chaudhuri et al. | A dataset centric feature selection and stacked model to detect breast cancer | |
Linthorst et al. | The cell‐free DNA virome of 108,349 Dutch pregnant women | |
KR102590308B1 (en) | SYstem and method for predicting the possibility of disease pathogen incubation | |
Gregory DiRienzo et al. | Non‐parametric methods to predict HIV drug susceptibility phenotype from genotype | |
Sun et al. | Removal of false positives in metagenomics-based taxonomy profiling via targeting Type IIB restriction sites | |
Sintchenko et al. | Laboratory-guided detection of disease outbreaks: three generations of surveillance systems | |
CN109415755B (en) | Flow cytometry data processing for antimicrobial susceptibility prediction | |
Jafarzadeh et al. | Bayesian estimation of the receiver operating characteristic curve for a diagnostic test with a limit of detection in the absence of a gold standard | |
CN109477129B (en) | Flow cytometry data processing for antimicrobial susceptibility prediction | |
Barker et al. | Rapid identification of stable clusters in bacterial populations using the adjusted Wallace coefficient | |
Moitas et al. | Forensic microbiology and geographical location: a systematic review | |
Rufino et al. | Consistent comparison of symptom-based methods for COVID-19 infection detection | |
Sun et al. | Eliminate false positives in metagenomic profiling based on type IIB restriction sites | |
Millard et al. | Maximizing statistical power to detect clinically associated cell states with scPOST |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |