KR102590308B1 - SYstem and method for predicting the possibility of disease pathogen incubation - Google Patents

SYstem and method for predicting the possibility of disease pathogen incubation Download PDF

Info

Publication number
KR102590308B1
KR102590308B1 KR1020210092919A KR20210092919A KR102590308B1 KR 102590308 B1 KR102590308 B1 KR 102590308B1 KR 1020210092919 A KR1020210092919 A KR 1020210092919A KR 20210092919 A KR20210092919 A KR 20210092919A KR 102590308 B1 KR102590308 B1 KR 102590308B1
Authority
KR
South Korea
Prior art keywords
analysis result
result data
data
microbial analysis
microbial
Prior art date
Application number
KR1020210092919A
Other languages
Korean (ko)
Other versions
KR20230013665A (en
Inventor
채성수
Original Assignee
(주)애버커스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)애버커스 filed Critical (주)애버커스
Priority to KR1020210092919A priority Critical patent/KR102590308B1/en
Publication of KR20230013665A publication Critical patent/KR20230013665A/en
Application granted granted Critical
Publication of KR102590308B1 publication Critical patent/KR102590308B1/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Epidemiology (AREA)
  • Biomedical Technology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

본 발명은 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 있어서, 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치; 및 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈,을 포함하는 서버;를 포함하는 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한 것이다. 본 발명에 따르면, 검진자에게 채취한 혈액, 타액 및 소변 중 어느 하나의 미생물 분석 결과와 상관관계 분석 후 빅데이터화된 미생물 분석 결과를 서로 비교하여 가장 유사한 미생물 분석결과를 검출하여 발병가능 성을 예측함으로써, 보다 저렴한 비용으로 빠르고 정확하게 잠복병원체를 검출하는 것이 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공할 수 있다.The present invention provides a system and method for predicting the possibility of developing a latent pathogen, comprising: a microbiological analysis device that analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmits it to a server; And receiving the examination information prepared by the examiner through the client, classifying and storing the received examination information according to the personal information included in the examination information, and matching and storing the microbial analysis result data received from the microbial analysis device to the relevant examination information. Representative microorganisms are selected through correlation analysis with the storage module and the microbial analysis result data stored in the storage module, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. It relates to a system and method for predicting the possibility of developing a latent pathogen, including a server including a calculation module that generates prediction data about the possibility of developing an outbreak through representative microorganisms in the microbial analysis result data. According to the present invention, after correlation analysis with the microbial analysis results of any one of blood, saliva, and urine collected from the examinee, the big data microbial analysis results are compared with each other to detect the most similar microbial analysis results to predict the possibility of disease. , it is possible to provide a system and method for predicting the likelihood of developing a latent pathogen that can detect latent pathogens quickly and accurately at a lower cost.

Description

잠복병원체의 발병가능성을 예측하는 시스템 및 방법{SYstem and method for predicting the possibility of disease pathogen incubation}System and method for predicting the possibility of disease pathogen incubation}

본 발명은 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한 것으로, 보다 상세하게는 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치; 및 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈,을 포함하는 서버;를 포함하는 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for predicting the possibility of developing a latent pathogen, and more specifically, to a microbiological analysis device that analyzes one or more of the examinee's blood, saliva, and urine to generate microbiological analysis result data and transmits it to the server. ; And receiving the examination information prepared by the examiner through the client, classifying and storing the received examination information according to the personal information included in the examination information, and matching and storing the microbial analysis result data received from the microbial analysis device to the relevant examination information. Representative microorganisms are selected through correlation analysis with the storage module and the microbial analysis result data stored in the storage module, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. It relates to a system and method for predicting the possibility of developing a latent pathogen, including a server including a calculation module that generates prediction data about the possibility of developing an outbreak through representative microorganisms in the microbial analysis result data.

본 발명은 미생물을 분석하여 발병가능성을 예측하는 서버에 관한 것이다.The present invention relates to a server that analyzes microorganisms and predicts the likelihood of an outbreak.

미생물이란, 육안의 가시한계를 넘어선 0.1mm이하의 크기를 이루고, 주로 단일세포 또는 균사로써 몸을 이루는 생물 입자를 통틀어 의미한다.Microorganisms collectively refer to biological particles that exceed the visual limit of the naked eye and are less than 0.1 mm in size and are mainly composed of single cells or hyphae.

상기 미생물은 보이지 않는 영역에서 우리 생활 전반에 많은 영향을 주고 있는데, 이러한 영향은 유익한 것에서 유해한 것까지 다양하게 존재한다.The above-mentioned microorganisms have a great influence on our overall life in an invisible area, and these influences range from beneficial to harmful.

따라서, 우리 몸의 안과 밖에 박테리아, 곰팡이, 바이러스, 바이로이드(Viroid) 및 미생물 유래 유전자 분자들을 해독 및 검형하여 미생물에 대한 종 동정정보, 미생물의 개체수, 각기 다른 미생물의 분포비율, 분포비율을 이미 알려진 건강하거나, 질병이 있는 사람들의 정보를 통해 유추된 주석화가 된 미생물 군체에 대한 표준적 데이터베이스 정보를 비교하고, 파악함으로써 질병 발생 및 건강을 예측할 수 있으며 유전자 검사를 통해 이러한 미생물의 양과 타입을 파악하는 다양한 방법들이 제시되고 있다.Therefore, by deciphering and detecting bacteria, fungi, viruses, viroids, and genetic molecules derived from microorganisms inside and outside of our bodies, we can already know the species identification information for microorganisms, the population of microorganisms, the distribution ratio of different microorganisms, and the distribution ratio. Disease occurrence and health can be predicted by comparing and identifying standard database information on annotated microbial communities inferred through information on healthy or diseased people, and identifying the amount and type of these microorganisms through genetic testing. Various methods are being proposed.

인체는 미생물에 감염되면 질병을 나타내는 증상과 증후가 나타날때까지 수일 또는 그 이상에 해당하는 잠복기가 있다.When the human body is infected with a microorganism, there is an incubation period of several days or more until signs and symptoms indicating disease appear.

병원체의 유전자는 존재하지만 무증상으로 존재하다가 면역 상태의 변화에 따라서 상시 발병으로 이행하는 위험성을 가지고 있다.Although the pathogen's genes exist, there is a risk of existing asymptomatically and transitioning to regular outbreaks depending on changes in immune status.

잠복 감염이 가능한 대표적인 병원체는 허피스바이러스에 속하는 단순포진 바이러스(HSV), 앱스타인-바 바이러스(EBV), 사람 거대세포 바이러스(HCMV), 대상포진 바이러스(VZV), HHV-6가 있으며, 그 외 바이러스에 아데노 바이러스, JC바이러스, BK 바이러스 등이 있다.Representative pathogens capable of latent infection include herpes simplex virus (HSV), Apstein-Barr virus (EBV), human cytomegalovirus (HCMV), herpes zoster virus (VZV), and HHV-6, which belong to the herpes virus family. Viruses include adenovirus, JC virus, and BK virus.

이들 바이러스들은 잠복 감염을 이루고 있다가 특정 환경이 되면 다시 재발현화 되어 바이러스 증식을 다시 시작하면서 다양한 질병에 관여한다.These viruses form a latent infection, but in a specific environment, they re-express and begin to multiply again, contributing to various diseases.

대한민국 등록특허공보 제10-2179850호Republic of Korea Patent Publication No. 10-2179850

상술한 바와 같은 같은 문제점을 해결하기 위해 안출된 본 발명의 목적은, 검진자에게 채취한 혈액, 타액 및 소변 중 어느 하나의 미생물 분석 결과와 상관관계 분석 후 빅데이터화된 미생물 분석 결과를 서로 비교하여 가장 유사한 미생물 분석결과를 검출하여 발병가능 성을 예측함으로써, 보다 저렴한 비용으로 빠르고 정확하게 잠복병원체를 검출하는 것이 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공하기 위함이다.The purpose of the present invention, which was devised to solve the same problems as described above, is to compare the microbial analysis results of any one of blood, saliva, and urine collected from the examinee with the big data microbial analysis results after correlation analysis. The purpose is to provide a system and method for predicting the possibility of developing a latent pathogen that can detect latent pathogens quickly and accurately at a lower cost by predicting the possibility of outbreak by detecting similar microbial analysis results.

또한, 본 발명의 다른 목적은, 빅데이터를 통해 비선형 함수관계를 찾아냄으로써 개인의 잠복감염체 발현 가능성을 쉽게 예측가능하고 예측된 결과값을 블록체인을 통해 전파하기 때문에 개인키를 갖고있는 개인만이 조회 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공하기 위함이다.In addition, another purpose of the present invention is to easily predict the possibility of an individual's latent infectious agent by finding a non-linear functional relationship through big data, and to disseminate the predicted result through the blockchain, so that only the individual with the private key can use it. The purpose is to provide a system and method for predicting the possibility of outbreak of latent pathogens that can be viewed.

상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명인 잠복병원체의 발병가능성을 예측하는 시스템은, 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치; 및 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈을 포함하는 서버를 포함하고, 상기 산출모듈은 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 검출모듈; 상기 검출모듈을 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 데이터분류모듈; 및 상기 데이터분류모듈을 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 데이터균형화모듈;을 더 포함하는 것을 특징으로 한다.According to the features of the present invention for achieving the above-described object, the system for predicting the possibility of developing a latent pathogen according to the present invention analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data. Microorganism analysis device transmitting to the server; And receiving the examination information prepared by the examiner through the client, classifying and storing the received examination information according to the personal information included in the examination information, and matching and storing the microbial analysis result data received from the microbial analysis device to the relevant examination information. Representative microorganisms are selected through correlation analysis with the storage module and the microbial analysis result data stored in the storage module, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. A server including a calculation module that generates disease probability prediction data through representative microorganisms of the microbial analysis result data, wherein the calculation module performs a correlation analysis of the examination information of one or more examinees and the microbial analysis result data stored in big data. A detection module that detects one or more microorganisms through; A data classification module that detects representative microorganisms by performing Min-Max Normalization if the microorganisms detected through the detection module are in the form of a continuous variable, and performs One Hot Encoding if the microorganism is in the form of a categorical variable and classifies them according to the values of the representative microorganisms. ; And a data balancing module that improves the accuracy of the microbial analysis result data by performing data augmentation or resampling when there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through the data classification module. It is characterized by further including ;.

삭제delete

또한, 상기 산출모듈은, 상기 저장모듈에 저장된 미생물분석결과데이터를 상기 데이터균형화모듈을 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 함수생성모듈; 및 상기 함수생성모듈을 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 데이터생성모듈;을 더 포함하는 것을 특징으로 한다.In addition, the calculation module includes a function generation module that generates a non-linear function by matching the microbial analysis result data stored in the storage module with the microbial analysis result data with improved accuracy through the data balancing module; And a data generation module that generates disease probability prediction data of representative microorganisms through a non-linear function generated through the function generation module.

또한, 상기 서버는, 상기 산출모듈을 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 전파모듈;을 더 포함하는 것을 특징으로 한다.In addition, the server generates encrypted data by encrypting the disease probability prediction data generated through the calculation module and the personal information of the examinee using a preset public key, and disseminates the generated encrypted data on the blockchain network. It is characterized in that it further includes a radio wave module.

상기한 바와 같은 목적을 달성하기 위한 본 발명의 또 다른 특징에 따르면, 본 발명인 잠복병원체의 발병가능성을 예측하는 방법은, (a) 미생물 분석장치가 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 단계; (b) 서버가 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 (a)단계로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 단계; 및 (c) 상기 (b)단계에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 단계;를 포함하고, 상기 (c)단계는 (c1) 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 단계; (c2) 상기 (c1)단계를 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 단계; 및 (c3) 상기 (c2)단계를 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 단계;를 더 포함하는 것을 특징으로 한다.According to another feature of the present invention for achieving the above-described object, the method of predicting the possibility of developing a latent pathogen according to the present invention includes (a) a microorganism analysis device measuring at least one of the examinee's blood, saliva, and urine; Analyzing and generating microbial analysis result data and transmitting it to the server; (b) The server receives the examination information written by the examiner through the client, stores the received examination information separately according to the personal information included in the examination information, and stores the microbial analysis result data received from step (a) above as the relevant examination information. matching and storing; and (c) representative microorganisms are selected through correlation analysis with the microbial analysis result data stored in step (b), and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. Generating disease probability prediction data through representative microorganisms of the detected microorganism analysis result data; Step (c) includes (c1) correlating the examination information of one or more examinees and the microbiological analysis result data stored in the big data. Detecting one or more microorganisms through relationship analysis; (c2) If the microorganism detected through step (c1) above is in the form of a continuous variable, Min-Max Normalization is performed, and if the microorganism is in the form of a categorical variable, One Hot Encoding is performed to detect representative microorganisms and categorize the values of representative microorganisms by performing One Hot Encoding. Classifying step; And (c3) if there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through step (c2), data augmentation or resampling is performed to improve the accuracy of the microbial analysis result data. It is characterized in that it further includes a step of allowing.

삭제delete

또한, 상기 (c)단계는, (c4) 상기 (b)단계에 저장된 미생물분석결과데이터를 상기 (c3)단계를 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 단계; 및 (c5) 상기 (c4)단계를 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 한다.In addition, step (c) includes: (c4) matching the microbial analysis result data stored in step (b) with microbial analysis result data with improved accuracy through step (c3) to generate a non-linear function; and (c5) generating prediction data on the likelihood of occurrence of representative microorganisms using the nonlinear function generated in step (c4).

또한, 본 발명인, 잠복병원체의 발병가능성을 예측하는 방법은, (d) 상기 (c)단계를 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 단계;를 더 포함하는 것을 특징으로 한다.In addition, the present inventor's method of predicting the likelihood of developing a latent pathogen is (d) encrypting the disease likelihood prediction data generated through step (c) and the personal information of the examinee using a preset public key. It is characterized in that it further includes the step of generating data and disseminating the generated encrypted data on the blockchain network.

이상 살펴본 바와 같은 본 발명에 따르면, 검진자에게 채취한 혈액, 타액 및 소변 중 어느 하나의 미생물 분석 결과와 상관관계 분석 후 빅데이터화된 미생물 분석 결과를 서로 비교하여 가장 유사한 미생물 분석결과를 검출하여 발병가능 성을 예측함으로써, 보다 저렴한 비용으로 빠르고 정확하게 잠복병원체를 검출하는 것이 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공할 수 있다.According to the present invention as discussed above, the most similar microbial analysis results can be detected by comparing the big data microbial analysis results after correlation analysis with the microbial analysis results of any one of blood, saliva, and urine collected from the examinee. By predicting the sex, it is possible to provide a system and method for predicting the likelihood of developing a latent pathogen that can detect latent pathogens quickly and accurately at a lower cost.

또한, 본 발명에 따르면, 빅데이터를 통해 비선형 함수관계를 찾아냄으로써 개인의 잠복감염체 발현 가능성을 쉽게 예측가능하고 예측된 결과값을 블록체인을 통해 전파하기 때문에 개인키를 갖고있는 개인만이 조회 가능한 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 제공할 수 있다.In addition, according to the present invention, the possibility of an individual's latent infectious agent can be easily predicted by finding a non-linear functional relationship through big data, and since the predicted result is propagated through the blockchain, only the individual who has the private key can view it. A system and method for predicting the likelihood of occurrence of a possible latent pathogen can be provided.

도 1은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템을 나타낸 예시도
도 2는 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템의 구성을 나타낸 블록도
도 3은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 방법을 나타낸 순서도이다.
Figure 1 is an exemplary diagram showing a system for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.
Figure 2 is a block diagram showing the configuration of a system for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.
Figure 3 is a flowchart showing a method for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다.The advantages and features of the present invention and methods for achieving them will become clear by referring to the embodiments described in detail below along with the accompanying drawings.

그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 명세서 전체에 걸쳐 동일 참조 부호는 동일 구성 요소를 지칭한다.However, the present invention is not limited to the embodiments disclosed below and may be implemented in various different forms. The present embodiments are merely provided to ensure that the disclosure of the present invention is complete and to be understood by those skilled in the art. It is provided to fully inform those who have the scope of the invention, and the present invention is only defined by the scope of the claims. Like reference numerals refer to like elements throughout the specification.

이하, 본 발명의 실시예들에 의하여 잠복병원체의 발병가능성을 예측하는 시스템 및 방법을 설명하기 위한 도면들을 참고하여 본 발명에 대해 설명하도록 한다.Hereinafter, the present invention will be described with reference to the drawings for explaining a system and method for predicting the possibility of developing a latent pathogen according to embodiments of the present invention.

본 발명은 잠복병원체의 발병가능성을 예측하는 시스템 및 방법에 관한것이다.The present invention relates to a system and method for predicting the likelihood of developing a latent pathogen.

본 발명에 기재된 미생물 분석장치(10)와 서버(100)는 유선 또는 무선으로 서로 연결되어 미생물분석장치(10)를 통해 생성된 분석결과데이터를 서버(100)가 수신하는 것이 가능하다.The microorganism analysis device 10 and the server 100 described in the present invention are connected to each other by wire or wirelessly, allowing the server 100 to receive analysis result data generated through the microorganism analysis device 10.

또한, 본 발명에 기재된 클라이언트(20)와 서버(100)는 블록체인 네트워크를 통해 서로 연결되어 서버(100)를 통해 생성된 암호화데이터를 클라이언트(20)가 수신하여 개인키를 통해 복호화하여 조회하기 때문에 데이터를 안전하게 검진자에게 전달 가능하다.In addition, the client 20 and the server 100 described in the present invention are connected to each other through a blockchain network, so that the client 20 receives the encrypted data generated through the server 100, decrypts it through a private key, and queries it. Therefore, the data can be safely delivered to the examiner.

도 1은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템을 나타낸 예시도이고, 도 2는 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 시스템의 구성을 나타낸 블록도이다.Figure 1 is an exemplary diagram showing a system for predicting the possibility of developing a latent pathogen according to an embodiment of the present invention, and Figure 2 is a block diagram showing the configuration of a system for predicting the possibility of developing a latent pathogen according to an embodiment of the present invention. am.

도 1 및 도 2를 참고하면, 본 발명인 잠복병원체의 발병가능성을 예측하는 시스템은, 미생물 분석장치(10), 서버(100) 및 클라이언트(20)를 포함한다.Referring to Figures 1 and 2, the system for predicting the possibility of occurrence of a latent pathogen according to the present invention includes a microorganism analysis device 10, a server 100, and a client 20.

미생물 분석장치(10)는, 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버(100)로 송신한다.The microbiological analysis device 10 analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmits it to the server 100.

여기서, 미생물 분석장치(10)는 혈액, 타액 및 소변을 분석하여 각 시료에 포함된 변수별로 평균, 분산, 표준편차, 최대값, 최소값을 추출하고 이 결과를 통해 미생물 분석결과데이터를 생성하는 것이 바람직하다.Here, the microbial analysis device 10 analyzes blood, saliva, and urine to extract the mean, variance, standard deviation, maximum, and minimum values for each variable included in each sample, and generates microbial analysis result data through these results. desirable.

미생물 분석장치(10)를 통해 분석결과데이터를 생성하는 기술은 현재 널리 이용되고 있는 기술로 이에 대한 자세한 설명은 생략한다.The technology for generating analysis result data through the microbial analysis device 10 is currently widely used, and detailed description thereof will be omitted.

서버(100)는, 저장모듈(110), 산출모듈(120) 및 전파모듈(130)을 포함한다.The server 100 includes a storage module 110, a calculation module 120, and a propagation module 130.

저장모듈(110)은, 클라이언트(20)를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치(10)로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장한다.The storage module 110 receives examination information prepared by the examiner through the client 20, classifies and stores the received examination information according to personal information included in the examination information, and stores the microorganisms received from the microorganism analysis device 10. The analysis result data is matched to the relevant examination information and stored.

산출모듈(120)은, 상기 저장모듈(110)에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성한다.The calculation module 120 selects representative microorganisms through correlation analysis with the microbial analysis result data stored in the storage module 110, then compares one or more groups of labeled and pre-stored microbial analysis result data to obtain the most similar microbial analysis result. Data is detected and outbreak probability prediction data is generated through representative microorganisms in the detected microorganism analysis result data.

즉, 산출모듈(120)을 통해 수신된 미생물분석결과데이터와 빅데이터에 저장된 가장 유사한 미생물분석결과데이터를 검출함으로써 빅데이터에 저장된 미생물분석결과데이터의 대표 미생물을 통해 보다 저렴한 비용으로 쉽고 빠르게 발병가능성을 검출하는 것이 가능하다.In other words, by detecting the most similar microbial analysis result data received through the calculation module 120 and the microbial analysis result data stored in big data, it is possible to develop an outbreak easily and quickly at a lower cost through representative microorganisms of the microbial analysis result data stored in big data. It is possible to detect.

여기서, 산출모듈(120)은, 검출모듈(121), 데이터분류모듈(122), 데이터균형화모듈(123), 함수생성모듈(124) 및 데이터생성모듈(125)을 포함한다.Here, the calculation module 120 includes a detection module 121, a data classification module 122, a data balancing module 123, a function generation module 124, and a data generation module 125.

검출모듈(121)은, 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출한다.The detection module 121 detects one or more microorganisms through correlation analysis of the examination information of one or more examinees and microbial analysis result data stored in big data.

즉, 미생물분석결과데이터를 수신하여 미생물분석결과데이터의 각종 변수간의 상관관계를 분석하고 해당 변수들을 t-SNE(t-distributed Stochastic Neighbor Emnedding)를 이용하여 2차원으로 차원축소 후 시각화하고, 선정된 독립변수에 대한 종속변수 값을 할당하는 것이 바람직하다.In other words, the microbial analysis result data is received, the correlation between various variables of the microbial analysis result data is analyzed, the variables are reduced to two dimensions using t-SNE (t-distributed Stochastic Neighbor Emnedding), and then visualized. It is desirable to assign dependent variable values to independent variables.

데이터분류모듈(122)은, 상기 검출모듈(121)을 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류한다.The data classification module 122 performs Min-Max Normalization when the microorganism detected through the detection module 121 is in the form of a continuous variable, and performs One Hot Encoding when the microorganism is in the form of a categorical variable to detect representative microorganisms. and classified according to the values of representative microorganisms.

즉, 검출모듈(121)을 통해 할당된 종속변수값이 연속형 변수인지 범주형변수인지를 파악한 후 연속형 변수인 경우에는 최소값과 최대값으로 정규화를 수행하고 범주형 변수인 경우 칼럼으로 만들어 데이터를 단순화 한 후 미생물의 값 별로 분류하는 것이 바람직하다.That is, after determining whether the assigned dependent variable value is a continuous variable or a categorical variable through the detection module 121, normalization is performed to the minimum and maximum values in the case of a continuous variable, and data is created into a column in the case of a categorical variable. It is desirable to simplify and then classify by microorganism value.

데이터균형화모듈(123)은, 상기 데이터분류모듈(122)을 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시킨다.The data balancing module 123 performs data augmentation or resampling when there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through the data classification module 122 to analyze the microorganism. Improves the accuracy of result data.

함수생성모듈(124)은, 상기 저장모듈(110)에 저장된 미생물분석결과데이터를 상기 데이터균형화모듈(123)을 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성한다.The function generation module 124 generates a non-linear function by matching the microbial analysis result data stored in the storage module 110 with the microbial analysis result data with improved accuracy through the data balancing module 123.

즉, 저장모듈(110)을 통해 입력한 데이터와 빅데이터에 포함된 미생물분석결과데이터를 매칭시켜 비선형 데이터를 생성하게 되는 것이 바람직하다.In other words, it is desirable to generate non-linear data by matching the data input through the storage module 110 with the microbial analysis result data included in the big data.

데이터생성모듈(125)은, 상기 함수생성모듈(124)을 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성한다.The data generation module 125 generates data predicting the likelihood of occurrence of representative microorganisms through the nonlinear function generated through the function generation module 124.

즉, 비선형 함수 관계를 찾아냄으로써 개인의 잠복감연체 발현 가능성의 높고 낮음을 예측하는 것이 가능하다.In other words, it is possible to predict whether an individual's likelihood of developing latent delinquency is high or low by finding a non-linear functional relationship.

전파모듈(130)은 상기 산출모듈(120)을 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파한다.The propagation module 130 generates encrypted data by encrypting the disease probability prediction data generated through the calculation module 120 and the personal information of the examinee using a preset public key, and transmits the generated encrypted data to the blockchain network. Spread it out on the table.

여기서, 전파모듈(130)을 통해 암호화데이터가 블록체인 네트워크 상에 전파되면 상기 공개키에 해당하는 개인키를 갖는 검진자가 해당 암호화데이터를 복호화하여 조회하는 것이 가능하다.Here, when the encrypted data is spread on the blockchain network through the propagation module 130, an examiner with a private key corresponding to the public key can decrypt and inquire the encrypted data.

이를 통해 검진자 본인만이 발병가능성예측데이터를 조회하는 것이 가능하다.Through this, only the examinee can check the disease probability prediction data.

도 3은 본 발명의 실시예에 따른 잠복병원체의 발병가능성을 예측하는 방법을 나타낸 순서도이다.Figure 3 is a flowchart showing a method for predicting the likelihood of developing a latent pathogen according to an embodiment of the present invention.

도 3을 참고하면, 우선 미생물 분석장치(10)가 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버(100)로 송신한다(S110).Referring to FIG. 3, first, the microbiological analysis device 10 analyzes one or more of the examinee's blood, saliva, and urine to generate microbiological analysis result data and transmits it to the server 100 (S110).

그 다음, 서버(100)가 클라이언트(20)를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 (S110)단계로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장한다(S120).Next, the server 100 receives the examination information written by the examiner through the client 20, stores the received examination information separately according to the personal information included in the examination information, and analyzes the microorganisms received from the step (S110). The result data is matched to the corresponding examination information and stored (S120).

그 다음, (S120)단계에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성한다(S130).Next, representative microorganisms are selected through correlation analysis with the microbial analysis result data stored in step (S120), and then the most similar microbial analysis result data is detected by comparing one or more groups of labeled and pre-stored microbial analysis result data. Infection probability prediction data is generated using representative microorganisms in the microbial analysis result data (S130).

여기서, (S130)단계는, 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출한다(S131).Here, in step (S130), one or more microorganisms are detected through correlation analysis of the examination information and microorganism analysis result data of one or more examinees stored in big data (S131).

그리고, (S130)단계는 상기 (S131)단계를 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류한다(S132).In step (S130), if the microorganism detected through step (S131) is in the form of a continuous variable, Min-Max Normalization is performed, and if the microorganism is in the form of a categorical variable, One Hot Encoding is performed to detect representative microorganisms to represent the microorganism. Classify by microorganism value (S132).

그리고, (S130)단계는 상기 (S132)단계를 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시킨다(S133).And, in step (S130), if there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through step (S132), data augmentation or resampling is performed to obtain the microbial analysis result data. Improve accuracy (S133).

그리고, (S130)단계는, 상기 (S120)단계에 저장된 미생물분석결과데이터를 상기 (S133)단계를 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성한다(S134).And, in step (S130), a non-linear function is generated by matching the microbial analysis result data stored in step (S120) with the microbial analysis result data with improved accuracy through step (S133) (S134).

그리고, (S130)단계는, 상기 (S134)단계를 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성한다(S135).And, in step (S130), prediction data on the likelihood of occurrence of representative microorganisms is generated through the nonlinear function generated in step (S134) (S135).

마지막으로, 상기 (S130)단계를 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파한다(S140).Finally, the disease probability prediction data and the personal information of the examinee generated through the step (S130) are encrypted using a preset public key to generate encrypted data, and the generated encrypted data is disseminated on the blockchain network. (S140).

본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Those skilled in the art to which the present invention pertains will understand that the present invention can be implemented in other specific forms without changing its technical idea or essential features. Therefore, the embodiments described above should be understood in all respects as illustrative and not restrictive. The scope of the present invention is indicated by the scope of the claims described below rather than the detailed description above, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts are included in the scope of the present invention. must be interpreted.

10: 미생물분석장치 20: 클라이언트
100: 서버 110: 저장모듈
120: 산출모듈 121: 검출모듈
122: 데이터분류모듈 123: 데이터균형화모듈
124: 함수생성모듈 125: 데이터생성모듈
130: 전파모듈
10: Microbial analysis device 20: Client
100: Server 110: Storage module
120: Calculation module 121: Detection module
122: Data classification module 123: Data balancing module
124: Function creation module 125: Data creation module
130: Radio wave module

Claims (8)

검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 미생물 분석장치;
클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 미생물 분석장치로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 저장모듈, 및 상기 저장모듈에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 산출모듈,을 포함하는 서버;를 포함하고,
상기 산출모듈은,
빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 검출모듈;
상기 검출모듈을 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 데이터분류모듈; 및
상기 데이터분류모듈을 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 데이터균형화모듈;을 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 시스템.
A microbiological analysis device that analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmits it to the server;
The examination information written by the examiner is received through the client, the received examination information is classified and stored according to the personal information included in the examination information, and the microbial analysis result data received from the microorganism analysis device is matched and stored to the relevant examination information. Representative microorganisms are selected through correlation analysis with the microorganism analysis result data stored in the module and the storage module, and then the most similar microorganism analysis result data is detected by comparing one or more groups of labeled and pre-stored microorganism analysis result data. A server including a calculation module that generates disease probability prediction data through representative microorganisms of the analysis result data,
The calculation module is,
A detection module that detects one or more microorganisms through correlation analysis of one or more examiner's examination information and microbiological analysis result data stored in big data;
A data classification module that detects representative microorganisms by performing Min-Max Normalization if the microorganisms detected through the detection module are in the form of a continuous variable, and performs One Hot Encoding if the microorganism is in the form of a categorical variable and classifies them according to the values of the representative microorganisms. ; and
A data balancing module that improves the accuracy of the microbial analysis result data by performing data augmentation or resampling when the microbial analysis result data collected for each value of the representative microorganism classified through the data classification module is severely imbalanced; A system for predicting the likelihood of developing a latent pathogen, further comprising:
삭제delete 제1항에 있어서, 상기 산출모듈은,
상기 저장모듈에 저장된 미생물분석결과데이터를 상기 데이터균형화모듈을 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 함수생성모듈; 및
상기 함수생성모듈을 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 데이터생성모듈;을 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 시스템.
The method of claim 1, wherein the calculation module:
a function generation module that generates a non-linear function by matching the microbial analysis result data stored in the storage module with the microbial analysis result data with improved accuracy through the data balancing module; and
A system for predicting the likelihood of developing a latent pathogen, further comprising a data generation module that generates prediction data on the likelihood of developing a representative microorganism using a non-linear function generated through the function generating module.
제1항에 있어서, 상기 서버는,
상기 산출모듈을 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 전파모듈;을 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 시스템.
The method of claim 1, wherein the server:
A propagation module that generates encrypted data by encrypting the disease probability prediction data generated through the calculation module and the personal information of the examinee using a preset public key and disseminates the generated encrypted data on the blockchain network; A system for predicting the likelihood of developing a latent pathogen, comprising:
(a) 미생물 분석장치가 검진자의 혈액, 타액 및 소변 중 어느 하나 이상을 분석하여 미생물 분석결과데이터를 생성하여 서버로 송신하는 단계;
(b) 서버가 클라이언트를 통해 검진자가 작성한 검진정보를 수신하고 수신된 검진정보를 검진정보에 포함된 개인정보에 따라 구분하여 저장하며 상기 (a)단계로부터 수신되는 미생물분석결과데이터를 해당 검진정보에 매칭하여 저장하는 단계; 및
(c) 상기 (b)단계에 저장된 미생물분석결과데이터와 상관관계 분석을 통해 대표 미생물이 선정된 후 레이블링되어 미리 저장된 하나 이상의 미생물분석결과데이터 군을 비교하여 가장 유사한 미생물분석결과데이터를 검출하여 검출된 미생물분석결과데이터의 대표 미생물을 통해 발병가능성예측데이터를 생성하는 단계;를 포함하고,
상기 (c)단계는,
(c1) 빅데이터에 저장된 하나 이상의 검진자의 검진정보 및 미생물분석결과데이터를 상관관계 분석을 통하여 하나 이상의 미생물을 검출하는 단계;
(c2) 상기 (c1)단계를 통해 검출된 미생물이 연속형 변수형태인 경우 Min-Max Nomalinzation을 수행하고, 범주형 변수형태인 경우 One Hot Encoding을 수행하여 대표 미생물을 검출하여 대표 미생물의 값 별로 분류하는 단계; 및
(c3) 상기 (c2)단계를 통해 분류된 상기 대표 미생물의 값 별로 수집된 미생물분석결과데이터의 불균형이 심한 경우 데이터 증식(Data Augmentation) 또는 리샘플링을 수행하여 상기 미생물분석결과데이터의 정확도를 향상시키는 단계;를 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 방법.
(a) a step in which a microbial analysis device analyzes one or more of the examinee's blood, saliva, and urine to generate microbial analysis result data and transmit it to the server;
(b) The server receives the examination information written by the examiner through the client, stores the received examination information separately according to the personal information included in the examination information, and stores the microbial analysis result data received from step (a) above as the relevant examination information. matching and storing; and
(c) Representative microorganisms are selected through correlation analysis with the microbial analysis result data stored in step (b) above, and then compared with one or more groups of labeled and pre-stored microbial analysis result data to detect the most similar microbial analysis result data. A step of generating disease probability prediction data through representative microorganisms of the microbial analysis result data,
In step (c),
(c1) detecting one or more microorganisms through correlation analysis of the examination information of one or more examinees and microbial analysis result data stored in big data;
(c2) If the microorganism detected through step (c1) above is in the form of a continuous variable, Min-Max Normalization is performed, and if the microorganism is in the form of a categorical variable, One Hot Encoding is performed to detect representative microorganisms and categorize the values of representative microorganisms by performing One Hot Encoding. Classifying step; and
(c3) If there is a severe imbalance in the microbial analysis result data collected for each value of the representative microorganism classified through step (c2), data augmentation or resampling is performed to improve the accuracy of the microbial analysis result data. A method for predicting the likelihood of developing a latent pathogen, further comprising:
삭제delete 제5항에 있어서, 상기 (c)단계는,
(c4) 상기 (b)단계에 저장된 미생물분석결과데이터를 상기 (c3)단계를 통해 정확도가 향상된 미생물분석결과데이터와 매칭시켜 비선형 함수를 생성하는 단계; 및
(c5) 상기 (c4)단계를 통해 생성된 비선형함수를 통해 대표 미생물의 발병가능성예측데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 방법.
The method of claim 5, wherein step (c) is,
(c4) generating a non-linear function by matching the microbial analysis result data stored in step (b) with the microbial analysis result data with improved accuracy through step (c3); and
(c5) generating prediction data on the likelihood of occurrence of representative microorganisms using the non-linear function generated in step (c4).
제5항에 있어서,
(d) 상기 (c)단계를 통해 생성된 상기 발병가능성예측데이터 및 상기 검진자의 개인정보를 미리 설정한 공개키를 통해 암호화하여 암호화데이터를 생성하고 생성된 암호화데이터를 블록체인 네트워크 상에 전파하는 단계;를 더 포함하는 것을 특징으로 하는 잠복병원체의 발병가능성을 예측하는 방법.
According to clause 5,
(d) Encrypting the disease probability prediction data and the personal information of the examinee generated through step (c) using a preset public key to generate encrypted data and disseminating the generated encrypted data on the blockchain network. A method for predicting the likelihood of developing a latent pathogen, further comprising:
KR1020210092919A 2021-07-15 2021-07-15 SYstem and method for predicting the possibility of disease pathogen incubation KR102590308B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210092919A KR102590308B1 (en) 2021-07-15 2021-07-15 SYstem and method for predicting the possibility of disease pathogen incubation

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210092919A KR102590308B1 (en) 2021-07-15 2021-07-15 SYstem and method for predicting the possibility of disease pathogen incubation

Publications (2)

Publication Number Publication Date
KR20230013665A KR20230013665A (en) 2023-01-27
KR102590308B1 true KR102590308B1 (en) 2023-10-18

Family

ID=85101824

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210092919A KR102590308B1 (en) 2021-07-15 2021-07-15 SYstem and method for predicting the possibility of disease pathogen incubation

Country Status (1)

Country Link
KR (1) KR102590308B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102030800B1 (en) * 2019-03-21 2019-10-10 주식회사 마크로젠 Bio data providing method, bio data encryption method and apparatus for processing bio data
KR102179850B1 (en) * 2019-12-06 2020-11-17 주식회사 클리노믹스 System and method for predicting health using analysis device for intraoral microbes (bacteria, virus, viroid, and/or fungi)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102367564B1 (en) * 2019-11-01 2022-02-28 주식회사 피씨티 Method and system for predicting colon cancer related information based on lifestyle information

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102030800B1 (en) * 2019-03-21 2019-10-10 주식회사 마크로젠 Bio data providing method, bio data encryption method and apparatus for processing bio data
KR102179850B1 (en) * 2019-12-06 2020-11-17 주식회사 클리노믹스 System and method for predicting health using analysis device for intraoral microbes (bacteria, virus, viroid, and/or fungi)

Also Published As

Publication number Publication date
KR20230013665A (en) 2023-01-27

Similar Documents

Publication Publication Date Title
Sperling et al. Comparison of bacterial 16S rRNA variable regions for microbiome surveys of ticks
Ali et al. Spike2vec: An efficient and scalable embedding approach for covid-19 spike sequences
Gonzalez-Dias et al. Methods for predicting vaccine immunogenicity and reactogenicity
Bzhalava et al. Machine Learning for detection of viral sequences in human metagenomic datasets
Leo et al. Machine learning model for imbalanced cholera dataset in Tanzania
CN102007407A (en) Genome identification system
US20130325771A1 (en) New classification method for spectral data
Villani et al. A machine learning approach to identify NIH-funded applied prevention research
Rawat et al. A study on cervical cancer prediction using various machine learning approaches
Zhu et al. OGUs enable effective, phylogeny-aware analysis of even shallow metagenome community structures
Gao et al. Early indicators of human activity during COVID-19 period using digital trace data of population activities
Chaudhuri et al. A dataset centric feature selection and stacked model to detect breast cancer
Linthorst et al. The cell‐free DNA virome of 108,349 Dutch pregnant women
KR102590308B1 (en) SYstem and method for predicting the possibility of disease pathogen incubation
Gregory DiRienzo et al. Non‐parametric methods to predict HIV drug susceptibility phenotype from genotype
Sun et al. Removal of false positives in metagenomics-based taxonomy profiling via targeting Type IIB restriction sites
Sintchenko et al. Laboratory-guided detection of disease outbreaks: three generations of surveillance systems
CN109415755B (en) Flow cytometry data processing for antimicrobial susceptibility prediction
Jafarzadeh et al. Bayesian estimation of the receiver operating characteristic curve for a diagnostic test with a limit of detection in the absence of a gold standard
CN109477129B (en) Flow cytometry data processing for antimicrobial susceptibility prediction
Barker et al. Rapid identification of stable clusters in bacterial populations using the adjusted Wallace coefficient
Moitas et al. Forensic microbiology and geographical location: a systematic review
Rufino et al. Consistent comparison of symptom-based methods for COVID-19 infection detection
Sun et al. Eliminate false positives in metagenomic profiling based on type IIB restriction sites
Millard et al. Maximizing statistical power to detect clinically associated cell states with scPOST

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant