KR102583585B1 - Method and system of predicting infectious diseases using big data and artificial intelligence - Google Patents

Method and system of predicting infectious diseases using big data and artificial intelligence Download PDF

Info

Publication number
KR102583585B1
KR102583585B1 KR1020210102578A KR20210102578A KR102583585B1 KR 102583585 B1 KR102583585 B1 KR 102583585B1 KR 1020210102578 A KR1020210102578 A KR 1020210102578A KR 20210102578 A KR20210102578 A KR 20210102578A KR 102583585 B1 KR102583585 B1 KR 102583585B1
Authority
KR
South Korea
Prior art keywords
infectious disease
seir
variable
input variable
predicting
Prior art date
Application number
KR1020210102578A
Other languages
Korean (ko)
Other versions
KR20230020779A (en
Inventor
박재현
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020210102578A priority Critical patent/KR102583585B1/en
Publication of KR20230020779A publication Critical patent/KR20230020779A/en
Application granted granted Critical
Publication of KR102583585B1 publication Critical patent/KR102583585B1/en

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/22Social work or social welfare, e.g. community support activities or counselling services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Pathology (AREA)
  • Development Economics (AREA)
  • Epidemiology (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Child & Adolescent Psychology (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 명세서의 일실시 예에 따른 감염병 예측 시스템을 이용하여 감염병을 예측하는 방법은 디지털 지도 상에 일정 크기의 격자를 복수 개로 생성하는 단계; 생성된 상기 격자를 기반으로, 상기 격자 내에서 무선통신망을 통해 수집되는 유동 인구와 관련된 제1 입력변수, 교통 정보망을 통해 수집되는 대중 교통과 관련된 제2 입력변수, 공공정보망을 통해 수집되는 공공정보와 관련된 제3 입력변수를 산출하는 단계; 질병감시정보 모듈로부터 제공되는 복수의 감염병 변수를 산출하는 단계; 상기 제1 입력변수, 상기 제2 입력변수, 상기 제3 입력변수 및 상기 복수의 감염병 변수로부터 특징값을 추출하고, 추출된 상기 특징값을 미리 학습된 딥러닝 모델에 입력하는 단계; 및 상기 딥러닝 모델의 출력에 기반하여 상기 디지털 지도 상에서 감염병에 대한 감염병 정보를 예측하는 단계;를 포함한다.A method of predicting an infectious disease using an infectious disease prediction system according to an embodiment of the present specification includes generating a plurality of grids of a certain size on a digital map; Based on the generated grid, a first input variable related to the floating population collected through a wireless communication network within the grid, a second input variable related to public transportation collected through a traffic information network, public information collected through a public information network, and calculating a related third input variable; Calculating a plurality of infectious disease variables provided from a disease surveillance information module; Extracting feature values from the first input variable, the second input variable, the third input variable, and the plurality of infectious disease variables, and inputting the extracted feature values into a pre-trained deep learning model; and predicting infectious disease information about infectious diseases on the digital map based on the output of the deep learning model.

Description

빅데이터와 인공지능을 이용한 감염병 예측 방법 및 시스템{METHOD AND SYSTEM OF PREDICTING INFECTIOUS DISEASES USING BIG DATA AND ARTIFICIAL INTELLIGENCE}Infectious disease prediction method and system using big data and artificial intelligence {METHOD AND SYSTEM OF PREDICTING INFECTIOUS DISEASES USING BIG DATA AND ARTIFICIAL INTELLIGENCE}

본 명세서는 빅데이터와 인공지능을 이용한 감염병 예측 방법 및 시스템에 관한 것으로, 더욱 상세하게는 실시간 무선 및 공공 통신망에서 수집되는 다양한 정보를 활용하여 인공지능과 수학적 모델링을 통해 행정구역별 감염병 발생, 사망, 입원 및 증감을 예측함으로써 감염병 방역을 지원할 수 있는 감염병 예측 방법 및 시스템에 관한 것이다.This specification relates to a method and system for predicting infectious diseases using big data and artificial intelligence. More specifically, the occurrence and death of infectious diseases by administrative district is based on artificial intelligence and mathematical modeling using various information collected from real-time wireless and public communication networks. , relates to an infectious disease prediction method and system that can support infectious disease quarantine by predicting hospitalization and increase/decrease.

감염병은 인류의 건강과 관련된 가장 중요한 문제 중 하나이며, 인류는 다양한 감염병들(예: 콜레라(cholera), 결핵(tuberculosis), 홍역(measles) 코로나 19등)을 치료 및 예방하기 위해서 많은 노력을 하고 있다. 감염병에 대처하기 위해서는 감염병의 유행을 예방하기 위한 사전조치를 취하고, 유행 발생시 유행을 종식시키기 위한 조치를 취할 수 있는 시스템이 필요하다. 이를 위한 일반적인 감염병 분석 및 예방 시스템은 감염병의 과거 유행 시기 및 지역을 파악하고, 이를 시각적으로 확인할 수 있도록 지원한다. Infectious diseases are one of the most important problems related to human health, and humanity is making great efforts to treat and prevent various infectious diseases (e.g. cholera, tuberculosis, measles, COVID-19, etc.) there is. In order to deal with infectious diseases, a system is needed that can take preliminary measures to prevent the spread of infectious diseases and take measures to end the epidemic when it occurs. For this purpose, a general infectious disease analysis and prevention system identifies the past epidemic periods and regions of infectious diseases and supports visual confirmation.

상기 내용을 기술적으로 상세히 서술하면, 일반적인 감염병 분석 및 예방 시스템은 감염병의 단순 과거의 발생 현상을 지도 상에만 나타내어 시각적으로 파악할 수 있도록 지원할 뿐이다.To describe the above in technical detail, a general infectious disease analysis and prevention system only supports the simple past occurrence of infectious diseases by showing them on a map so that they can be visually identified.

[등록특허 10-1976189], (발명의 명칭: 유동 인구의 분석 서비스 제공 방법)[Registered Patent 10-1976189], (Title of invention: Method for providing analysis service of floating population)

본 명세서는 상기와 같은 문제점을 해결하기 위해 산출된 것으로, 실시간 무선통신망에서 수집되는 유동인구 정보 및 버스/지하철 도로 교통량 정보, 일별 항공편수 정보, 감염병 역학정보, 기상정보, 날짜정보, 경제지표, 인구 및 인구이동 정보를 활용하여 인공지능과 수학적 모델링을 통해 행정구역별 감염병 발생, 사망, 입원 및 증감을 예측함으로써 감염병 방역을 지원할 수 있는 감염병 예측 시스템을 이용하여 감염병을 예측하는 방법을 제공하는데 그 목적이 있다.This specification has been calculated to solve the above problems, and includes floating population information collected from a real-time wireless communication network, bus/subway road traffic information, daily flight number information, infectious disease epidemiology information, weather information, date information, economic indicators, It provides a method of predicting infectious diseases using an infectious disease prediction system that can support infectious disease quarantine by predicting the occurrence, death, hospitalization, and increase/decrease of infectious diseases by administrative district through artificial intelligence and mathematical modeling using population and population movement information. There is a purpose.

본 명세서에서 이루고자 하는 기술적 목적들은 이상에서 언급한 사항들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 이하 설명할 본 명세서의 실시예들로부터 본 명세서가 속하는 기술분야에서 통상의 지식을 가진 자에 의해 고려될 수 있다.The technical objectives to be achieved in this specification are not limited to the matters mentioned above, and other technical tasks not mentioned can be solved by those skilled in the art from the embodiments of this specification described below. can be considered.

이하에서는 본 명세서의 실시예들로서 빅데이터와 인공지능을 이용한 감염병 예측 방법 및 시스템에 대해서 설명한다.Hereinafter, an infectious disease prediction method and system using big data and artificial intelligence will be described as embodiments of the present specification.

본 명세서의 일실시예에 따른 감염병 예측 방법은 디지털 지도 상에 일정 크기의 격자를 복수 개로 생성하는 단계; 생성된 상기 격자를 기반으로, 상기 격자 내에서 무선통신망을 통해 수집되는 유동 인구와 관련된 제1 입력변수, 교통 정보망을 통해 수집되는 대중 교통과 관련된 제2 입력변수, 공공정보망을 통해 수집되는 공공정보와 관련된 제3 입력변수를 산출하는 단계; 질병감시정보 모듈로부터 제공되는 복수의 감염병 변수를 산출하는 단계; 상기 제1 입력변수, 상기 제2 입력변수, 상기 제3 입력변수 및 상기 복수의 감염병 변수로부터 특징값을 추출하고, 추출된 상기 특징값을 딥러닝 모델에 입력하는 단계; 및 상기 딥러닝 모델의 출력에 기반하여 상기 디지털 지도 상에서 감염병에 대한 감염병 정보를 예측하는 단계;를 포함한다.An infectious disease prediction method according to an embodiment of the present specification includes generating a plurality of grids of a certain size on a digital map; Based on the generated grid, a first input variable related to the floating population collected through a wireless communication network within the grid, a second input variable related to public transportation collected through a traffic information network, public information collected through a public information network, and calculating a related third input variable; Calculating a plurality of infectious disease variables provided from a disease surveillance information module; Extracting feature values from the first input variable, the second input variable, the third input variable, and the plurality of infectious disease variables, and inputting the extracted feature values into a deep learning model; and predicting infectious disease information about infectious diseases on the digital map based on the output of the deep learning model.

또한, 상기 딥러닝 모델은, 추출된 상기 특징값에 기초하여 지도 학습되며, 이를 통해 감염병 예측 모형을 구축하고, 주기적으로 업데이트하는 것을 포함할 수 있다.In addition, the deep learning model is supervised based on the extracted feature values, and may include constructing an infectious disease prediction model through this and periodically updating it.

또한, 상기 감염병 정보를 예측하는 단계는, 상기 딥러닝 모델을 통해 출력된 변수 값을 예측하여 N일을 산출하고, 산출된 N일을 기반으로 특정 일자의 변수 값을 예측하는 것을 포함할 수 있다.In addition, the step of predicting the infectious disease information may include calculating N days by predicting variable values output through the deep learning model, and predicting variable values for a specific date based on the calculated N days. .

또한, 상기 딥러닝 모델은 수학적 모델링인 SI, SIS, SIR, SIRS, SEIR, SEIRS 등을 포함하고, 상기 감염병 정보를 예측하는 단계는, 상기 SEIR를 통해 특정 일자의 SEIR 변수 값을 예측하는 경우, 상기 특정 일자의 이전 N일의 이전 일자 그리고 상기 특정 일자의 이전 N일의 다음 일자의 각 SEIR 변수 값의 평균 증가율을 상기 특정 일자 이전 날짜의 상기 SEIR 변수 값에 곱하여 상기 특정 일자의 SEIR의 변수 값을 예측하는 것을 포함할 수 있다.In addition, the deep learning model includes mathematical modeling SI, SIS, SIR, SIRS, SEIR, SEIRS, etc., and the step of predicting the infectious disease information involves predicting the SEIR variable value of a specific date through the SEIR, The SEIR variable value on the specific date is calculated by multiplying the SEIR variable value on the date before the specific date by the average increase rate of the value of each SEIR variable on the previous N days prior to the specific date and the date following the N days prior to the specific date. It may include predicting.

또한, 상기 미리 학습된 딥러닝 모델은, 상기 감염병 예측 모형을 구축시 감염병 전파위험도 및 그 증감률과 감염병 발생, 사망 및 그 증감률 사이에 일정 시간의 lag time을 설정하는 것을 포함할 수 있다.In addition, the pre-trained deep learning model may include setting a certain lag time between the infectious disease transmission risk and its increase/decrease rate and infectious disease occurrence, death, and its increase/decrease rate when constructing the infectious disease prediction model.

본 발명의 다른 일실시예는, 감염병 예측 시스템에 있어서, 무선통신망, 교통정보망, 공공정보망 중 적어도 하나에 기초하여 데이터를 송수신하는 통신 모듈; 감염병 정보를 저장하는 질병감시정보 모듈; 및 디지털 지도 상에 일정 크기의 격자를 복수 개로 생성하고, 생성된 상기 격자를 기반으로, 상기 격자 내에서 상기 무선통신망을 통해 수집되는 유동 인구와 관련된 제1 입력변수, 상기 교통 정보망을 통해 수집되는 대중 교통과 관련된 제2 입력변수, 상기 공공정보망을 통해 수집되는 공공정보와 관련된 제3 입력변수를 산출하고, 상기 질병감시정보 모듈로부터 제공되는 감염병 정보에 기초하여 복수의 감염병 변수를 산출하고, 상기 제1 입력변수, 상기 제2 입력변수, 상기 제3 입력변수 및 상기 복수의 감염병 변수로부터 특징값을 추출하고, 추출된 상기 특징값을 딥러닝 모델에 입력하고, 상기 딥러닝 모델의 출력에 기반하여 상기 디지털 지도 상에서 감염병에 대한 감염병 정보를 예측하는 프로세서를 포함하는 감염병을 예측하는 시스템을 제공한다.Another embodiment of the present invention provides an infectious disease prediction system, comprising: a communication module for transmitting and receiving data based on at least one of a wireless communication network, a traffic information network, and a public information network; A disease surveillance information module that stores infectious disease information; and generating a plurality of grids of a certain size on a digital map, and based on the generated grids, a first input variable related to the floating population collected through the wireless communication network within the grid, collected through the traffic information network. Calculate a second input variable related to public transportation, a third input variable related to public information collected through the public information network, calculate a plurality of infectious disease variables based on infectious disease information provided from the disease surveillance information module, and calculate the first input variable. 1 Extract feature values from the input variable, the second input variable, the third input variable, and the plurality of infectious disease variables, input the extracted feature values into a deep learning model, and based on the output of the deep learning model A system for predicting infectious diseases is provided, including a processor that predicts infectious disease information about infectious diseases on the digital map.

또한, 상기 딥러닝 모델은, 추출된 상기 특징값에 기초하여 지도 학습되며, 이를 통해 감염병 예측 모형을 구축하고, 주기적으로 업데이트하는 것을 특징으로 한다.In addition, the deep learning model is supervised based on the extracted feature values, and through this, an infectious disease prediction model is built and periodically updated.

또한, 상기 프로세서는, 상기 딥러닝 모델을 통해 출력된 변수 값을 예측하여 N일을 산출하고, 산출된 N일을 기반으로 특정 일자의 변수 값을 예측하는 것을 특징으로 한다.In addition, the processor predicts variable values output through the deep learning model to calculate N days, and predicts variable values for a specific date based on the calculated N days.

또한, 상기 딥러닝 모델은, 수학적 모델링인 SI, SIS, SIR, SIRS, SEIR, SEIRS 등을 포함하고, 상기 프로세서는,상기 SEIR를 통해 특정 일자의 SEIR 변수 값을 예측하는 경우, 상기 특정 일자의 이전 N일의 이전 일자 그리고 상기 특정 일자의 이전 N일의 다음 일자의 각 SEIR 변수 값의 평균 증가율을 상기 특정 일자 이전 날짜의 상기 SEIR 변수 값에 곱하여 상기 특정 일자의 SEIR의 변수 값을 예측하는 것을 특징으로 한다.In addition, the deep learning model includes mathematical modeling SI, SIS, SIR, SIRS, SEIR, SEIRS, etc., and when predicting the SEIR variable value of a specific date through the SEIR, the processor predicts the SEIR variable value of the specific date. Predicting the variable value of SEIR on the specific date by multiplying the average growth rate of the value of each SEIR variable on the previous N days previous and the next N days prior to the specific date by the SEIR variable value on the date prior to the specific date. It is characterized by

또한, 상기 딥러닝 모델은, 상기 감염병 예측 모형을 구축시 염병 전파위험도 및 그 증감률과 감염병 발생, 사망 및 그 증감률 사이에 일정 시간의 lag time을 설정하는 것을 특징으로 한다.In addition, the deep learning model is characterized by setting a certain lag time between the risk of infectious disease transmission and its increase/decrease rate and the occurrence of infectious disease, death, and its increase/decrease rate when constructing the infectious disease prediction model.

상술한 본 명세서의 양태들은 본 명세서의 바람직한 실시예들 중 일부에 불과하며, 본 명세서의 기술적 특징들이 반영된 다양한 실시예들이 당해 기술분야의 통상적인 지식을 가진 자에 의해 이하 상술할 본 명세서의 상세한 설명을 기반으로 도출되고 이해될 수 있다.The aspects of the present specification described above are only some of the preferred embodiments of the present specification, and various embodiments reflecting the technical features of the present specification can be understood by those skilled in the art. It can be derived and understood based on the explanation.

본 명세서의 실시예들에 따르면 다음과 같은 효과를 얻을 수 있다. According to the embodiments of the present specification, the following effects can be achieved.

본 명세서의 실시 예에 따른 감염병 예측 시스템은 무선통신사에서 실시간으로 수집되는 유동인구 정보 및 버스, 지하철, 도로교통, 항공편 인구유동 정보를 활용하여 사회적 거리두기 지표를 산출하여 예측모형에 활용함으로써 사회적 거리두기가 전파에 중요한 역할을 하는 코로나 19와 같은 신종감염병 발생, 사망, 입원자수 증감 예측에 정확도를 향상시킬 수 있다.The infectious disease prediction system according to the embodiment of this specification calculates a social distancing index using floating population information collected in real time from wireless carriers and population movement information on buses, subways, road traffic, and flights, and uses it in a prediction model to determine social distancing. Accuracy can be improved in predicting the increase or decrease in the number of new infectious diseases, deaths, and hospitalizations, such as COVID-19, which plays an important role in the spread of the virus.

본 명세서의 실시예들에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 이하의 본 명세서의 실시예들에 대한 기재로부터 본 명세서가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 도출되고 이해될 수 있다. 즉, 본 명세서를 실시함에 따른 의도하지 않은 효과들 역시 본 명세서의 실시예들로부터 당해 기술분야의 통상의 지식을 가진 자에 의해 도출될 수 있다.The effects that can be obtained from the embodiments of the present specification are not limited to the effects mentioned above, and other effects not mentioned are commonly known in the technical field to which the present specification pertains from the description of the embodiments of the present specification below. It can be clearly derived and understood by those with knowledge. That is, unintended effects resulting from implementing the present specification may also be derived from the embodiments of the present specification by those skilled in the art.

본 명세서에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되고, 첨부된 도면들은 본 명세서에 대한 다양한 실시예들을 제공한다. 또한, 첨부된 도면들은 상세한 설명과 함께 본 명세서의 실시 형태들을 설명하기 위해 사용된다.
도 1은 본 명세서가 적용될 수 있는 학습데이터를 획득하기 위한 시스템의 구성을 예시한다.
도 2는 본 명세서가 적용될 수 있는 감염병 예측 시스템을 설명하기 위한 도이다.
도 3은 본 명세서의 일실시 예에 따라 제1 입력변수를 수집하는 방법을 설명하기 위한 도이다.
도 4 내지 도 7은 본 명세서의 일실시 예에 따라 제2 입력변수를 수집하는 방법을 설명하기 위한 도이다.
도 8 내지 도 16은 본 명세서의 실시 예에 따라 딥러닝 모델을 이용하여 특정 일자의 예측 변수값 산출 방법을 설명하기 위한 도이다.
BRIEF DESCRIPTION OF THE DRAWINGS To facilitate understanding of the present specification, the accompanying drawings are included as part of the detailed description and provide various embodiments of the present specification. Additionally, the accompanying drawings, together with the detailed description, are used to describe embodiments of the present specification.
Figure 1 illustrates the configuration of a system for acquiring learning data to which this specification can be applied.
Figure 2 is a diagram for explaining an infectious disease prediction system to which this specification can be applied.
Figure 3 is a diagram for explaining a method of collecting a first input variable according to an embodiment of the present specification.
4 to 7 are diagrams for explaining a method of collecting second input variables according to an embodiment of the present specification.
Figures 8 to 16 are diagrams for explaining a method of calculating predictor values for a specific date using a deep learning model according to an embodiment of the present specification.

이하에서는 본 명세서의 실시예들로서 감염병 예측 시스템을 이용하여 감염병을 예측하는 방법에 대해서 설명한다.Hereinafter, a method for predicting an infectious disease using an infectious disease prediction system will be described as embodiments of the present specification.

이하의 실시예들은 본 명세서의 구성요소들과 특징들을 소정 형태로 결합한 것들이다. 각 구성요소 또는 특징은 별도의 명시적 언급이 없는 한 선택적인 것으로 고려될 수 있다. 각 구성요소 또는 특징은 다른 구성요소나 특징과 결합되지 않은 형태로 실시될 수 있다. 또한, 일부 구성요소들 및/또는 특징들을 결합하여 본 명세서의 실시예를 구성할 수도 있다. 본 명세서의 실시예들에서 설명되는 동작들의 순서는 변경될 수 있다. 어느 실시예의 일부 구성이나 특징은 다른 실시예에 포함될 수 있고, 또는 다른 실시예의 대응하는 구성 또는 특징과 교체될 수 있다.The following embodiments combine the elements and features of this specification in a predetermined form. Each component or feature may be considered optional unless explicitly stated otherwise. Each component or feature may be implemented in a form that is not combined with other components or features. Additionally, some components and/or features may be combined to configure embodiments of the present specification. The order of operations described in the embodiments of this specification may be changed. Some features or features of one embodiment may be included in other embodiments or may be replaced with corresponding features or features of other embodiments.

도면에 대한 설명에서, 본 명세서의 요지를 흐릴 수 있는 부분, 장치 및/또는 구성 등은 기술하지 않았으며, 당업자의 수준에서 이해할 수 있을 정도의 부분, 장치 및/또는 구성 또한 기술하지 아니하였다. 또한, 도면에서 동일한 도면 부호를 사용하여 지칭하는 부분은 장치 구성 또는 방법에서 동일한 구성 요소 또는 단계를 의미한다.In the description of the drawings, parts, devices, and/or configurations that may obscure the gist of the present specification are not described, and parts, devices, and/or configurations that can be understood at a level by those skilled in the art are not described. Additionally, parts referred to using the same reference numerals in the drawings refer to the same components or steps in the device configuration or method.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "~부" 또는 ~기" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미한다. 또한, "일(a 또는 an)", "하나(one)", "그(the)" 및 유사 관련어는 본 발명을 기술하는 문맥에 있어서(특히, 이하의 청구항의 문맥에서) 본 명세서에 달리 지시되거나 문맥에 의해 분명하게 반박되지 않는 한, 단수 및 복수 모두를 포함하는 의미로 사용될 수 있다.Throughout the specification, when a part is said to “comprise or include” a certain element, this means that it does not exclude other elements but may further include other elements, unless specifically stated to the contrary. do. In addition, terms such as "~unit" or "~gi" used in the specification mean a unit that processes at least one function or operation. Also, "a or an", "one", " "The" and similar related terms include both the singular and the plural in the context of describing the invention (especially in the context of the claims below), unless otherwise indicated herein or clearly contradicted by context. It can be used with meaning.

또한, 본 명세서의 실시예들에서 사용되는 특정(特定) 용어들 및/또는 기호들은 본 명세서의 이해를 돕기 위해서 제공된 것이며, 이러한 특정 용어의 사용은 본 명세서의 기술적 사상을 벗어나지 않는 범위에서 다른 형태로 변경될 수 있다.In addition, specific terms and/or symbols used in the embodiments of the present specification are provided to aid understanding of the present specification, and the use of such specific terms may be used in other forms without departing from the technical spirit of the present specification. It can be changed to .

도 1은 본 명세서가 적용될 수 있는 학습데이터를 획득하기 위한 시스템의 구성을 예시한다.Figure 1 illustrates the configuration of a system for acquiring learning data to which this specification can be applied.

본 명세서는 감염병 역학정보, 기상정보, 날짜정보, 경제지표, 인구 및 인구이동 정보는 물론 실시간 무선통신망에서 수집되는 유동인구 정보, 버스, 지하철, 도로교통량 정보, 일별 항공편수 정보를 통해 산출된 유동인구를 반영한 사회적 거리두기 지표를 활용하고 인공지능을 이용한 학습모형을 통해 행정구역별로 감염병 발생, 사망, 입원자수 발생 확률을 예측함으로써 사회적 거리두기가 중요한 코로나19와 같은 신종감염병에 대한 방역을 하는데 도움을 줄 수 있다.This specification includes infectious disease epidemiological information, weather information, date information, economic indicators, population and population movement information, as well as floating population information collected from real-time wireless communication networks, bus, subway, and road traffic information, and daily flight number information. It helps prevent new infectious diseases such as COVID-19, where social distancing is important, by using social distancing indicators that reflect the population and predicting the probability of infectious disease occurrence, death, and hospitalization by administrative district through a learning model using artificial intelligence. can be given.

도 1을 살펴보면, 이러한 AI 모델의 학습데이터를 획득하기 위한 시스템의 구성을 예시한다. 도 1을 살펴보면, 감염 시스템(100)은 프로세서(110), 메모리(130), 통신 모듈(150)을 포함할 수 있다.Looking at Figure 1, the configuration of a system for acquiring training data for such an AI model is illustrated. Referring to FIG. 1 , the infection system 100 may include a processor 110, a memory 130, and a communication module 150.

프로세서(110)는 하나 이상의 어플리케이션 프로세서(application processor, AP), 하나 이상의 커뮤니케이션 프로세서(communication processor, CP) 또는 적어도 하나 이상의 AI 프로세서(artificial intelligence processor)를 포함할 수 있다. 어플리케이션 프로세서, 커뮤니케이션 프로세서 또는 AI 프로세서는 서로 다른 IC(integrated circuit) 패키지들 내에 각각 포함되거나 하나의 IC 패키지 내에 포함될 수 있다.The processor 110 may include one or more application processors (AP), one or more communication processors (CP), or at least one artificial intelligence processor (AI processor). The application processor, communication processor, or AI processor may each be included in different integrated circuit (IC) packages or may be included in one IC package.

어플리케이션 프로세서는 운영체제 또는 응용 프로그램을 구동하여 어플리케이션 프로세서에 연결된 다수의 하드웨어 또는 소프트웨어 구성요소들을 제어하고, 멀티미디어 데이터를 포함한 각종 데이터 처리/연산을 수행할 수 있다. 일 예로, 어플리케이션 프로세서는 SoC(system on chip)로 구현될 수 있다. 프로세서(110)는 GPU(graphic prcessing unit)를 더 포함할 수 있다.The application processor runs an operating system or application program, controls multiple hardware or software components connected to the application processor, and can perform various data processing/computations, including multimedia data. As an example, an application processor may be implemented as a system on chip (SoC). The processor 110 may further include a graphics processing unit (GPU).

커뮤니케이션 프로세서는 네트워크로 연결된 무선통신망, 교통정보망, 공공정보망, 질병감시정보 모듈 그리고 예측기반 서비스 모듈과의 통신에서 데이터 링크를 관리하고 통신 프로토콜을 변환하는 기능을 수행할 수 있다. 일 예로, 커뮤니케이션 프로세서는 SoC로 구현될 수 있다. 커뮤니케이션 프로세서는 멀티미디어 제어 기능의 적어도 일부를 수행할 수 있다.The communication processor can perform the function of managing data links and converting communication protocols in communication with networked wireless communication networks, traffic information networks, public information networks, disease surveillance information modules, and prediction-based service modules. As an example, a communication processor may be implemented as a SoC. The communications processor may perform at least some of the multimedia control functions.

또한, 커뮤니케이션 프로세서는 통신 모듈(150)의 데이터 송수신을 제어할 수 있다. 커뮤니케이션 프로세서는 어플리케이션 프로세서의 적어도 일부로 포함되도록 구현될 수도 있다. 예를 들어, 데이터는 유동 인구와 관련된 제1 입력변수, 대중 교통과 관련된 제2 입력변수, 공공정보와 관련된 제3 입력변수, 복수의 감염병 변수 및 예측된 감염병 데이터(또는 정보)를 포함할 수 있다.Additionally, the communication processor may control data transmission and reception of the communication module 150. The communication processor may be implemented to be included as at least part of the application processor. For example, the data may include a first input variable related to floating population, a second input variable related to public transportation, a third input variable related to public information, a plurality of infectious disease variables, and predicted infectious disease data (or information). .

어플리케이션 프로세서 또는 커뮤니케이션 프로세서는 각각에 연결된 비휘발성 메모리 또는 다른 구성요소 중 적어도 하나로부터 수신한 명령 또는 데이터를 휘발성 메모리에 로드(load)하여 처리할 수 있다. 또한, 어플리케이션 프로세서 또는 커뮤니케이션 프로세서는 다른 구성요소 중 적어도 하나로부터 수신하거나 다른 구성요소 중 적어도 하나에 의해 생성된 데이터를 비휘발성 메모리에 저장할 수 있다.The application processor or communication processor may load and process commands or data received from at least one of the non-volatile memory or other components connected to the volatile memory. Additionally, the application processor or communication processor may store data received from or generated by at least one of the other components in a non-volatile memory.

메모리(130)는 내장 메모리 또는 외장 메모리를 포함할 수 있다. 내장 메모리는 휘발성 메모리(예를 들면, DRAM(dynamic RAM), SRAM(static RAM), SDRAM(synchronous dynamic RAM) 등) 또는 비휘발성 메모리 비휘발성 메모리(예를 들면, OTPROM(one time programmable ROM), PROM(programmable ROM), EPROM(erasable and programmable ROM), EEPROM(electrically erasable and programmable ROM), mask ROM, flash ROM, NAND flash memory, NOR flash memory 등) 중 적어도 하나를 포함할 수 있다. 일례에 따르면, 내장 메모리는 SSD(solid state drive)의 형태를 취할 수도 있다. 외장 메모리는 플래시 드라이브(flash drive), 예를 들면, CF(compact flash), SD(secure digital), Micro-SD(micro secure digital), Mini-SD(mini secure digital), xD(extreme digital) 또는 메모리 스틱(memory stick) 등을 포함할 수 있다.Memory 130 may include internal memory or external memory. Built-in memory may be volatile memory (e.g., dynamic RAM (DRAM), static RAM (SRAM), synchronous dynamic RAM (SDRAM), etc.) or non-volatile memory (e.g., one time programmable ROM (OTPROM), It may include at least one of programmable ROM (PROM), erasable and programmable ROM (EPROM), electrically erasable and programmable ROM (EEPROM), mask ROM, flash ROM, NAND flash memory, NOR flash memory, etc.). According to one example, the internal memory may take the form of a solid state drive (SSD). External memory may be a flash drive, such as compact flash (CF), secure digital (SD), micro secure digital (Micro-SD), mini secure digital (Mini-SD), extreme digital (xD), or It may include a memory stick, etc.

통신 모듈(150)은 무선 통신 모듈 또는 RF 모듈를 포함할 수 있다. 무선 통신 모듈은, 예를 들면, Wi-Fi, BT, GPS 또는 NFC를 포함할 수 있다. 예를 들면, 무선 통신 모듈은 무선 주파수를 이용하여 무선 통신 기능을 제공할 수 있다. 추가적으로 또는 대체적으로, 무선 통신 모듈은 무선통신망(210), 교통정보망(230), 공공정보망(250), 질병감시정보 모듈(270) 그리고 예측기반 서비스 모듈(290, 도 2 참조)을 네트워크(예: Internet, LAN, WAN, telecommunication network, cellular network, satellite network, POTS 또는 5G network 등)와 연결시키기 위한 네트워크 인터페이스 또는 모뎀 등을 포함할 수 있다.The communication module 150 may include a wireless communication module or an RF module. The wireless communication module may include, for example, Wi-Fi, BT, GPS or NFC. For example, a wireless communication module may provide a wireless communication function using radio frequencies. Additionally or alternatively, the wireless communication module includes a wireless communication network 210, a traffic information network 230, a public information network 250, a disease surveillance information module 270, and a prediction-based service module 290 (see FIG. 2) over a network (e.g. : May include a network interface or modem for connection to (Internet, LAN, WAN, telecommunication network, cellular network, satellite network, POTS or 5G network, etc.).

RF 모듈은 데이터의 송수신, 예를 들면, RF 신호 또는 호출된 전자 신호의 송수신을 담당할 수 있다. 일 예로, RF 모듈은 트랜시버(transceiver), PAM(power amp module), 주파수 필터(frequency filter) 또는 LNA(low noise amplifier) 등을 포함할 수 있다. 또한, RF 모듈은 무선 통신에서 자유공간상의 전자파를 송수신하기 위한 부품, 예를 들면, 도체 또는 도선 등을 포함할 수 있다.The RF module may be responsible for transmitting and receiving data, for example, RF signals or called electronic signals. As an example, the RF module may include a transceiver, a power amp module (PAM), a frequency filter, or a low noise amplifier (LNA). Additionally, the RF module may include components for transmitting and receiving electromagnetic waves in free space in wireless communication, for example, conductors or wires.

프로세서(110)는 AI 프로세서(111), 데이터 학습부(111a), 데이터 전처리부(111b), 데이터 선택부(111c), 모델 평가부(111d) 및 예측 모듈(115) 등을 포함할 수 있다.The processor 110 may include an AI processor 111, a data learning unit 111a, a data pre-processing unit 111b, a data selection unit 111c, a model evaluation unit 111d, and a prediction module 115. .

AI 프로세서(111)는 메모리(330)에 저장된 프로그램을 이용하여 신경망을 학습할 수 있다. 특히, AI 프로세서(111)는 무선통신망, 교통정보망, 공공정보망, 질병감시정보 모듈로부터 입력된 제1 입력변수, 제2 입력변수, 제3 입력변수 및 감염병 변수를 이용하여 감염병의 예측을 해독하기 위한 신경망을 학습할 수 있다. 여기서, 신경망은 인간의 뇌 구조(예를 들어, 인간의 신경망의 뉴런 구조)를 컴퓨터 상에서 모의하도록 설계될 수 있다. 신경망은 입력층(input layer), 출력층(output layer) 및 적어도 하나의 은닉층(hidden layer)를 포함할 수 있다. 각 층은 가중치를 갖는 적어도 하나의 뉴런을 포함하고, 신경망은 뉴런과 뉴런을 연결하는 시냅스(synapse)를 포함할 수 있다. 신경망에서 각 뉴런은 시냅스를 통해 입력되는 입력 신호를 가중치(weight) 및/또는 편향(bias)에 대한 활성함수(activation function)의 함수값으로 출력할 수 있다.The AI processor 111 can learn a neural network using a program stored in the memory 330. In particular, the AI processor 111 decodes the prediction of infectious diseases using the first input variable, second input variable, third input variable, and infectious disease variable input from the wireless communication network, traffic information network, public information network, and disease surveillance information module. You can learn a neural network for Here, the neural network may be designed to simulate human brain structure (eg, neuron structure of a human neural network) on a computer. A neural network may include an input layer, an output layer, and at least one hidden layer. Each layer includes at least one neuron with a weight, and the neural network may include synapses connecting neurons. In a neural network, each neuron can output an input signal input through a synapse as a function value of an activation function for weight and/or bias.

복수의 네트워크 모드들은 뉴런이 시냅스를 통해 신호를 주고받는 뉴런의 시냅틱 활동을 모의하도록 각각 연결 관계에 따라 데이터를 주고받을 수 있다. 여기서 신경망은 신경망 모델에서 발전한 딥러닝 모델을 포함할 수 있다. 딥러닝 모델에서 복수의 네트워크 노드들은 서로 다른 레이어에 위치하면서 콘볼루션(convolution) 연결 관계에 따라 데이터를 주고받을 수 있다. 신경망 모델의 예는 심층 신경망(deep neural network, DNN), 합성곱 신경망(convolutional neural network, CNN), 순환 신경망(recurrent neural network), 제한 볼츠만 머신(restricted Boltzmann machine), 심층 신뢰 신경망(deep belief network), 심층 Q-네트워크(deep Q-Network)와 같은 다양한 딥러닝 기법들을 포함하며, 비전인식, 음성인식, 자연어처리, 음성/신호처리 등의 분야에서 적용될 수 있다.Multiple network modes can exchange data according to each connection relationship to simulate the synaptic activity of neurons sending and receiving signals through synapses. Here, the neural network may include a deep learning model developed from a neural network model. In a deep learning model, multiple network nodes are located in different layers and can exchange data according to convolutional connection relationships. Examples of neural network models include deep neural networks (DNN), convolutional neural networks (CNN), recurrent neural networks, restricted Boltzmann machines, and deep belief networks. ), deep Q-Network, and various deep learning techniques, and can be applied in fields such as vision recognition, speech recognition, natural language processing, and voice/signal processing.

한편, 상술한 바와 같은 기능을 수행하는 프로세서(110)는 범용 프로세서(예를 들어, CPU)일 수 있으나, 인공지능 학습을 위한 AI 전용 프로세서(예를 들어, GPU)일 수 있다.Meanwhile, the processor 110 that performs the functions described above may be a general-purpose processor (eg, CPU), or may be an AI-specific processor (eg, GPU) for artificial intelligence learning.

메모리(130)는 무선통신망(210), 교통정보망(230), 공공정보망(250), 질병감시정보 모듈(270)로부터 입력된 제1 입력변수, 제2 입력변수, 제3 입력변수 및 감염병 변수를 이용하여 감염병과 관련된 감염병의 예측을 해독하기 위한 감염 예측 시스템(100)의 동작에 필요한 각종 프로그램, 감염병의 데이터 및 감염병의 예측 데이터 등을 저장할 수 있다. 메모리(130)는 AI 프로세서(111)에 의해 액세스되며, AI 프로세서(111)에 의한 데이터의 독취/기록/수정/삭제/갱신 등이 수행될 수 있다. 또한, 메모리(130)는 본 명세서의 일 실시예에 따른 데이터 분류/인식을 위한 학습 알고리즘을 통해 생성된 신경망 모델(예를 들어, 딥러닝 모델)을 저장할 수 있다. 나아가, 메모리(330)는 학습 모델(221) 뿐만 아니라, 입력 데이터, 학습 데이터, 학습 히스토리 등을 저장할 수도 있다.The memory 130 includes first input variables, second input variables, third input variables, and infectious disease variables input from the wireless communication network 210, traffic information network 230, public information network 250, and disease surveillance information module 270. It is possible to store various programs, infectious disease data, and infectious disease prediction data necessary for the operation of the infection prediction system 100 to decipher the prediction of infectious diseases related to infectious diseases. The memory 130 is accessed by the AI processor 111, and reading/writing/modifying/deleting/updating data by the AI processor 111 can be performed. Additionally, the memory 130 may store a neural network model (eg, deep learning model) generated through a learning algorithm for data classification/recognition according to an embodiment of the present specification. Furthermore, the memory 330 may store not only the learning model 221 but also input data, learning data, and learning history.

한편, AI 프로세서(111)는 데이터 분류/인식을 위한 신경망을 학습하는 데이터 학습부(111a)를 포함할 수 있다. 데이터 학습부(111a)는 데이터 분류/인식을 판단하기 위하여 어떤 학습 데이터를 이용할지, 학습 데이터를 이용하여 데이터를 어떻게 분류하고 인식할지에 관한 기준을 학습할 수 있다. 데이터 학습부(111a)는 학습에 이용될 학습 데이터를 획득하고, 획득된 학습데이터를 딥러닝 모델에 적용함으로써, 딥러닝 모델을 학습할 수 있다.Meanwhile, the AI processor 111 may include a data learning unit 111a that learns a neural network for data classification/recognition. The data learning unit 111a can learn standards regarding which learning data to use to determine data classification/recognition and how to classify and recognize data using the learning data. The data learning unit 111a can learn a deep learning model by acquiring training data to be used for learning and applying the acquired training data to the deep learning model.

데이터 학습부(111a)는 적어도 하나의 하드웨어 칩 형태로 제작되어 감염병과 관련된 감염병의 예측을 해독하기 위한 감염 예측 시스템(100)에 탑재될 수 있다. 일 예로, 데이터 학습부(111a)는 인공지능을 위한 전용 하드웨어 칩 형태로 제작될 수 있고, 범용 프로세서(CPU) 또는 그래픽 전용 프로세서(GPU)의 일부로 제작되어 감염병과 관련된 감염병의 예측을 해독하기 위한 감염 예측 시스템(100)에 탑재될 수 있다. 또한, 데이터 학습부(111a)는 소프트웨어 모듈로 구현될 수도 있다. 소프트웨어 모듈(또는 인스트럭션(instruction)을 포함하는 프로그램 모듈)로 구현되는 경우, 소프트웨어 모듈은 컴퓨터로 읽을 수 있는 판독 가능한 비일시적 판독 가능 기록 매체(non-transitory computer readable media)에 저장될 수 있다. 이 경우에 적어도 하나의 소프트웨어 모듈은 OS(operating system)에 제공되거나, 애플리케이션에 의해 제공될 수 있다.The data learning unit 111a can be manufactured in the form of at least one hardware chip and mounted on the infection prediction system 100 to decipher the prediction of infectious diseases related to infectious diseases. As an example, the data learning unit 111a may be manufactured in the form of a dedicated hardware chip for artificial intelligence, and may be manufactured as part of a general-purpose processor (CPU) or graphics processor (GPU) to decipher predictions of infectious diseases related to infectious diseases. It can be mounted on the infection prediction system 100. Additionally, the data learning unit 111a may be implemented as a software module. When implemented as a software module (or a program module including instructions), the software module may be stored in a non-transitory computer readable recording medium that can be read by a computer. In this case, at least one software module may be provided to an operating system (OS) or may be provided by an application.

데이터 학습부(111a)는 획득된 학습 데이터를 이용하여, 신경망 모델이 소정의 데이터를 어떻게 분류/인식할지에 관한 판단기준을 가지도록 학습할 수 있다. 이때, 데이터 학습부(111a)에 의한 학습 방식은 지도 학습(supervised learning), 비지도 학습(unsupervised learning), 강화 학습(reinforcement learning)으로 분류될 수 있다. 여기서, 지도 학습은 학습 데이터에 대한 레이블(label)이 주어진 상태에서 인공 신경망을 학습시키는 방법을 지칭하며, 레이블이란 학습 데이터가 인공 신경망에 입력되는 경우 인공 신경망이 추론해야 하는 정답(또는 결과 값)을 의미할 수 있다. 비지도 학습은 학습 데이터에 대한 레이블이 주어지지 않는 상태에서 인공 신경망을 학습시키는 방법을 의미할 수 있다. 강화 학습은 특정 환경 안에서 정의된 에이전트(agent)가 각 상태에서 누적 보상을 최대화하는 행동 혹은 행동 순서를 선택하도록 학습시키는 방법을 의미할 수 있다. 또한, 데이터 학습부(111a)는 오류 역전파법(backpropagation) 또는 경사 하강법(gradient decent)을 포함하는 학습 알고리즘을 이용하여 신경망 모델을 학습시킬 수 있다. 신경망 모델이 학습되면 학습된 신경망 모델은 학습 모델(131)이라 호칭할 수 있다. 학습 모델(131)은 메모리(130)에 저장되어 학습 데이터가 아닌 새로운 입력 데이터에 대한 결과를 추론하는 데 사용될 수 있다.The data learning unit 111a can use the acquired training data to train the neural network model to have a judgment standard on how to classify/recognize certain data. At this time, the learning method by the data learning unit 111a can be classified into supervised learning, unsupervised learning, and reinforcement learning. Here, supervised learning refers to a method of training an artificial neural network with a given label for the learning data, and the label is the correct answer (or result value) that the artificial neural network must infer when the learning data is input to the artificial neural network. It can mean. Unsupervised learning can refer to a method of training an artificial neural network in a state where no labels for training data are given. Reinforcement learning can refer to a method of training an agent defined within a specific environment to select an action or action sequence that maximizes the cumulative reward in each state. Additionally, the data learning unit 111a may learn a neural network model using a learning algorithm including error backpropagation or gradient descent. When a neural network model is learned, the learned neural network model may be referred to as a learning model 131. The learning model 131 is stored in the memory 130 and can be used to infer results for new input data other than training data.

한편, AI 프로세서(111)는 학습 모델(131)을 이용한 분석 결과를 향상시키거나, 학습 모델(131)의 생성에 필요한 리소스 또는 시간을 절약하기 위하여 데이터 전처리부(111b) 및/또는 데이터 선택부(111c)를 더 포함할 수도 있다.Meanwhile, the AI processor 111 includes a data pre-processing unit 111b and/or a data selection unit to improve the analysis results using the learning model 131 or to save resources or time required for generating the learning model 131. (111c) may further be included.

데이터 전처리부(111b)는 획득된 데이터가 상황 판단을 위한 학습/추론에 이용될 수 있도록, 획득된 데이터를 전처리할 수 있다.The data preprocessing unit 111b may preprocess the acquired data so that the acquired data can be used for learning/inference for situation determination.

데이터 선택부(111c)는 데이터 학습부(111a) 또는 데이터 전처리부(111b)에서 전처리된 학습 데이터 중 학습에 필요한 데이터를 선택할 수 있다. 선택된 학습 데이터는 학습 모델(131)에 제공될 수 있다. 또한, 데이터 선택부(111c)는 입력 장치를 통해 획득된 입력 데이터 또는 전처리부에서 전처리된 입력 데이터 중 추론에 필요한 데이터를 선택할 수도 있다.The data selection unit 111c may select data required for learning from the learning data preprocessed by the data learning unit 111a or the data preprocessing unit 111b. Selected learning data may be provided to the learning model 131. Additionally, the data selection unit 111c may select data required for inference among input data obtained through an input device or input data preprocessed in a preprocessor.

또한, AI 프로세서(111)는 신경망 모델의 분석 결과를 향상시키기 위하여 모델 평가부(111d)를 더 포함할 수 있다. 모델 평가부(111d)는, 신경망 모델에 평가 데이터를 입력하고, 평가 데이터로부터 출력되는 분석 결과가 소정 기준을 만족하지 못하는 경우, 모델 학습부로 하여금 다시 학습하도록 할 수 있다. 이 경우, 평가 데이터는 학습 모델(131)을 평가하기 위한 기 설정된 데이터일 수 있다. 일 예로, 모델 평가부(111d)는 평가 데이터에 대한 학습된 신경망 모델의 분석 결과 중, 분석 결과가 정확하지 않은 평가 데이터의 개수 또는 비율이 미리 설정된 임계치를 초과하는 경우에 소정 기준을 만족하지 못한 것으로 평가할 수 있다.Additionally, the AI processor 111 may further include a model evaluation unit 111d to improve the analysis results of the neural network model. The model evaluation unit 111d inputs evaluation data into the neural network model, and when the analysis result output from the evaluation data does not meet a predetermined standard, it can cause the model learning unit to learn again. In this case, the evaluation data may be preset data for evaluating the learning model 131. As an example, the model evaluation unit 111d determines that among the analysis results of the learned neural network model for the evaluation data, when the number or ratio of evaluation data for which the analysis result is inaccurate exceeds a preset threshold, the model evaluation unit 111d determines that the analysis result does not meet a predetermined standard. It can be evaluated as

예측 모듈(115)은 인공지능을 통한 수학적 모델링을 기법을 도입함으로써 감염병 전파 경로가 복잡, 복합적이며 아직 정확한 전파경로가 파악되지 않는 신종감염병의 전파를 예측할 수 있다. 예측 모듈(115)은 전염병 예측 및 미래 예측에 활용되는 다양한 알고리즘을 활용할 수 있다. 예측 모듈(115)은 국가전체 감염병을 예측하거나, 행정구역별로 감염병을 예측할 수 있다.By introducing mathematical modeling techniques through artificial intelligence, the prediction module 115 can predict the spread of new infectious diseases whose transmission routes are complex and complex and whose exact transmission routes are not yet known. The prediction module 115 can utilize various algorithms used for epidemic prediction and future prediction. The prediction module 115 can predict infectious diseases for the entire country or for each administrative district.

도 2는 본 명세서가 적용될 수 있는 감염병 예측 시스템을 설명하기 위한 도이다.Figure 2 is a diagram for explaining an infectious disease prediction system to which this specification can be applied.

도 2를 살펴보면, 본 명세서의 일실시 예에 따른 감염병 예측 시스템(100)은 프로세서(110), 무선통신망(210), 교통정보망(230), 공공정보망(250) 그리고 질병감시정보 모듈(270)을 포함할 수 있다.Looking at Figure 2, the infectious disease prediction system 100 according to an embodiment of the present specification includes a processor 110, a wireless communication network 210, a traffic information network 230, a public information network 250, and a disease surveillance information module 270. may include.

도 2에서 설명할 프로세서(110)는 도 1에서 설명한 프로세서(110)와 중첩되는 부분에 대한 설명은 생략하기로 한다.Description of the portion of the processor 110 to be described in FIG. 2 that overlaps with the processor 110 described in FIG. 1 will be omitted.

프로세서(110)는 디지털 지도 상에 일정 크기의 격자를 복수 개로 생성하고, 생성된 격자를 기반으로, 격자 내에서 무선통신망(210)을 통해 수집되는 유동 인구와 관련된 제1 입력변수, 교통정보망(230)을 통해 수집되는 대중 교통과 관련된 제2 입력변수, 공공정보망(250)을 통해 수집되는 공공정보와 관련된 제3 입력변수를 산출할 수 있다. 프로세서(110)는 정보처리 모듈이라 칭할 수 있다.The processor 110 generates a plurality of grids of a certain size on a digital map, and based on the generated grids, the first input variable related to the floating population collected through the wireless communication network 210 within the grid, the traffic information network ( A second input variable related to public transportation collected through 230) and a third input variable related to public information collected through the public information network 250 can be calculated. The processor 110 may be referred to as an information processing module.

예를 들어, 프로세서(110)는 데이터 통합 모듈(11) 그리고 변수 추출 모델(12)을 이용하여 제1 입력변수 내지 제3 입력변수를 산출 또는 추출할 수 있다.For example, the processor 110 may calculate or extract first to third input variables using the data integration module 11 and the variable extraction model 12.

프로세서(110)는 질병감시정보 모듈(270)로부터 제공되는 복수의 감염병 변수를 산출할 수 있다.The processor 110 can calculate a plurality of infectious disease variables provided from the disease surveillance information module 270.

프로세서(110)는 제1 입력변수, 제2 입력변수, 제3 입력변수 및 복수의 감염병 변수로부터 특징값을 추출하고, 추출된 특징값을 미리 학습된 딥러닝 모델에 입력하고, 딥러닝 모델의 출력에 기반하여 디지털 지도 상에서 감염병에 대한 감염병 정보를 예측할 수 있다.The processor 110 extracts feature values from the first input variable, the second input variable, the third input variable, and a plurality of infectious disease variables, inputs the extracted feature values into a pre-trained deep learning model, and Based on the output, infectious disease information about infectious diseases can be predicted on a digital map.

예를 들어, 프로세서(110)는 인공지능을 통한 수학적 모델링을 기법을 도입함으로써 감염병 전파 경로가 복잡, 복합적이며 아직 정확한 전파경로가 파악되지 않는 신종감염병의 전파를 효과적으로 예측할 수 있다.For example, by introducing mathematical modeling techniques through artificial intelligence, the processor 110 can effectively predict the spread of new infectious diseases whose transmission routes are complex and complex and whose exact transmission routes are not yet known.

수학적 모델링은 SI, SIS, SIR, SIRS, SEIR, SEIRS 등을 포함할 수 있다. 이하 SEIR 모형 또는 SEIR 모델로 통일하여 기술을 활용할 수 있다. 이에 한정되는 것은 아니다. 예를 들어, 인공지능을 통한 수학적 모델링의 경우 Random Forest, ARIMA, LSTM(long short-term Memory), XBboost, Light GBM 등의 알고리즘, 코로나 19에 대해 최근 개발된 LSTM(Interpretable sequence learning for covid-19 forecasting) 모형들을 활용할 수 있다. 이에 한정되는 것은 아니며, 프로세서(110)는 전염병 예측 및 미래 예측에 활용되는 다양한 알고리즘을 활용할 수 있다. 예를 들어, 프로세서는 예측 모듈(115)을 포함하고, 예측 모듈(115)을 이용하여 국가전체 감염병을 예측하거나, 행정구역별로 감염병을 예측할 수 있다.Mathematical modeling may include SI, SIS, SIR, SIRS, SEIR, SEIRS, etc. Hereinafter, the technology can be utilized by unifying it into the SEIR model or SEIR model. It is not limited to this. For example, in the case of mathematical modeling through artificial intelligence, algorithms such as Random Forest, ARIMA, LSTM (long short-term memory), XBboost, Light GBM, etc., and the recently developed LSTM (Interpretable sequence learning for covid-19) forecasting models can be used. It is not limited to this, and the processor 110 may utilize various algorithms used for epidemic prediction and future prediction. For example, the processor includes a prediction module 115, and can use the prediction module 115 to predict infectious diseases for the entire country or to predict infectious diseases for each administrative district.

프로세서(110)는 인공지능을 통한 수학적 모델링을 이용하여 딥러닝 모델을 구축할 수 있다. 예를 들어, 미리 학습된 딥러닝 모델은 예측 모델, 예측 모형, 감염병 예측 모델 또는 감염병 예측 모형이라 칭할 수 있다.The processor 110 can build a deep learning model using mathematical modeling through artificial intelligence. For example, a pre-trained deep learning model can be called a prediction model, prediction model, infectious disease prediction model, or infectious disease prediction model.

프로세서(110)는 예측모형 구축시 감염병 전파위험도 및 그 증감률과 감염병 발생, 사망 및 그 증감률 사이에 일정 시간의 lag time을 설정할 수 있다. 이때 프로세서(110)는 감염병 전파위험도 및 그 증감률을 독립변수로 설정하고, 감염병 발생, 사망 및 그 증감률을 결과변수로 설정할 수 있다. 프로세서(110)는 lag time을 각 감염병이 가지는 평균 잠복기, 확진까지 걸리는 시간 등을 종합적으로 고려하여 설정할 수 있다.When constructing a prediction model, the processor 110 may set a certain lag time between the infectious disease transmission risk and its increase/decrease rate and the infectious disease occurrence, death, and its increase/decrease rate. At this time, the processor 110 can set the infectious disease transmission risk and its increase/decrease rate as independent variables, and the infectious disease occurrence, death, and its increase/decrease rate as outcome variables. The processor 110 can set the lag time by comprehensively considering the average incubation period of each infectious disease and the time it takes to confirm the diagnosis.

프로세서(110)는 인공지능을 이용한 지도학습을 통해 실시간으로 이루어지며, 이를 통해 감염병 예측 모형을 주기적으로 업데이트할 수 있다. 예를 들어, 이를 통해 얻어지는 결과변수(또는 예측변수)는 행정구역별 성/연령대별 감염병 별 일일 발생자수, 발생자수 증감률, 외래환자수, 외래환자수 증감율, 입원환자수, 입원환자수 증감율, 중환자실 입원자수, 중환자실 입원환자수 증감율, 사망자수, 사망자수 증감율 등일 수 있고, 국가 전체 성/연령대별 감염병 별 일일 발생자수, 발생자수 증감률, 외래환자수, 외래환자수 증감율, 입원환자수, 입원환자수 증감율, 중환자실 입원자수, 중환자실 입원환자수 증감율, 사망자수, 사망자수 증감율 등일 수 있다.The processor 110 performs real-time supervised learning using artificial intelligence, and through this, the infectious disease prediction model can be periodically updated. For example, the outcome variables (or predictor variables) obtained through this are the daily number of cases by infectious disease by administrative district, sex/age group, rate of increase/decrease in the number of cases, number of outpatients, rate of increase/decrease in the number of outpatients, number of inpatients, rate of increase/decrease in the number of inpatients. , the number of patients admitted to the intensive care unit, the rate of change in the number of patients admitted to the intensive care unit, the number of deaths, the rate of change in the number of deaths, etc., the number of daily cases by infectious disease by sex/age group in the entire country, the rate of change in the number of cases, the number of outpatients, the rate of change in the number of outpatients, hospitalization It may be the number of patients, the rate of increase or decrease in the number of hospitalized patients, the number of patients admitted to the intensive care unit, the rate of increase or decrease in the number of patients hospitalized in the intensive care unit, the number of deaths, or the rate of increase or decrease in the number of deaths.

프로세서(110)는 통신모듈(150)을 통해 무선통신망(210)으로부터 격자별 시간대별 유동인구, 주간 유동인구 핫스팟 선정, 핫스팟 격자의 유동인구 일별 합산 그리고 행정구역별 유동인구 일별 합산 등과 관련된 정보인 제1 입력변수를 제공받을 수 있다. 이에 대한 자세한 설명은 후술하기로 한다.The processor 110 receives information related to the floating population by grid and time zone from the wireless communication network 210 through the communication module 150, selection of weekly floating population hotspots, daily summation of floating population in the hotspot grid, and daily summing of floating population by administrative district. A first input variable may be provided. A detailed explanation of this will be provided later.

프로세서(110)는 통신모듈(150)을 통해 교통정보망(230)으로부터 버스 일별 승하차 총 승객수, 지하철 일별 승하차 총 승객수, 일별 도로 교통량 그리고 일별 항공편수 등과 관련된 정보인 제2 입력변수를 제공받을 수 있다. 이에 대한 자세한 설명은 후술하기로 한다.The processor 110 receives a second input variable, which is information related to the total number of passengers getting on and off the bus per day, the total number of passengers getting on and off the subway per day, the daily road traffic volume, and the number of daily flights, from the traffic information network 230 through the communication module 150. You can. A detailed explanation of this will be provided later.

프로세서(110)는 통신모듈(150)을 통해 공공정보망(250)으로부터 기상정보, 경제지표정보 인구 및 인구이동 정보 그리고 날짜정보/기타 통계정보 등과 관련된 정보인 제3 입력변수를 제공받을 수 있다.The processor 110 can receive a third input variable, which is information related to weather information, economic indicator information, population and population movement information, and date information/other statistical information, from the public information network 250 through the communication module 150.

프로세서(110)는 실시간 기상정보를 활용하여 제3 입력변수 중 일부 입력변수를 추출하고, 추출된 일부 입력변수를 기반으로 감염병 전파위험도 모델링에 활용할 수 있다. 예를 들어, 기상정보는 일평균 상대습도, 일평균 기온, 일평균 풍속, 일최고 기온, 일최저 기온, 일합계 일사, 일 강수량, 일합계 일조시간 등을 포함할 수 있다.The processor 110 extracts some of the third input variables using real-time weather information, and can be used for modeling the risk of infectious disease transmission based on some of the extracted input variables. For example, weather information may include daily average relative humidity, daily average temperature, daily average wind speed, daily maximum temperature, daily minimum temperature, daily total solar radiation, daily precipitation, daily total sunlight hours, etc.

프로세서(110)는 실시간 경제지표를 활용하여 제3 입력변수 중 일부 입력변수를 추출하고, 추출된 일부 입력변수를 기반으로 감염병 전파위험도 모델링에 활용할 수 있다. 예를 들어 경제지표는 원/미국달러(매매기준율), 원/일본엔(100엔), 원/유로, 원/영국파운드, 원/캐나다달러, 원/홍콩달러, 원/호주달러, 원/달러(종가), KOSPI 지수, 거래량(주식시장, 잠정치), 거래대금(주식시장, 잠정치), 외국인 순매수(주식시장, 잠정치), 주식시장-거래량(만주, 시간외 거래분 포함), 주식시장-거래대금(억원, 시간외거래분 포함), KOSDAQ 지수, 거래량(만주: 코스닥시장, 잠정치), 거래대금(억원: 코스닥시장, 잠정치), 외국인 순매수(코스닥시장, 잠정치), 시가총액(주식시장, 잠정치), 한국은행 기준금리, 자금조정대출금리, 자금조정 예금금리 등을 포함할 수 있다.The processor 110 can extract some of the third input variables using real-time economic indicators and use them for modeling the risk of infectious disease transmission based on some of the extracted input variables. For example, economic indicators include KRW/US dollar (basic trading rate), KRW/Japanese yen (100 yen), KRW/Euro, KRW/British pound, KRW/Canadian dollar, KRW/Hong Kong dollar, KRW/Australian dollar, KRW/ Dollar (closing price), KOSPI index, trading volume (stock market, provisional value), trading amount (stock market, provisional value), foreign net purchase (stock market, provisional value), stock market-trading volume (including 10,000 shares, after-hours trading), stock market- Trading amount (KRW 100 million, including after-hours trading), KOSDAQ index, trading volume (Manchuria: KOSDAQ market, provisional value), Trading amount (KRW 100 million: KOSDAQ market, provisional value), foreign net purchase (KOSDAQ market, provisional value), market capitalization (stock market, provisional value) It may include the provisional value), Bank of Korea base interest rate, fund-adjusted loan interest rate, and fund-adjusted deposit interest rate.

프로세서(110)는 실시간 날짜정보를 활용하여 제3 입력변수 중 일부 입력변수를 추출하고, 추출된 일부 입력변수를 기반으로 감염병 전파위험도 모델링에 활용할 수 있다. 예를 들어 날짜정보는 월, 요일, 휴무일 여부, 여름휴가기간 여부, 특정 이벤트 발생일, 기타 날짜 유형 등을 포함할 수 있다.The processor 110 can extract some of the third input variables using real-time date information and use them for modeling the risk of infectious disease transmission based on some of the extracted input variables. For example, date information may include month, day of the week, whether it is a holiday, whether it is a summer vacation period, the date on which a specific event occurs, and other date types.

또한, 프로세서(110)는 통신모듈(150)을 통해 질병감시정보 모듈(270)로부터 복수의 감염병 변수를 전송받아 감염병 전파위험도 모델링에 활용할 수 있다. 복수의 감염병 변수는 감염병 역학정보, 해외국가의 감염병 정보, 감염병 예방 정보 및 감염병 특성 정보를 포함할 수 있다. In addition, the processor 110 can receive a plurality of infectious disease variables from the disease surveillance information module 270 through the communication module 150 and use them for modeling the risk of infectious disease transmission. Multiple infectious disease variables may include infectious disease epidemiology information, infectious disease information in foreign countries, infectious disease prevention information, and infectious disease characteristic information.

예를 들어, 감염병 역학정보는 행정구역별 누적 확진자 수, 행정구역별 전일대비 증감 수(신규 확진자 수), 행정구역별 격리자 수, 행정구역별 격리 해제 수, 행정구역별 사망자 수, 행정구역별 신규 해외 유입 수, 전국 확진률 대비 사망률, 전국 누적 확진률, 전국 누적 검사 진행 수, 전국 누적 검사 완료 수, 전국 치료중 환자 수, 전국 격리 해제 수, 전국 사망자 수, 전국 누적 확진자 수, 전국 검사 진행 수, 전국 검사 결과 음성 수, 행정구역별 누적 확진자 수(자치구별 누적 확진자 수 합), 행정구역별 누적 해외유입 수(자치구별 누적 해외유입 수 합), 행정구역별 감염대상군, 행정구역별 현재 검사자 수, 행정구역별 현재 확진자 수, 행정구역별 현재 격리자 수, 행정구역별 현재 회복자 수 + 사망자 수를 포함할 수 있다.For example, infectious disease epidemiology information includes the cumulative number of confirmed cases by administrative district, the number of changes compared to the previous day (number of new confirmed cases) by administrative district, the number of quarantined people by administrative district, the number of release from quarantine by administrative district, the number of deaths by administrative district, Number of new overseas inflows by administrative district, death rate compared to national confirmation rate, nationwide cumulative confirmation rate, nationwide cumulative number of tests in progress, nationwide number of completed tests, number of patients under treatment nationwide, number of people released from quarantine nationwide, number of deaths nationwide, cumulative number of confirmed cases nationwide Number, number of nationwide tests conducted, number of negative test results nationwide, cumulative number of confirmed cases by administrative district (sum of cumulative number of confirmed cases by autonomous district), cumulative number of overseas inflows by administrative district (sum of cumulative number of overseas inflows by autonomous district), by administrative district It can include the number of infected subjects, the current number of people tested by administrative district, the current number of confirmed cases by administrative district, the current number of quarantined people by administrative district, and the current number of recoveries + number of deaths by administrative district.

해외국가의 감염병 정보는 해외 각국의 일별 확진자 수와 사망자 수, 해외 각국에서의 코로나19 관련 키워드 검색빈도를 포함할 수 있다. 여기서 전염병 발생 이력 정보는, 각 국가 별로 보고되는 자국 내 발생된 전염병 및 해당 전염병의 풍토병 정착 여부 등에 대한 정보로서, 각 국가로부터 자국 내에서 발생된 전염병 및 해당 전염병의 풍토병 정착 여부 등이 보고되는 정보학분석사이트로부터 획득될 수 있다. (예: GIDEON, ProMED-mail, WHO COVID-19 Dashboard, 질병관리본부 홈페이지 등) Infectious disease information in overseas countries may include the daily number of confirmed cases and deaths in each overseas country, and the search frequency of keywords related to COVID-19 in each overseas country. Here, the information on the history of infectious diseases is information on infectious diseases that have occurred in the country and whether the infectious diseases have become endemic, as reported by each country. Informatics, where each country reports the infectious diseases that have occurred in the country and whether the infectious diseases have become endemic, etc. It can be obtained from an analysis site. (Example: GIDEON, ProMED-mail, WHO COVID-19 Dashboard, Korea Centers for Disease Control and Prevention website, etc.)

감염병 예방 정보는 백신 개발 여부, 시도별 백신 접종률, 국가별 백신 접종률 등을 포함할 수 있다.Infectious disease prevention information may include whether a vaccine has been developed, the vaccination rate by province or province, and the vaccination rate by country.

또한, 복수의 감염병 변수는 기타 통계 정보 활용을 활용할 수 있다. 복수의 감염병 변수는 비실시간으로 수집되는 인구통계정보, 감염병 특성 정보, 기타 행정구역별 통계정보 등 다음과 같은 변수가 포함된 포괄적인 빅데이터 정보를 활용할 수 있다. 예를 들어, 인구통계정보는 행정구역별 성별, 연령대별 인구수, 행정구역별 인구밀집도 등을 포함할 수 있고, 감염병 특성 정보는 감염병명, 전파경로 유형(수인성, 곤충매개, 공기매개, 접촉전파, 비말전파 등), 법정감염병 분류 기준, 잠복기, 신종감염병 여부 등을 포함할 수 있다. 기타 행정구역별 통계정보는 통계청에서 제공받을 수 있다.Additionally, multiple infectious disease variables can utilize other statistical information. Multiple infectious disease variables can utilize comprehensive big data information that includes the following variables, such as demographic information collected in non-real time, infectious disease characteristic information, and other statistical information by administrative district. For example, demographic information may include gender by administrative district, population by age group, population density by administrative district, etc., and infectious disease characteristic information may include the name of the infectious disease and the type of transmission route (water-borne, insect-borne, air-borne, contact). transmission, droplet transmission, etc.), criteria for classification of legally infectious diseases, incubation period, and whether or not it is a new infectious disease. Other statistical information by administrative district can be obtained from the National Statistical Office.

상술한 바와 같이, 본 명세서의 실시 예에 따른 감염 예측 시스템(100)은 프로세서(110)의 제어 하에 감염병 발생에 대한 예측 결과를 활용한 서비스를 전송할 수 있다. 예를 들어, 감염 예측 시스템(100)은 지역별 감염병 예측을 통해 지역별로 맞춤형 방역을 위한 기초정보를 제공하거나, 의료자원을 미리 배치할 수 있게 해주는 서비스, 감염병으로 인해 발생할 피해에 대해 선제적으로 지원, 대응하게 해주는 서비스와 연결할 수 있다.As described above, the infection prediction system 100 according to an embodiment of the present specification may transmit a service using the prediction result for the occurrence of an infectious disease under the control of the processor 110. For example, the infection prediction system 100 provides basic information for customized quarantine by region through regional infectious disease prediction, a service that allows medical resources to be deployed in advance, and preemptive support for damage caused by infectious diseases. , it can be connected to a service that allows you to respond.

도 3은 본 명세서의 일실시 예에 따라 제1 입력변수를 수집하는 방법을 설명하기 위한 도이다.Figure 3 is a diagram for explaining a method of collecting a first input variable according to an embodiment of the present specification.

도 3을 참조하면, 본 명세서의 일실시 예에 따른 감염병 예측 시스템(100)은 격자 내에서 무선통신망을 통해 유동 인구와 관련된 제1 입력변수를 수집할 수 있다. 감염병 예측 시스템(100)은 무선통신망(210)에서 가입자 무선단말기를 통해 수집되는 정보를 취합할 수 있다.Referring to FIG. 3, the infectious disease prediction system 100 according to an embodiment of the present specification may collect a first input variable related to the floating population through a wireless communication network within the grid. The infectious disease prediction system 100 can collect information collected through subscriber wireless terminals in the wireless communication network 210.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 디지털 지도 상에 일정 크기의 격자를 생성할 수 있다. 격자는 프로세서(110)의 제어 하에 다양한 감염병 데이터 또는 감염병 예측 데이터에 기초하여 소정의 크기로 조정될 수 있다. 조정된 격자는 복수 개로 설정될 수 있다.The infectious disease prediction system 100 may generate a grid of a certain size on a digital map under the control of the processor 110. The grid may be adjusted to a predetermined size based on various infectious disease data or infectious disease prediction data under the control of the processor 110. Multiple adjusted grids can be set.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 각 격자 내의 무선통신망(210)을 이용하여 무선통신 가입자의 유동 인구수를 시간대 별로 계산 또는 산출 또는 수집할 수 있다(S211). 예를 들어, 일정 시간대별은 1시간 간격 등일 수 있다. 예를 들어, 감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 행정구역별, 격자별로 주간시간 대의 유동인구수 또는 야간 시간대의 유동인구수를 산출할 수 있다.The infectious disease prediction system 100 can calculate, calculate, or collect the floating population of wireless communication subscribers by time zone using the wireless communication network 210 in each grid under the control of the processor 110 (S211). For example, certain time slots may be 1 hour intervals, etc. For example, the infectious disease prediction system 100 can calculate the number of floating populations during daytime hours or the number of floating populations during nighttime hours for each administrative district and grid under the control of the processor 110.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 복수의 격자 중 유동 인구수가 가장 많은 격자를 선정할 수 있다(S212). The infectious disease prediction system 100 may select a grid with the largest floating population among a plurality of grids under the control of the processor 110 (S212).

이후 감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 선정된 격자의 일별 합산 유동인구수를 산출할 수 있다(S213). 복수의 격자 중 유동 인구수가 가장 많은 격자는 유동인구 핫스팟이라 칭할 수 있다. 감염병 시스템(100)은 유동인구 핫스팟에 기초하여 행정 구역별로 일별 유동인구수를 산출할 수 있다(S214). 산출된 유동인구수는 제1 입력변수라 칭할 수 있다. 제1 입력변수는 격자 내에서 무선통신망(210)을 통해 수집되는 유동 인구와 관련된 변수일 수 있다.Thereafter, the infectious disease prediction system 100 may calculate the daily combined floating population of the selected grid under the control of the processor 110 (S213). Among multiple grids, the grid with the largest floating population can be called a floating population hotspot. The infectious disease system 100 can calculate the daily floating population for each administrative district based on floating population hotspots (S214). The calculated floating population number can be referred to as the first input variable. The first input variable may be a variable related to the floating population collected through the wireless communication network 210 within the grid.

도 4 내지 도 7은 본 명세서의 일실시 예에 따라 제2 입력변수를 수집하는 방법을 설명하기 위한 도이다.4 to 7 are diagrams for explaining a method of collecting second input variables according to an embodiment of the present specification.

도 4 내지 도 7을 참조하면, 본 명세서의 일실시 예에 따른 감염병 예측 시스템(100)은 교통정보망(2300을 통해 대중 교통과 관련된 제2 입력변수를 수집할 수 있다.Referring to FIGS. 4 to 7 , the infectious disease prediction system 100 according to an embodiment of the present specification may collect second input variables related to public transportation through the traffic information network 2300.

제2 입력변수는 버스, 지하철, 도로교통, 항공편 등 다양한 교통 정보를 통해 일별 유동 인구를 반영하는 지표를 생성하는 변수일 수 있다.The second input variable may be a variable that generates an index reflecting the daily floating population through various transportation information such as buses, subways, road traffic, and flights.

도 4를 참조하면, 감염병 예측 시스템(100)은 버스 승하차승객수 정보를 통해 행정구역별로 유동 인구를 수집할 수 있다.Referring to FIG. 4, the infectious disease prediction system 100 can collect the floating population by administrative district through information on the number of passengers getting on and off buses.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 교통정보망(230)을 이용하여 버스정류장별 일별 승차 총 승객수(S221)와 일별 하차 총 승객수(S222)를 더하여 일별 승하차 총 승객수를 산출할 수 있다(S223).The infectious disease prediction system 100 uses the traffic information network 230 under the control of the processor 110 to calculate the total number of passengers getting on and off per day by adding the total number of daily boarding passengers (S221) and the total number of daily disembarking passengers (S222) for each bus stop. It can be calculated (S223).

감염 예측 시스템(110)은 프로세서(110)의 제어 하에 해당 버스정류장이 속한 행정구역별로 일별 승하차 총 승객수를 합산하고(S223), 이를 기반으로 행정구역별 일별 승하차 총 승객수를 산출함(S224)으로써, 유동 인구수를 수집할 수 있다.The infection prediction system 110, under the control of the processor 110, adds up the total number of daily boarding and alighting passengers for each administrative district to which the corresponding bus stop belongs (S223), and calculates the total number of daily boarding and alighting passengers for each administrative district based on this (S224) ), the floating population can be collected.

도 5를 참조하면, 감염병 예측 시스템(100)은 지하철 승하차승객수 정보를 통해 행정구역별로 유동 인구를 수집할 수 있다.Referring to FIG. 5, the infectious disease prediction system 100 can collect the floating population by administrative district through information on the number of passengers getting on and off the subway.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 교통정보망(230)을 이용하여 지하철역별 일별 승차 총 승객수(S225)와 일별 하차 총 승객수(S226)를 더하여 일별 승하차 총 승객수를 산출할 수 있다(S227).The infectious disease prediction system 100 uses the traffic information network 230 under the control of the processor 110 to calculate the total number of passengers getting on and off per day by adding the total number of daily passengers getting on (S225) and the total number of daily getting off (S226) for each subway station. You can do it (S227).

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 해당 지하철역이 속한 행정구역별로 일별 승하차총승객수를 합산하고, 이를 기반으로 행정구역별 일별 승하차 총 승객수를 산출함(S228)으로써, 유동 인구수를 수집할 수 있다.The infectious disease prediction system 100, under the control of the processor 110, adds up the total number of passengers getting on and off per day for each administrative district to which the subway station belongs, and calculates the total number of passengers getting on and off per day for each administrative district based on this (S228). Population numbers can be collected.

도 6을 참조하면, 감염병 예측 시스템(100)은 도로 또는 영업소별 일별 교통량을 해당 도로 또는 영업소가 속한 행정구역 별로 유동 인구를 수집할 수 있다.Referring to FIG. 6, the infectious disease prediction system 100 can collect daily traffic volume for each road or business office and the floating population for each administrative district to which the road or business office belongs.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 교통정보망(230)을 이용하여 도로 또는 영업소별 일별 교통량(S229)을 해당 도로 또는 영업소가 속한 행정구역 별로 합산하고, 이를 기반으로 행정구역별 일별 교통량을 산출함(S230)으로써, 유동 인구수를 수집할 수 있다.The infectious disease prediction system 100 uses the traffic information network 230 under the control of the processor 110 to add up the daily traffic volume (S229) for each road or business office by administrative district to which the road or business office belongs, and based on this, each administrative district. By calculating the daily traffic volume (S230), the number of floating populations can be collected.

도 7을 참조하면, 감염병 예측 시스템(100)은 교통정보망(230)을 이용하여 실시간 항공기 운항정보를 활용함으로써, 유동 인구를 수집할 수 있다.Referring to FIG. 7, the infectious disease prediction system 100 can collect floating population by utilizing real-time aircraft operation information using the traffic information network 230.

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 국제선에서 한국에 도착하고 한국에서 출발하는 항공 편을 국가별로 분류를 하여 각 국가별 한국으로의 일별 항공편수 및 입국자수 추출할 수 있다(S231).The infectious disease prediction system 100, under the control of the processor 110, classifies flights arriving and departing from Korea on international flights by country and can extract the number of daily flights to Korea and the number of arrivals for each country (S231 ).

감염병 예측 시스템(100)은 프로세서(110)의 제어 하에 국가별 질병관리청에 접속하여 해외 각 국가별 감염병 발생자수를 실시간으로 추출할 수 있다(S232).The infectious disease prediction system 100 can access the Korea Disease Control and Prevention Agency under the control of the processor 110 and extract the number of infectious disease cases in each overseas country in real time (S232).

감염병 예측 시스템(100)은 무선통신데이터를 활용해 해외 각국에서 각 국가별 한국으로의 로밍 고객 입국자수를 추출할 수 있다(S233).The infectious disease prediction system 100 can use wireless communication data to extract the number of roaming customers entering Korea from each overseas country (S233).

감염병 예측 시스템(100)은 상술한 추출된 입국자수, 국가별 감염병 발생자수, 로밍고객 입국자수를 매칭하고(S234), 매칭된 데이터에 기초하여 일별 해외유입 감염병 전파위험도를 산출할 수 있다(S235).The infectious disease prediction system 100 matches the extracted number of entrants, the number of infectious disease outbreaks by country, and the number of roaming customer entrants (S234), and calculates the daily risk of spreading infectious diseases imported from overseas based on the matched data (S235). ).

도 8 내지 도 16은 본 명세서의 실시 예에 따라 딥러닝 모델을 이용하여 특정 일자의 예측 변수값 산출 방법을 설명하기 위한 도이다.Figures 8 to 16 are diagrams for explaining a method of calculating predictor values for a specific date using a deep learning model according to an embodiment of the present specification.

도 8을 참조하면, 본 명세서의 프로세서(110)는 딥러닝 모델을 이용하여 변수값을 가장 잘 예측하는 N일을 산출하고, 이를 기반으로 특정 일자의 변수값을 예측할 수 있다. 본 명세서에서는 딥러닝 모델 중 수학적 모델링인 SEIR에 기초하여 설명하기로 한다. 이에 한정되는 것은 아니며 다양한 딥러닝 모델을 적용할 수 있다. 후술할 SEIR은 SEIR 모델이라 칭할 수 있고, 인구집단을 S: 감수성자(Susceptible), E: 잠복기(Exposed), I: 감염기(Infective), R: 회복기(Recoverd)의 4가지 집단으로 분류하여 감염병을 수리적으로 예측하는 모델로 정의될 수 있다.Referring to FIG. 8, the processor 110 of the present specification calculates the N days that best predict the variable value using a deep learning model, and can predict the variable value of a specific date based on this. In this specification, the explanation will be based on SEIR, a mathematical modeling among deep learning models. It is not limited to this and various deep learning models can be applied. SEIR, which will be described later, can be referred to as the SEIR model, and the population group is classified into four groups: S: Susceptible, E: Exposed, I: Infective, and R: Recovered. It can be defined as a model that mathematically predicts infectious diseases.

변수값은 상술한 제1 입력변수 내지 제3 입력변수 그리고 감염병 변수 등에서 추출한 특징값을 분석한 예측 값일 수 있다.The variable value may be a predicted value obtained by analyzing feature values extracted from the above-described first to third input variables and infectious disease variables.

프로세서는 수학적 모델링인 SEIR를 통해 특정 일자의 SEIR 변수값을 예측할 때 특정 일자 이전 N일의 이전일자-다음일자의 각 SEIR 변수값의 평균 증가율을 특정 일자 이전 날짜의 SEIR 변수값에 곱하여 특정 일자의 SEIR의 변수값을 예측할 수 있다.When predicting the SEIR variable value of a specific date through mathematical modeling, SEIR, the processor multiplies the SEIR variable value of the date before the specific date by the average increase rate of each SEIR variable value of the previous date and the next date N days before the specific date to obtain the average increase rate of the SEIR variable value of the date before the specific date. SEIR variable values can be predicted.

예를 들어, 프로세서는 21일의 SEIR 예측 변수값을 예측하기 위해 20일의 SEIR 변수값, 19일의 SEIR 변수값, ..., 2일의 SEIR 변수값, 1일의 SEIR 변수값, 19일의 SEIR 변수값과 20일의 SEIR 변수값 사이의 SEIR 변수값들의 증가율, ..., 1일의 SEIR 변수값과 2일의 SEIR 변수값 사이의 SEIR 변수값들의 증가율, 그리고 N일간 증가율의 평균 등을 산출하고, 이를 기반으로 통계분석을 하고, 통계분석을 통해 특정 일자의 SEIR 변수값을 가장 잘 예측하는 N일을 산출할 수 있다.For example, to predict the SEIR predictor variable value on the 21st, the processor uses the SEIR variable value on the 20th, the SEIR variable value on the 19th, ..., the SEIR variable value on the 2nd, the SEIR variable value on the 1st, 19 The increase rate of SEIR variable values between the SEIR variable value of day 1 and the SEIR variable value of day 20, ..., the increase rate of SEIR variable values between the SEIR variable value of day 1 and the SEIR variable value of day 2, and the increase rate of N days. You can calculate the average, perform statistical analysis based on this, and calculate the N days that best predict the SEIR variable value for a specific date through statistical analysis.

이때 산출된 N일은 감염병의 종류와 전파 시기, 전파 지역 및 전파 특성에 따라 다를 수 있다. 프로세서는 산출된 N일을 이후 수학적 모델링인 SEIR할 때 고정값으로 사용될 수 있다. 예를 들어, 프로세서는 산출된 N일을 이후 해당 감염병 예측 모델링을 할 때 고정된 값으로 사용될 수 있다.At this time, the calculated N days may vary depending on the type of infectious disease, transmission period, transmission area, and transmission characteristics. The processor can use the calculated N days as a fixed value when doing mathematical modeling (SEIR) later. For example, the processor can use the calculated N days as a fixed value when doing predictive modeling for the infectious disease in the future.

예를 들어, 프로세서는 통계분석을 통해 코로나19의 경우 N이 30일이 될 경우 특정 일자의 SEIR 변수값을 가장 잘 예측한다는 결과가 도출될 경우 코로나19 예측 모델링의 경우 30일을 코로나19 예측모형에 모두 적용할 수 있다.For example, if the processor determines through statistical analysis that the SEIR variable value on a specific date is best predicted when N is 30 days in the case of COVID-19, in the case of COVID-19 prediction modeling, 30 days is used as the COVID-19 prediction model. Can be applied to all.

도 9 내지 도 11을 참조하면, 프로세서는 수학적 모델링인 SEIR를 이용하여 미래 특정 일자의 SEIR 변수값 예측 시 현재 시점을 기준으로 미래 일자에 대해 순차적으로 하루씩 SEIR 변수값을 예측해서 특정 일자의 SEIR 변수값을 예측할 수 있다.Referring to FIGS. 9 to 11, when predicting the SEIR variable value of a specific date in the future using SEIR, which is mathematical modeling, the processor sequentially predicts the SEIR variable value for each future date, one day at a time, based on the current time, and predicts the SEIR variable value of the specific date. Variable values can be predicted.

만약 N을 30일로 정할 경우, 미래 특정 일자의 SEIR 예측 변수값 산출 방법은 다음과 같다.If N is set to 30 days, the method for calculating the SEIR predictor value for a specific date in the future is as follows.

예를 들어, 프로세서는 수학적 모델링인 SEIR를 이용하여 현재일자(0일) 기준으로 미래 4일(+4일)의 SEIR 변수값을 예측할 때, 도 8에서 상술한 방법을 이용하여 1일 후(+1일), 2일 후(+2일), 3일 후(+3일)의 SEIR 변수값을 순차적으로 예측한 후 이를 기반으로 4일 후(+4일)의 SEIR 변수값을 예측할 수 있다.For example, when the processor predicts the SEIR variable value for 4 days (+4 days) in the future based on the current date (day 0) using SEIR, which is mathematical modeling, 1 day later ( You can sequentially predict the SEIR variable values after (+1 day), 2 days later (+2 days), and 3 days later (+3 days), and then predict the SEIR variable values 4 days later (+4 days) based on this. there is.

즉, 프로세서는 수학적 모델링인 SEIR를 이용하여 2일 후의 SEIR 변수값은 현재 일자를 기준으로 1일 후에 예측된 SEIR 변수값에 이전 30일의 SEIR 변수값의 평균 증가율을 곱해 산출할 수 있다. 이와 같은 방법으로 프로세서는 3일 후의 SEIR 변수값은 현재 일자를 기준으로 2일 후에 예측된 SEIR 변수값에 이전 30일의 SEIR 변수값의 평균 증가율을 곱해 산출할 수 있다. 본 명세서의 프로세서는 현재 시점을 기준으로 미래 일자에 대해 순차적으로 하루씩 SEIR 변수값을 예측해서 특정 일자의 SEIR 변수값을 예측할 수 있다.In other words, the processor can use mathematical modeling, SEIR, to calculate the SEIR variable value 2 days later by multiplying the SEIR variable value predicted 1 day from the current date by the average increase rate of the SEIR variable value for the previous 30 days. In this way, the processor can calculate the SEIR variable value 3 days later by multiplying the SEIR variable value predicted 2 days from the current date by the average increase rate of the SEIR variable value of the previous 30 days. The processor of the present specification can predict the SEIR variable value on a specific date by sequentially predicting the SEIR variable value one day for future dates based on the current time.

예를 들어, 프로세서는 특정일자(예 M일) 후 결과값 예측을 위한 예측 모델링인 SEIR 모델 구축 시 특정 일자 이전의 SEIR 이외의 기타 설명 변수값(a1), 예측하고자 하는 특정 일자에 대해 예측된 SEIR 변수값(a2), 그리고 특정 일자 이전 일자에 예측된 결과값(a3)을 설명변수(a)로 사용하고, 특정일자 후의 예측 결과값과 실제 결과값과의 차이를 결과변수(b)로 하여 인공지능을 통해 지도학습을 시켜서 특정 일자 후의 감염병 예측모형(110)을 구축할 수 있다.For example, when building a SEIR model, which is predictive modeling for predicting result values after a specific date (e.g. M day), the processor uses the values of other explanatory variables (a1) other than SEIR before a specific date, The SEIR variable value (a2) and the result value predicted on a date before a specific date (a3) are used as explanatory variables (a), and the difference between the predicted result value after a specific date and the actual result value is used as the result variable (b). Therefore, supervised learning can be performed through artificial intelligence to build an infectious disease prediction model (110) after a specific date.

도 12 및 도 13을 참조하면, 프로세서가 14일을 기준으로 7일 뒤인 21일의 감염병 예측을 한다고 했을 때, 예측하고자 하는 날짜인 21일 이전 7일(14일)의 SEIR 이외의 기타 설명 변수값(c1), 21일에 예측된 SEIR 변수값(c2), 그리고 21일 이전에 예측된 결과값(예를 들어 15, 16, 19일에 대한 감염병 예측이 되었다고 하면 15, 16, 19일의 결과값, (c3))을 설명변수(c)로 사용하고 21일의 예측 결과값과 실제 결과값과의 차이를 결과변수(d)로 하여 인공지능을 통해 지도학습을 시켜서 21일(14일로부터 7일 후)에 대한 감염병 예측모형(110)을 구축할 수 있다.Referring to Figures 12 and 13, when the processor predicts an infectious disease on the 21st, 7 days after the 14th, other explanatory variables other than SEIR 7 days (14th) before the 21st, the date to be predicted, value (c1), the SEIR variable value predicted on the 21st (c2), and the result predicted before the 21st (for example, if the infectious disease was predicted for the 15th, 16th, and 19th, the The result value (c3)) is used as the explanatory variable (c), and the difference between the predicted result value on the 21st and the actual result value is used as the result variable (d), and supervised learning is performed through artificial intelligence to obtain the result on the 21st day (14 days). An infectious disease prediction model (110) can be built for (7 days after).

도 14 및 도 15를 참조하면, 프로세서는 현재 시점을 기준으로 미래 M일의 감염병 예측 시 특정 일자 이전의 SEIR 이외의 기타 설명 변수값(e1), 예측하고자 하는 특정 일자(M일)에 대해 예측된 SEIR 변수값(e2), 그리고 특정 일자(M일) 이전 일자에 예측된 결과값(e3)을 설명변수(e)로 하여 기 개발된 M일 후 감염병 예측 모델에 적용하여 M일의 예측 결과 값(f)을 산출할 수 있다. Referring to Figures 14 and 15, when predicting an infectious disease for M days in the future based on the current time, the processor predicts the value of other explanatory variables (e1) other than SEIR before a specific date and the specific date (M day) to be predicted. The predicted result on day M is obtained by applying the previously developed infectious disease prediction model after M days using the SEIR variable value (e2) and the predicted result value (e3) on the day before a specific date (M day) as the explanatory variable (e). The value (f) can be calculated.

즉, 현재 시점을 기준으로 예측하려고 하는 미래 M일에 대한 예측을 하려고 할 경우, 감염 예측 시스템은 프로세서의 제어 하에 M일 후 결과값을 예측하기 위해 개발된 “M일 후 예측 모델링”을 적용할 수 있다. 예를 들어, 감염 예측 시스템은 프로세서의 제어 하에 1일 후 예측을 하려고 할 경우 1일 후 예측 모델로 개발된 모형을 적용하며, 2일 후 예측을 하려고 할 경우 2일 후 예측 모델로 개발된 모형을 적용할 수 있다.In other words, if you are trying to make a prediction for M days in the future based on the current point in time, the infection prediction system can apply “M day future predictive modeling,” which was developed to predict the result after M days under the control of the processor. You can. For example, under the control of the processor, the infection prediction system applies the model developed as a 1-day prediction model when trying to predict after 1 day, and when trying to predict after 2 days, it applies the model developed as a 2-day prediction model. can be applied.

또한, 도 16에 도시된 것처럼, 감염 예측 시스템은 프로세서의 제어 하에 예측하고자 하는 특정 날짜에 대한 예측 결과값을 다수의 인공지능 예측모형(예: Random forest, Extremely randomized trees, GBM, XGBoost, GLM, Deep learning, Stacked ensemble 등)을 이용한 다수의 예측 결과값들 및 그 결과값의 최대값, 최소값, 평균값, 중앙값 등을 계산할 수 있고, 이를 날짜별로 그래프 또는 표를 이용하여 설명할 수 있다.In addition, as shown in Figure 16, the infection prediction system uses a number of artificial intelligence prediction models (e.g. Random forest, Extremely randomized trees, GBM, XGBoost, GLM, You can calculate multiple prediction results using (Deep learning, Stacked ensemble, etc.) and the maximum, minimum, average, median, etc. of the results, and explain them by date using a graph or table.

상술한 바와 같이, 본 명세서의 감염 예측 시스템은 프로세서의 제어 하에 예측하고자 하는 특정 날짜에 대한 예측 결과 값을 정확하게 산출함으로써, 감염병 발생 예측 결과를 활용한 서비스를 제공할 수 있다. 예를 들어, 본 명세서의 감염 예측 시스템은 감염병 발생 예측 결과를 활용하여 지역별 감염병 예측을 통해 지역별로 맞춤형 방역을 위한 기초정보를 제공하거나, 의료자원을 미리 배치할 수 있게 해주는 서비스, 감염병으로 인해 발생할 피해에 대해 선제적으로 지원, 대응하게 해주는 서비스와 연결할 수 있다.As described above, the infection prediction system of the present specification can provide a service utilizing the infectious disease outbreak prediction results by accurately calculating the prediction result value for the specific date to be predicted under the control of the processor. For example, the infection prediction system of this specification utilizes the results of infectious disease outbreak predictions to provide basic information for customized quarantine by region through regional infectious disease predictions, a service that allows medical resources to be deployed in advance, and a service that allows for the pre-positioning of medical resources, You can connect with services that provide proactive support and response to damage.

상술한 본 발명의 실시예들은 본 발명의 필수적 특징을 벗어나지 않는 범위에서 다른 특정한 형태로 구체화될 수 있다. 따라서, 상술한 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다. 또한, 특허청구범위에서 명시적인 인용 관계가 있지 않은 청구항들을 결합하여 실시예를 구성하거나 출원 후의 보정에 의해 새로운 청구항으로 포함할 수 있다.The embodiments of the present invention described above may be embodied in other specific forms without departing from the essential characteristics of the present invention. Accordingly, the above detailed description should not be construed as restrictive in all respects and should be considered illustrative. The scope of the present invention should be determined by reasonable interpretation of the appended claims, and all changes within the equivalent scope of the present invention are included in the scope of the present invention. In addition, claims that do not have an explicit reference relationship in the patent claims can be combined to form an embodiment or included as a new claim through amendment after filing.

Claims (10)

감염병 시스템을 이용하여 감염병을 예측하는 방법에 있어서,
디지털 지도 상에 일정 크기의 격자를 복수 개로 생성하는 단계;
생성된 상기 격자를 기반으로, 상기 격자 내에서 무선통신망을 통해 수집되는 유동 인구 수와 관련된 제1 입력변수, 교통 정보망을 통해 수집되는 대중 교통과 관련한 유동 인구 수를 보여주는 제2 입력변수, 공공정보망을 통해 수집되는 공공정보와 관련된 제3 입력변수를 산출하는 단계;
질병감시정보 모듈로부터 제공되는 복수의 감염병 변수를 산출하는 단계;
상기 제1 입력변수, 상기 제2 입력변수, 상기 제3 입력변수 및 상기 복수의 감염병 변수로부터 특징값을 추출하고, 추출된 상기 특징값을 딥러닝 모델에 입력하는 단계; 및
상기 딥러닝 모델의 출력에 기반하여 상기 디지털 지도 상에서 감염병에 대한 감염병 정보를 예측하는 단계;
를 포함하고,
상기 제1 입력변수는, 상기 격자 내의 상기 무선통신망을 이용하여 무선통신 가입자의 유동 인구수를 시간대 별로 계산하고, 상기 격자 중 유동 인구수가 가장 많은 핫스팟을 선정하고, 상기 핫스팟에 기초해 일별 유동인구수를 산출하고,
상기 제2 입력변수는, 지하철, 버스와 같은 대중 교통의 행정 구역별 일별 승차 총 승객수의 일별 하차 총 승객수를 더하여 구해지거나, 항공편인 경우에는 한국에 도착하고 한국에서 출발하는 항공 편을 국가별로 분류를 하여 각 국가별 한국으로의 일별 항공편수 및 입국자수를 기초로 구해지는 방법.
In a method of predicting an infectious disease using an infectious disease system,
Creating a plurality of grids of a certain size on a digital map;
Based on the generated grid, a first input variable related to the number of floating population collected through a wireless communication network within the grid, a second input variable showing the number of floating population related to public transportation collected through a traffic information network, and a public information network. Calculating a third input variable related to public information collected through;
Calculating a plurality of infectious disease variables provided from a disease surveillance information module;
Extracting feature values from the first input variable, the second input variable, the third input variable, and the plurality of infectious disease variables, and inputting the extracted feature values into a deep learning model; and
Predicting infectious disease information about infectious diseases on the digital map based on the output of the deep learning model;
Including,
The first input variable calculates the floating population of wireless communication subscribers by time zone using the wireless communication network in the grid, selects a hotspot with the largest floating population among the grid, and calculates the daily floating population based on the hotspot. Calculate,
The second input variable is obtained by adding the total number of daily passengers boarding and the total number of daily disembarking passengers by administrative district for public transportation such as subways and buses, or, in the case of flights, the number of flights arriving in and departing from Korea by country. A method of categorizing each country based on the number of daily flights and arrivals to Korea.
제1항에 있어서,
상기 딥러닝 모델은,
추출된 상기 특징값에 기초하여 지도 학습되며, 이를 통해 감염병 예측 모형을 구축하고, 주기적으로 업데이트하는 방법.
According to paragraph 1,
The deep learning model is,
A method of supervised learning based on the extracted feature values, through which an infectious disease prediction model is built and periodically updated.
제2항에 있어서,
상기 감염병 정보를 예측하는 단계는,
상기 딥러닝 모델을 통해 출력된 변수 값을 예측하여 N일을 산출하고,
산출된 N일을 기반으로 특정 일자의 변수 값을 예측하는 방법.
According to paragraph 2,
The step of predicting the infectious disease information is,
N days are calculated by predicting variable values output through the deep learning model,
A method of predicting the value of a variable on a specific date based on the calculated N days.
제3항에 있어서,
상기 딥러닝 모델은,
수학적 모델링인 SI, SIS, SIR, SIRS, SEIR, SEIRS 등을 포함하고,
상기 감염병 정보를 예측하는 단계는,
상기 SEIR를 통해 특정 일자의 SEIR 변수 값을 예측하는 경우, 상기 특정 일자의 이전 N일의 이전 일자 그리고 상기 특정 일자의 이전 N일의 다음 일자의 각 SEIR 변수 값의 평균 증가율을 상기 특정 일자 이전 날짜의 상기 SEIR 변수 값에 곱하여 상기 특정 일자의 SEIR의 변수 값을 예측하는 방법.
According to paragraph 3,
The deep learning model is,
Includes mathematical modeling SI, SIS, SIR, SIRS, SEIR, SEIRS, etc.
The step of predicting the infectious disease information is,
When predicting the SEIR variable value of a specific date through the SEIR, the average increase rate of each SEIR variable value on the previous N days prior to the specific date and the date following the N days prior to the specific date is calculated as the average increase rate of the value of each SEIR variable on the date prior to the specific date. A method of predicting the SEIR variable value of the specific date by multiplying the SEIR variable value of .
제2항에 있어서,
상기 딥러닝 모델은,
상기 감염병 예측 모형을 구축시 염병 전파위험도 및 그 증감률과 감염병 발생, 사망 및 그 증감률 사이에 일정 시간의 lag time을 설정하는 방법.
According to paragraph 2,
The deep learning model is,
When constructing the infectious disease prediction model, a method of setting a certain lag time between the risk of infectious disease transmission and its increase/decrease rate and the occurrence of infectious disease, death, and its increase/decrease rate.
감염병을 예측하는 시스템에 있어서,
무선통신망, 교통정보망, 공공정보망 중 적어도 하나에 기초하여 데이터를 송수신하는 통신 모듈;
감염병 정보를 저장하는 질병감시정보 모듈; 및
디지털 지도 상에 일정 크기의 격자를 복수 개로 생성하고, 생성된 상기 격자를 기반으로, 상기 격자 내에서 상기 무선통신망을 통해 수집되는 유동 인구 수와 관련된 제1 입력변수, 상기 교통 정보망을 통해 수집되는 대중 교통과 관련한 유동 인구 수를 보여주는 제2 입력변수, 상기 공공정보망을 통해 수집되는 공공정보와 관련된 제3 입력변수를 산출하고,
상기 질병감시정보 모듈로부터 제공되는 감염병 정보에 기초하여 복수의 감염병 변수를 산출하고,
상기 제1 입력변수, 상기 제2 입력변수, 상기 제3 입력변수 및 상기 복수의 감염병 변수로부터 특징값을 추출하고, 추출된 상기 특징값을 딥러닝 모델에 입력하고,
상기 딥러닝 모델의 출력에 기반하여 상기 디지털 지도 상에서 감염병에 대한 감염병 정보를 예측하는 프로세서
를 포함하고,
상기 제1 입력변수는, 상기 격자 내의 상기 무선통신망을 이용하여 무선통신 가입자의 유동 인구수를 시간대 별로 계산하고, 상기 격자 중 유동 인구수가 가장 많은 핫스팟을 선정하고, 상기 핫스팟에 기초해 일별 유동인구수를 산출해 구해지고,
상기 제2 입력변수는, 지하철, 버스와 같은 대중 교통의 행정 구역별 일별 승차 총 승객수의 일별 하차 총 승객수를 더하여 구해지거나, 항공편인 경우에는 한국에 도착하고 한국에서 출발하는 항공 편을 국가별로 분류를 하여 각 국가별 한국으로의 일별 항공편수 및 입국자수를 기초로 구해지는 감염병을 예측하는 시스템.
In a system for predicting infectious diseases,
A communication module that transmits and receives data based on at least one of a wireless communication network, a traffic information network, and a public information network;
A disease surveillance information module that stores infectious disease information; and
A plurality of grids of a certain size are created on a digital map, and based on the generated grids, a first input variable related to the number of floating population collected through the wireless communication network within the grid, and a first input variable collected through the traffic information network Calculating a second input variable showing the number of floating population related to public transportation and a third input variable related to public information collected through the public information network,
Calculate a plurality of infectious disease variables based on the infectious disease information provided from the disease surveillance information module,
Extracting feature values from the first input variable, the second input variable, the third input variable, and the plurality of infectious disease variables, and inputting the extracted feature values into a deep learning model,
A processor that predicts infectious disease information about infectious diseases on the digital map based on the output of the deep learning model
Including,
The first input variable calculates the floating population of wireless communication subscribers by time zone using the wireless communication network in the grid, selects a hotspot with the largest floating population among the grid, and calculates the daily floating population based on the hotspot. Calculated and saved,
The second input variable is obtained by adding the total number of daily passengers boarding and the total number of daily disembarking passengers by administrative district for public transportation such as subways and buses, or, in the case of flights, the number of flights arriving in and departing from Korea by country. A system that classifies and predicts infectious diseases based on the daily number of flights and arrivals to Korea for each country.
제6항에 있어서,
상기 딥러닝 모델은,
추출된 상기 특징값에 기초하여 지도 학습되며, 이를 통해 감염병 예측 모형을 구축하고, 주기적으로 업데이트하는 감염병을 예측하는 시스템.
According to clause 6,
The deep learning model is,
A system for predicting infectious diseases that is supervised based on the extracted feature values, builds an infectious disease prediction model through this, and updates periodically.
제7항에 있어서,
상기 프로세서는,
상기 딥러닝 모델을 통해 출력된 변수 값을 예측하여 N일을 산출하고,
산출된 N일을 기반으로 특정 일자의 변수 값을 예측하는 감염병을 예측하는 시스템.
In clause 7,
The processor,
N days are calculated by predicting variable values output through the deep learning model,
A system for predicting infectious diseases that predicts variable values for a specific date based on the calculated N days.
제8항에 있어서,
상기 딥러닝 모델은,
수학적 모델링인 SI, SIS, SIR, SIRS, SEIR, SEIRS 등을 포함하고,
상기 프로세서는,
상기 SEIR를 통해 특정 일자의 SEIR 변수 값을 예측하는 경우, 상기 특정 일자의 이전 N일의 이전 일자 그리고 상기 특정 일자의 이전 N일의 다음 일자의 각 SEIR 변수 값의 평균 증가율을 상기 특정 일자 이전 날짜의 상기 SEIR 변수 값에 곱하여 상기 특정 일자의 SEIR의 변수 값을 예측하는 감염병을 예측하는 시스템.
According to clause 8,
The deep learning model is,
Includes mathematical modeling SI, SIS, SIR, SIRS, SEIR, SEIRS, etc.
The processor,
When predicting the SEIR variable value of a specific date through the SEIR, the average increase rate of each SEIR variable value on the previous N days prior to the specific date and the date following the N days prior to the specific date is calculated as the average increase rate of the value of each SEIR variable on the date prior to the specific date. A system for predicting infectious diseases that predicts the SEIR variable value of the specific date by multiplying the SEIR variable value of .
제7항에 있어서,
상기 딥러닝 모델은,
상기 감염병 예측 모형을 구축시 염병 전파위험도 및 그 증감률과 감염병 발생, 사망 및 그 증감률 사이에 일정 시간의 lag time을 설정하는 감염병을 예측하는 시스템.
In clause 7,
The deep learning model is,
A system for predicting infectious diseases that sets a certain lag time between the risk of infectious disease transmission and its increase/decrease rate and the occurrence of infectious disease, death, and its increase/decrease rate when constructing the infectious disease prediction model.
KR1020210102578A 2021-08-04 2021-08-04 Method and system of predicting infectious diseases using big data and artificial intelligence KR102583585B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210102578A KR102583585B1 (en) 2021-08-04 2021-08-04 Method and system of predicting infectious diseases using big data and artificial intelligence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210102578A KR102583585B1 (en) 2021-08-04 2021-08-04 Method and system of predicting infectious diseases using big data and artificial intelligence

Publications (2)

Publication Number Publication Date
KR20230020779A KR20230020779A (en) 2023-02-13
KR102583585B1 true KR102583585B1 (en) 2023-10-05

Family

ID=85202703

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210102578A KR102583585B1 (en) 2021-08-04 2021-08-04 Method and system of predicting infectious diseases using big data and artificial intelligence

Country Status (1)

Country Link
KR (1) KR102583585B1 (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101960504B1 (en) * 2017-12-18 2019-07-15 세종대학교산학협력단 Apparatus and method for epidemic spread prediction modeling

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101244252B1 (en) * 2009-11-23 2013-03-25 한국과학기술정보연구원 Epidemiology simulation system and method
KR101976189B1 (en) 2018-06-07 2019-05-08 넥스엔정보기술(주) Method of providing analysis service of floating population

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101960504B1 (en) * 2017-12-18 2019-07-15 세종대학교산학협력단 Apparatus and method for epidemic spread prediction modeling

Also Published As

Publication number Publication date
KR20230020779A (en) 2023-02-13

Similar Documents

Publication Publication Date Title
CN110188331A (en) Model training method, conversational system evaluation method, device, equipment and storage medium
CN111260249B (en) Electric power communication service reliability assessment and prediction method and device based on LSTM and random forest mixed model
CN110516910A (en) Declaration form core based on big data protects model training method and core protects methods of risk assessment
WO2021081445A1 (en) System and method with federated learning model for geotemporal data associated medical prediction applications
Zheng et al. Investigation of model ensemble for fine-grained air quality prediction
CN110443185B (en) Driver identification method, driver identification device, electronic device, and storage medium
CN109740965A (en) A kind of engineering verification analysis method and device
CN111523570A (en) Smart city system based on community post house and control method thereof
Kashifi et al. Deep hybrid learning framework for spatiotemporal crash prediction using big traffic data
KR102583585B1 (en) Method and system of predicting infectious diseases using big data and artificial intelligence
Cascallar-Fuentes et al. Meta-heuristics for generation of linguistic descriptions of weather data: Experimental comparison of two approaches
Ye et al. Demand forecasting of online car‐hailing by exhaustively capturing the temporal dependency with TCN and Attention approaches
CN111523604A (en) User classification method and related device
CN112801360B (en) Taxi demand prediction method, system and equipment
CN113344290B (en) Method for correcting sub-season rainfall weather forecast based on U-Net network
Wang et al. Demand-responsive windows scheduling in tertiary hospital leveraging spatiotemporal neural networks
CN115116226A (en) Highway freight car flow prediction algorithm, software and device based on deep reinforcement learning model
Liu et al. Growth scale prediction of big data for information systems based on a deep learning SAEP method
Turukmane et al. Proper Weather Forecasting Internet of Things Sensor Framework with Machine Learning
CN111639786B (en) Resource allocation method, device, storage medium and computer equipment
CN116310391B (en) Identification method for tea diseases
CN118094368B (en) Bearing fault diagnosis method and device based on diffusion model and attention mechanism
Saini et al. A Weighted Ensemble Approach to Real-Time Prediction of Suspended Particulate Matter
CN112561128B (en) Method for predicting daily passenger capacity of conventional buses for future urban rail transit transfer
CN113744882B (en) Method, device, equipment and storage medium for determining target area

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right