KR102439038B1 - System and method for predicting fine dust and odor - Google Patents

System and method for predicting fine dust and odor Download PDF

Info

Publication number
KR102439038B1
KR102439038B1 KR1020190178098A KR20190178098A KR102439038B1 KR 102439038 B1 KR102439038 B1 KR 102439038B1 KR 1020190178098 A KR1020190178098 A KR 1020190178098A KR 20190178098 A KR20190178098 A KR 20190178098A KR 102439038 B1 KR102439038 B1 KR 102439038B1
Authority
KR
South Korea
Prior art keywords
air quality
prediction
prediction model
information
spatial
Prior art date
Application number
KR1020190178098A
Other languages
Korean (ko)
Other versions
KR20210086786A (en
Inventor
양재경
배성훈
김성태
Original Assignee
전북대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전북대학교산학협력단 filed Critical 전북대학교산학협력단
Priority to KR1020190178098A priority Critical patent/KR102439038B1/en
Publication of KR20210086786A publication Critical patent/KR20210086786A/en
Application granted granted Critical
Publication of KR102439038B1 publication Critical patent/KR102439038B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/02Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Environmental & Geological Engineering (AREA)
  • Quality & Reliability (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Sampling And Sample Adjustment (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 미세먼지 및 악취 농도 예측 시스템에 관한 것으로, 이는 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델; 및 예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 대기질 예측부를 포함하며, 상기 대기질 정보는 미세먼지 정보와 악취 정보로 구성되는 것을 특징으로 한다.The present invention relates to a fine dust and odor concentration prediction system, which includes: a time series prediction model for acquiring and outputting air quality prediction values corresponding to air quality information and weather information in a deep learning method; a spatial attribute-based prediction model for acquiring and outputting spatial variation values of the air quality information in units of regions through a geographic weighted regression model (GWR); a spatio-temporal prediction model for obtaining and outputting air quality final prediction values corresponding to outputs of the time series prediction model and the spatial property-based prediction model in a deep learning method; and when a prediction target area is selected, the air quality prediction value of the prediction target area and the spatial variation value of the air quality information are first obtained through the time series prediction model and the spatial attribute-based prediction model, and then through the spatio-temporal prediction model and an air quality prediction unit that finally obtains and outputs the final air quality prediction paper corresponding to the air quality prediction value and the spatial variation value of the air quality information, wherein the air quality information is characterized in that it consists of fine dust information and odor information.

Description

미세먼지 및 악취 예측 시스템 및 방법{System and method for predicting fine dust and odor}System and method for predicting fine dust and odor

본 발명은 대기질 측정소가 없는 지역의 대기질을 보다 정확하게 예측할 수 있도록 하며, 또한 미세먼지와 악취를 함께 분석 및 예측할 수 있는 새로운 방식의 미세먼지 및 악취 예측 시스템 및 방법에 관한 것이다. The present invention relates to a system and method for predicting fine dust and odor in a new way that can more accurately predict air quality in an area where there is no air quality measuring station, and can analyze and predict both fine dust and odor.

현재 기상 예측 분야에서 사용되고 있는 대부분의 대기질 예측 방법은 오염원, 지형, 풍향, 풍속 등을 고려하려 대기확산 모델을 기반으로 하고 있다. Most of the air quality prediction methods currently used in the field of weather forecasting are based on atmospheric diffusion models to consider pollution sources, topography, wind direction, and wind speed.

이런 부류의 모델은 오염원 발생 지점으로부터 대기 변화를 고려하여 예측을 하고 있어, 공간적인 특성에 따른 미세먼지, 악취 등의 예측치 변화를 반영하기에는 근본적인 한계가 존재한다. This type of model makes predictions in consideration of atmospheric changes from the point of occurrence of pollutants, so there is a fundamental limit to reflect changes in predicted values such as fine dust and odors according to spatial characteristics.

반면 최근에 기계 학습을 이용한 시계열 모델이 개발되고 있는데, 이 역시 공간 정보를 소홀히 다루고 있다는 점에서 비슷한 한계가 있다 할 수 있다. On the other hand, recently, time series models using machine learning have been developed, which also have similar limitations in that spatial information is neglected.

특히, 도시 지역의 경우, 인접 지역이라도 대기질에 확연한 차이가 발생할 가능성이 매우 커지게 된다. 예를 들어, 도 1 및 표 1에 도시된 바와 같이, 1km 정도 떨어진 두 개의 측정소(셀 12, 1)의 미세 먼지 PM10의 차이가 거의 2배이며, 바로 인접한 셀인 12와 22의 복합악취(OU : H2S, NH3, VOS의 가중 합)의 차이는 약 19배가 될 수 있음을 알 수 있다. In particular, in the case of an urban area, there is a very high possibility that a clear difference in air quality will occur even in adjacent areas. For example, as shown in Fig. 1 and Table 1, the difference in PM10 of fine dust at two measuring stations (cells 12 and 1) that are about 1 km apart is almost double, and the complex odor (OU) of cells 12 and 22, which are immediately adjacent, is : It can be seen that the difference between the weighted sum of H 2 S, NH3 and VOS) can be about 19 times.


Cell No.

Cell No.

PM2.5

PM2.5

PM10

PM10

OU

OU

2

2

52.53

52.53

311.67

311.67

0.02

0.02

12

12

50.74

50.74

*184.94

*184.94

*0.11

*0.11

22

22

49.82

49.82

127.66

127.66

*1.95

*1.95

13

13

87.84

87.84

*92.27

*92.27

0.06

0.06

41

41

57.21

57.21

147.15

147.15

0.03

0.03

46

46

62.49

62.49

90.05

90.05

2.20

2.20

74

74

42.80

42.80

117.83

117.83

0.00

0.00

80

80

51.05

51.05

134.66

134.66

0.01

0.01

이와 같이, 도시 지역에서의 대기질 농도는 공간적인 특성에 특히 많은 영향을 받음을 알 수 있다. 따라서 대기질 측정소가 없는 지역의 대기질 예측은 기본적으로 공간 정보를 반영해야할 필요가 있음을 추측할 수 있다. As such, it can be seen that the air quality concentration in an urban area is particularly greatly affected by spatial characteristics. Therefore, it can be inferred that it is necessary to basically reflect spatial information in the air quality prediction in an area where there is no air quality measurement station.

이에 상기와 같은 문제점을 해결하기 위한 것으로서, 본 발명은 대기질의 시계열 속성과 공간적 속성까지 함께 고려한 예측 동작을 수행할 수 있도록 하는 미세먼지 및 악취 예측 시스템 및 방법을 제공하고자 한다. Accordingly, in order to solve the above problems, the present invention is to provide a system and method for predicting fine dust and odors that can perform a prediction operation considering both the time series and spatial properties of air quality.

또한 미세먼지와 악취를 함께 분석 및 예측할 수 있도록 하는 미세먼지 및 악취 예측 시스템 및 방법을 제공하고자 한다. In addition, it is intended to provide a fine dust and odor prediction system and method that can analyze and predict both fine dust and odor.

본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The object of the present invention is not limited to the object mentioned above, and other objects not mentioned will be clearly understood by those of ordinary skill in the art from the following description.

상기 과제를 해결하기 위한 수단으로서, 본 발명의 일 실시 형태에 따르면 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델; 및 예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 대기질 예측부를 포함하며, 상기 대기질 정보는 미세먼지 정보와 악취 정보로 구성되는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템을 제공한다. As a means for solving the above problem, according to an embodiment of the present invention, a time series prediction model for acquiring and outputting air quality prediction values corresponding to air quality information and weather information in a deep learning method; a spatial attribute-based prediction model for acquiring and outputting spatial variation values of the air quality information in units of regions through a geographic weighted regression model (GWR); a spatio-temporal prediction model for obtaining and outputting air quality final prediction values corresponding to outputs of the time series prediction model and the spatial property-based prediction model in a deep learning method; and when a prediction target area is selected, the air quality prediction value of the prediction target area and the spatial variation value of the air quality information are first obtained through the time series prediction model and the spatial attribute-based prediction model, and then through the spatio-temporal prediction model An air quality prediction unit that finally acquires and outputs a final air quality prediction sheet corresponding to the air quality prediction value and the spatial variation value of the air quality information, wherein the air quality information is composed of fine dust information and odor information It provides a dust and odor concentration prediction system.

상기 미세먼지 및 악취 농도 예측 시스템은 상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 학습시킨 후, 이에 연속하여 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 추가 학습시키는 예측 모델 학습부를 더 포함하는 것을 특징으로 한다. The fine dust and odor concentration prediction system learns the correlation between the air quality information and the weather information and the air quality prediction value to the time series prediction model, and then continuously outputs the time series prediction model and the spatial property-based prediction model and It characterized in that it further comprises a prediction model learning unit for additionally learning the correlation between the air quality final prediction value to the spatio-temporal prediction model.

상기 시계열 예측모델은 순환신경망(RNN)의 LSTM(Long Short Term Memory)으로 구현되는 것을 특징으로 한다. The time series prediction model is characterized in that it is implemented as a Long Short Term Memory (LSTM) of a recurrent neural network (RNN).

상기 미세먼지 및 악취 농도 예측 시스템은 대기질 정보, 기상 정보 및 공간 정보를 지역 단위로 획득 및 저장하되, 공간 속성에 기반하여 지역 클러스터링을 수행한 후, 대기질 측정소를 통해 측정한 대기질 정보 및 기상 정보를 클러스터 단위로 공유하는 데이터 수집부를 더 포함하는 것을 특징으로 한다. The fine dust and odor concentration prediction system acquires and stores air quality information, meteorological information, and spatial information in units of regions, and after performing regional clustering based on spatial properties, air quality information measured through an air quality measuring station and It characterized in that it further comprises a data collection unit for sharing the weather information in units of clusters.

상기 과제를 해결하기 위한 수단으로서, 본 발명의 다른 실시 형태에 따르면 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 및 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델를 구비하는 앙상블 예측모델을 이용한 미세먼지 및 악취 농도 예측 방법은 상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 반복 학습시키고, 이와 동시에 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 반복 학습시키는 단계; 및 예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 단계를 포함할 수 있다. As a means for solving the above problem, according to another embodiment of the present invention, a time series prediction model for obtaining and outputting air quality prediction values corresponding to air quality information and weather information in a deep learning method; a spatial attribute-based prediction model for acquiring and outputting spatial variation values of the air quality information in units of regions through a geographic weighted regression model (GWR); And fine dust and odor concentration prediction method using an ensemble prediction model having a space-time prediction model that obtains and outputs final prediction values for air quality corresponding to the outputs of the time-series prediction model and the spatial property-based prediction model in a deep learning method The correlation between air quality information and weather information and the air quality prediction value is repeatedly learned in the time series prediction model, and at the same time, the correlation between the output of the time series prediction model and the spatial attribute-based prediction model and the air quality final prediction value is obtained in the space and time repeatedly learning the predictive model; and when a prediction target area is selected, the air quality prediction value of the prediction target area and the spatial variation value of the air quality information are first obtained through the time series prediction model and the spatial attribute-based prediction model, and then through the spatio-temporal prediction model It may include the step of finally obtaining and outputting the final predicted air quality corresponding to the air quality predicted value and the spatial variation value of the air quality information.

본 발명은 정확한 농도 예측을 위한 시계열 모델과 공간속성 기반 모델을 스택킹 구조로 결합한 앙상블 모델을 새롭게 제안하고, 이를 통해 대기질의 시계열 속성을 공간적 속성에 따라 보정한 후, 최종의 대기질 예측치를 획득 및 출력할 수 있도록 한다. 즉, 시계열 속성 뿐 아니라 공간 속성까지 충분히 고려한 대기질 변화 패턴을 예측할 수 있게 되고, 그 결과 대기질 측정소가 없는 지역의 대기질까지도 보다 정확하게 예측할 수 있도록 한다. The present invention newly proposes an ensemble model combining a time series model and a spatial property-based model for accurate concentration prediction in a stacking structure, and through this, the time series property of air quality is corrected according to the spatial property, and the final air quality prediction value is obtained and print it out. In other words, it is possible to predict air quality change patterns that sufficiently consider spatial properties as well as time series properties, and as a result, it is possible to more accurately predict air quality in areas without air quality measurement stations.

또한 본 발명에서는 또한 미세먼지와 악취도 함께 분석 및 예측할 수 있도록 함으로써, 보다 다양한 정보를 가지는 대기질 예측 정보를 획득 및 제공할 수도 있도록 한다. In addition, in the present invention, it is also possible to obtain and provide air quality prediction information having more diverse information by analyzing and predicting fine dust and odors together.

도 1은 도시 지역의 지역별로 상이해지는 대기질 측정 결과를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 미세먼지 및 악취 농도 예측 시스템을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 미세먼지 및 악취 농도 예측 방법의 개념을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 시계열 예측모델을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 지역별 대기질 및 기상 정보를 획득을 위한 지역 클러스터링 방법을 설명하기 위한 도면이다.
1 is a diagram for explaining air quality measurement results that are different for each region of an urban area.
2 is a view for explaining a system for predicting concentrations of fine dust and odors according to an embodiment of the present invention.
3 is a diagram for explaining the concept of a method for predicting concentrations of fine dust and odors according to an embodiment of the present invention.
4 is a diagram for explaining a time series prediction model according to an embodiment of the present invention.
5 is a diagram for explaining a regional clustering method for acquiring regional air quality and weather information according to an embodiment of the present invention.

이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.The following is merely illustrative of the principles of the invention. Therefore, those skilled in the art will be able to devise various devices that, although not explicitly described or shown herein, embody the principles of the present invention and are included within the spirit and scope of the present invention. Further, it is to be understood that all conditional terms and examples listed herein are, in principle, expressly intended solely for the purpose of enabling the concept of the present invention to be understood, and not limited to such specifically enumerated embodiments and states. should be

또한, 본 발명의 원리, 관점 및 실시예들 뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물뿐만 아니라 장래에 개발될 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다.Moreover, it is to be understood that all detailed description reciting the principles, aspects, and embodiments of the invention, as well as specific embodiments, are intended to cover structural and functional equivalents of such matters. It is also to be understood that such equivalents include not only currently known equivalents, but also equivalents developed in the future, i.e., all devices invented to perform the same function, regardless of structure.

따라서, 예를 들어, 본 명세서의 블럭도는 본 발명의 원리를 구체화하는 예시적인 회로의 개념적인 관점을 나타내는 것으로 이해되어야 한다. 이와 유사하게, 모든 흐름도, 상태 변환도, 의사 코드 등은 컴퓨터가 판독 가능한 매체에 실질적으로 나타낼 수 있고 컴퓨터 또는 프로세서가 명백히 도시되었는지 여부를 불문하고 컴퓨터 또는 프로세서에 의해 수행되는 다양한 프로세스를 나타내는 것으로 이해되어야 한다.Thus, for example, the block diagrams herein are to be understood as representing conceptual views of illustrative circuitry embodying the principles of the present invention. Similarly, all flowcharts, state transition diagrams, pseudo code, etc. may be tangibly embodied on a computer-readable medium and be understood to represent various processes performed by a computer or processor, whether or not a computer or processor is explicitly shown. should be

프로세서 또는 이와 유사한 개념으로 표시된 기능 블럭을 포함하는 도면에 도시된 다양한 소자의 기능은 전용 하드웨어뿐만 아니라 적절한 소프트웨어와 관련하여 소프트웨어를 실행할 능력을 가진 하드웨어의 사용으로 제공될 수 있다. 프로세서에 의해 제공될 때, 상기 기능은 단일 전용 프로세서, 단일 공유 프로세서 또는 복수의 개별적 프로세서에 의해 제공될 수 있고, 이들 중 일부는 공유될 수 있다.The functions of the various elements shown in the figures including a processor or functional blocks represented by similar concepts may be provided by the use of dedicated hardware as well as hardware having the ability to execute software in association with appropriate software. When provided by a processor, the functionality may be provided by a single dedicated processor, a single shared processor, or a plurality of separate processors, some of which may be shared.

또한 프로세서, 제어 또는 이와 유사한 개념으로 제시되는 용어의 명확한 사용은 소프트웨어를 실행할 능력을 가진 하드웨어를 배타적으로 인용하여 해석되어서는 아니되고, 제한 없이 디지털 신호 프로세서(DSP) 하드웨어, 소프트웨어를 저장하기 위한 롬(ROM), 램(RAM) 및 비 휘발성 메모리를 암시적으로 포함하는 것으로 이해되어야 한다. 주지관용의 다른 하드웨어도 포함될 수 있다.In addition, the clear use of terms presented as processor, control or similar concepts should not be construed as exclusively referring to hardware having the ability to execute software, and without limitation, digital signal processor (DSP) hardware, ROM for storing software. It should be understood to implicitly include (ROM), RAM (RAM) and non-volatile memory. Other common hardware may also be included.

본 명세서의 청구범위에서, 상세한 설명에 기재된 기능을 수행하기 위한 수단으로 표현된 구성요소는 예를 들어 상기 기능을 수행하는 회로 소자의 조합 또는 펌웨어/마이크로 코드 등을 포함하는 모든 형식의 소프트웨어를 포함하는 기능을 수행하는 모든 방법을 포함하는 것으로 의도되었으며, 상기 기능을 수행하도록 상기 소프트웨어를 실행하기 위한 적절한 회로와 결합된다. 이러한 청구범위에 의해 정의되는 본 발명은 다양하게 열거된 수단에 의해 제공되는 기능들이 결합되고 청구항이 요구하는 방식과 결합되기 때문에 상기 기능을 제공할 수 있는 어떠한 수단도 본 명세서로부터 파악되는 것과 균등한 것으로 이해되어야 한다.In the claims of the present specification, a component expressed as a means for performing the function described in the detailed description includes, for example, any form of software including a combination of circuit elements or firmware/microcode that performs the above function. It is intended to include all methods of performing the functions of the device, coupled with suitable circuitry for executing the software to perform the functions. Since the present invention defined by these claims is combined with the functions provided by the various enumerated means and in a manner required by the claims, any means capable of providing the functions are equivalent to those contemplated from the present specification. should be understood as

상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다. The above-described objects, features and advantages will become more apparent through the following detailed description in relation to the accompanying drawings, and accordingly, those of ordinary skill in the art to which the present invention pertains can easily implement the technical idea of the present invention. There will be. In addition, in the description of the present invention, when it is determined that a detailed description of a known technology related to the present invention may unnecessarily obscure the gist of the present invention, the detailed description thereof will be omitted.

도 2는 본 발명의 일 실시예에 따른 미세먼지 및 악취 농도 예측 시스템을 설명하기 위한 도면이다. 2 is a view for explaining a system for predicting concentrations of fine dust and odors according to an embodiment of the present invention.

도 2에 도시된 바와 같이, 본 발명의 시스템은 대기질의 시계열 속성을 예측하는 시계열 예측모델(111) 및 대기질의 공간 속성을 예측하는 공간속성 기반 예측모델(112)을 통해 두 개의 예측치를 생성한 후, 이들을 다시 시공간 예측모델(113)의 입력으로 사용하는 스택킹(stacking) 형태의 앙상블 예측 모델(110), 각 지역의 대기질 정보 및 기상 정보 이외에 공간 정보를 추가 획득 및 저장하는 데이터 수집부(120), 각 지역의 대기질 정보, 기상 정보, 및 공간 정보를 통해 시계열 예측모델(111)과 공간속성 기반 예측모델(112)을 동시 학습시키되, 이들의 출력값을 이용하여 시공간 예측모델(113)을 추가 훈련시키는 과정을 반복 수행하는 예측 모델 학습부(130), 및 예측 대상 지역이 선택되면, 예측 대상 지역의 대기질 정보, 기상 정보, 및 공간 정보를 통해 시계열 예측모델(111)과 공간속성 기반 예측모델(112), 그리고 시공간 예측모델(113)을 통해 순차 이용하여 대기질 최종 예측지를 획득 및 출력하는 대기질 예측부(140)로 구성된다. As shown in FIG. 2, the system of the present invention generates two prediction values through a time series prediction model 111 for predicting time series properties of air quality and a spatial property based prediction model 112 for predicting spatial properties of air quality. After that, the ensemble prediction model 110 of the stacking type that uses them as an input of the spatio-temporal prediction model 113 again, and a data collection unit that additionally acquires and stores spatial information in addition to air quality information and weather information of each region (120), the time-series prediction model 111 and the spatial property-based prediction model 112 are simultaneously trained through the air quality information, weather information, and spatial information of each region, and the spatial-temporal prediction model 113 using their output values ) when the prediction model learning unit 130 repeatedly performs the process of additional training, and the prediction target area is selected, the time series prediction model 111 and the space through air quality information, weather information, and spatial information of the prediction target area It consists of an attribute-based prediction model 112 and an air quality prediction unit 140 that acquires and outputs the final air quality prediction site by sequentially using the spatio-temporal prediction model 113 .

즉, 본 발명은 대기질의 시계열 속성을 예측하는 시계열 예측모델(111) 및 대기질의 공간 속성을 예측하는 공간속성 기반 예측모델(112)을 통해 두 개의 예측치를 생성한 후, 이들을 다시 시공간 예측모델(113)의 입력으로 사용하는 스택킹(stacking) 형태의 앙상블 예측 모델(110)을 구현하여, 대기질의 시계열 속성 뿐 아니라 공간 속성까지 고려한 대기질 예측 동작을 수행하도록 한다. That is, the present invention generates two prediction values through a time-series prediction model 111 for predicting time-series properties of air quality and a spatial-property-based prediction model 112 for predicting spatial properties of air quality, 113), the ensemble prediction model 110 of the stacking type is implemented to perform an air quality prediction operation considering not only the time series property of air quality but also the spatial property.

다시 말해, 본 발명은 도 3에서와 같이 대기질의 시계열 예측 방법과 지리적 가중 회귀모델을 이용한 공간속성 기반 예측 방법을 혼합하여, 대기 측정소가 없는 지역의 대기질 또한 정확하게 예측할 수 있도록 한다. In other words, the present invention mixes the air quality time series prediction method and the spatial attribute-based prediction method using a geographically weighted regression model as shown in FIG.

이하, 각 구성요소를 기능 및 동작을 보다 상세히 설명하면 다음과 같다. Hereinafter, the function and operation of each component will be described in more detail as follows.

시계열 예측모델(111)은 대기질 및 기상 정보에 대응되는 대기질 예측치(즉, 기상 정보에 따라 대기질 정보가 시간별로 변화하는 패턴)를 획득 및 출력하기 위한 것으로, 도 4에서와 같이, 입력층, 은닉층, 출력층으로 구성되는 순환신경망(Recurrent Neural Network, RNN)의 LSTM(Long Short Term Memory)으로 구현될 수 있다. The time series prediction model 111 is for obtaining and outputting air quality prediction values (that is, a pattern in which air quality information changes with time according to weather information) corresponding to air quality and weather information, and as shown in FIG. 4 , input It can be implemented as a Long Short Term Memory (LSTM) of a Recurrent Neural Network (RNN) composed of a layer, a hidden layer, and an output layer.

대기질 정보는 미세먼지 2종(PM2.5, PM10), 악취의 원인 물질인 황화수소(H2S), 암모니아(NH3), 휘발성 유기화합물(VOC)이라는 총 5개의 속성으로 정의되고, 기상 정보는 풍속 및 풍향이라는 총 2개의 속성으로 정의되는 것이 바람직하나, 이는 차후 실제의 적용예에서 다양하게 변화될 수 있음은 물론 당연하다. Air quality information is defined by a total of five properties: two types of fine dust (PM2.5, PM10), hydrogen sulfide (H 2 S), which is a odor-causing substance, ammonia (NH 3 ), and volatile organic compounds (VOC). It is preferable that the information is defined with a total of two attributes, namely wind speed and wind direction, but of course, this may be variously changed in practical applications in the future.

이에 표 2에서와 같이 입력층은 대기질 정보와 기상 정보를 입력받기 위한 7개의 노드들을 가지고, 출력층은 기상 정보를 제외한 대기질 예측치를 출력하기 위한 5개의 노드들을 가지고, 은닉층은 8개 또는 10개의 노드를 가질 수 있다. Accordingly, as shown in Table 2, the input layer has 7 nodes for receiving air quality information and weather information, the output layer has 5 nodes for outputting air quality forecasts excluding the weather information, and the hidden layer has 8 or 10 nodes. It can have multiple nodes.

그리고 입력층 및 은닉 노드 상태, 3가지 게이트, 출력층 각각의 활성 함수(activation function)로는 하이퍼볼릭탄젠트(tanh), 로지스틱 시그모이트(logistic sigmoid), 소프트맥스(softmax)가 적용되고, 에포크(Epoch) 및 미니 배치 사이즈(mini batch size)는 10과 100으로 설정될 수 있다. 다만, 한정 사항 또한 차후 실제의 적용예에서 다양하게 변화될 수 있음은 물론 당연하다. In addition, hyperbolic tangent (tanh), logistic sigmoid (logistic sigmoid), and softmax are applied as activation functions of the input layer and hidden node state, the three gates, and the output layer, respectively, and the epoch ) and mini batch size can be set to 10 and 100. However, it is of course natural that the limitations may also be variously changed in actual application examples in the future.

ParametersParameters DescriptionDescription No. of Inputs No. of Inputs 7 (PM2.5, PM10, H2S,NH3,WindDirection,WinSpeed) 7 (PM2.5, PM10, H 2 S,NH 3 ,WindDirection,WinSpeed) No. of hidden nodesNo. of hidden nodes 1010 No. of output nodesNo. of output nodes 55 Input activation functionInput activation function tanhtanh Gate activation functionGate activation function logistic sigmoidlogistic sigmoid Hidden state activation functionHidden state activation function tanhtanh Output activation functionOutput activation function softmaxsoftmax Mini batch sizeMini batch size 100100 No. of epochsNo. of epochs 1010

공간속성 기반 예측모델(112)은 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하기 위한 것으로, 이는 공간적 변이를 분석하는 회귀모형의 하나인 지리적 가중 회귀모델(GWR)로 구현될 수 있다. The spatial attribute-based prediction model 112 is for acquiring and outputting spatial variation values of air quality information in units of regions, which can be implemented as a geographically weighted regression model (GWR), which is one of the regression models that analyze spatial variation. .

지리적 가중 회귀분석의 핵심은 회귀계수를 상수가 아니라 위치의 함수로 간주하는 것이다. 즉, 회귀계수가 모든 지역에서 동일한 것이 아니라 공간적 위치에 따라 달라지도록 모형화하는 것이다. 알려진 어떤 위치(ui, vi)에 대해 종속변수 y와 j개의 독립변수 x가 있고, 회귀계수와 오차항이 각각 β, ε인 경우, 회귀식은 수학식1과 같이 표현될 수 있다. The key to geographic weighted regression is to treat the regression coefficients as a function of location, not a constant. In other words, the regression coefficient is not the same in all regions, but is modeled so that it varies according to spatial location. When there are y dependent variables and j independent variables x for a known position (u i , v i ), and the regression coefficients and error terms are β and ε, respectively, the regression equation can be expressed as Equation 1.

Figure 112019135589881-pat00001
Figure 112019135589881-pat00001

이때, yi는 i번째 지역의 종속 변수, xij는 i번째 지역에서의 j번째 설명 변수, (ui, vi)는 i번째 지역의 공간좌표, β0(ui, vi)는 절편계수, βj(ui, vi)는 i번째 지역의 j번째 회귀계수이다.Here, y i is the dependent variable of the i-th region, x ij is the j-th explanatory variable in the i-th region, (u i , v i ) is the spatial coordinate of the i-th region, and β 0 (u i , v i ) is The intercept coefficient, β j (u i , v i ) is the j-th regression coefficient of the i-th region.

최소제곱추정모델과 달리 해당 모델의 특징은 지역적으로 개별 회귀계수를 추정함으로써 지역적 영향력을 파악할 수 있다는 장점이 있다. 해당 모형의 회귀계수를 추정하기 위해서는 지리적 위치 i 지역을 기준으로 거리가 가까울수록 거리가 먼 곳 보다 공간적으로 더 많은 영향을 받는 것을 가정으로 한다. 따라서 회귀계수

Figure 112019135589881-pat00002
의 추정은 다음의 수학식2로 계산되어진다.Unlike the least-squares estimation model, the characteristic of this model is that it can identify regional influences by estimating individual regression coefficients locally. In order to estimate the regression coefficient of the model, it is assumed that the closer the distance to the geographic location i is, the more spatially it is affected than the farther away. Therefore, the regression coefficient
Figure 112019135589881-pat00002
Estimation of is calculated by Equation 2 below.

Figure 112019135589881-pat00003
Figure 112019135589881-pat00003

이때, 지리적 가중치 행렬 W의 각 요소는 가중함수인 커널(kernel)에 따라 계산된다.In this case, each element of the geographic weight matrix W is calculated according to a kernel that is a weight function.

커널은 다양한 형태를 취할 수 있지만 일반적으로 가우스 형태인 수학식3이 사용된다. The kernel may take various forms, but Equation 3, which is generally a Gaussian form, is used.

Figure 112019135589881-pat00004
Figure 112019135589881-pat00004

이때, 공간좌표(ui, vi)에서 측정치 i에 대한 가중치, di,(ui, vi)는 측정치 i와 공간좌표(ui, vi)간의 거리, h는 대역폭이다. At this time, in spatial coordinates (u i , v i ), the weight, d i , (u i , v i ) for the measured value i is the distance between the measured value i and the spatial coordinates (u i , v i ), and h is the bandwidth.

커널은 가중치를 만드는 대역폭(Bandwidth)이 고정되어있는 고정방식(Fixed spatial kernel)과 측정치의 수에 따라 다른 대역폭을 적용하는 가변방식(Adaptive spatial kernel)이 있다. 측정치가 조사지역에 규칙적으로 분포할 경우 고정방식을 사용하고, 조사지역 주위에 측정치의 분포가 다양할 경우는 가변방식을 사용한다. 그러나 이에 대한 판단이 확실치 않을 경우, 대개 가변방식을 채택한다. 또한, 적정 대역폭을 설정하기 위해 AIC(Akaike Information Criterion) 또는 CV(Cross Validation)가 사용되는데, 측정치과 추정치의 차이 및 모형의 복합성을 고려하는 AIC방식이 선호된다.The kernel has a fixed method (Fixed spatial kernel) in which the bandwidth for creating weights is fixed and a variable method (Adaptive spatial kernel) in which a different bandwidth is applied according to the number of measurements. When the measured values are regularly distributed in the survey area, the fixed method is used, and when the distribution of the measured values around the survey area is varied, the variable method is used. However, when the judgment is not certain, the variable method is usually adopted. In addition, AIC (Akaike Information Criterion) or CV (Cross Validation) is used to set the appropriate bandwidth, and the AIC method considering the difference between the measured value and the estimated value and the complexity of the model is preferred.

지리적 가중 회귀모델의 입력 변수는 표 3과 같이 공간 속성과 대기질 측정치인 것이 바람직하고, m개의 대기질 정보에 대해 각각 모델을 생성하였다. It is preferable that the input variables of the geographic weighted regression model are spatial properties and air quality measurements as shown in Table 3, and each model was created for m pieces of air quality information.

지역별로 수집 가능한 공간속성은 공장 수, 공사 중 건수, 건물 수, 건물의 평균 면적, 녹지 면적, 공원 면적, 거주지 면적, 상업지구 면적, 도로 길이, 도로 넓이, 교차로 수, 거주 인구 수 등이 있을 수 있으나, 본 발명은 공간속성 데이터와 대기질 측정치를 이용한 상관분석기반의 속성선택 방법(Correlation Based Feature Selection)을 적용함으로써, 최종적으로 5개의 변수를 선택해 사용하였다.The spatial attributes that can be collected by region include the number of factories, the number of cases under construction, the number of buildings, the average building area, green area, park area, residential area, commercial district area, road length, road width, number of intersections, number of residents, etc. However, in the present invention, by applying a correlation-based feature selection method using spatial attribute data and air quality measurements, five variables were finally selected and used.

즉, 본 발명의 지리적 가중 회귀모델(GWR)는 각 지역의 공간정보와 대기질 정보를 입력받아, 각 지역의 공간 속성을 고려한 대기질 정보의 공간적 변이값을 획득 및 출력하도록 한다. That is, the geographic weighted regression model (GWR) of the present invention receives spatial information and air quality information of each region, and obtains and outputs spatial variation values of air quality information in consideration of spatial properties of each region.

AttributesAttributes MeanMean MinMin MaxMax Standard DeviationStandard Deviation Green Zone SizeGreen Zone Size 109310109310 00 250000250000 9846998469 Residential Area SizeResidential Area Size 1610716107 00 132301132301 3173331733 Road LengthRoad Length 11851185 00 49084908 11171117 Averaged Road WidthAverage Road Width 1422914229 00 4925949259 1282512825 Residential PopulationResidential Population 430430 00 39773977 906906

시공간 예측모델(113)은 딥 러닝 방식으로 시계열 예측모델과 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하기 위한 것으로, 시계열 예측모델(111)과 공간속성 기반 예측모델(112)의 결과를 시간 단위로 데이터를 생성한 후 다시 LSTM 모델의 입력값으로 사용해 최종 대기질 예측치를 산출한다.The spatio-temporal prediction model 113 is for acquiring and outputting air quality final prediction values corresponding to the outputs of the time-series prediction model and the spatial property-based prediction model in a deep learning method, and the time-series prediction model 111 and the spatial property-based prediction model After generating data in units of time, the result of (112) is used again as an input value for the LSTM model to calculate the final air quality forecast.

시공간 예측모델(113) 또한 순환신경망의 LSTM로 구현되나, 입력 노드 수는 시계열 모델의 출력 값 m개, 공간속성 기반 예측모델의 출력 값 m개로 구성된 2ㅧm개가 되며 은닉 노드는 2ㅧl개로 구성되며, 나머지 파라메타는 앞서 설명된 표1와 동일하게 설정될 수 있다. 이 모델(113)은 시간 및 일 단위의 예측치를 생성 및 제공할 수 있으나, 이에 한정되지는 않는다. The spatiotemporal prediction model 113 is also implemented as an LSTM of a recurrent neural network, but the number of input nodes is 2xm, consisting of m output values of the time series model and m output values of the spatial property-based prediction model, and the number of hidden nodes is 2xl. configured, and the remaining parameters may be set to be the same as in Table 1 described above. The model 113 can generate and provide forecasts in hours and days, but is not limited thereto.

데이터 수집부(120)는 대기질 정보, 기상 정보 및 공간 정보를 지역 단위로 획득하고 저장 관리하도록 한다. 즉, 분석 대상 지역 전체를 다수의 지역으로 분할한 후, 지역 단위로 대기질 및 기상 정보, 공간속성 정보를 각각 획득 및 저장하도록 한다. The data collection unit 120 acquires, stores, and manages air quality information, weather information, and spatial information in units of regions. That is, after the entire analysis target region is divided into a plurality of regions, air quality and weather information and spatial attribute information are respectively acquired and stored in units of regions.

다만, 다수의 지역 모두에 대기질 측정소를 설치하여, 다수의 지역 각각의 대기질 및 기상 정보를 직접 획득하는 것은 현실적으로 불가능한 문제가 발생한다. However, it is practically impossible to directly acquire air quality and meteorological information for each of a plurality of regions by installing air quality measuring stations in all of a plurality of regions.

이에 본 발명에서는 도 5에서와 같이 대기질 측정소의 공간 속성과 나머지 셀 영역의 공간 속성들을 비교 분석하여, 유사 공간 특성을 가지는 셀 영역들을 동일 그룹으로 클러스터링한 후, 대기질 측정소의 측정값을 클러스터 단위(빨간, 초록, 노란, 파란)로 공유할 수 있도록 한다. 즉, 대기질 측정소가 없는 셀 영역은 자신과 유사한 공간 특성을 가지는 셀 영역에 설치된 대기질 측정소의 측정치를 공유받아 이용할 수 있도록 한다. Accordingly, in the present invention, as shown in FIG. 5 , the spatial properties of the air quality measuring station and the spatial properties of the remaining cell areas are compared and analyzed, the cell areas having similar spatial characteristics are clustered into the same group, and then the measured values of the air quality measuring station are clustered. Allow sharing in units (red, green, yellow, blue). That is, a cell area without an air quality measurement station can receive and use the measurement value of an air quality measurement station installed in a cell area having spatial characteristics similar to itself.

이때, 클러스터링은 K-means 방식으로 수행되며, 엘보우 기법(Elbow)을 알고리즘을 통해 클러스터 수가 결정 및 조정될 수 있으나, 이에 한정될 필요는 없다.In this case, clustering is performed in a K-means method, and the number of clusters may be determined and adjusted through an Elbow algorithm, but is not limited thereto.

예측 모델 학습부(130)는 시계열 예측모델(111) 및 공간속성 기반 예측모델(112)을 1차 훈련시킨 후, 이들의 출력값을 이용하여 시공간 예측모델(113)을 추가 훈련시키는 일련의 과정을 반복 수행함으로써, 앙상블 예측모델(110)이 대기질 정보와 기상 정보 이외에 공간 정보까지 추가 고려한 대기질 예측 동작을 수행될 수 있도록 한다. The predictive model learning unit 130 first trains the time series predictive model 111 and the spatial attribute-based predictive model 112, and then performs a series of processes of additionally training the space-time predictive model 113 using their output values. By iteratively performing, the ensemble prediction model 110 can perform an air quality prediction operation that additionally considers spatial information in addition to air quality information and weather information.

보다 상세하게는, 먼저 예측 모델 학습부(130)는 데이터 수집부(120)에 저장된 정보에 기반하여 대기질 정보 및 기상 정보를 입력 조건으로 가지고 대기질 예측치를 출력 조건으로 가지는 1차 학습 데이터를 다수개 생성하도록 한다. More specifically, first, the predictive model learning unit 130 receives primary learning data having air quality information and weather information as input conditions and air quality prediction values as output conditions based on the information stored in the data collection unit 120 . Create multiple.

그리고 1차 학습 데이터를 통해 시계열 예측모델(111)을 반복 학습함과 동시에 시계열 예측모델(111)에 제공되는 대기질 정보 또한 공간속성 기반 예측모델(112)에도 동시 제공함으로써, 시계열 예측모델(111)의 출력값에 대응되는 대기질 정보의 공간적 변이값을 또한 동시 획득하도록 한다. And by repeatedly learning the time series prediction model 111 through the primary learning data and simultaneously providing the air quality information provided to the time series prediction model 111 to the spatial property-based prediction model 112, the time series prediction model 111 ) to simultaneously acquire the spatial variation value of air quality information corresponding to the output value of .

그리고 시계열 예측모델(111)의 대기질 예측치와 공간속성 기반 예측모델(112)의 대기질 정보의 공간적 변이값을 입력 조건으로 가지고, 대기질 최종 예측치를 출력 조건으로 가지는 2차 학습 데이터를 추가 생성하고, 이들을 통해 시공간 예측모델(113)을 반복적으로 기계 학습시키도록 한다. In addition, secondary learning data having the air quality prediction value of the time series prediction model 111 and the spatial variation value of the air quality information of the spatial attribute-based prediction model 112 as input conditions, and the final air quality prediction value as output conditions are additionally generated and to repeatedly machine-lear the spatiotemporal prediction model 113 through these.

그리고 시공간 예측모델(113)의 출력 편차가 기 설정값 이하로 수렴되면, 예측 모델 학습을 종료하도록 한다. And when the output deviation of the spatiotemporal prediction model 113 converges to less than or equal to a preset value, the prediction model learning is terminated.

예측부(140)는 다수의 지역 중 어느 하나가 예측 대상 지역으로 결정되면, 데이터 수집부(120)를 통해 예측 대상 지역의 현재 대기질 정보 및 기상 정보, 그리고 공간속성 정보를 획득하도록 한다. When any one of a plurality of regions is determined as a prediction target region, the prediction unit 140 acquires current air quality information, weather information, and spatial attribute information of the prediction target region through the data collection unit 120 .

이때, 예측 대상 지역에 대기질 측정소가 존재하는 경우에는, 해당 대기질 측정소의 대기질 정보 및 기상 정보를 이용하되, 대기질 측정소가 존재하지 않는 경우에는 예측 대상 지역이 속한 클러스터에 존재하는 대기질 측정소의 측정치를 공유받아 이용할 수 있도록 한다. At this time, if there is an air quality measuring station in the prediction target area, air quality information and weather information of the corresponding air quality measuring station are used, but if there is no air quality measuring station, the air quality present in the cluster to which the prediction target area belongs Make it possible to share and use the measurement values of the measuring stations.

그리고 대기질 정보 및 기상 정보는 시계열 예측모델(111)에 입력하고, 대기질 정보 및 공간속성 정보는 공간속성 기반 예측모델(112)에 입력하여, 시계열 예측모델(111) 및 공간속성 기반 예측모델(112)을 통해서 대기질 예측치와 대기질 정보의 공간적 변이값을 동시 획득하도록 한다. Then, air quality information and weather information are input to the time series prediction model 111, and air quality information and spatial property information are input to the spatial property based prediction model 112, and the time series prediction model 111 and the spatial property based prediction model Through (112), the air quality prediction value and the spatial variation value of air quality information are simultaneously acquired.

그리고 대기질 예측치와 대기질 정보의 공간적 변이값을 다시 시공간 예측모델(113)에 입력함으로써, 시공간 예측모델(113)이 대기질 정보, 기상 정보 및 공간 정보 모두를 고려한 대기질 최종 예측치를 획득 및 출력하도록 한다. And by inputting the spatial variation value of the air quality prediction value and the air quality information back into the spatio-temporal prediction model 113, the spatio-temporal prediction model 113 obtains the final air quality prediction value considering all of the air quality information, weather information and spatial information, and to output.

상술한 본 발명에 따른 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.The method according to the present invention described above may be produced as a program to be executed by a computer and stored in a computer-readable recording medium. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape. , a floppy disk, an optical data storage device, and the like, and also includes those implemented in the form of a carrier wave (eg, transmission through the Internet).

컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.The computer-readable recording medium is distributed in a network-connected computer system, so that the computer-readable code can be stored and executed in a distributed manner. In addition, functional programs, codes, and code segments for implementing the method can be easily inferred by programmers in the art to which the present invention pertains.

이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.In the above, preferred embodiments of the present invention have been illustrated and described, but the present invention is not limited to the specific embodiments described above, and it is common in the technical field to which the present invention pertains without departing from the gist of the present invention as claimed in the claims. Various modifications may be made by those having the knowledge of, of course, and these modifications should not be individually understood from the technical spirit or perspective of the present invention.

Claims (5)

딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델;
지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 및
딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델;
예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 대기질 예측부를 포함하며,
상기 대기질 정보는
미세먼지 정보와 악취 정보로 구성되는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
a time series prediction model for acquiring and outputting air quality information and air quality prediction values corresponding to weather information in a deep learning method;
a spatial attribute-based prediction model for acquiring and outputting spatial variation values of the air quality information in units of regions through a geographic weighted regression model (GWR); and
a spatio-temporal prediction model for obtaining and outputting air quality final prediction values corresponding to outputs of the time series prediction model and the spatial property-based prediction model in a deep learning method;
When a prediction target area is selected, the air quality prediction value of the prediction target area and the spatial variation value of air quality information are first obtained through the time series prediction model and the spatial property-based prediction model, and then the air quality through the spatiotemporal prediction model It includes an air quality prediction unit that finally acquires and outputs the air quality final prediction corresponding to the quality prediction value and the spatial variation value of air quality information,
The air quality information
Fine dust and odor concentration prediction system, characterized in that it consists of fine dust information and odor information.
제1항에 있어서,
상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 학습시킨 후, 이에 연속하여 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 추가 학습시키는 예측 모델 학습부를 더 포함하는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
According to claim 1,
After learning the correlation between the air quality information and the weather information and the air quality prediction value in the time series prediction model, the correlation between the output of the time series prediction model and the spatial attribute-based prediction model and the final air quality prediction value is continuously performed. Fine dust and odor concentration prediction system, characterized in that it further comprises a prediction model learning unit for additionally learning the spatiotemporal prediction model.
제2항에 있어서, 상기 시계열 예측모델은
순환신경망(RNN)의 LSTM(Long Short Term Memory)으로 구현되는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
The method of claim 2, wherein the time series prediction model is
A system for predicting the concentration of fine dust and odors, characterized in that it is implemented as a LSTM (Long Short Term Memory) of a recurrent neural network (RNN).
제2항에 있어서,
대기질 정보, 기상 정보 및 공간 정보를 지역 단위로 획득 및 저장하되, 공간 속성에 기반하여 지역 클러스터링을 수행한 후, 대기질 측정소를 통해 측정한 대기질 정보 및 기상 정보를 클러스터 단위로 공유하는 데이터 수집부를 더 포함하는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
3. The method of claim 2,
Data that acquires and stores air quality information, meteorological information, and spatial information in units of regions, but performs regional clustering based on spatial attributes, and shares air quality information and meteorological information measured through air quality measurement stations in cluster units Fine dust and odor concentration prediction system, characterized in that it further comprises a collection unit.
딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 및 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델를 구비하는 앙상블 예측모델을 이용한 미세먼지 및 악취 농도 예측 방법에 있어서,
상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 반복 학습시키고, 이와 동시에 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 반복 학습시키는 단계; 및
예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 단계를 포함하는 미세먼지 및 악취 농도 예측 방법.
a time series prediction model for acquiring and outputting air quality information and air quality prediction values corresponding to weather information in a deep learning method; a spatial attribute-based prediction model for acquiring and outputting spatial variation values of the air quality information in units of regions through a geographic weighted regression model (GWR); And fine dust and odor concentration prediction method using an ensemble prediction model having a spatio-temporal prediction model for obtaining and outputting air quality final prediction values corresponding to the outputs of the time series prediction model and the spatial property-based prediction model in a deep learning method ,
The correlation between the air quality information and weather information and the air quality prediction value is repeatedly learned in the time series prediction model, and at the same time, the correlation between the output of the time series prediction model and the spatial attribute-based prediction model and the final air quality prediction value is repeatedly learning the spatiotemporal prediction model; and
When a prediction target area is selected, the air quality prediction value of the prediction target area and the spatial variation value of air quality information are first obtained through the time series prediction model and the spatial property-based prediction model, and then the air quality through the spatiotemporal prediction model A method for predicting the concentration of fine dust and odors, comprising the step of finally acquiring and outputting a final predicted air quality corresponding to the quality prediction value and the spatial variation value of air quality information.
KR1020190178098A 2019-12-30 2019-12-30 System and method for predicting fine dust and odor KR102439038B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190178098A KR102439038B1 (en) 2019-12-30 2019-12-30 System and method for predicting fine dust and odor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190178098A KR102439038B1 (en) 2019-12-30 2019-12-30 System and method for predicting fine dust and odor

Publications (2)

Publication Number Publication Date
KR20210086786A KR20210086786A (en) 2021-07-09
KR102439038B1 true KR102439038B1 (en) 2022-09-02

Family

ID=76865184

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190178098A KR102439038B1 (en) 2019-12-30 2019-12-30 System and method for predicting fine dust and odor

Country Status (1)

Country Link
KR (1) KR102439038B1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102537964B1 (en) * 2021-09-06 2023-05-30 인하대학교 산학협력단 Ensemble Prediction Method and Apparatus of Disaster Propagation Area Using Machine Learning Models for Elementary Structural Components in Indoor Disaster Environments
KR102374002B1 (en) * 2021-10-08 2022-03-15 주식회사 에어핏 Device, method and program for measuring fine dust concentration through satellite imagery
KR20230123574A (en) 2022-02-16 2023-08-24 경희대학교 산학협력단 Transfer learning driven sequential forecasting and ventilation control of PM2.5 associated health risk levels in underground public facilities
KR102642421B1 (en) * 2022-12-30 2024-02-28 건국대학교 산학협력단 Apparatus and method for air quality modeling based on artificial intelligence
CN117196109B (en) * 2023-09-15 2024-04-05 中煤科工集团重庆研究院有限公司 Underground coal mine dust concentration prediction correction method based on multi-source information fusion

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101610595B1 (en) 2015-07-16 2016-04-07 김승우 Expedient Storm Surges Prediction System and Method
WO2018214060A1 (en) 2017-05-24 2018-11-29 北京质享科技有限公司 Small-scale air quality index prediction method and system for city
KR101945314B1 (en) 2018-07-27 2019-04-17 딥클라우드 주식회사 Decreasing Device of Particulate Matter Using Particulate Matter Predictive Module Based on Artificial Intelligence

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190030403A (en) * 2017-09-14 2019-03-22 주식회사 케이티 Apparatus for predicting shipment of crops based on price and cost and method thereof
KR102042165B1 (en) * 2018-01-29 2019-11-07 성균관대학교산학협력단 Method and apparatus for predicting particulate matter concentrations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101610595B1 (en) 2015-07-16 2016-04-07 김승우 Expedient Storm Surges Prediction System and Method
WO2018214060A1 (en) 2017-05-24 2018-11-29 北京质享科技有限公司 Small-scale air quality index prediction method and system for city
KR101945314B1 (en) 2018-07-27 2019-04-17 딥클라우드 주식회사 Decreasing Device of Particulate Matter Using Particulate Matter Predictive Module Based on Artificial Intelligence

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
이종영 외 3인, "미세먼지, 악취 농도 예측을 위한 앙상블 방법", J. Soc. Korea Ind. Syst. Eng Vol. 42, No. 4 : 203-210 (2019.12.16)*

Also Published As

Publication number Publication date
KR20210086786A (en) 2021-07-09

Similar Documents

Publication Publication Date Title
KR102439038B1 (en) System and method for predicting fine dust and odor
Seyedzadeh et al. Tuning machine learning models for prediction of building energy loads
Nutkiewicz et al. Data-driven Urban Energy Simulation (DUE-S): A framework for integrating engineering simulation and machine learning methods in a multi-scale urban energy modeling workflow
Luo et al. An algorithm for traffic flow prediction based on improved SARIMA and GA
Velo et al. Wind speed estimation using multilayer perceptron
Dutot et al. A 24-h forecast of ozone peaks and exceedance levels using neural classifiers and weather predictions
Augustin et al. The role of simulation in modelling spatially correlated data
Kocabas et al. Bayesian networks and agent-based modeling approach for urban land-use and population density change: a BNAS model
Jia et al. Bootstrapped artificial neural networks for synthetic flow generation with a small data sample
Ghosh et al. Modeling uncertainty resulting from multiple downscaling methods in assessing hydrological impacts of climate change
Körner et al. Introducing Gradient Boosting as a universal gap filling tool for meteorological time series
Chari et al. Building energy performance prediction using neural networks
Amirabadizadeh et al. Downscaling daily precipitation and temperatures over the Langat River Basin in Malaysia: a comparison of two statistical downscaling approaches
Lark Multi-objective optimization of spatial sampling
Van Doren et al. Automated acoustic monitoring captures timing and intensity of bird migration
Parishwad et al. Investigating machine learning for simulating urban transport patterns: A comparison with traditional macro-models
CN117993305B (en) Dynamic evaluation method for river basin land utilization and soil erosion relation
Pahlavani et al. Evaluation of residential land use compatibilities using a density-based IOWA operator and an ANFIS-based model: A case study of Tehran, Iran
Zhao et al. LandSys II: Agent-based land use–forecast model with artificial neural networks and multiagent model
Haviluddin et al. Comparing of ARIMA and RBFNN for short-term forecasting
Al-Ahmadi et al. A fuzzy cellular automata urban growth model (FCAUGM) for the city of Riyadh, Saudi Arabia. Part 1: Model structure and validation
Mezhoud et al. Hybrid Kriging and multilayer perceptron neural network technique for coverage prediction in cellular networks
Fallah-Ghalhary et al. Spring rainfall prediction based on remote linkage controlling using adaptive neuro-fuzzy inference system (ANFIS)
Fekih et al. On the regression and assimilation for air quality mapping using dense low-cost wsn
Aman et al. Influence-driven model for time series prediction from partial observations

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant