KR102218734B1 - 인공지능 기반 환경유해인자 고해상도 데이터 보간방법 - Google Patents

인공지능 기반 환경유해인자 고해상도 데이터 보간방법 Download PDF

Info

Publication number
KR102218734B1
KR102218734B1 KR1020200060542A KR20200060542A KR102218734B1 KR 102218734 B1 KR102218734 B1 KR 102218734B1 KR 1020200060542 A KR1020200060542 A KR 1020200060542A KR 20200060542 A KR20200060542 A KR 20200060542A KR 102218734 B1 KR102218734 B1 KR 102218734B1
Authority
KR
South Korea
Prior art keywords
data
environmental hazard
prediction
environmental
spatial information
Prior art date
Application number
KR1020200060542A
Other languages
English (en)
Inventor
이헌주
주재걸
Original Assignee
켐아이넷(주)
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 켐아이넷(주), 한국과학기술원 filed Critical 켐아이넷(주)
Priority to KR1020200060542A priority Critical patent/KR102218734B1/ko
Application granted granted Critical
Publication of KR102218734B1 publication Critical patent/KR102218734B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/10Devices for predicting weather conditions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Abstract

본 발명의 일 실시예에 따른 인공지능 기반 환경유해인자 고해상도 데이터 보간방법은, 예측 모델 생성장치(40)에서 측정 노드(10)가 하나 이상 설치된 측정지점(A) 또는 측정 노드(10)가 미설치된 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터와 공간 정보 데이터를 정규화 및 인코딩한 입력 데이터로부터 예측 데이터를 생성하는 복수의 예측 모델을 생성한 후, 환경유해인자 데이터가 측정된 별도의 측정지점에 대해 적용되는 평가 기법으로 복수의 예측 모델을 평가하여 복수의 예측 모델 중 별도의 측정지점의 환경유해인자 데이터의 실제 값과 예측 값의 오차 정도가 가장 작은 예측 모델을 최종 예측 모델로 확정하는 훈련 단계(S100); 및 훈련 단계(S100) 후, 예측 모델 생성장치(40)가 최종 예측 모델을 통해 측정지점(A) 또는 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터와 공간 정보 데이터를 정규화 및 인코딩한 입력 데이터로부터 예측 데이터를 생성하며, 계산장치(50)가 예측 데이터를 고해상도의 최종 예측 데이터로 보간하는 보간 단계(S200);를 포함하되, 측정지점(A)의 환경유해인자 데이터는 환경유해인자의 농도가 미측정된 결측 데이터가 하나 이상 존재하고, 미측정지점(B)의 환경유해인자 데이터는 모든 데이터가 결측 데이터이다.

Description

인공지능 기반 환경유해인자 고해상도 데이터 보간방법{Artificial intelligence-based interpolation method of high-resolution data}
본 발명은 인공지능 기반 환경유해인자 고해상도 데이터 보간방법에 관한 것으로, 보다 상세하게는 미세먼지 등의 환경유해인자에 대한 인근 측정 노드들의 저해상도 데이터를 이용하여 다른 노드의 미측정 또는 결측 데이터를 고해상도 데이터로 보간하는 방법에 관한 것이다.
고전적인 접근으로 미세먼지 등 환경유해인자의 공기질과 관련된 저해상도의 공간 격자(Spatial grid)에서 측정된 데이터를 바탕으로 보다 고해상도로 예측하는 기술은 CMAQ(Community Multiscale Air Quality) 모델을 비롯한 Hybrid 모델링 등 다양한 대기 모델링 분야의 기법들이 제시되고 있으며, 현재까지도 연구 중에 있다.
또한, 최근 4차산업혁명의 도래로 인공지능 기술의 활용이 가속화됨에 따라, 딥러닝을 활용한 데이터 예측 기술에 대한 연구 및 시도가 지속적으로 이루어지고 있는 실정이다.
그러나 상기 딥러닝 기반의 데이터 예측 기술은 동시에 복수로 측정된 환경유해인자의 측정 데이터간 교화작용 또는 인접 공간의 노드간 상호작용을 활용한 보간 기술의 연구가 미흡한 실정이다.
더 나아가, 현재 미세먼지 등 환경유해인자의 국가 단위 측정망의 숫자는 비싼 설치비용의 문제로 제한적으로 설치되어 있으며, 다소 저렴한 센서 등 IoT 기반의 측정망 설치가 통신회사를 중심으로 최근 활발히 이루어지고 있으나, 이 또한 경제성의 문제로 미세 환경을 완벽히 이해하기에는 부족한 상황이다.
이에 따라, 기존 저해상도의 측정망 설치환경에서 보다 조밀한 지점을 고해상도로 예측하는 기술이 매우 중요하게 됐다.
그러나 기존의 측정망 설치환경에서 측정되지 않는 지역의 지점, 센서의 결함 또는 정전 등의 다양한 문제로 발생한 결측 데이터는 해당 데이터를 이용할 수 없거나 이용하기 어려우며, 종래 머신러닝 기반의 데이터 보간 기술은 공간적인 요소를 고려하지 않고 결측 데이터를 보간하거나, 아예 제외하는 방식으로 결측 데이터를 다루기 때문에 보간의 정확도가 낮고, 해당 데이터를 사용한 후속 작업에서의 활용도가 떨어지는 문제점이 있다.
일본 등록특허 제4908972호 미국 공개특허 제2019-0325334호 한국 등록특허 제10-1716111호
따라서, 본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로서, 공간적인 요소를 고려할 수 있는 딥러닝 기반의 예측 모델을 통해 결측 데이터가 존재하는 공기 중 환경유해인자 측정 노드의 데이터를 보간하는 방법을 제공하는데 목적이 있다.
또한, 본 발명은 환경유해인자간 교화작용 및 인접 공간의 영향력을 고려하여 기존 머신러닝 기반의 데이터 보간 기술에 비해 결측 데이터를 높은 정확도로 예측 가능한 인공지능 기반 환경유해인자 고해상도 데이터 보간방법을 제공하는데 목적이 있다.
다만, 본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기와 같은 목적을 달성하기 위한 기술적 방법으로서, 본 발명의 일 실시예에 따른 인공지능 기반 환경유해인자 고해상도 데이터 보간방법은, 예측 모델 생성장치(40)에서 측정 노드(10)가 하나 이상 설치된 측정지점(A) 또는 측정 노드(10)가 미설치된 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터와 공간 정보 데이터를 정규화 및 인코딩한 입력 데이터로부터 예측 데이터를 생성하는 복수의 예측 모델을 생성한 후, 환경유해인자 데이터가 측정된 별도의 측정지점에 대해 적용되는 평가 기법으로 복수의 예측 모델을 평가하여 복수의 예측 모델 중 별도의 측정지점의 환경유해인자 데이터의 실제 값과 예측 값의 오차 정도가 가장 작은 예측 모델을 최종 예측 모델로 확정하는 훈련 단계(S100); 및 훈련 단계(S100) 후, 예측 모델 생성장치(40)가 최종 예측 모델을 통해 측정지점(A) 또는 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터와 공간 정보 데이터를 정규화 및 인코딩한 입력 데이터로부터 예측 데이터를 생성하며, 계산장치(50)가 예측 데이터를 고해상도의 최종 예측 데이터로 보간하는 보간 단계(S200);를 포함하되, 측정지점(A)의 환경유해인자 데이터는 환경유해인자의 농도가 미측정된 결측 데이터가 하나 이상 존재하고, 미측정지점(B)의 환경유해인자 데이터는 모든 데이터가 결측 데이터이다.
또한, 예측 데이터는, 입력 데이터에 포함된 환경유해인자 데이터와, 예측 모델 또는 최종 예측 모델이 환경유해인자 데이터의 결측 데이터를 예측한 값으로 이루어진다.
그리고 최종 예측 데이터는, 계산장치(50)에서 예측 데이터의 반정규화를 통해 보간되어, 측정지점(A) 또는 미측정지점(B)의 실외 농도로 사용된다.
또한, 평가 기법은, MAE(Mean absolute error), RMSE(Root mean squared error) 및 MAPE(Mean absolute percentage error)를 적어도 포함한다.
그리고 훈련 단계(S100)는, 측정 노드(10)가 측정지점(A)의 환경유해인자 데이터를 측정하며, 입력장치(20)에 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터가 입력되는 단계(S110); 데이터 처리장치(30)가 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터를 각각 정규화한 후, 정규화된 환경유해인자 데이터와 공간 정보 데이터를 입력 데이터로 인코딩하는 단계(S120); 예측 모델 생성장치(40)가 기저장된 반복 신경망의 예측 모델 중 입력 데이터로부터 예측 데이터를 생성하기 위한 복수의 예측 모델을 생성하는 단계(S130); 예측 모델 생성장치(40)가 평가 기법으로 복수의 예측 모델의 성능을 평가하는 단계(S140); 및 예측 모델 생성장치(40)가 복수의 예측 모델 중 최종 예측 모델을 확정하는 단계(S150);를 포함한다.
또한, 보간 단계(S200)는, 측정 노드(10)가 측정지점(A)의 환경유해인자 데이터를 측정한 후 입력장치(20)에 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터가 입력되거나, 입력장치(20)에 미측정지점(B)의 환경유해인자 데이터와 공간 정보 데이터가 입력되는 단계(S210); 데이터 처리장치(30)가 입력장치(20)에 입력된 측정지점(A) 또는 미측정지점(B)의 환경유해인자 데이터와 공간 정보 데이터를 정규화한 후, 정규화된 환경유해인자 데이터와 공간 정보 데이터를 입력 데이터로 인코딩하는 단계(S220); 예측 모델 생성장치(40)에 최종 예측 모델이 적용되는 단계(S230); 및 예측 모델 생성장치(40)가 최종 예측 모델을 통해 입력 데이터로부터 예측 데이터를 생성한 후, 예측 데이터의 반정규화를 통해 고해상도의 최종 예측 데이터를 보간하고, 최종 예측 데이터가 데이터베이스(60)에 저장되는 단계(S240);를 포함한다.
그리고 데이터 처리장치(30)는, 환경유해인자 데이터와 공간 정보 데이터가 정규 분포를 따르도록 정규화하며, 원-핫 인코딩(One-Hot Encoding) 방식으로 환경유해인자의 결측 데이터에 임시 값을 채워 넣고, 딥러닝 기반의 예측 모델이 임시 값을 알 수 있도록, 정규화된 환경유해인자 데이터의 마스크 데이터와 정규화된 공간 정보 데이터의 마스크 데이터를 각각 생성한다.
또한, 데이터 처리장치(30)는, 임시 값에 해당되는 영역에 '1'의 값을 채워 넣고, 임시 값을 제외한 나머지 환경유해인자 데이터에 해당되는 영역에 '0'의 값을 채워 넣어 마스크 데이터를 생성한다.
그리고 데이터 처리장치(30)는, 정규화된 환경유해인자 데이터 및 정규화된 환경유해인자 데이터의 마스크 데이터와, 정규화된 공간 정보 데이터 및 정규화된 공간 정보 데이터의 마스크 데이터를 입력 데이터로 인코딩한다.
또한, 데이터 처리장치(30)는, 좌측으로부터 우측 방향을 기준으로 정규화된 환경유해인자 데이터, 정규화된 환경유해인자 데이터의 마스크 데이터, 정규화된 공간 정보 데이터 및 정규화된 공간 정보 데이터의 마스크 데이터로 정렬하여 입력 데이터를 생성한다.
본 발명의 일 실시예에 따르면, 딥러닝 기반의 예측 모델을 통해 공간적인 요소를 고려하여 결측 데이터가 존재하는 공기 중 환경유해인자 측정 노드의 데이터를 보간함으로써, 데이터의 활용도를 높일 수 있다.
또한, 본 발명의 일 실시예에 따르면, 환경유해인자간 교화작용 및 인접 공간 영향력을 고려하여 기존 머신러닝 기반의 데이터 보간 기술에 비해 결측 데이터를 높은 정확도로 예측해줌으로써, 데이터의 활용도를 높일 수 있다.
다만, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시예에 따른 보간시스템의 구성을 나타내는 블록도이다.
도 2는 결측 데이터가 보간된 측정지점 및 측정 노드 데이터를 예측할 미측정지점이 포함된 지도 이미지이다.
도 3은 본 발명의 일 실시예에 따른 인공지능 기반 환경유해인자 고해상도 데이터 보간방법의 과정을 나타내는 흐름도이다.
도 4는 환경유해인자의 산점도 분석을 위한 산점도이다.
도 5는 환경유해인자의 선형관계 평가를 위한 피어슨 상관계수이다.
도 6은 결측 데이터가 복원된 PM10 변수와 다른 환경유해인자 변수(Feature)의 영향력에 대한 상관관계를 나타내는 그래프이다.
도 7은 머신러닝 모델과 딥러닝 모델의 예측 성능 비교를 위한 그래프이다.
이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 이하의 상세한 설명은 본 발명의 완전한 이해를 제공하기 위해서 구체적 세부사항을 포함한다. 그러나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 이러한 구체적 세부사항 없이도 실시될 수 있음을 안다. 또한, 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함(comprising 또는 including)"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 본 발명의 실시예들을 설명함에 있어서 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다. 그리고 후술되는 용어들은 본 발명의 실시예에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
데이터 보간시스템
이하에서는, 첨부된 도면들을 참조하여 바람직한 실시예의 보간시스템(1)에 대해 자세히 설명하도록 하겠다.
도 1은 본 발명의 일 실시예에 따른 보간시스템의 구성을 나타내는 블록도이며, 도 2는 결측 데이터가 보간된 측정지점 및 측정 노드 데이터를 예측할 미측정지점이 포함된 지도 이미지이다.
측정 노드(10)는 측정지점(A)의 복수의 환경유해인자 데이터를 측정한다.
여기서, 측정지점(A)은 측정노드(10)가 하나 이상 설치되어 환경유해인자 데이터의 측정이 가능한 지점이다.
복수의 환경유해인자 데이터는 PM 10(μg/㎥), PM 2.5(μg/㎥), CO(ppm), CO2(ppm), NO2(ppb), VOC(ppb), HCHO(ppb), Temp(℃), Humidity(%)중 적어도 하나일 수 있다. 다만, 측정 노드(10)는 측정지점(A)의 환경유해인자 데이터를 다양하게 측정하기 위해 상기 환경유해인자 데이터를 모두 측정하는 것이 바람직할 것이며, 상기 환경유해인자 데이터 외 환경유해인자 데이터도 추가적으로 측정할 수 있다.
또한, 측정 노드(10)는 상기 환경유해인자 데이터를 각각 측정하기 위한 복수의 측정 노드로 이루어지는 것이 바람직하다.
이러한 측정 노드(10)가 측정한 환경유해인자 데이터는 측정지점(A)와 같이 측정 노드(10)의 결함 또는 정전 등에 의해 환경유해인자의 농도가 미측정된 결측 데이터가 하나 이상 발생되거나, 측정지점(B)와 같이 미측정의 사유로 결측 데이터가 존재함에 따라 저해상도의 데이터일 수 있다.
입력장치(20)는 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터 및 미측정지점(B)의 환경유해인자 데이터와 공간 정보 데이터가 각각 입력된다.
여기서, 미측정지점(B)은 측정노드(10)가 미설치되어 환경유해인자 데이터의 측정이 오측정된 지점이므로 환경유해인자 데이터의 모든 값이 결측 데이터이고, 미측정지점(B)의 환경유해인자 데이터는 모든 값이 결측 데이터임에 따라 저해상도의 데이터일 수 있다.
공간 정보 데이터는 위도, 경도, 교통량, 날씨 중 적어도 하나일 수 있다. 다만, 다양한 공간 정보 데이터를 획득하기 위해, 입력장치(20)는 상기 공간 정보 데이터외 공간 정보 데이터(예: 주소, 도로, 고도 등)도 입력될 수 있다.
데이터 처리장치(30)는 결측 데이터가 존재하는 환경유해인자 데이터와 공간 정보 데이터의 전처리를 위해 데이터 정규화부(31) 및 인코딩부(32)로 구성된다.
데이터 정규화부(31)는 환경유해인자 데이터와 공간 정보 데이터를 각각 정규화한다.
여기서, 정규화는 테이터의 중복성을 제거하여 데이터베이스(60)의 성능을 향상시키기 위한 데이터 구조화 프로세스를 의미하며, 바람직한 실시예에서는 환경유해인자 데이터와 공간 정보 데이터가 평균과 분산을 이용한 정규 분포를 따르도록 하는 정규화일 수 있다.
또한, 데이터 정규화부(31)는 입력장치(20)로부터 복수의 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터를 수신하는 경우, 연속(또는 동일)된 값을 가지는 데이터를 동일한 데이터로 정규화하는 것이 바람직하다.
인코딩부(32)는 데이터 정규화부(31)에서 정규화된 환경유해인자 데이터 중 결측 데이터에 임시 값(예: '0')을 채워 넣고, 딥러닝 기반의 예측 모델 또는 머신러닝 기반의 예측 모델(바람직하게는, 딥러닝 기반의 예측 모델)이 임시 값임을 알 수 있도록 하는 마스크 데이터를 생성한다.
이때, 인코딩부(32)는 각 단어에 고유한 정수 인덱스를 부여하는 원-핫 인코딩(One-Hot Encoding) 방식을 이용하여 마스크 데이터를 생성할 수 있다.
여기서, 원-핫 인코딩은 단어 집합의 크기를 벡터로 하고, 표현하고 싶은 단어(True)의 인덱스에 '1'의 값을 부여할 수 있으며, 나머지 다른 단어(False)의 인덱스에 '0'의 값을 부여할 수 있는 단어의 벡터 표현 방식을 의미한다.
이에 따라, 인코딩부(32)는 마스크 데이터 중 임시 값에 해당되는 영역을 '1'로 표시할 수 있으며, 임시 값을 제외한 나머지 환경유해인자 데이터에 해당되는 영역을 '0'으로 표시할 수 있다. 다만, 임시 값과 상기 임시 값을 제외한 나머지 영역의 값은 상기와 같이 한정하는 것은 아니며, 서로 구분되는 값이라면, 표시되는 값을 한정하지 아니한다.
또한, 인코딩부(32)는 데이터 정규화부(31)에서 정규화된 환경유해인자 데이터 및 상기 정규화된 환경유해인자의 마스크 데이터와 정규화된 공간 정보 데이터 및 상기 정규화된 공간 정보 데이터의 마스크 데이터를 하나의 입력 데이터로 인코딩한다.
바람직한 실시예에서 인코딩부(32)는 좌측으로부터 우측을 기준으로 정규화된 환경유해인자 데이터, 상기 정규화된 환경유해인자 데이터의 마스크 데이터, 정규화된 공간 정보 데이터 및 상기 정규화된 공간 정보 데이터의 마스크 데이터로 정렬하여 입력 데이터를 생성할 수 있다.
예측 모델 생성장치(40)는 하나 이상 기저장된 반복 신경망(Recurrent neural network) 기반의 예측 모델 중 입력 데이터로부터 예측 데이터를 생성하는 복수의 예측 모델을 생성하고, 입력 데이터로부터 예측 데이터를 생성하기 위한 인코더부(41) 및 디코더부(42)가 구성된다.
인코더부(41)는 입력 데이터의 값을 암호화하며, 디코더부(42)는 엔코딩된 입력 데이터의 값을 복원하여 예측 데이터를 생성한다.
여기서, 예측 데이터는 입력 데이터에 포함된 환경유해인자 데이터와, 예측 모델 또는 최종 예측 모델이 환경유해인자 데이터의 결측 데이터를 예측한 값으로 이루어진다.
한편, 예측 모델 생성장치(40)에는 이하의 [수학식 1], [수학식 2] 및 [수학식 3]의 평가 기법에 의한 성능 평가를 통해 복수의 예측 모델 중 가장 좋은 성능을 가지는 예측 모델이 적용될 수 있다.
여기서, 가장 좋은 성능의 예측 모델은 환경유해인자 데이터가 측정된 별도의 측정지점에 대해 상기 [수학식 1], [수학식 2] 및 [수학식 3]의 평가 기법을 적용하여 복수의 예측 모델 중 별도의 측정지점에 대한 환경유해인자 데이터의 실제 값과 예측 값의 오차 정도가 가장 낮은(또는 작은) 것으로 평가된 최종 예측 모델일 수 있다.
Figure 112020051014412-pat00001
상기 [수학식 1]은 예측 모델을 평가하기 위한 평균 절대 오차(Mean absolute error, MAE)의 수식으로 모든 절대 오차의 평균이면서, 예측 결과 값과 실제 값이 어느정도 동일한지 평가하는 함수이기도 하다.
Figure 112020051014412-pat00002
상기 [수학식 2]는 예측 모델을 평가하기 위한 평균 제곱근 오차(Root mean squared error, RMSE)의 수식으로서, 추정 값 또는 모델이 예측한 값과 실제 환경에서 관찰되는 값의 차이를 다룰 때 사용되는 측도로 정밀도를 표현하는데 사용되는 기법이다. 또한, 각각의 차이 값은 잔차(residual)라고도 하며, 평균 제곱근 오차는 이러한 잔차들을 하나의 측도로 종합할 때 사용된다.
Figure 112020051014412-pat00003
상기 [수학식 3]은 예측 모델을 평가하기 위한 평균 절대비 오차(Mean absolute percentage error, MAPE)의 수식으로서, 오차 평균의 크기가 크게 차이나는 모델을 비교할 경우, 오차 평균의 크기가 더 작은 모델을 상대적으로 성능이 좋은 모델로 평가하는 기법이다.
즉, 예측 모델 생성장치(40)는 MAE, RMSE, MAPE의 성능 평가에서 가장 좋은 성능의 결과를 낸 예측 모델을 최종 예측 모델로 결정한다.
더 나아가, 예측 모델 생성장치(40)는 바람직한 실시예에서 MAE, RMSE, MAPE 순으로 예측 모델의 성능을 평가하거나, 이의 역순으로 예측 모델의 성능을 평가할 수 있다. 다만, 평가 기법은 상기의 평가 기법으로 한정하지 아니하며, 이보다 많은 수의 평가 기법으로 예측 모델의 성능을 평가할 수도 있다.
최종 예측 모델은 측정 노드(10)가 측정한 측정지점(A)의 환경유해인자 데이터를 학습 가능한 고차원 벡터로 임베딩하여 입력값으로 이용함으로써, 지점 간의 연관성을 파악하여 측정 노드(10) 사이의 예측이 가능하도록 함에 따라, 결측 데이터를 예측하는 결측 데이터의 보간법을 학습하게 된다.
또한, 최종 예측 모델은 결측 데이터의 보간법을 학습함으로써, 전 시간 영역에 걸쳐 모든 데이터의 값이 결측 상태인 미측정지점(B)의 환경유해인자 데이터를 생성할 수 있다.
계산장치(50)는 예측 모델 생성장치(40)에서 생성된 예측 데이터의 반정규화(De-Normalization)를 통해 적절한 규격(scale)을 가지는 최종 예측 데이터를 보간(또는 생성)한다.
여기서, 반정규화(또는 역정규화)는 데이터 처리장치(30)의 정규화로 인해 발생될 수 있는 데이터베이스(60)의 성능 저하를 방지하기 위해 정규화된 예측 데이터를 정규화 이전의 상태로 되돌리는 프로세스를 의미한다.
즉, 계산장치(50)에서 보간된 최종 예측 데이터는 반정규화된 예측 데이터이며, 결측 데이터가 미존재하는 고해상도 데이터로서 측정지점(A) 또는 미측정지점(B)의 실외 농도(또는 환경유해인자의 농도)로 사용될 데이터를 의미한다.
데이터베이스(60)는 계산장치(50)에서 보간된 최종 예측 데이터가 저장된다.
출력장치(70)는 데이터베이스(60)에 저장된 최종 예측 데이터를 출력하여 사용자에게 제공한다. 다만, 출력장치(70)는 본 발명의 보간시스템(1)의 필수 구성은 아니며, 최종 예측 데이터를 출력하는 수단 또는 상기 보간시스템(1)의 구성 중 하나인 계산장치(50)가 최종 예측 데이터를 출력한다면, 본 발명의 보간시스템(1)의 구성에서 생략될 수 있다.
데이터 보간방법
이하에서는, 도 3을 참조하여 본 발명의 보간시스템(1)을 이용한 인공지능 기반 환경유해인자 고해상도 데이터 보간방법(이하에서는 '데이터 보간방법')의 과정에 대해 자세히 설명하도록 하겠다.
또한, 본 발명의 데이터 보간방법은 이하와 같이, 예측 모델의 훈련 단계(S100)와 보간 단계(S200)로 나누어질 수 있다.
도 3은 본 발명의 일 실시예에 따른 인공지능 기반 환경유해인자 고해상도 데이터 보간방법의 과정을 나타내는 흐름도이다.
<훈련 단계>
먼저, 예측 모델의 훈련 단계(S100)는 측정 노드(10)가 측정지점(A)의 환경유해인자 데이터를 측정하고, 입력장치(20)에 측정지점(A)의 환경유해인자 데이터(이하의 [표 1])와 공간 정보 데이터(이하의 [표 2])가 입력될 수 있다(S110).
PM 10(μg/㎥) PM 2.5(μg/㎥) CO(PPM) CO2(PPM) Time
72.6 30.1 0.0 309.0 2019-01-01 03:00
73.5 - 0.0 436.0 2019-01-01 04:00
75.3 30.9 0.0 - 2019-01-01 05:00
위도 경도 교통량 날씨 Time
37.5 126.9 672 2019-01-01 03:00
37.5 126.9 813 흐림 2019-01-01 04:00
37.5 126.9 1,352 맑음 2019-01-01 05:00
상기 측정지점의 데이터 입력 단계(S110) 후, 데이터 처리장치(30)는 데이터 정규화부(31) 및 인코딩부(32)를 통해 측정지점(A)의 환경유해인자 데이터를 정규화(이하의 [표 3])한 후, 정규화된 환경유해인자 데이터와 상기 정규화된 환경유해인자 데이터의 마스크 데이터(이하의 [표 4])를 생성할 수 있고, 측정지점(A)의 공간 정보 데이터를 정규화한 후, 공간 정보 데이터와 상기 공간 정보 데이터의 마스크 데이터(이하의 [표 5])를 생성하고, [표 4]의 정규화된 환경유해인자 데이터 및 상기 환경유해인자 데이터의 마스크 데이터와, [표 5]의 정규화된 공간 정보 데이터 및 상기 공간 정보 데이터의 마스크 데이터를 측정지점(A)의 입력 데이터로 인코딩함으로써, 데이터를 전처리할 수 있다(S120).
PM 10(μg/㎥) PM 2.5(μg/㎥) CO(PPM) CO2(PPM) Time
0.678 0.152 -0.32 -0253 2019-01-01 03:00
0.732 - -0.32 0.324 2019-01-01 04:00
0.851 0.200 -0.32 - 2019-01-01 05:00
0.678 0.152 -0.32 -0.253 0 0 0 0
0.732 0 -0.32 0.324 0 1 0 0
0.851 0.200 -0.32 0 0 0 0 1
인코딩부(32)는 [표 4]와 같이, [표 3]의 정규화된 환경유해인자 데이터 중 결측 데이터를 임시 값인 '0'으로 채워 넣을 수 있으며, 마스크 데이터의 임시 값에 해당되는 영역에 '1', 임시 값을 제외한 나머지 환경유해인자 데이터에 해당되는 영역에 '0'의 값을 채워 넣을 수 있다.
-0.1 0.05 -0.33 0 1 0
-0.1 0.05 -0.12 0 0 1
-0.1 0.05 0.26 1 0 0
상기 데이터 전처리 단계(S120) 후, 예측 모델 생성장치(40)는 예측 데이터를 생성하기 위한 반복 신경망 기반의 예측 모델을 생성할 수 있다(S130).
상기 예측 모델 생성 단계(S130)에서는, 예측 모델 생성장치(40)가 예측 모델의 성능을 평가하기 위해 예측 모델을 복수로 생성하는 것이 바람직하다.
상기 예측 모델 생성 단계(S130) 후, 예측 모델 생성장치(40)는 환경유해인자 데이터의 결측 데이터가 존재하지 않는 측정지점(A)에 대해 평가 기법을 적용하여 예측 모델의 성능을 평가할 수 있으며(S140), 복수의 예측 모델 중 가장 좋은 성능의 예측 모델을 확정할 수 있다(S150).
상기 예측 모델 성능평가 단계(S140)에서는, 예측 모델 생성장치(40)가 복수의 예측 모델에 대해 MAE, RMSE, MAPE의 성능 평가 기법을 순차적으로 적용하여 예측 모델의 성능을 평가할 수 있다.
상기 예측 모델 확정 단계(S150)에서는, 예측 모델 생성장치(40)가 성능 평가된 복수의 예측 모델 중 환경유해인자가 측정된 별도의 측정지점에 대한 환경유해인자 데이터의 실제 값과 오차 값의 차이가 가장 낮은 예측 모델을 최종 예측 모델로 확정할 수 있다.
한편, 상기 예측 모델 확정 단계(S150)에서 확정된 최종 예측 모델은 보간 단계(S200)의 예측 모델 적용 단계(S230)에서 예측 모델 생성장치(40)에 적용될 수 있다.
<보간 단계>
본 발명의 보간 단계(S200)는 측정지점(A) 또는 미측정지점(B)의 환경유해인자 데이터의 보간이 이루어지는 것이 바람직하나, 이하에서는 미측정지점(B)의 보간 단계를 통해 본 발명의 보간 단계(S200)를 자세히 설명하도록 하겠다.
먼저, 예측 모델의 보간 단계(S200)는 입력장치(20)에 미측정지점(B)의 환경유해인자 데이터(이하의 [표 6])와 미측정지점(B)의 공간 정보 데이터(이하의 [표 7])가 입력될 수 있다(S210).
PM 10(μg/㎥) PM 2.5(μg/㎥) CO(PPM) CO2(PPM) Time
- - - - 2019-01-01 03:00
- - - - 2019-01-01 04:00
- - - - 2019-01-01 05:00
상기 [표 6]의 환경유해인자 데이터는 측정 노드(10)가 미설치되어 미측정지점(B)의 환경유해인자 데이터를 측정하는 것이 불가능하므로, 환경유해인자 데이터는 전 시간 영역에 걸쳐 모두 결측 데이터일 수 있다.
위도 경도 교통량 날씨 Time
37.5 126.9 672 2019-01-01 03:00
37.5 126.9 813 흐림 2019-01-01 04:00
37.5 126.9 1,352 맑음 2019-01-01 05:00
상기 [표 7]의 공간 정보 데이터는 상기 [표 2]의 공간 정보 데이터와 값이 동일한 것으로 표시되어 있으나, 측정지점(A)과 미측정지점(B)의 공간 정보가 다르다면, 공간 정보 데이터의 값은 상기 [표 2]의 공간 정보 데이터와 다른 것이 바람직하다.
상기 미측정지점의 데이터 입력 단계(S210) 후, 데이터 처리장치(30)는 데이터 정규화부(31) 및 인코딩부(32)를 통해 미측정지점(B)의 환경유해인자 데이터와 상기 환경유해인자 데이터의 마스크 데이터(이하의 [표 8])를 생성하며, 미측정지점(B)의 공간 정보 데이터를 정규화한 후, 상기 공간 정보 데이터와 상기 공간 정보 데이터의 마스크 데이터(이하의 [표 9])를 생성하고, [표 8]의 정규화된 환경유해인자 데이터 및 상기 환경유해인자 데이터의 마스크 데이터와, [표 9]의 정규화된 공간 정보 데이터 및 상기 공간 정보 데이터의 마스크 데이터를 미측정지점(B)의 입력 데이터로 인코딩함으로써, 데이터를 전처리할 수 있다(S220).
0 0 0 0 1 1 1 1
0 0 0 0 1 1 1 1
0 0 0 0 1 1 1 1
상기 [표 8]에서, 인코딩부(32)는 미측정지점(B)의 환경유해인자 데이터는 모든 데이터가 결측 데이터이므로, 모든 데이터가 임시 값인 '0'으로 채워 넣을 수 있으며, 임시 값에 해당되는 마스크 데이터의 전체 영역에 '1'의 값을 채워 넣을 수 있다.
-0.1 0.05 -0.33 0 1 0
-0.1 0.05 -0.12 0 0 1
-0.1 0.05 0.26 1 0 0
상기 [표 9]의 정규화된 공간 정보 데이터 및 상기 공간 정보 데이터의 마스크 데이터는 상기 [표 5]의 정규화된 공간 정보 데이터 및 상기 공간 정보 데이터의 마스크 데이터와 값이 동일한 것으로 표시되어 있으나, 실질적으로는 데이터의 값이 다른 것이 바람직하다.
상기 데이터 전처리 단계(S220) 후, 예측 모델 생성장치(40)는 상기 예측 모델 확정 단계(S150)에서 확정된 최종 예측 모델을 적용할 수 있다(S230).
상기 예측 모델 적용 단계(S230)에서는, 예측 모델 생성장치(40)가 최종 예측 모델이 적용된 인코더부(41) 및 디코더부(42)를 통해 미측정지점(B)의 입력 데이터로부터 미측정지점(B)의 예측 데이터(이하의 [표 10])를 생성할 수 있다.
0.932 0.123 -0.32 -0.253
0.658 0.057 -0.32 -0.260
0.658 0.057 -0.32 -0.412
상기 예측 모델 적용 단계(S230) 후, 계산장치(50)는 미측정지점(B)의 예측 데이터로의 반정규화를 통해 미측정지점(B)의 예측 데이터로부터 최종 예측 데이터(이하의 [표 11])를 보간하고, 상기 최종 예측 데이터가 데이터베이스(60)에 저장될 수 있다(S240).
PM 10(μg/㎥) PM 2.5(μg/㎥) CO(PPM) CO2(PPM) Time
118.7 38.3 0.0 316.0 2019-01-01 03:00
96.5 37.0 0.0 314.0 2019-01-01 04:00
96.5 37.0 0.0 447.0 2019-01-01 05:00
이러한 본 발명의 데이터 보간방법은 측정지점(A) 및 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터에 포함된 결측 데이터를 예측하여 고해상도의 최종 예측 데이터를 보간함으로써, 사용자는 측정지점(A) 또는 미측정지점(B)의 실외 농도를 예측할 수 있다.
한편, 본 발명에서의 최종 예측 모델은 딥러닝 기반의 예측 모델 또는 머신러닝 기반의 예측 모델일 수 있으나, 바람직하게는 딥러닝 기반의 예측 모델일 수 있다. 이와 같이, 최종 예측 모델이 딥러닝 기반의 예측 모델로 적용되어야 하는 것은 첨부된 도면들을 참조하여 자세히 설명하도록 하겠다.
도 4는 환경유해인자의 산점도 분석을 위한 산점도이며, 도 5는 환경유해인자의 선형관계 평가를 위한 피어슨 상관계수이고, 도 6은 결측 데이터가 복원된 PM10 변수와 다른 환경유해인자 변수(Feature)의 영향력에 대한 상관관계를 나타내는 그래프이며, 도 7은 머신러닝 모델과 딥러닝 모델의 예측 성능 비교를 위한 그래프이다.
먼저, 도 4의 산점도(Scatter plot)를 이용하여 측정 노드(10)에서 측정되는 환경유해인자 간 상관관계를 분석할 수 있다.
여기서, 산점도는 환경유해인자 변수 간의 일대일 상관관계를 분석하기 위한 통계 그래프를 의미한다.
도 4를 참조하면, 환경유해인자의 산점도의 수직 축은 상측에서 하측으로 수평 축은 좌측에서 우측으로 PM 10(μg/㎥), PM 2.5(μg/㎥), CO(ppm), CO2(ppm), NO2(ppb), VOC(ppb), HCHO(ppb), Temp(℃), Humid(%)와 같은 순서일 수 있다.
피어슨(Pearson) 알고리즘은 도 4의 산점도로부터 환경유해인자 간 상관관계를 분석할 수 있다.
여기서, 피어슨 알고리즘은 환경유해인자의 두 변수 간의 연관성을 측정하기 위한 피어슨 상관계수 기반의 알고리즘이다.
도 5를 참조하면, 환경유해인자 변수 간의 상관계수에서 PM 10(μg/㎥)와 PM 2.5(μg/㎥)의 연관성이 '0.98'로 도출되었으며, Temp(℃)와 Humid(%)의 연관성은 '0.81'로 도출되었다. 이를 통해, 피어슨 알고리즘은 PM 10(μg/㎥)와 PM 2.5(μg/㎥), 그리고 Temp(℃)와 Humid(%)의 사이에서 뚜렷한 상관관계가 있는 것으로 분석할 수 있다.
또한, CO(ppm), NO2(ppb), HCHO(ppb)는 측정 노드(10)에서 환경유해인자 데이터를 측정한 기간동안 '0'의 값으로 측정됨에 따라 연관성이 모두 '0'이므로, 도 5의 환경유해인자 변수 간의 상관계수에 도시되지 않았다. 이를 통해, 피어슨 알고리즘은 CO(ppm), NO2(ppb), HCHO(ppb)가 변수로 사용하기에는 부적합한 것으로 분석할 수 있다.
더 나아가, 환경유해인자 변수 간의 상관계수에서는 커널밀도 추정(Kernel Density Estimation)을 통해 PM 10(μg/㎥)으로부터 Humid(%)를 향해 연관성의 값이 '1'인 그래프가 이루어질 수 있다.
도 6의 미래 예측 성능(MSE)의 값은 환경유해인자 데이터의 20 %를 임의로 결측시킨 후, 환경유해인자 변수를 하나씩 제외하면서 PM 10(μg/㎥)의 수치를 예측한 결과를 나타낸다. 이러한 도 6의 미래 예측 성능에 대한 그래프는 PM 10(μg/㎥)과 다른 변수 간의 상관관계를 제시하고 있다.
도 6을 참조하면, PM 2.5(μg/㎥)가 '208.48', CO2(ppm)가 '67.42', VOC(ppb)가 '66.94', Temp(℃)가 '72.98', Humid(%)가 '63.72', 변수의 전체 사용이 '75.11'로 미래 예측 성능 값이 도출되었다. 이를 통해, PM 2,5(μg/㎥)가 PM 10(μg/㎥)와 가장 큰 상관관계를 갖고 있으며, PM 2,5(μg/㎥)를 제외한 나머지 환경유해인자 변수는 미래 예측 성능이 크게 떨어지며, PM 10(μg/㎥)과의 상관관계가 없을 뿐만 아니라, 딥러닝 예측 모델 또는 머신러닝 예측 모델의 학습을 방해하는 것으로 분석할 수 있다.
즉, 환경유해인자 변수 간의 상관관계와 대응하여 딥러닝 예측 모델 또는 머신러닝 예측 모델의 학습이 이루어지는 것이 학습 효율이 높은 것을 의미한다.
한편, 측정 노드(10) 간의 거리를 이용하여 딥러닝 예측 모델과 머신러닝 예측 모델의 성능을 비교하였다.
먼저, 측정 노드(10) 간의 거리는 위도와 경도를 이용하는 하버사인(haversine) 공식을 통해 산출될 수 있다. 여기서, 하버사인 공식은 타겟 노드와 비타겟 노드 간의 위도와 경도를 통해 타겟 노드와 비타겟 노드 간의 최단거리를 구하는 공식이다.
그 후, 타겟 노드로부터 거리가 짧은 비타겟 노드를 반경 1 km, 2 km, 3 km, 4 km, 5 km 순으로 제외하면서 타겟 노드의 예측 실험을 진행하여 딥러닝 예측 모델과 머신러닝 예측 모델의 타겟 노드와 비타겟 노드의 간격에 의한 영향력을 확인하였으며, 이에 대한 결과는 도 7의 그래프와 같다.
도 7을 참조하면, 머신러닝 예측 모델은 타겟 노드와 비타겟 노드 간의 거리에 따라, 미래 예측 성능(MAE 또는 RMSE)의 값이 크게 변화되는 반면, 딥러닝 예측 모델은 타겟 노드와 비타겟 노드 간의 거리와 상관없이 미래 예측 성능 값에 변화가 없는 것으로 분석되었다.
이에 따라, 딥러닝 예측 모델은 타겟 노드와 비타겟 노드 간의 거리에 대한 영향력이 머신러닝 예측 모델보다 작아 미래 예측 성능 값의 변화가 크게 일어나지 않으므로, 딥러닝 예측 모델이 머신러닝 예측 모델보다 환경유해인자 데이터의 보간을 위한 최종 예측 모델로 적용되는 것이 바람직하다는 결과가 도출되었다.
전술한 본 발명의 설명은 예시를 위한 것이며, 본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
1: 보간시스템,
10: 측정 노드,
20: 입력장치,
30: 데이터 처리장치,
31: 데이터 정규화부,
32: 인코딩부,
40: 예측 모델 생성장치,
41: 인코더부,
42: 디코더부,
50: 계산장치,
60: 데이터베이스,
70: 출력장치,
A: 측정지점,
B: 미측정지점.

Claims (10)

  1. 예측 모델 생성장치(40)에서 측정 노드(10)가 하나 이상 설치된 측정지점(A) 또는 상기 측정 노드(10)가 미설치된 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터와 공간 정보 데이터를 정규화 및 인코딩한 입력 데이터로부터 예측 데이터를 생성하는 복수의 예측 모델을 생성한 후, 상기 환경유해인자 데이터가 측정된 별도의 측정지점에 대해 적용되는 평가 기법으로 상기 복수의 예측 모델을 평가하여 상기 복수의 예측 모델 중 상기 별도의 측정지점의 환경유해인자 데이터의 실제 값과 예측 값의 오차 정도가 가장 작은 예측 모델을 최종 예측 모델로 확정하는 훈련 단계(S100); 및
    상기 훈련 단계(S100) 후, 상기 예측 모델 생성장치(40)가 상기 최종 예측 모델을 통해 상기 측정지점(A) 또는 상기 미측정지점(B)에 대한 저해상도의 환경유해인자 데이터와 공간 정보 데이터를 정규화 및 인코딩한 입력 데이터로부터 예측 데이터를 생성하며, 계산장치(50)가 상기 예측 데이터를 고해상도의 최종 예측 데이터로 보간하는 보간 단계(S200);를 포함하되,
    상기 측정지점(A)의 환경유해인자 데이터는 환경유해인자의 농도가 미측정된 결측 데이터가 하나 이상 존재하고, 상기 미측정지점(B)의 환경유해인자 데이터는 모든 데이터가 결측 데이터인 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  2. 제 1 항에 있어서,
    상기 예측 데이터는,
    상기 입력 데이터에 포함된 환경유해인자 데이터와, 상기 예측 모델 또는 상기 최종 예측 모델이 상기 환경유해인자 데이터의 결측 데이터를 예측한 값으로 이루어지는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  3. 제 2 항에 있어서,
    상기 최종 예측 데이터는,
    상기 계산장치(50)에서 상기 예측 데이터의 반정규화를 통해 보간되어, 상기 측정지점(A) 또는 미측정지점(B)의 실외 농도로 사용되는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  4. 제 1 항에 있어서,
    상기 평가 기법은,
    MAE(Mean absolute error), RMSE(Root mean squared error) 및 MAPE(Mean absolute percentage error)를 적어도 포함하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  5. 제 1 항에 있어서,
    상기 훈련 단계(S100)는,
    상기 측정 노드(10)가 측정지점(A)의 환경유해인자 데이터를 측정하며, 입력장치(20)에 상기 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터가 입력되는 단계(S110);
    데이터 처리장치(30)가 상기 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터를 각각 정규화한 후, 상기 정규화된 환경유해인자 데이터와 공간 정보 데이터를 상기 입력 데이터로 인코딩하는 단계(S120);
    상기 예측 모델 생성장치(40)가 기저장된 반복 신경망의 예측 모델 중 상기 입력 데이터로부터 예측 데이터를 생성하기 위한 복수의 예측 모델을 생성하는 단계(S130);
    상기 예측 모델 생성장치(40)가 상기 평가 기법으로 상기 복수의 예측 모델의 성능을 평가하는 단계(S140); 및
    상기 예측 모델 생성장치(40)가 상기 복수의 예측 모델 중 상기 최종 예측 모델을 확정하는 단계(S150);를 포함하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  6. 제 1 항에 있어서,
    상기 보간 단계(S200)는,
    상기 측정 노드(10)가 측정지점(A)의 환경유해인자 데이터를 측정한 후 입력장치(20)에 상기 측정지점(A)의 환경유해인자 데이터와 공간 정보 데이터가 입력되거나, 상기 입력장치(20)에 미측정지점(B)의 환경유해인자 데이터와 공간 정보 데이터가 입력되는 단계(S210);
    데이터 처리장치(30)가 상기 입력장치(20)에 입력된 상기 측정지점(A) 또는 미측정지점(B)의 환경유해인자 데이터와 공간 정보 데이터를 정규화한 후, 상기 정규화된 환경유해인자 데이터와 공간 정보 데이터를 입력 데이터로 인코딩하는 단계(S220);
    상기 예측 모델 생성장치(40)에 상기 최종 예측 모델이 적용되는 단계(S230); 및
    상기 예측 모델 생성장치(40)가 상기 최종 예측 모델을 통해 상기 입력 데이터로부터 예측 데이터를 생성한 후, 상기 예측 데이터의 반정규화를 통해 고해상도의 최종 예측 데이터를 보간하고, 상기 최종 예측 데이터가 데이터베이스(60)에 저장되는 단계(S240);를 포함하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  7. 제 5 항 또는 제 6 항에 있어서,
    상기 데이터 처리장치(30)는,
    상기 환경유해인자 데이터와 공간 정보 데이터가 정규 분포를 따르도록 정규화하며,
    원-핫 인코딩(One-Hot Encoding) 방식으로 상기 환경유해인자의 결측 데이터에 임시 값을 채워 넣고, 딥러닝 기반의 예측 모델이 상기 임시 값을 알 수 있도록, 상기 정규화된 환경유해인자 데이터의 마스크 데이터와 상기 정규화된 공간 정보 데이터의 마스크 데이터를 각각 생성하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  8. 제 7 항에 있어서,
    상기 데이터 처리장치(30)는,
    상기 임시 값에 해당되는 영역에 '1'의 값을 채워 넣고, 상기 임시 값을 제외한 나머지 환경유해인자 데이터에 해당되는 영역에 '0'의 값을 채워 넣어 마스크 데이터를 생성하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  9. 제 7 항에 있어서,
    상기 데이터 처리장치(30)는,
    상기 정규화된 환경유해인자 데이터 및 상기 정규화된 환경유해인자 데이터의 마스크 데이터와, 상기 정규화된 공간 정보 데이터 및 상기 정규화된 공간 정보 데이터의 마스크 데이터를 상기 입력 데이터로 인코딩하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
  10. 제 9 항에 있어서,
    상기 데이터 처리장치(30)는,
    좌측으로부터 우측 방향을 기준으로 상기 정규화된 환경유해인자 데이터, 상기 정규화된 환경유해인자 데이터의 마스크 데이터, 상기 정규화된 공간 정보 데이터 및 상기 정규화된 공간 정보 데이터의 마스크 데이터로 정렬하여 상기 입력 데이터를 생성하는 것을 특징으로 하는 인공지능 기반 환경유해인자 고해상도 데이터 보간방법.
KR1020200060542A 2020-05-20 2020-05-20 인공지능 기반 환경유해인자 고해상도 데이터 보간방법 KR102218734B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200060542A KR102218734B1 (ko) 2020-05-20 2020-05-20 인공지능 기반 환경유해인자 고해상도 데이터 보간방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200060542A KR102218734B1 (ko) 2020-05-20 2020-05-20 인공지능 기반 환경유해인자 고해상도 데이터 보간방법

Publications (1)

Publication Number Publication Date
KR102218734B1 true KR102218734B1 (ko) 2021-02-24

Family

ID=74689116

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200060542A KR102218734B1 (ko) 2020-05-20 2020-05-20 인공지능 기반 환경유해인자 고해상도 데이터 보간방법

Country Status (1)

Country Link
KR (1) KR102218734B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102414765B1 (ko) 2021-10-13 2022-06-30 주식회사 엔씨엘 사용자 위치정보 기반 환경유해인자 노출정보알림 시스템
KR102499640B1 (ko) 2022-07-08 2023-02-14 주식회사 파모스 이미지 복원 기반의 스마트팜 온습도 결측 복원방법
KR102509392B1 (ko) * 2022-06-15 2023-03-14 주식회사 광덕철강 뉴럴 네트워크를 이용하여 서버가 품목별 예측 주문량에 따라 원자재 요청 메시지를 전송하는 방법 및 장치
KR102596744B1 (ko) 2023-04-19 2023-11-02 주식회사 엔씨엘 화학사고 오염지역 내 복수의 모바일 측위정보를 이용한 개인 노출평가시스템 및 평가방법
KR102641882B1 (ko) 2023-04-21 2024-02-29 서경대학교 산학협력단 사용자 위치정보와 웨어러블 기기 기반의 환경보건 건강영향 모니터링 시스템 및 모니터링 방법
CN117743808A (zh) * 2024-02-20 2024-03-22 中铁西南科学研究院有限公司 一种隧道变形预测方法、系统、设备及介质
CN117743808B (zh) * 2024-02-20 2024-05-14 中铁西南科学研究院有限公司 一种隧道变形预测方法、系统、设备及介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS498972B1 (ko) 1969-11-12 1974-03-01
JP2008058109A (ja) * 2006-08-30 2008-03-13 Central Res Inst Of Electric Power Ind 観測データ推定方法及び観測データ推定プログラム
KR20110077040A (ko) * 2009-12-30 2011-07-07 건국대학교 산학협력단 상세규모 대기질 관리 시스템 및 운영방법
US20160125307A1 (en) * 2013-06-05 2016-05-05 Yu Zheng Air quality inference using multiple data sources
KR101716111B1 (ko) 2015-12-04 2017-03-15 충북대학교 산학협력단 이물질 검출 시스템 및 방법
KR20180123951A (ko) * 2017-05-10 2018-11-20 주식회사 알스피릿 기계학습 기반 실시간 태양광 셀 또는 어레이 상태 진단/예측 장치 및 방법
KR101945314B1 (ko) * 2018-07-27 2019-04-17 딥클라우드 주식회사 인공지능 알고리즘을 기반으로 한 미세먼지 예측모듈을 이용한 미세먼지 저감장치
US20190325334A1 (en) 2018-04-23 2019-10-24 National Chung-Shan Institute Of Science And Technology Method for predicting air quality with aid of machine learning models
KR20200003664A (ko) * 2018-07-02 2020-01-10 주식회사 케이티 공기질 데이터의 보정 로직을 생성하는 장치 및 방법

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS498972B1 (ko) 1969-11-12 1974-03-01
JP2008058109A (ja) * 2006-08-30 2008-03-13 Central Res Inst Of Electric Power Ind 観測データ推定方法及び観測データ推定プログラム
KR20110077040A (ko) * 2009-12-30 2011-07-07 건국대학교 산학협력단 상세규모 대기질 관리 시스템 및 운영방법
US20160125307A1 (en) * 2013-06-05 2016-05-05 Yu Zheng Air quality inference using multiple data sources
KR101716111B1 (ko) 2015-12-04 2017-03-15 충북대학교 산학협력단 이물질 검출 시스템 및 방법
KR20180123951A (ko) * 2017-05-10 2018-11-20 주식회사 알스피릿 기계학습 기반 실시간 태양광 셀 또는 어레이 상태 진단/예측 장치 및 방법
US20190325334A1 (en) 2018-04-23 2019-10-24 National Chung-Shan Institute Of Science And Technology Method for predicting air quality with aid of machine learning models
KR20200003664A (ko) * 2018-07-02 2020-01-10 주식회사 케이티 공기질 데이터의 보정 로직을 생성하는 장치 및 방법
KR101945314B1 (ko) * 2018-07-27 2019-04-17 딥클라우드 주식회사 인공지능 알고리즘을 기반으로 한 미세먼지 예측모듈을 이용한 미세먼지 저감장치

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102414765B1 (ko) 2021-10-13 2022-06-30 주식회사 엔씨엘 사용자 위치정보 기반 환경유해인자 노출정보알림 시스템
KR102509392B1 (ko) * 2022-06-15 2023-03-14 주식회사 광덕철강 뉴럴 네트워크를 이용하여 서버가 품목별 예측 주문량에 따라 원자재 요청 메시지를 전송하는 방법 및 장치
KR102499640B1 (ko) 2022-07-08 2023-02-14 주식회사 파모스 이미지 복원 기반의 스마트팜 온습도 결측 복원방법
KR102596744B1 (ko) 2023-04-19 2023-11-02 주식회사 엔씨엘 화학사고 오염지역 내 복수의 모바일 측위정보를 이용한 개인 노출평가시스템 및 평가방법
KR102641882B1 (ko) 2023-04-21 2024-02-29 서경대학교 산학협력단 사용자 위치정보와 웨어러블 기기 기반의 환경보건 건강영향 모니터링 시스템 및 모니터링 방법
CN117743808A (zh) * 2024-02-20 2024-03-22 中铁西南科学研究院有限公司 一种隧道变形预测方法、系统、设备及介质
CN117743808B (zh) * 2024-02-20 2024-05-14 中铁西南科学研究院有限公司 一种隧道变形预测方法、系统、设备及介质

Similar Documents

Publication Publication Date Title
KR102218734B1 (ko) 인공지능 기반 환경유해인자 고해상도 데이터 보간방법
CN109492830B (zh) 一种基于时空深度学习的移动污染源排放浓度预测方法
Leroy et al. Without quality presence–absence data, discrimination metrics such as TSS can be misleading measures of model performance
Simmonds et al. Is more data always better? A simulation study of benefits and limitations of integrated distribution models
Barber et al. Target‐group backgrounds prove effective at correcting sampling bias in Maxent models
Höge et al. A primer for model selection: The decisive role of model complexity
Liu et al. Selecting thresholds for the prediction of species occurrence with presence‐only data
Murakami et al. Participatory sensing data tweets for micro-urban real-time resiliency monitoring and risk management
KR102414765B1 (ko) 사용자 위치정보 기반 환경유해인자 노출정보알림 시스템
KR101925480B1 (ko) 가속수명시험 데이터 기반 고장예지용 운용하중 데이터 생성 방법 및 장치
Sánchez-Balseca et al. Spatio-temporal air pollution modelling using a compositional approach
Zhang et al. Method of speed data fusion based on Bayesian combination algorithm and high‐order multi‐variable Markov model
Nolan et al. Solving sampling bias problems in presence–absence or presence‐only species data using zero‐inflated models
CN111444233A (zh) 基于复制器神经网络模型发现环境监测异常数据的方法
CN116960962A (zh) 一种跨区域数据融合的中长期区域负荷预测方法
Liu et al. Predicting the Hypoxic‐Volume in Chesapeake Bay with the Streeter–Phelps Model: A Bayesian Approach 1
Segura et al. Expected seismic performance of gravity dams using machine learning techniques
Aman et al. Influence-driven model for time series prediction from partial observations
Kefeng et al. CNN Based No‐Reference HDR Image Quality Assessment
CN115423159A (zh) 光伏发电预测方法、装置及终端设备
CN115238245A (zh) 污染物监测方法、装置、存储介质及电子设备
CN112034007B (zh) 一种微波辐射计间接测量露点温度方法及系统
CN114880954A (zh) 一种基于机器学习的滑坡敏感性的评估方法
JP6950647B2 (ja) データ判定装置、方法、及びプログラム
Ahmed Development of a continuous condition monitoring system based on probabilistic modelling of partial discharge data for polymeric insulation cables

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant