KR20230086850A

KR20230086850A - 인공기능 기반 하수처리장의 유입 부하 예측방법

Info

Publication number: KR20230086850A
Application number: KR1020210174834A
Authority: KR
Inventors: 유창규; 허성구
Original assignee: 경희대학교 산학협력단
Priority date: 2021-12-08
Filing date: 2021-12-08
Publication date: 2023-06-16

Abstract

본 발명은 인공기능 기반 하수처리장의 유입 부하 예측방법에 관한 것으로, 보다 상세하게는 세부 기술 원리로는 Hilbert-Haung transform 방법에 기반한 empirical mode decomposition을 활용해 유입수의 성상 데이터를 서로 다른 orthogonal basis로 분해하여 기간별 유입 부하의 동특성을 분석하고, 이를 바탕으로 유입수의 성상 별 동특성을 고려할 수 있는 multimodal learning과 ensemble learning 기반 유입수 예측 모델을 생성하여 단기(1시간 후), 장기(1일 후), 단계별(1시간부터 24시간까지) 유입 부하를 예측할 수 있는 인공기능 기반 하수처리장의 유입 부하 예측방법에 관한 것이다.

Description

인공기능 기반 하수처리장의 유입 부하 예측방법{DataDriven Hybrid Model for Forecasting Wastewater Infuent Loads Based on Multimodal and Ensemble Deep Learning}

본 발명은 인공기능 기반 하수처리장의 유입 부하 예측방법에 관한 것으로, 보다 상세하게는 하수처리장에 유입되는 유입수의 성상별 부하량을 예측하기 위한 심층 인공신경망 기반 예측모델에 대한 것이다.

하수처리장은 높은 처리 효율 유지를 위한 운전비용이 높은 처리 시설로, 최근 수처리 분야에서는 다양한 유입수 조건에도 하수처리장을 효율적으로 운영할 수 있도록 유입수 예측 모델 개발에 대한 관심이 증가하고 있다. 하지만 유입수 성상의 강한 시변성 때문에 유입수의 동특성을 분석하여 다음 유입 부하를 예측하기는 매우 어려운 실정이다.

하수처리장(WWTPs)는 공중 보건 위험과 자연 생태계의 악화를 방지하기 위해 도시, 농촌 및 산업 환경에서 유입되는 부하를 처리하도록 설계되었다. 일반적으로 물 사용 및 소스의 유입 부하 변동으로 인해 허용 가능한 작동 조건을 유지하기 위해 과장된 운영 전략(즉, 과도한 폭기 및 화학 물질의 과도한 투여)이 일반적으로 수행된다. 그러나 유입수 교란은 오염 물질을 제거하는 WWTP의 안정적인 능력을 위협하게 된다. 그러면 여분의 에너지 낭비와 잔류 화학 물질의 방출로 인한 2차 오염이 발생할 수 있다. 따라서 WWTP 실무자들은 최근 다양한 영향 역학에서 에너지 전달 및 처리 화학물질 투여량을 규제하기 전에 WWTP의 예측 유지 보수를 실현하기 위해 유입 부하 및 그 구성 요소에 대한 조기 감지 및 예측 방법에 중점을 두고 있다.

데이터 기반 예측 기술은 신호의 고도로 비선형적인 동작을 처리하는 유용한 도구로 여러 산업 영역에서 널리 입증되었다. 특히 딥러닝(DL)은 복잡한 산업 시스템에서 플랜트 운영을 향상시키는 강력한 예측 도구로 부상했다. 예를 들어, Wen et al.는 태양광(PV) 발전소의 에너지 절감을 줄이기 위해 태양 예측을 위한 CNN(Convolutional Neural Networks)을 사용하는 앙상블 기반 심층 아키텍처를 제한한 바 있다. 기존의 예측 접근 방식과 비교하여 DL 기반 예측 모델은 예측 범위가 다른 우수한 정확도와 강력한 태양 예측을 제공한다. 이는 PV 램프 속도 제어에서 제어 실패를 낮추는 결과를 가져온다. Ma et al.는 CNN과 LSTM을 결합한 하이브리드 모델을 활용하여 회전 기계에서 볼 베어링의 남은 유효 수명을 예측했다. 하이브리드 CNN-LSTM 모델은 단순한 DL 알고리즘보다 더 나은 정확도와 계산 효율성으로 시스템 예후를 보여주었다. 또한 Essien et al.은 2-D CNN, LSTM 및 autoencoder 모델을 통합하여 금속 포장 공장에 대한 다단계 시계열 예측 모델을 개발했다. 이러한 연구는 DL 기술을 사용하는 데이터 기반 접근 방식이 데이터 특성의 높은 차원, 다중 공선성 및 다양한 데이터 집계를 처리함으로써 복잡한 산업 시스템의 스마트 운영에 적극적으로 기여한다는 것을 보여주었다.

또한 시계열 모델 및 통계적 방법과 같은 기존의 데이터 기반 접근 방식은 유입 부하를 특성화하기 위해 물 부문에서 널리 적용되었다. Kim et al.는 k-최근접 이웃 접근 방식(k-nearest neighbor approach)을 사용하여 화학적 산소 요구량(COD), 부유 고형물(SS), 총 질소(TN) 및 총 인(TP)을 포함한 예측 폐수 성분을 예측하였고, Boyd et al.는 ARIMA(autoregressive integrated moving average, 자기회귀 통합 이동 평균)를 사용하여 북미의 5개 WWTP에서 일일 유입량을 예측했다. Wang et al.는 ARIMA와 EMD(경험적 모드 분해)를 결합하여 중국 저수지의 장기적인 연간 유출수를 예측했다. 이러한 조사는 복잡한 상호 작용과 영향을 미치는 변수의 특징을 포착하는 데 어려움을 겪었지만 부정확한 예측 결과를 제시했고 모델 및 시간 지연을 훈련하기 위한 값비싼 계산 요구로 어려움을 겪었다. 유입 유량과 구성 요소는 복잡하고 시간이 지남에 따라 변하기 때문에 미래의 영향 특성을 예측하려면 방대한 데이터 세트에서 유익한 특성을 추출하여 메커니즘에 대한 깊은 이해가 필요하다.

일부 연구에서는 영향 예측 모델을 개발하기 위해 DL 알고리즘을 구현하려고 시도했다. Li et al.은 희소 자동 인코더와 LSTM(장단기 기억) 네트워크를 기반으로 하는 용존 산소의 하이브리드 예측 모델을 제안했습다. Wang et al.은 CNN과 LSTM으로 구성된 하이브리드 모델을 사용하여 도시 하수에서 동적 COD를 예측했다. 기존 접근 방식과 비교하여 이러한 DL 기반 모델은 예측 성능이 향상되었다. 그럼에도 불구하고, 이러한 연구는 단기 기간과 불충분한 데이터 세트만을 포함했으며, 다양한 수원에 대한 영향 부하 메커니즘 및 비호환성에 대한 깊은 이해와 함께 예측 능력에 대한 탁월한 증거를 제공하지 못했다. 효과적인 데이터 기반 방법을 활용하지 않은 이전 연구의 기존 하이브리드 모델은 영향 하중의 높은 비선형 및 비정상 특성으로 인해 시간 지연과 같은 과적합 문제에 쉽게 빠질 수 있다. 게다가, 그들은 DL 기반 하이브리드 예측 모델이 피드백-피드포워드 제어를 위한 피크 부하를 안내하는 스마트 전략 및 예측 유지 보수를 위한 실제 WWTP 운영에 실제로 적용할 수 있음을 보여주지 않았다. 따라서 스마트 폐수처리시설의 구현을 위해서는 유량, COD, TN, TP 등 주요영향성분의 뛰어난 예측능력을 갖춘 혁신적인 예측모형이 개발되어야 한다.

대한민국 공개특허 10-2021-0058231 대한민국 등록특허 10-1629240 대한민국 공개특허 10-2014-0142491 대한민국 공개특허 10-2015-011167

따라서 본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 실시예에 따르면, 하수처리장에 유입되는 유입수의 성상별 부하량을 예측하기 위한 심층 인공신경망 기반 예측모델을 제공하는데 그 목적이 있다.

본 발명의 실시예에 따르면, 동적 유입 부하를 예측하기 위한 방법으로 인공지능 방법론 중 심층 인공 신경망을 이용하여 유입수 내 주요 오염물질 측정 인자를 예측하기 위한 유입수 예측 모델을 제안하는데 그 목적이 있다.

본 발명의 실시예에 따르면, 세부 기술 원리로는 Hilbert-Haung transform 방법에 기반한 empirical mode decomposition을 활용해 유입수의 성상 데이터를 서로 다른 orthogonal basis로 분해하여 기간별 유입 부하의 동특성을 분석하고, 이를 바탕으로 유입수의 성상 별 동특성을 고려할 수 있는 multimodal learning과 ensemble learning 기반 유입수 예측 모델을 생성하여 단기(1시간 후), 장기(1일 후), 단계별(1시간부터 24시간까지) 유입 부하를 예측할 수 있는 인공기능 기반 하수처리장의 유입 부하 예측방법을 제공하는데 목적이 있다.

본 발명의 실시예에 따르면, 실규모 하수처리장의 유입 부하 예측 시, 기존 종래 계산독성학 모델과 비교하여, 90% 이상의 뛰어난 예측력을 보이고, 다양한 유입수 성상에 적용 가능하며 다양한 시간 단위의 유입수 오염물질의 농도를 빠른 시간 안에 예측할 수 있어 다양한 수처리 분야에 적용될 수 있는, 인공기능 기반 하수처리장의 유입 부하 예측방법을 제공하는데 목적이 있다.

한편, 본 발명에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 발명의 목적은 하수처리장의 유입 부하를 예측하는 방법으로서, 유입수의 성상 데이터로부터 기간별 유입 부하의 동특성을 분석 제1단계; 및 상기 유입부하의 동특성을 기반으로 유입수 예측모델을 생성하는 제2단계;를 포함하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법으로서 달성될 수 있다.

그리고 생성된 유입수 예측모델을 통해 새로운 유입수를 예측, 평가하는 제3단계;를 포함하는 것을 특징으로 할 수 있다.

또한 상기 제1단계에서, 유입수의 성상 데이터를 Hilbert-Haung transform 방법에 기반한 경험적 모드분해(empirical mode decomposition)를 활용해 orthogonal basis로 분해하여 기간별 유입 부하의 동특성을 분석하는 것을 특징으로 할 수 있다.

그리고 상기 제1단계 후에, 분해된 유입 성상 데이터를 슬라이딩 윈도우 기법(sliding window technique)을 이용해, 데이터 차원 재구성(data dimension reconstruction)을 하는 단계를 더 포함하는 것을 특징을 할 수 있다.

또한 상기 제2단계는, 딥러닝을 기반으로 예측모델을 생성하는 것을 특징으로 할 수 있다.

그리고 상기 심층 인공신경망은 다중모드학습(multimodal learning)과 앙상블 학습(ensemble learning) 기반 알고리즘을 이용한 것을 특징으로 할 수 있다.

또한 상기 다중모드학습과 앙상블 학습을 기반으로 유입수 내 주요 요염물질 측정인자를 예측하기 위한 유입수 예측모델을 생성하는 것을 특징으로 할 수 있다.

그리고 상기 제2단계 후에, 유입수의 성상데이터를 학습하고 유입 성상별 예측모델을 생성하는 단계를 더 포함하는 것을 특징으로 할 수 있다.

본 발명의 실시예에 따르면, 하수처리장에 유입되는 유입수의 성상별 부하량을 예측하기 위한 심층 인공신경망 기반 예측모델을 제공할 수 있다.

본 발명의 실시예에 따른 인공기능 기반 하수처리장의 유입 부하 예측방법에 따르면, 동적 유입 부하를 예측하기 위한 방법으로 인공지능 방법론 중 심층 인공 신경망을 이용하여 유입수 내 주요 오염물질 측정 인자를 예측할 수 있는 효과를 갖는다.

본 발명의 실시예에 따른 인공기능 기반 하수처리장의 유입 부하 예측방법에 따르면, 세부 기술 원리로는 Hilbert-Haung transform 방법에 기반한 empirical mode decomposition을 활용해 유입수의 성상 데이터를 서로 다른 orthogonal basis로 분해하여 기간별 유입 부하의 동특성을 분석하고, 이를 바탕으로 유입수의 성상 별 동특성을 고려할 수 있는 multimodal learning과 ensemble learning 기반 유입수 예측 모델을 생성하여 단기(1시간 후), 장기(1일 후), 단계별(1시간부터 24시간까지) 유입 부하를 예측할 수 있는 효과를 갖는다.

본 발명의 실시예에 따른 인공기능 기반 하수처리장의 유입 부하 예측방법에 따르면, 실규모 하수처리장의 유입 부하 예측 시, 기존 종래 계산독성학 모델과 비교하여, 90% 이상의 뛰어난 예측력을 보이고, 다양한 유입수 성상에 적용 가능하며 다양한 시간 단위의 유입수 오염물질의 농도를 빠른 시간 안에 예측할 수 있어 다양한 수처리 분야에 적용될 수 있는 장점이 있다.

한편, 본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 발명의 상세한 설명과 함께 본 발명의 기술적 사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석 되어서는 아니 된다.
도 1은 M-WWTP의 개념적 구성,
도 2는 한국의 M-WWTP에서 측정된 유입 데이터 (a) 일일 유량 (b) BOD (c) 화학적 산소 요구량 (d) 부유 고체 (e) 총 질소 (f) 총 인 (g) 시간당 유량,
도 3은 서로 다른 시간 지연에 대한 자기상관 계수 (a) 일일 유량 (b) 시간당 유량,
도 4는 본 발명의 실시예에 따른 M-WWTP에서 영향 예측을 위해 데이터 기반 하이브리드 접근 방식의 개념적 구성도,
도 5는 (a) ME-DeepL 아키텍처, (b) 1D-CNN, (c) 최대 풀링, (d) GRU 및 (e) DNN 계층의 도식적 표현,
도 6은 HHT 기반 EMD를 사용하여 일일 유량 데이터에 대한 (a) 원본 데이터 세트 및 (b) 분해된 하위 계층 구성,
도 7은 유입수 COD에 대한 ME-DeepL 예측 모델의 예측 결과, (a) 2017년 7월부터 2018년 12월까지 ME-DeepL 모델에 의한 장기 예측 측정값 및 예측값, (b) 2017년 8월 5일부터 9월 24일까지의 예측 성과 비교, (c) 5개의 참조 예측 모델을 사용한 평가 지표,
도 8은 ME-DeepL 예측 모델의 시간 분해능의 유입량 예측 결과 (a) ME-DeepL 모델의 실제 및 예측 값, (b) 참조 모델과의 24시간 예측 성능 비,
도 9는 ME-DeepL 예측 모델의 시간 분해능의 유입량에 대한 다단계 예측 결과 (a) ME-DeepL 모델의 실제 및 예측 값, (b) 참조 모델과 다단계에서의 예측 성능 비교이다.

이상의 본 발명의 목적들, 다른 목적들, 특징들 및 이점들은 첨부된 도면과 관련된 이하의 바람직한 실시예들을 통해서 쉽게 이해될 것이다. 그러나 본 발명은 여기서 설명되는 실시예들에 한정되지 않고 다른 형태로 구체화될 수도 있다. 오히려, 여기서 소개되는 실시예들은 개시된 내용이 철저하고 완전해질 수 있도록 그리고 통상의 기술자에게 본 발명의 사상이 충분히 전달될 수 있도록 하기 위해 제공되는 것이다.

본 명세서에서, 어떤 구성요소가 다른 구성요소 상에 있다고 언급되는 경우에 그것은 다른 구성요소 상에 직접 형성될 수 있거나 또는 그들 사이에 제 3의 구성요소가 개재될 수도 있다는 것을 의미한다. 또한 도면들에 있어서, 구성요소들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다.

본 명세서에서 기술하는 실시예들은 본 발명의 이상적인 예시도인 단면도 및/또는 평면도들을 참고하여 설명될 것이다. 도면들에 있어서, 막 및 영역들의 두께는 기술적 내용의 효과적인 설명을 위해 과장된 것이다. 따라서 제조 기술 및/또는 허용 오차 등에 의해 예시도의 형태가 변형될 수 있다. 따라서 본 발명의 실시예들은 도시된 특정 형태로 제한되는 것이 아니라 제조 공정에 따라 생성되는 형태의 변화도 포함하는 것이다. 예를 들면, 직각으로 도시된 영역은 라운드지거나 소정 곡률을 가지는 형태일 수 있다. 따라서 도면에서 예시된 영역들은 속성을 가지며, 도면에서 예시된 영역들의 모양은 소자의 영역의 특정 형태를 예시하기 위한 것이며 발명의 범주를 제한하기 위한 것이 아니다. 본 명세서의 다양한 실시예들에서 제1, 제2 등의 용어가 다양한 구성요소들을 기술하기 위해서 사용되었지만, 이들 구성요소들이 이 같은 용어들에 의해서 한정되어서는 안 된다. 이들 용어들은 단지 어느 구성요소를 다른 구성요소와 구별시키기 위해서 사용되었을 뿐이다. 여기에 설명되고 예시되는 실시예들은 그것의 상보적인 실시예들도 포함한다.

본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 '포함한다(comprises)' 및/또는 '포함하는(comprising)'은 언급된 구성요소는 하나 이상의 다른 구성요소의 존재 또는 추가를 배제하지 않는다.

아래의 특정 실시예들을 기술하는데 있어서, 여러 가지의 특정적인 내용들은 발명을 더 구체적으로 설명하고 이해를 돕기 위해 작성되었다. 하지만 본 발명을 이해할 수 있을 정도로 이 분야의 지식을 갖고 있는 독자는 이러한 여러 가지의 특정적인 내용들이 없어도 사용될 수 있다는 것을 인지할 수 있다. 어떤 경우에는, 발명을 기술하는 데 있어서 흔히 알려졌으면서 발명과 크게 관련 없는 부분들은 본 발명을 설명하는데 있어 별 이유 없이 혼돈이 오는 것을 막기 위해 기술하지 않음을 미리 언급해 둔다.

이하에서는 본 발명의 실시예에 따르면, 복잡한 하수처리장(WWTP) 프로세스의 변동하는 유입 부하를 예측하기 위한 새로운 하이브리드 프레임워크를 제안한다. 이와 관련하여 본 발명의 실시예에서는 유입수 데이터 세트의 고도로 비선형적인 특성을 처리하여 예측 능력을 보존할 수 있는 다중 모드 및 앙상블 기반 DL(ME-DeepL) 알고리즘을 기반으로 하는 전문 예측 모델을 생성하는 것이다.

본 발명의 실시예에서는 변동하는 유입 하중에서 고유한 시간 패턴을 식별하기 위해 HHT(Hilbert-Huang 변환) 방법을 사용하여 원본 유입 데이터를 여러 고유 모드 함수(IMF)로 EMD; 다양한 예측 범위를 제공하기 위해 슬라이딩 윈도우 기법에 의한 IMF의 데이터 차원 재구성하고, ME-DeepL 아키텍처는 1-D-CNN, GRU(gated recurrent unit) 및 완전 연결된 고밀도 레이어를 통합한다. 이러한 레이어를 결합하면 seq2seq 문제로 유입 부하의 비선형 및 비정상 데이터 예측 성능이 향상된다.

본 발명의 실시예에 따른 새로운 하이브리드 프레임워크는 데이터 분해 방법을 통해 불규칙한 정보를 무시하는 것과 관련된 ME-DeepL 아키텍처의 속성별 우수한 예측 기능을 제시한다. 특히 ME-DeepL 구조는 정보적 특징을 추출하고 다양한 규모의 IMF에서 시간적 패턴을 포착함으로써 영향력의 다중 규모 특성을 인식하는 DL 알고리즘의 조합을 도왔다. 실제 WWTP의 장단기 운영 전략을 안내하기 위해 제안된 예측 프레임워크의 타당성을 검증하기 위해 일별(1일 전), 시간별(1시간 전), 다단계(1~24시간 전)에 적용했다. 그리고 한국의 WWTP 사례 연구에 대한 예측 범위 및 실험 결과를 널리 사용되는 5가지 다른 예측 프레임워크(예: RNN, LSTM, GRU, 스택형 GRU 및 CNN-GRU)와 비교하였다.

이하에서는 1) 측정된 유입수 성상 데이터와 목표 WWTP에 대해 설명하고, 2) HHT 방법에 기반한 데이터 분해, 데이터 차원 재구성을 위한 슬라이딩 윈도우 및 ME-DeepL 아키텍처를 통합한 제안된 하이브리드 영향 예측 모델에 대해 설명하고, 3) 본 발명의 실시예에 따른 모델의 예측 성능에 대한 실험데이터를 설명하도록 한다.

먼저, 국내 M-WWTP 유입수 데이터 분석에 대해 설명하도록 한다. 도 1은 한국 M-city의 M-WWTP(M-municipal WWTP)의 개념도를 나타낸 것이다. M-WWTP의 최대 용량은 16,000 m³/day이며 막생물 반응기(MBR)가 있다. 유입수 데이터 세트에는 2010년 1월 12일부터 2018년 12월 31일까지 일일 분해능에서 유량, 생화학적 산소 요구량(BOD), COD, SS, TN 및 TP 값이 포함된다. 또한, 유입유량 데이터는 2018년 1월 1일부터 2018년 2월 28일까지 시간별 분해능으로 측정되었다. 표 1은 유입 성분에 대한 통계를 설명한다. 측정된 유입 성분은 광범위한 표준편차(SD)를 나타내어 M-WWTP 운영을 복잡하게 만들었다. 영향 오염물질의 왜도 값은 -0.5에서 0.5 사이였으며, 각 성분의 분포는 거의 대칭적이었다. 한편, 시간별 및 일별 분해능에서 유입유량은 -1 미만의 왜도 값을 나타내어 매우 치우친 분포를 나타낸다. 유속 분포의 꼬리는 비선형 거동을 나타내는 정규성에서 분기되었다. 특히, 일유량 데이터세트에 비해 상대적으로 꼬리가 두꺼운 분포를 갖는 시간당 유량 데이터 세트는 강한 비선형 특성을 보였다.

[표 1]

예비 데이터 분석은 WWTP의 센서에 의해 제공되는 가능한 누락 데이터 및 이상값을 검색하기 위해 수행되었다. 수집된 데이터 중 이상치를 검출하기 위해 평균 절대편차 방법을 사용하였으며, 이는 이상치가 분산 추정치를 부풀리는 산업 데이터세트를 처리할 수 있다. 도 2는 M-WWTP에서 수집된 영향 데이터세트의 전처리 과정을 보여주고 있다. 도 2에서 관리 상한과 하한은 이상값 탐지를 위한 임계값을 의미한다. 누락된 데이터에는 0 값이 지정되고 이상값으로 처리되었다. 일별 및 주별 변조를 고려하여 동일한 시간 또는 연속 일에 대한 데이터 경향에 따라 선형 보간법으로 대체했다. 도 2(d)에서 SS 성분의 농도는 3,195 일점에서 낮았으며(5 mg/L) 공장 운영자의 권고에 따라 주변 데이터와 차이가 있어 이상치로 대체하였다.

전처리된 데이터 세트의 비정상 거동을 평가하기 위해 자기상관 분석이 활용되었다. 각 구성요소의 자기상관 함수는 매일 측정된 데이터 세트가 1년 이내의 이전 측정값과 주기적인 주기로 상관됨을 의미한다. 특히 일별 유량은 도 3(a)에서 볼 수 있듯이 이전 측정 및 시간 패턴과 강한 상관 관계가 있다. 마찬가지로 도 3(b)의 시간당 측정된 유량 데이터는 일주기와 상관관계가 있었다. 자기상관 플롯의 선분 길이는 점차 감소했으며 이 패턴은 지연이 증가하는 동안 계속되어 데이터세트가 비정상 계열임을 나타낸다.

이하에서는 M-WWTP의 유입량과 구성요소를 예측하기 위해 본 발명에서 제안하는 프레임워크를 설명한다. 이 프레임워크의 구현은 도 4에 도시되어 있다. 유입 유량과 그 구성 요소의 하이브리드 예측 프레임워크는 세 부분으로 개발되었다. A HHT 방법에 의한 유입 부하의 데이터 분해; B 슬라이딩 윈도우 분석에 의한 데이터 차원 재구성; C ME-DeepL 아키텍처 기반의 영향 예측 모델 생성을 포함하여 구성된다. 본 발명에서 영향 예측 모델은 시간별(1시간 앞서), 일별(1일 앞서) 및 다단계(1시간에서 24시간까지) 예측 범위에 대해 개발되었다.

A. 유입수 성상 데이터 분해

HHT는 문제가 되는 진동 데이터를 다양한 주파수의 특성을 유지하면서 IMF로 명명된 시간 영역에서 유한하고 적은 수의 단순 고조파 함수로 분해하는 데이터 기반 접근 방식이다. 따라서 폐수 영향을 설명하는 것과 같은 비정상 및 비선형 데이터 세트에 적용된다. IMF는 극한값과 영교차 수가 같은 함수로 정의된다. 극대값과 극소값으로 정의된 대칭 포락선을 사용하여 계산한다. 이 분해 방법은 입력 데이터의 국부적 특성을 기반으로 하기 때문에 데이터 고유의 비선형 및 비정상 프로세스를 적응적으로 식별할 수 있어 다른 EMD 접근 방식보다 우수하다. 데이터 세트를 IMF로 분해하는 것은 M-WWTP의 유량 및 구성 요소에 대한 원시 영향 데이터에 대해 다음과 같이 수행할 수 있는 이동 프로세스이다.

1) 입력 행렬 X =[x1 ,x1 ,...,xt ]로 유량 및 성분에 대한 시계열 유입 데이터를 고려한다. 국소 극대값과 극소값을 포함한 모든 극값을 식별하고 이를 3차 스플라인 선으로 위쪽 및 아래쪽 envelopes로 연결합니다. 그런 다음 식 (1)에서 X와 해당 envelopes의 평균값의 차이를 계산한다.

2) H₁이 IMF의 정의를 만족한다면, H₁은 첫 번째 IMF(C₁)로 할당된다. 그렇지 않으면 식 (2)에서 IMF의 정의를 충족할 때까지 첫 번째 단계를 반복한다. 이동 프로세스(k)의 반복 단계 수는 정지 기준에 따라 결정된다.

3) 최단주기 성분 C₁을 확인한 후, 식 (3)을 이용하여 원본 데이터와 분리할 수 있다. 시프팅 과정을 반복하여 잔여 데이터 R1,...,Rn-1에서 더 많은 확장 주기 성분 C₂,...,C_n을 추출할 수 있다. 원본 유입 데이터 세트는 식 (4)와 같이 n-경험적 모드와 잔여 Rn으로 분해될 수 있다. Rn이 단조 함수가 될 때; 더 이상 IMF를 추출할 수 없다.

B. 데이터 차원 재구성(Data Dimension Reconstruction)

비정상 유입수 데이터 세트에서 추출된 IMF C₁,...,C_n 및 잔류물 R_n은 슬라이딩 윈도우 분석(sliding-window analyses)에 사용할 수 있다. 이 기법은 원래 영향을 미치는 데이터의 하위 계층에서 숨겨진 복잡한 패턴의 트랙을 공개하고 추적함으로써 시간 종속적 예측 성능을 향상시킬 수 있다. 입력 IMF는 작업 창의 길이(m)를 할당하여 더 높은 차원의 공간으로 확장되었다. 각 IMF, C_i는 길이가 t(샘플링된 시간)인 벡터이다. 작업 윈도우(S_j)의 행렬로 입력 IMF의 위상 재구성은 식 (5)에 나와 있다. 이것은 예측 모델이 분해된 신호의 시간적 패턴에서 중요한 정보를 이용하도록 강요했다. 각 작업 윈도우 방식에서, 유입 부하의 분해된 하위 계층은 행렬 S로 재구성되었다. S_j는 시간 t - m + 1에서 t까지의 과거 및 현재 유입수 데이터를 포함한다. 관측치가 업데이트되는 동안 최신 영향 값 x_t+1이 추가되었고 작업 윈도우 구성표가 S_j에서 S_j+1로 이동하여 작업 위도우 구성표의 일관성을 보장한다. 슬라이딩 윈도우 기법은 데이터 세트의 끝에 도달할 때까지 데이터 차원을 재구성하기 위해 지속적으로 작동했다.

C. 다중모드 및 앙상블 기반 딥러닝 아키텍처(Multimodal and Ensemble-Based DL Architecture)

본 발명의 실시예에 따른 하이브리드 예측 프레임워크의 핵심 메커니즘은 ME-DeepL에 의해 설계되었다. 예측 모델은 변동하는 영향 부하를 모델링하기 위해 원래 데이터 세트의 다른 시간 패턴을 나타내는 직교 기반(orthogonal basis)으로 다중 모드 소스로 간주될 수 있는 입력 IMF의 유익한 기능을 연결해야 한다.

ME-DeepL 아키텍처는 여러 IMF의 관련 정보에 대한 융합 학습을 포함하여 IMF의 다중 모드 특성을 처리하기 위해 여러 DL 알고리즘의 강점을 결합한다. 또한 앙상블 접근법은 지역 최적에 빠질 가능성을 줄이고 모델 성능을 높일 수 있다고 보고되었다. 이와 관련하여 제안된 다중 모드 앙상블 학습 기반 DL 아키텍처는 도 5(a)와 같다. 제안된 ME-DeepL 아키텍처에서 동기는 CNN, GRU 및 심층 신경망(DNN)과 같은 특수 DL 알고리즘의 조합을 통해 IMF의 시간 패턴에서 중요한 정보를 캡처하는 데 중점을 둔다. IMF의 unimodal 데이터는 각 학습기 모듈로 전파되어, 제안된 아키텍처는 학습기 모듈의 특수 DL 알고리즘에 의해 포착된 장단기 계절성에 대한 인식 정보를 연결하여 정보를 합성할 수 있다. 결과적으로, 예측 프레임워크는 다양한 예측 범위에서 고도의 비선형 및 비정상 영향 하중에 대해 더 신뢰할 수 있고 우수한 결과를 나타낼 수 있다.

CNN은 주기적 신호 데이터(즉, IMF)의 숨겨진 표현을 분석하기 위한 학습 모듈의 게이트로 결정된다. CNN의 작업 과정은 도 5(b)와 같다. CNN은 컨볼루션 필터를 통해 방대한 데이터 세트에서 주요 특징을 자동으로 추출하는 뛰어난 신경망 알고리즘이다. 시계열 데이터의 경우 1-D CNN은 로컬 패턴을 인식하고 순차적 데이터 세트에서 1-D 하위 시퀀스 기능을 추출하는 데 적합하다. S_j에서 재구성된 데이터 S_jt의 IMF는 처음에 다음 식 6과 같이 정의된 컨볼루션 계층으로 전파된다.

여기서 F는 p번째 레이어의 q번째 컨벌루션 커널(convolutional kernel)과 관련된 벡터를 나타낸다. f는 비선형 함수이고, K^l _p,q는 p번째 입력 맵과 q번째 출력 맵 사이의 l번째 레이어에 있는 컨볼루션 커널이고, b^l _q은 해당 바이어스를 나타낸다. 구현된 CNN 레이어는 식 (6)의 컨볼루션 연산으로 인해 영향을 받는 데이터의 숨겨진 표현을 효과적으로 제공할 수 있으며 자유 변수의 수를 줄이고 시퀀스에 의한 불변성을 제공할 수 있다. 또한 CNN은 숨겨진 표현을 식별하기 위해 계층을 연속적으로 합성할 때 이점을 보여준다. 일반적으로 최대 풀링 계층[도 5(c) 참조]은 CNN 계층 뒤에 활용되어 최대 풀링 연산, 풀링을 통해 자유 변수를 줄이면서 차원 축소를 달성한다.

여기서,

는 최대 풀링 레이어의 가중치이다.

GRU는 장기간의 데이터 시퀀스를 처리하는데 사용되었다. GRU의 구조는 도 5(d)와 같다. GRU는 가장 강조된 메모리 셀 기반 순환 신경망(RNN) 구조 중 하나로, 동적 정보를 모델링하고 영향과 같은 순차적 데이터의 시변 특성을 캡처하는 데 특화되어 있다. GRU 셀은 데이터 전파를 제어하고 네트워크 내에서 시간 종속성을 캡처하기 위한 업데이트 게이트(Z)와 리셋 게이트(r)로 구성된다. 이전 메모리 값 중 다음 상태로 전파되는 양을 결정한다. 한편, 리셋 게이트는 이전 상태에 직접 적용되어 새로운 입력을 저장된 정보와 통합한다. GRU는 망각 요인과 상태 단위 업데이트 결정을 동시에 제어하는 단일 게이팅 단위에서 더 적은 구조 매개변수를 가지고 있다. 대규모 ME-DeepL 아키텍처가 교육 기간 동안 최적화되는 데 도움이 될 수 있다. GRU 셀에서 데이터 전파 절차는 다음 방정식으로 설명할 수 있다.

여기서 h는 GRU의 출력, W와 U는 가중치 벡터, b는 GRU의 바이어스 벡터이다.

모델 성능을 강화하기 위해 도 5(e)와 같은 DNN을 GRU 뒤에 부착하였다. 스택 레이어에 의한 과적합을 피하기 위해 노드의 10%가 삭제됩니다. DNN은 각 학습자 모듈을 결합하는 공동 모델로 활용되었다. 이 아키텍처는 각 모듈에서 추출된 IMF의 시간적 특징을 통한 융합 학습을 위해 설계되었다. 그런 다음 융합 기능이 회귀 계층으로 전파되어 유입 부하(

)을 예측한다.

이하에서는 앞서 언급한 예측모델에 대한 실험결과에 대해 설명하도록 한다. 먼저, 실험 셋업과 평가밥법에 대해 언급하도록 한다.

제안된 예측 모델을 개발하기 위해 데이터 세트를 8:2 비율을 고려하여 훈련 세트와 테스트 세트로 나누었다. 원래의 유입 부하에서 분해된 모든 IMF를 예측모형의 입력자료로 활용하여 원래의 유입 부하의 장단기적 특성을 고려하였다. 자기상관분석에 따르면, 작업창의 길이 m은 일일 훈련 데이터 세트(유입 오염물질 및 일일 유량)에 대해 21로, 시간당 유량 데이터 세트에 대해 24로 할당되었다. 신경망 모델은 Keras DL 라이브러리를 사용하여 개발되었다. 각 학습 모듈의 아키텍처는 20개의 커널 필터가 있는 4개의 CNN 및 최대 풀링 계층, 32개의 노드가 있는 1개의 GRU 계층, 16-4-1의 순차 노드가 있는 3개의 DNN 계층으로 구성된다. 훈련은 배치 크기가 128 및 200 Epoch인 미니 배치로 수행되었다. 본 발명에 따른 하이브리드 예측 모델은 세 가지 예측 범주와 비교하여 평가되었다. 표준 RNN; 메모리 게이트 RNN(LSTM 및 GRU); 및 단순 하이브리드 예측 모델(Stacked GRU 및 CNN-GRU).예측 모델의 성능은 식 (11), (12) 및 (13)에서 평균 절대 오차(MAE), 평균 절대 척도 오차(MASE), 평균 절대 백분율 오차(MAPE)로 비교되었으며, 여기서 yt는 시간 t에서 관측된 데이터이다.

M-WWTP에서 수집된 유입수 데이터 세트는 고유한 시간 패턴을 포함하는 HHT 기반 EMD 방법에 의해 IMF로 분해되었다. IMF의 수는 일유량, BOD, COD, SS, TN에 대해 10개, BOD에 대해 12개, 시간당 유량에 대해 14개였다. 분해된 서브 레이어에서 고주파수와 적은 수의 IMF는 원본 데이터의 랜덤 노이즈 정보와 단기 특성을 반영했다. 낮은 빈도와 많은 수의 IMF는 원래 데이터 세트의 연간, 반년 및 계절 패턴과 같은 시간 데이터 세트의 장기 주기적 특성을 반영했다.

데이터 분해의 경우, 도 6(a)는 유입 유량 데이터의 원래 시계열 플롯을 보여주고 도 6(b)는 IMF로의 분해 구성을 보여준다. 이 구성에서 HHT 기반 EMD 방법으로 분해된 값은 고유한 시간 패턴을 나타내는 원래 유입 유량 데이터의 숨겨진 하위 계층으로 수많은 IMF를 나타낸다. 각 하위 계층은 일일 유량 데이터 세트의 복잡한 패턴을 해석하는 데 필수적인 역할을 했다. 가장 짧은 주기 정보인 IMF₁은 유입 성분의 비선형 및 비정상적 특성을 가진 일별 패턴을 나타낸다. IMF₂~IMF₄는 주간 및 반월간 패턴을 반영했다. IMF₅~IMF₁₀은 유입을 받는 데이터 세트의 장기 특성을 반영했다. IMF₅~IMF₆은 월간 패턴을, IMF₇~IMF₈은 1개월~6개월 사이의 계절적 변조 패턴을 나타냈다. 게다가, IMF₉에서 IMF₁₀까지의 다른 구성요소는 연간에서 반십년 시간 척도에서 패턴 변화를 보였다. 각 IMF는 변동하는 영향하중의 비선형 및 비정상 데이터세트의 고유 패턴을 반영했다. 각 변조의 분해된 하위 계층은 부정확한 모델 성능을 방지하기 위해 예측 모델을 개발하는 데 활용되었다.

표 2는 일일 분해능에서 유입 부하에 대한 예측 성능을 보여준다. 본 발명에 따른 ME-DeepL 프레임워크에서 결합된 CNN, GRU 및 DNN 구조는 다중 모드 및 앙상블 학습 아키텍처의 속성으로 인해 로컬 최적에 떨어지지 않고 모든 영향 부하에 대해 우수한 예측 기능과 연관되었다.

[표 2]

각 평가 메트릭에 대해 MAE는 측정 데이터의 전체 추세를 따르고 균일한 분포를 갖는 예측 모델의 속성을 나타낸다. 표준 RNN 및 LSTM 구조에 의해 최악의 성능이 제공되는 반면, 다른 예측 범주는 구조에 GRU 셀의 통합을 고려할 때 적절한 성능을 나타냄에 유의해야 한다. 그럼에도 불구하고 본 발명에 따른 하이브리드 모델의 특별한 형성은 예측 능력을 강화시켰다. 각 학습 모듈의 GRU는 IMF의 서로 다른 시간 척도의 시간적 패턴에만 초점을 맞추기 때문에 GRU 구조의 메모리 게이트 메커니즘은 IMF의 시변 속성을 처리하는 것을 가능하게 했다. 따라서 ME-DeepL 접근법의 새로운 구조는 데이터 분해 방법에 따라 영향 부하의 비선형 및 비정상 데이터 예측 성능을 향상시켰다.

또한 본 발명에 따른 ME-DeepL 모델은 각각의 영향하중 사례에 대해 가장 낮은 MASE 값을 갖는다. 특히, 본 발명에 따른 하이브리드 모델은 모든 영향 하중에 대해 MASE 값이 1 미만이다. MASE 값이 1보다 낮을수록 데이터셋의 전체적인 경향을 동시에 만족시켜 피크를 포착하는 높은 예측 성능을 나타낸다고 보고되었다. 예측 능력의 단순지표인 MAPE의 경우 개발된 복합예측모형이 각 유입하중에 대해 90% 이상의 정확도를 달성함을 나타내었다. 이러한 예측 성능은 다른 모델을 능가하여 실제 WWTP 운영에 활용하기에 적합하다. HHT 기반 분해의 장점은 모델의 데이터 증대로 노이즈를 피할 때 더욱 강력해진다. 그러나 입력의 기능이 늘어남에 따라 표준 및 메모리 셀 기반 RNN 모델은 신호의 정보 표현을 캡처하는 데 거의 최적화되지 않는다. 반면, 시간적 특징 추출에 특화된 학습자 모듈의 CNN 알고리즘으로 인해 본 발명에 따른 하이브리드 예측 모델은 변동하는 영향 부하의 장단기 특성을 분석할 때 우수한 특성을 나타냈다. 이 경우 다중모드 앙상블 기반 하이브리드 모델은 원래 영향하중의 하위 계층에서 각 주파수의 가변성을 집중적으로 인식한다. 결과적으로 학습 모듈에서 CNN과 GRU 구조의 조합은 IMF의 다양한 시간 척도에서 유익한 기능과 시간 패턴을 캡처하도록 최적화되었다.

도 7은 제안된 ME-DeepL 예측 모델을 이용한 COD 성분의 예측 결과를 보여준다. 그것은 본 발명에 따른 모델이 높은 정확도로 변동하는 영향 성분을 예측했음을 보여준다. 도 7(a)에서 2017년 7월부터 2018년 12월까지 GRU 기반 모델의 예측 결과는 측정 데이터의 전반적인 추세를 따르며 본 발명에 따른하이브리드 모델이 변동하는 영향력에 대해 COD 성분의 시변 특성을 반영할 수 있음을 나타낸다.

또한 예측 결과는 변동하는 영향의 단기 속성을 이해하는 능력을 반영한다. 하이브리드 HHT 및 다중 모드 DL 모델은 다양한 COD 구성 요소의 최대 부하를 캡처했다. 결과적으로 다중 모드 앙상블 기반 예측 모델은 COD의 시계열 데이터의 경향과 영향의 변동 특성을 나타내는 피크의 높은 정확도를 명확하게 따른다. ME-DeepL은 도 7(b)~(c)와 같이 RNN 기반 참조 모델과 비교하여 가장 낮은 평가 지표에서 가장 낮은 값으로 우수한 조림 성능을 보였다. HHT 기반 분해가 영향을 미치는 COD의 전체 부하에서 하위 레이어의 장단기 계절성을 포착하여 시간적 패턴에서 시퀀스를 모델링하는 ME-DeepL 구조를 도왔다고 추론할 수 있다. 따라서 하이브리드 ME-DeepL 모델은 피크 부하 뿐만 아니라 시간별, 일별, 주별, 월별, 계절별 변동에 따른 다중규모의 유입부하 특성을 반영하여 장기 유입부하에 가장 적합한 예측접근법을 제공하였다.

시간별 예측의 경우 ME-DeepL 예측 모델의 MASE 값은 1시간 간격으로 0.564였다. 이 시간별 예측 결과는 본 발명에 따른 하이브리드 모델이 영향 하중의 비선형 및 시변 특성을 포함하여 측정 데이터의 대부분의 특성을 반영함을 나타낸다, 도 8은 시간당 유입유량에 대한 다중모드 하이브리드 모델의 1시간 전 예측 결과를 보여준다. 도 8(a)에서 보는 바와 같이 본 발명에 따른 ME-DeepL 모델은 피크 포인트를 포착하면서 변동된 유량의 시간별 경향을 따를 수 있다. 본 발명에 따른 예측 모델의 장점 중 하나는 하이브리드 HHT와 DL 기반 예측 모델이 측정된 영향 유량과 예측 영향 유량 사이에 시차를 보이지 않는다는 것이다. 종래 기술에서 기존의 영향 예측 모델은 다중 선형 회귀 및 ARIMA를 포함한 통계적 방법을 사용했으며 단순 인공 신경망은 예측 범위가 증가함에 따라 시간 지연에 직면했다. 종래 기술과 달리 본 발명에 따른 모델은 데이터를 하위 계층으로 분해하고 학습자 모듈로 전파하여 시스템 오류를 무시하는 것과 관련된 시계열 데이터 세트의 복잡한 패턴을 처리할 수 있다. 따라서 변동하는 원본 데이터의 데이터 분해는 CNN 블록이 주요 기능을 인식하고 RNN 기반 모델이 IMF의 고유 패턴을 입력으로 캡처하는 동시에 불필요하고 불규칙한 정보를 거부하는 데 도움이 되었다. 따라서 ME-DeepL 모델은 그림 8(b)와 같이 다른 RNN 기반 참조 모델보다 예측 능력이 높다.

하수처리장에서는 예측 모델의 높은 예측 성능을 고려하여 모든 WWTP의 정성적 운영을 달성할 수 있다. 이를 위해 도 9는 다단계(즉, 1~24시간 전)에서 유입유량에 대한 제안된 모델의 다단계 예측 결과를 보여준다. 일별 및 시간별 예측을 위해 본 발명에 따른 하이브리드 ME-DeepL 모델은 다단계에서 우수한 성능을 보여준다. 이 모델은 최대 24시간 전에 MAPE의 10%로 변동성이 큰 시간당 데이터 세트를 예측하는 것이 가능하다. 이 예측 접근 방식은 실제 WWTP에 적용할 수 있으며 운영자에게 실용적인 정보를 제공한다. 유입 유량에 대한 정확한 예측은 다양한 시간적 지평에서 유입 부하 경향을 안내할 수 있으며, 이는 하수 처리 공정의 최적 일정에 필수적이다. 운영자는 경제적이고 효율적으로 에너지 전달 및 화학 물질 투여량을 조절하여 실질적인 방식으로 폐수 시설의 효율성을 개선할 수 있다.

또한, 상기와 같이 설명된 장치 및 방법은 상기 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.

Claims

하수처리장의 유입 부하를 예측하는 방법으로서,
유입수의 성상 데이터로부터 기간별 유입 부하의 동특성을 분석 제1단계; 및
상기 유입부하의 동특성을 기반으로 유입수 예측모델을 생성하는 제2단계;를 포함하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 1항에 있어서,
생성된 유입수 예측모델을 통해 새로운 유입수를 예측, 평가하는 제3단계;를 포함하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 2항에 있어서,
상기 제1단계에서, 유입수의 성상 데이터를 Hilbert-Haung transform 방법에 기반한 경험적 모드분해(empirical mode decomposition)를 활용해 orthogonal basis로 분해하여 기간별 유입 부하의 동특성을 분석하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 3항에 있어서,
상기 제1단계 후에,
분해된 유입 성상 데이터를 슬라이딩 윈도우 기법(sliding window technique)을 이용해, 데이터 차원 재구성(data dimension reconstruction)을 하는 단계를 더 포함하는 것을 특징을 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 4항에 있어서,
상기 제2단계는, 딥러닝을 기반으로 예측모델을 생성하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 5항에 있어서,
상기 심층 인공신경망은 다중모드학습(multimodal learning)과 앙상블 학습(ensemble learning) 기반 알고리즘을 이용한 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 6항에 있어서,
상기 다중모드학습과 앙상블 학습을 기반으로 유입수 내 주요 요염물질 측정인자를 예측하기 위한 유입수 예측모델을 생성하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.
제 6항에 있어서,
상기 제2단계 후에, 유입수의 성상데이터를 학습하고 유입 성상별 예측모델을 생성하는 단계를 더 포함하는 것을 특징으로 하는 인공기능 기반 하수처리장의 유입 부하 예측방법.