KR102440372B1 - 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체 - Google Patents

빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체 Download PDF

Info

Publication number
KR102440372B1
KR102440372B1 KR1020220002536A KR20220002536A KR102440372B1 KR 102440372 B1 KR102440372 B1 KR 102440372B1 KR 1020220002536 A KR1020220002536 A KR 1020220002536A KR 20220002536 A KR20220002536 A KR 20220002536A KR 102440372 B1 KR102440372 B1 KR 102440372B1
Authority
KR
South Korea
Prior art keywords
data
influent
inflow
model
input
Prior art date
Application number
KR1020220002536A
Other languages
English (en)
Inventor
권종호
허재성
Original Assignee
니브스코리아 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 니브스코리아 주식회사 filed Critical 니브스코리아 주식회사
Priority to KR1020220002536A priority Critical patent/KR102440372B1/ko
Application granted granted Critical
Publication of KR102440372B1 publication Critical patent/KR102440372B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02WCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO WASTEWATER TREATMENT OR WASTE MANAGEMENT
    • Y02W10/00Technologies for wastewater treatment
    • Y02W10/10Biological treatment of water, waste water, or sewage

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Quality & Reliability (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Educational Administration (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)

Abstract

하수처리시설로 처리를 위하여 유입되는 유입수의 수량 및 수질을 기존의 유입수의 수량 및 수질 등에 대한 내역 정보에 관한 빅데이터를 기반으로 하여 예측할 수 있는 기술을 제공한다. 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법은, 일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리 단계; 전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축 단계; 및 유입수 예측 모델을 이용하여 도출된 예측 유입 데이터와, 실제 측정된 유입 데이터를 이용하여 유입수 예측 모델을 평가하고 학습시키는 모델 학습 단계;를 포함하는 것을 특징으로 한다.

Description

빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체 {PROVIDING METHOD, APPARATUS AND COMPUTER-READABLE MEDIUM OF MANAGING INFLUENT ENVIRONMENTAL INFORMATION OF SEWAGE TREATMENT FACILITIES BASED ON BIG DATA AND ARTIFICIAL INTELLIGENCE}
본 발명은 하수처리시설로 처리를 위하여 유입되는 유입수의 수량 및 수질을 예측하는 기술에 관한 것으로, 구체적으로는 기존의 유입수의 수량 및 수질 등에 대한 내역 정보에 관한 빅데이터를 기반으로 하여, 인공지능 학습 모델을 이용하여 하수처리시설에서 유입수의 수량 및 수질에 영향을 미치는 변수, 각 변수 간의 상관관계에 따라 유입수량 및 수질의 예측 모델을 학습시킴으로써, 하수처리시설의 구동 프로세스의 제어 및 관리단에서의 의사 결정을 지원하는 기술에 관한 것이다.
하수처리시설은, 지역 내의 하수관로를 통해 취합된 하수를 유입받고, 물리 화학적 반응이 이루어지는 반응조 내에서 하수를 처리하여 정화한 뒤 방류하는 시설로서, 수처리 시설에서 중요한 요소이다. 하수처리시설은 유입부, 반응조 및 방류부 등을 주요 요소로 포함한다.
하수처리시설에 유입되는 유입수량 및 유입수의 수질은 반응조의 운전 조건 및 방류수의 수질을 결정하는 데 직접적인 영향을 미치는 요소이다. 즉, 유입수의 유입 조건으로서의 유입수량 및 수질에 따라서 하수처리시설에서의 반응조의 운전 조건을 자동 또는 관리자가 설정할 수 있고, 이에 따라서 방류수의 수량 및 수질이 정해지기 때문에, 이에 따라서 정확한 공정 제어를 수행하는 것이 중요하고, 이러한 공정 제어는 자동으로 이루어질 수 있거나, 관리자의 의사 결정에 의하여 주기적으로 제어될 수 있다.
이러한 원인에 기인하여, 하수처리시설에 유입되는 유입수의 수량 및 수질을 이용하여 공정 제어에 활용하는 것은 상술한 공정 제어의 제어 조건으로서 특히 중요한 요소이며, 유입수의 수량 및 수질을 모니터링하는 기술에 대한 지속적인 개발이 이루어지고 있다. 예를 들어 한국등록특허 제10-1138319호 등에서는 유입수에 대한 모니터링을 통하여 센싱되는 인 농도에 따라서 처리수에 인이 포함되어 처리에 영향을 미치는 것을 방지하고, 이를 통해 수질을 모니터링하는 기술에 관하여 게시하고 있다.
또한 기존의 기술들에서는 유입수에 대한 다양한 센싱을 통해, 실시간으로 모니터링되는 유입수의 수량 및 수질에 따라서 반응조 내의 공정 제어 및 의사 결정에 대한 정보 제공을 수행하고 있다.
그러나 이러한 유입수의 수량 및 수질에 대한 모니터링 기술들은, 수질을 사후 측정하는 데 지나지 않아, 유입수에 따라서 사후에 이에 대한 대처를 수행할 수밖에 없어, 공정 제어를 위하여 활용할 수 있는 시간이 적어, 관리에 어려움이 있다. 즉, 미리 유입수량 및 수질을 예측하여, 환경 관리에 효율적으로 사전대처할 수 있는 기술에 대한 필요성이 증가되고 있는 것이다.
이에 본 발명은, 하수처리시설로 처리를 위하여 유입되는 유입수의 수량 및 수질을 기존의 유입수의 수량 및 수질 등에 대한 내역 정보에 관한 빅데이터를 기반으로 하여 예측할 수 있는 기술을 제공함으로써, 유입수량 및 수질의 센싱 후 이에 대한 공정 제어를 수행하는 것이 아니라, 미리 이를 예측하여 사전에 하수처리에 대한 공정 제어에 대한 대비가 가능하도록 하여, 환경 관리에 효율적으로 사전 대처할 수 있는 동시에, 공정 제어를 위한 의사결정 시간을 충분히 확보할 수 있도록 하는 기술을 제공하는 데 그 목적이 있다.
상기 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법은, 일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리 단계; 전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축 단계; 및 상기 유입수 예측 모델을 이용하여 도출된 예측 유입 데이터와, 실제 측정된 유입 데이터를 이용하여 상기 유입수 예측 모델을 평가하고 학습시키는 모델 학습 단계;를 포함하는 것을 특징으로 한다.
상기 데이터 전처리 단계는, 실시간으로 수집된 유입 데이터에 대한 수정된 Z-score를 이용하여 유입 데이터에 포함된 유입 수량 또는 수질값이 이상치로 판단되는 유입 데이터를 상기 모델 구축 단계 및 상기 모델 학습 단계에 적용할 유입 데이터로부터 제거하는 것이 가능하다.
상기 모델 구축 단계는, 상기 제1 분석 알고리즘을 이용하여, 유입 데이터의 주기성을 분석함으로써, 모델 구축 단계에 입력값으로 입력할 유입 데이터를 선택하는 제1 입력 변수 선정 단계; 상기 제2 분석 알고리즘을 이용하여, 유입 데이터에 영향을 미치는 것으로 파악되는 변수 데이터를 입력값으로 선택하는 제2 입력 변수 선정 단계; 상기 입력값을 데이터 정규화를 통해 정규화시키는 데이터 정규화 단계; 및 정규화된 입력값과 상기 출력값을 갖는 유입수 예측 모델을 시계열 데이터 분석 모델로 구축하는 모델 구축 단계;를 포함하는 것이 가능하다.
상기 유입수 예측 모델은, 장단기 메모리 저장(LSTM, Long Short Term Memory) 모델인 것이 가능하다.
상기 모델 학습 단계는, 상기 유입수 예측 모델을 통한 예측 유입 데이터와, 예측된 시점에서의 실제 측정된 유입 데이터 간의 오차값에 기반하여, 상기 유입수 예측 모델을 평가하는 모델 평가 단계; 및 상기 유입수 예측 모델에 대한 평가 결과 및 예측된 유입 데이터를 이용하여, 상기 유입수 예측 모델을 학습시키는 모델 학습 단계;를 포함하는 것이 가능하다.
상기 모델 평가 단계는, MAPE(Mean Absolute Percentage Error) 기법을 이용하여 상기 유입수 예측 모델을 평가하는 것이 가능하다.
상기 모델 평가 단계는, RMSE(Root Mean Squared Error) 기법을 이용하여 상기 유입수 예측 모델을 평가하는 것이 가능하다.
상기 모델 학습 단계는, 상기 평가 결과 및 예측된 유입 데이터를 이용하여 유입수 예측 모델에 대한 베이지안 최적화(Bayesian Optimization) 기법을 이용한 학습을 적용하여, 상기 유입수 예측 모델을 학습시키는 것이 가능하다.
한편 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 장치는, 일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리부; 전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축부; 및 상기 유입수 예측 모델에 과거의 유입 데이터를 이용하여 모델을 평가하고 학습시키는 모델 학습부;를 포함하는 것을 특징으로 한다.
본 발명에 의하면, 유입 수량 및 수질을 포함하는 유입 데이터의 시계열적인 변동 패턴과, 유입 데이터에 대응되는 하수처리시설의 반응 장치 및 배출 장치 등에 대한 이종 데이터 간의 상관관계를 이용하여, 유입 데이터를 예측 가능한 유입수 예측 모델을 구축하고, 이에 대한 이전 계측 데이터를 이용한 학습을 통해, 매우 높은 정확도로 하수처리시설의 유입 데이터를 예측할 수 있다.
이를 통해, 유입수량 및 수질의 센싱 후 이에 대한 공정 제어를 수행하는 것이 아니라, 미리 이를 예측하여 사전에 하수처리에 대한 공정 제어에 대한 대비가 가능해지기 때문에, 환경 관리에 효율적으로 사전 대처할 수 있는 동시에, 공정 제어를 위한 의사결정 시간을 충분히 확보할 수 있는 효과가 있다.
도 1 내지 3은 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법의 플로우차트.
도 4는 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 장치의 구성 블록도.
도 5는 본 발명의 일 실시예의 구현에 따라서 입력값이 도출되는 흐름을 설명하기 위한 도면.
도 6은 본 발명의 일 실시예의 구현에 따라서 구축되는 유입수 예측 모델의 예.
도 7은 본 발명의 일 실시예의 구현에 따라서 유입수 예측 모델이 학습되는 흐름을 설명하기 위한 도면.
도 8은 본 발명의 일 실시 예에 따른 컴퓨팅 장치의 내부 구성의 일 예.
이하에서는, 다양한 실시 예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.
본 명세서에서 사용되는 "실시 예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다.
또한, 제 1, 제 2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제 1 구성요소는 제 2 구성요소로 명명될 수 있고, 유사하게 제 2 구성요소도 제 1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
또한, 본 발명의 실시 예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시 예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1 내지 3은 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법의 플로우차트, 도 4는 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 장치의 구성 블록도, 도 5는 본 발명의 일 실시예의 구현에 따라서 입력값이 도출되는 흐름을 설명하기 위한 도면, 도 6은 본 발명의 일 실시예의 구현에 따라서 구축되는 유입수 예측 모델의 예, 도 7은 본 발명의 일 실시예의 구현에 따라서 유입수 예측 모델이 학습되는 흐름을 설명하기 위한 도면이다. 이하의 설명에 있어서 본 발명의 다양한 실시예 및 각 구성요소들에 대한 설명을 위하여 다수의 도면이 함께 참조되어 설명될 것이다.
또한, 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법은 후술하는 도 8에 도시된 컴퓨팅 장치, 즉 도 4에 도시된 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 장치(10, 이하 본 발명의 장치라 함)의 각 구성요소에 의하여 수행되는 것으로 이해될 것이다. 즉, 본 발명의 장치(10)는 도 8에 도시된 컴퓨팅 장치와 동일하거나, 컴퓨팅 장치에 포함되거나 다수의 컴퓨팅 장치로 구성되는 것으로 이해될 것이다.
컴퓨팅 장치는 본 발명의 일 실시예에 따른 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법의 수행에 있어서 먼저 일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리 단계(S10)를 수행한다.
일 하수처리시설이라 함은, 강에서 취수한 물을 상수도를 통해 공급하여 일반 가정의 생활용수나, 공장, 기타 산업형장에서 상업용수로 사용한 뒤, 오염되고 더럽혀진 물이 모이게 되며, 이를 정화하여 하천으로 방류하는 공정을 수행하는 시설을 의미한다.
하수처리시설에서 하수를 처리하는 과정은 크게 5단계로 이루어진다. 먼저, 1단계로서 침사지 및 유량조정조에서는, 하수중의 모래와 흙을 가라앉혀 제거한다. 침사지에서는 무거운 모래를 우선적으로 가라앉히며, 스크린이 설치되어 있어 협잡물(비닐, 큰 이물질)을 걸러주는 역할을 한다. 바닥에 가라앉은 토사는 정기적으로 제거하며, 스크린에 걸린 협잡물은 협잡물제거기를 이용하여 제거하고, 하수는 유량조정조에 저장된다. 유량조정조는 하수가 갑자기 많이 유입될 때 그 물량을 일시조정하여 다음 처리단계로 물량이 한꺼번에 많이 유입되는 것을 방지하고 일정하게 유입되도록 조정한다.
2단계는 최초침전지에서 수행되며, 하수중의 모래와 흙을 가라앉혀 제거한다. 침사지에서는 무거운 모래를 우선적으로 가라앉히며, 스크린이 설치되어 있어 협잡물(비닐, 큰 이물질)을 걸러주는 역할을 한다. 바닥에 가라앉은 토사는 정기적으로 제거하며, 스크린에 걸린 협잡물은 협잡물제거기를 이용하여 제거하고, 하수는 유량조정조에 저장된다. 유량조정조는 하수가 갑자기 많이 유입될 때 그 물량을 일시조정하여 다음 처리단계로 물량이 한꺼번에 많이 유입되는 것을 방지하고 일정하게 유입되도록 조정한다.
3단계는 폭기조로서, 공기를 넣어 미생물을 활성화시키고 오염물질을 미생물이 먹도록 한다. 하수처리장에서 가장 중요한 시설로서 유기물질(하수)을 미생물에 의해 분해하는 공정으로 최종방류수의 수질을 좌우한다. 유기물은 미생물에게 먹이가 되어 섭취 분해하는 공정을 거치게 된다.
4단계는 최종침전지에서 이루어지며, 맑은 물을 방류조로 보내고 미생물을 가라앉혀 농축조나 폭기조로 보낸다. 폭기조에서 처리된 물은 슬러지(미생물이 부착된 침전물 덩어리)와 함께 침전조로 넘어와 물과 슬러지로 분리되며, 위로 모인 깨끗이 처리된 물은 월류되어 방류구로 향하고 바닥에 가라앉은 슬러지는 한곳에 모여 일부는 폭기조로 되돌아 가고 일부는 농축조로 가서 쌓여 탈수기실로 옮겨진다.
마지막 5단계는 방류조로서, 정화된 맑은 물을 방류한다.침전조의 상등수가 최종방류되는 조로서 방류수의 최종 수질상태를 육안으로 확인하며, 염소 등으로 소독하는 장치를 포함한다.
본 발명에서 반응조라 함은, 하수처리시설에서 1 내지 4단계의 하수처리를 수행하는 공정을 포함하여, 방류조에서 염소 등으로 소독하는 장치를 모두 포함하는 개념으로서, 다시 말해 하수가 유입된 후 최종적으로 방류될 때까지 하수를 처리하는 모든 설비를 통칭하는 개념으로 이해될 것이다.
이에 따라서 반응조의 운전에 대한 조건 정보는 상기의 각 단계에서 이루어지는 처리 공정에 있어서 제어 단말(관리자 단말)에서 설정 가능한 모든 설비들의 각 운전 조건에 대한 정보의 그룹으로 이해될 것이다.
유입 조건 정보는, 하수처리시설에 유입되는 유입수의 수량 및 수질에 대한 모든 정보를 의미한다. 예를 들어, 유입 수량 및 유입 수질로서 온도, pH, SS(부유물질량, Suspended Solids), COD(화학적 산소요구량, Chemical Oxygen Demand), TN(총질소, Total Nitrogen), TP(총인, Total Phosphors), DO(용존 산소량, Dissolved Oxygen), BOD(생화학적 산소 요구량, Biochemical Oxygen Demand) 등을 포함하는 정보를 의미한다.
방류수의 수량 및 수질 정보는 유입 조건 정보와 동종의 정보를 포함하되, 최종적으로 상기의 5단계 후 방류되는 방류수에 대한 수량 및 수질에 관한 정보를 의미한다.
상기의 데이터들은 하수처리시설에 따라서 해당 시설에 설치된 센서 및 제어 단말 등에 따라서 다양한 통일되지 않은 포맷으로 관리될 수 있다. 본 발명에서는 S10 단계를 통해서 동시 처리에 문제가 발생될 수 있는 상기의 데이터들을 통합 처리 및 관리하기 위해서, 데이터를 단위 통합, 포맷 통합 등의 동일한 형식으로 가공 처리를 수행하거나, 비정상적인 데이터를 제거하는 등의 전처리를 수행하게 된다.
본 발명에서 비정상적인 데이터는, 실제 측정 값에 오류가 발생된 상태이거나, 센서의 고장 등으로 제대로 측정되지 않아 각 데이터 간의 정상적인 상관관계에 영향을 미칠 수 있는 오데이터를 제거할 필요가 있으며, 이에 해당하는 모든 데이터들을 의미한다. 또는 후술하는 유입수 예측 모델에 적용되기 힘든 패턴을 벗어난 모든 데이터를 의미할 수 있다.
이러한 비정상적인 데이터를 후술하는 S20 및 S30 단계에 적용하지 않는 것은 정확한 유입수 예측 모델의 구축 및 학습에 필수적이다. 이를 위해서 본 ㅏ발명에 있어서, S10 단계의 수행 시 컴퓨팅 장치는 데이터 전처리를 통해 이상치로 판단되는 유입 데이터를 S20 및 S30 단계에 적용할 유입 데이터로부터 제거할 수 있다.
이러한 이상치로 판단되는 유입 데이터의 판단 기준은 수정된 Z-score를 통하여 결정될 수 있다. 이상치(Anomaly)란 주어진 데이터 분포의 중심에서 떨어져 의미가 없는 데이터를 의미한다. 일반적으로 주어진 복수의 데이터(빅데이터 포함)에서 이상치를 찾는 가장 간단한 방법은 Z-score이다. Z-score는 데이터들의 평균과 표준오차가 정의되어 있을 때 일 데이터가 이들로부터 얼마나 벗어나 있는지 측정하는 지표이다. 그러나, 일반적인 Z-score에 있어서 평균은 이상치에 의하여 영향을 크게 받아, 평균이 지나치게 증가되거나 감소되는 경우 이상치를 발견하기 쉽지 않다.
이러한 문제를 해결하기 위하여, 상술한 수정된 Z-score(Modified Z-score)를 사용하게 된다. 수정된 Z-score에서는 중앙값과 중앙값의 절대편차(MAD, Median Absolute Deviation)를 이용하여 Z-Score를 산츨하게 된다.
Figure 112022002261481-pat00001
(median : 중앙값, MAD : 중앙값 절대 편차)
이러한 수정된 Z-score가 기설정된 임계치를 초과하거나, 초과된 순으로 기설정된 비율의 유입 데이터를 이상치로 판단하여 적용 대상 유입 데이터에서 제거하게 되는 것이다.
이와 같이 S10 단계의 수행에 따라서 유입 데이터가 전처리되면, 컴퓨팅 장치는, 전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축 단계(S20)를 수행한다.
본 발명에서 제1 분석 알고리즘은, 시계열적인 데이터에 있어서 주기적인 데이터들의 시계열적인 상관관계를 파악하기 위한 알고리즘이며, 제2 분석 알고리즘은 서로 다른 데이터들 사이의 상관관계를 파악하기 위한 알고리즘이다. 이들로부터 유입 수량 및 수질에 대한 예측에 관계된 것으로 판단되는 일정 시간 이전의 유입 수량 및 수질에 관한 유입 데이터 및 다른 기타 데이터들을, 유입수 예측 모델에서 적용될 입력값으로 결정하고, 이에 의하여 예측되는 유입 수량 및 수질에 대한 데이터인 예측 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하게 되는 것이다.
이에 대한 구체적인 흐름은 도 2를 참조하면, 컴퓨팅 장치는, 제1 분석 알고리즘을 이용하여, 유입 데이터의 주기성을 분석함으로써, 모델 구축 단계에 입력값으로 입력할 유입 데이터를 선택하는 제1 입력 변수 선정 단계(S211)와, 제2 분석 알고리즘을 이용하여, 유입 데이터에 영향을 미치는 것으로 파악되는 변수 데이터를 입력값으로 선택하는 제2 입력 변수 선정 단계(S212)를 함께 수행하게 된다.
이때 제1 분석 알고리즘은, 상술한 바와 같이 주기적인 데이터에 대한 분석을 위한 자기 상관관계의 파악을 위한 알고리즘으로서, 자기 상관함후(Autocorrelation function)으로도 지칭된다. 시계열 자료가 다른 자료, 대표적으로 횡단면 자료와 가장 큰 차이를 보이는 것은 바로 자료의 index가 시간(Time)이라는 것이고, 이로 인해 현재의 상태가 과거, 미래의 상태와 매우 밀접한 관련을 갖고 있다는 것이다. 즉 시간의 흐름에 따라서 독립적이지 않다는 뜻이며, 이러한 경우 시계열 자료는 자기상관관계를 갖는다고 지칭되며, 시간에 따른 상관 정보를 나타내기 위한 함수로서 상술한 자기상관함수를 사용하는 것이다.
한편, 제2 분석 알고리즘은, 서로 다른 데이터들 사이의 상관관계를 파악하기 위한 알고리즘으로서, 선형 또는 비선형의 각 데이터들 사이의 상관관계를 도출하기 위한 알고리즘을 의미한다. 예를 들어, 피어슨 상관계수(PCC, Pearson Correlation Coefficient) 분석 기법 및 주성분 분석(PCA, Principal Component Analysis) 기법 중 어느 하나를 이용하여, 세부 정보간의 상관관계를 파악할 수 있다.
피어슨 상관계수 분석 기법은, 두 변수 X 와 Y 간의 선형 상관 관계를 계량화한 수치다. 피어슨 상관 계수는 코시-슈바르츠 부등식에 의해 +1과 -1 사이의 값을 가지며, +1은 완벽한 양의 선형 상관 관계, 0은 선형 상관 관계없음, -1은 완벽한 음의 선형 상관 관계를 의미한다. 일반적으로 상관관계는 피어슨 상관관계를 의미하는 상관계수이다.
Figure 112022002261481-pat00002
표본(sample) 피어슨 상관 계수는 등간척도(간격척도)나 비례척도(비율척도)의 데이타에서 두 변수의 공분산(covariance)을 각각의 표준 편차의 곱으로 나눈 값이다.
주성분 분석 기법은, 고차원의 데이터를 저차원의 데이터로 환원시키는 기법을 말한다. 이 때 서로 연관 가능성이 있는 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간(주성분)의 표본으로 변환하기 위해 직교 변환을 사용한다. 데이터를 한개의 축으로 사상시켰을 때 그 분산이 가장 커지는 축을 첫 번째 주성분, 두 번째로 커지는 축을 두 번째 주성분으로 놓이도록 새로운 좌표계로 데이터를 선형 변환한다. 이와 같이 표본의 차이를 가장 잘 나타내는 성분들로 분해함으로써 데이터 분석에 여러가지 이점을 제공한다. 이 변환은 첫째 주성분이 가장 큰 분산을 가지고, 이후의 주성분들은 이전의 주성분들과 직교한다는 제약 아래에 가장 큰 분산을 갖고 있다는 식으로 정의되어있다. 중요한 성분들은 공분산 행렬의 고유 벡터이기 때문에 직교하게 된다.
주성분 분석은 신호처리 분야에서는 이산 카루넨-뢰브 변환, 다변량 품질 관리에서는 호텔링 변환, 기계공학에서는 적합 직교 분해(POD), 선형대수학에서는 특잇값 분해[1] 또는 고윳값 분해, 인자 분석[2]:Chapter 7, 심리측정학의 Eckart-Young 이론 (Harman, 1960) 또는 Schmidt-Mirsky 이론, 기상 과학의 실증 직교 함수(EOF), 소음과 진동의 실증적 고유 함수 분해(Sirovich, 1987)와 실증적 요소 분석(Lorenz, 1956), 준조화모드(Brooks et al., 1988), 스펙트럼 분해, 구조 동역학의 실증적 모델 분석 등으로 응용된다.
주성분 분석은 실제 고유 벡터 기반의 다변량 분석들 중 가장 간단한 방식이다. 만약 다변량 데이터 집합이 변수당 1개의 축이 있는 높은 차원의에서 보았을 때 단순히 좌표의 집합으로 보인다면, 주성분 분석은 이를 낮은 차원으로 끌어내려 일종의 그림자를 보고 분석할 수 있게 도와준다. 이는 가장 주요한 일부 요소들을 보여줌으로써 변환된 데이터의 차원수를 줄임으로써 끝난다.
주성분 분석은 인자 분석과 밀접한 관계를 갖고 있다. 인자 분석은 일반적으로 기저 구조에 대한 영역 한정적인 가정을 포함하고, 약간의 차이가 있는 행렬의 고유 벡터를 풀어낸다.
또한 주성분 분석은 정준상관분석(CCA)과도 관계가 있다. 주성분 분석이 하나의 데이터 집합의 변화를 제일 잘 설명하는 새로운 직교 좌표 시스템을 정의하는 반면 정준상관분석은 두 개의 데이터 집합간의 교차 공분산을 가장 잘 설명하는 좌표 시스템을 정의한다.
주성분 분석은 가장 큰 분산을 갖는 부분공간을 보존하는 최적의 선형 변환이라는 특징을 갖는다. 그러나 이산 코사인 변환과 같은 다른 방법에 비해 더 많은 계산시간을 요구하는 단점이 있다. 다른 선형 변환과 달리 주성분 분석은 정해진 기저 벡터를 갖지 않으며, 기저 벡터는 데이터의 특성에 따라 달라진다.
이와 같은 S211 및 S212에서 제1 분석 알고리즘과 제2 분석 알고리즘의 적용에 따라서, 유입 데이터와 기타 데이터들의 입력값이 선택되면, 컴퓨팅 장치는 입력값을 데이터 정규화를 통해 정규화시키는 데이터 정규화 단계(S22)를 수행한다.
데이터 정규화 (Min-Max Normalization)는 데이터가 가진 feature들의 scale이 심하게 차이나는 경우 scale 조정이 필요함에 따라서 이루어지는 프로세스로서, 본 발명에서는 Min-Max 정규화가 사용될 수 있다. 상기 정규화는 모든 feature에 대해 최소값은 0, 최대값은 1, 다른 값들은 0 ~ 1 사이의 값으로 변환하는 방식으로 데이터를 정규화하게 된다.
Figure 112022002261481-pat00003
이와 같은 예가 도 5에 도시되어 있다. 즉, 유입수 예측 모델의 구축을 위한 입력값들을 선택 및 가공하는 데 있어서 상술한 흐름을 적용하게 된다. 이에 따라서, 실시간 유입 데이터(21)와 기존의 측정되어 저장되는 일정 시간 또는 주기에 따른 유입 데이터(22)가 제1 분석 알고리즘(121)에 적용되어 자기 상관관계에 따른 입력값이 도출된다. 또한, 실시간 유입 데이터(21)와 상술한 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터(23)가 제2 분석 알고리즘(122)에 적용되어 PCC 상관관계 등의 기법에 따라서 입력값이 도출되는 것이다.
이후, 데이터 정규화 모델(123)에 적용함으로써, 최종적으로 유입수 예측 모델 구축을 위해서 해당 모델에 적용되는 입력값(101)으로서 도출된다.
이후, 정규화된 입력값과 상기 출력값을 갖는 유입수 예측 모델을 시계열 데이터 분석 모델로 구축하는 모델 구축 단계(S23)가 추후 수행되어, 학습 대상이 되는 유입수 예측 모델이 구축된다.
본 발명에서 S20 단계에 의하여 구축되는 유입수 예측 모델은, 시계열적 데이터의 분석에 최적화된 모델로서, 장단기 메모리 저장(LSTM, Long Short Term Memory) 모델인 것이 바람직하다.
즉 도 6에 도시된 바와 같이, 장단기 메모리 저장 모델로서의 유입수 예측 모델(124)은 상술한 입력값(101)을 입력받아, 유입 데이터에 대한 유입수량 및 수질에 대한 데이터를 출력값(102)으로 갖도록 구축된다.
장단기 메모리 저장 모델은, RNN의 단점을 보완한 것으로 이전 단계의 정보를 저장하여 장기 기억이 가능하기 때문에 연속적인 데이터(시계열 데이터)의 분석에 주로 사용된다. 장기의존성 문제 해결을 위해 3개의 게이트가 존재하는데, 이들 게이트는 이전 단계의 정보를 보존하거나 삭제하는 결정을 하고, 다음 단계에 넘겨줄 데이터와 출력할 값을 결정하게 되며, 다음과 같이 존재한다.
a. 입력 게이트 : 현재 정보를 기억하기 위한 게이트
b. 망각 게이트 : 어떤 정보를 버릴 지에 대한 계산을 진행하는 게이트
c. 출력 게이트 : t 시점의 결과 값을 가지고 있는 게이트
LSTM에 사용되는 다양한 수식은 다음과 같다.
Figure 112022002261481-pat00004
(σ = 활성화함수, ht-1 = 이전 단계 출력값, Wf = Wi = Wo = 게이트 가중치, xt = 입력값, bf = bi = bo = bc = 편향값, ~ct= 활성화 함수를 통해 생성된 새로운 셀 상태, Ct-1 = 이전 단계의 셀 상태, Wc = 셀 상태의 가중치, ht = 셀에서의 출력값, tanh = 활성화함수)
(1)은 cell state로부터 어떤 정보를 버릴 것인지를 정하는 것으로, sigmoid layer에 의해 결정된다. 그래서 이 단계의 gate를 "forget gate layer"라고 부른다. 이 단계에서는 ht-1과 xt를 받아서 0과 1 사이의 값을 Ct-1에 보내준다. 그 값(ft)이 1이면 "모든 정보를 보존해라"가 되고, 0이면 "죄다 갖다버려라"가 된다.
(2) 및 (4)는 앞으로 들어오는 새로운 정보 중 어떤 것을 cell state에 저장할 것인지를 정한다. 먼저, "input gate layer"라고 불리는 sigmoid layer가 어떤 값을 업데이트할 지 정한다. 그 다음에 tanh layer가 새로운 후보 값들인 Θt 라는 vector를 만들고, cell state에 더할 준비를 한다. 이렇게 두 단계에서 나온 정보를 합쳐서 state를 업데이트할 재료를 만들게 된다.
(5)는 과거 state인 Ct-1를 업데이트해서 새로운 cell state인 Ct를 만들 것이다. 이미 이전 단계에서 어떤 값을 얼마나 업데이트해야 할 지 다 정해놨으므로 여기서는 그 일을 실천만 하면 된다. 우선 이전 state에 ft를 곱해서 가장 첫 단계에서 잊어버리기로 정했던 것들을 진짜로 잊어버린다. 그리고 나서 it~Ct를 더한다. 이 더하는 값은 두 번째 단계에서 업데이트하기로 한 값을 얼마나 업데이트할 지 정한 만큼 scale한 값이 된다.
또 다시 언어 모델 문제로 돌아가보면, 이 단계에서 실제로 이전 주어의 성별 정보를 없애고 새로운 정보를 더하게 되는데, 이는 지난 단계들에서 다 정했던 것들을 실천만 하는 단계임을 다시 확인할 수 있다.
(3) 및 (6)은 무엇을 output으로 내보낼 지 정하는 "output gate layer"이다. output은 cell state를 바탕으로 필터된 값이 될 것이다. 가장 먼저, sigmoid layer에 input 데이터를 태워서 cell state의 어느 부분을 output으로 내보낼 지를 정한다. 그리고나서 cell state를 tanh layer에 태워서 -1과 1 사이의 값을 받은 뒤에 방금 전에 계산한 sigmoid gate의 output과 곱해준다. 그렇게 하면 우리가 output으로 보내고자 하는 부분만 내보낼 수 있게 된다.
이제 언어 모델 예제를 생각해보면, 우리는 주어를 input으로 받았으므로 주어 다음에 오게 될 예측값인 output으로 적절한 답은 아마도 동사 개념의 무언가가 될 것이다. 예를 들어 최종적인 Output은 앞에서 본 주어가 단수형인지 복수형인지에 따라 그 형태가 달라질 수도 있는 것이다.
이러한 구체적인 방식으로 구축된 유입수 예측 모델에 대해서 컴퓨팅 장치는, 유입수 예측 모델을 이용하여 도출된 예측 유입 데이터와, 실제 측정된 유입 데이터를 이용하여 상기 유입수 예측 모델을 평가하고 학습시키는 모델 학습 단계(S30)를 수행하여, 이후 유입수 예측 모델에 따라서 관리자에게 특정 시점의 유입수에 대한 수량 및 수질 데이터를 포함하는 예측 유입 데이터를 제공하게 된다.
S30 단계를 구체적으로 설명하기 위하여 도 3을 참조하면, 컴퓨팅 장치는 먼저, 유입수 예측 모델을 통한 예측 유입 데이터와, 예측된 시점에서의 실제 측정된 유입 데이터 간의 오차값에 기반하여, 유입수 예측 모델을 평가하는 모델 평가 단계(S31)를 수행한다.
구체적으로, 모델 평가 단계는 예를 들어 MAPE(Mean Absolute Percentage Error) 기법이나, RMSE(Root Mean Squared Error) 기법을 이용하여 유입수 예측 모델을 평가하는 것이 가능하다.
MAPE(Mean Absolute Percentage Error)는 크기 의존적 에러의 단점을 커버하기 위한 모델로서, MAPE는 퍼센트 값을 가지며 0에 가까울수록 회귀 모형의 성능이 좋다고 해석할 수 있다.
MAPE는 백분율이기 때문에 다른 검증 방식에 비해 쉽게 이해 가능(MAPE = 5, 예측 값은 평균 5%를 벗어남), 실제 값이 0이면 MAPE 계산이 불가능하며, 실제 값이 1보다 작을 경우 무한대에 가까운 값을 찍을 수 있는 문제가 발생된다.
Figure 112022002261481-pat00005
(n : 데이터 개수, At : 실제 값, Ft : 예측 값)
RMSE(Root Mean Squared Error)는 MSE(Mean Squared Error)의 경우 오류의 제곱을 구할 때, 실제 오류 평균보다 더 커지는 특성이 있어 MSE에 루트를 씌운 것이다. 큰 오류 값 차이에 대해 패널티를 크게 주는 이점이 있다. 머신러닝 학습에 있어 특이 값에 휘둘리지 않는 것이 중요하다. RMSE는 MSE에 비해 직관성은 떨어지지만, 극단적이지 않는 점에서 강점을 보인다.
Figure 112022002261481-pat00006
(n : 데이터 개수, yi : 실제 값, yi^ : 예측 값)
이와 같은 예의 모델을 적용하여 S31 단계에 따른 오류도출 등의 평가가 완료되면, 컴퓨팅 장치는 유입수 예측 모델에 대한 평가 결과 및 예측된 유입 데이터를 이용하여, 유입수 예측 모델을 학습시키는 모델 학습 단계(S32)를 수행한다.
이때, S32 단계의 수행에 있어서, 평가 결과 및 예측된 유입 데이터를 이용하여 유입수 예측 모델에 대한 베이지안 최적화(Bayesian Optimization) 기법을 이용한 학습을 적용하여, 유입수 예측 모델을 학습시킬 수 있다.
베이지안 최적화 기법은, 어느 입력값(x)를 받는 미지의 목적 함수(f(x))를 상정하여, 해당 함수값(f(x))을 최대로 만드는 최적해를 찾는 것을 목적으로 한다. 즉, 목적 함수(탐색대상함수)와 하이퍼파라미터 쌍(pair)을 대상으로 Surrogate Model(대체 모델)을 만들고, 순차적으로 하이퍼 파라미터를 업데이트해 가면서 평가를 통해 최적의 하이퍼파라미터 조합을 탐색한다. 이 때의 목점 함수를 black-box function 이라고 한다. Bayesian Optimization 에는 두 가지 필수 요소가 존재하며, Surrogate Model 은, 현재까지 조사된 입력값-출력값 점들 (x1, f(x1))~(xt, f(xt)) 을 바탕으로, 미지의 목적 함수의 형태에 대한 확률적인 추정을 수행하는 모델을 지칭한다. 그리고 Acquisition Function 은, 목적 함수에 대한 현재까지의 확률적 추정 결과를 바탕으로, '최적 입력값을 찾는 데 있어 가장 유용할 만한' 다음 입력값 후보를 추천해 주는 함수를 지칭한다.
이와 같은 평가 및 예측은 도 7에 도시된 바와 같은 구조를 가진다. 즉 상술한 유입 데이터(21)는 유입수 예측 모델(124)의 구축을 위한 입력값(101)으로 사용될 수 있음은 상술한 바와 같다. 상술한 S20 단계의 기능 수행에 따라서 유입수 예측 모델(124)이 구축되면 입력값(101)에 따라서 출력값(102)이 도출된다. 이때 특정 시점에서 예측된 유입 데이터와, 실제 유입 데이터가 상술한 바와 같은 오류값 도출 기법을 포함하는 평가 모델(131)에 적용되어 평가되면 평가값이 도출되며, 이 값들이 상술한 베이지안 최적화 모델 등을 포함하는 학습모델(132)에 적용되어, 유입수 예측 모델(124)을 학습시키게 되는 것이다.
이와 같은 본 발명의 실시예에 의하면, 유입 데이터의 시계열적인 변동 패턴과, 유입 데이터에 대응되는 하수처리시설의 반응 장치 및 배출 장치 등에 대한 이종 데이터 간의 상관관계를 이용하여, 유입 데이터를 예측 가능한 유입수 예측 모델을 구축하고, 이에 대한 이전 계측 데이터를 이용한 학습을 통해, 매우 높은 정확도로 하수처리시설의 유입 데이터를 예측할 수 있다.
이를 통해, 유입수량 및 수질의 센싱 후 이에 대한 공정 제어를 수행하는 것이 아니라, 미리 이를 예측하여 사전에 하수처리에 대한 공정 제어에 대한 대비가 가능해지기 때문에, 환경 관리에 효율적으로 사전 대처할 수 있는 동시에, 공정 제어를 위한 의사결정 시간을 충분히 확보할 수 있는 효과가 있다.
도 4는 상술한 본 발명의 장치(10)에 대한 구성 블록도로서, 본 발명의 장치(10)는 데이터 전처리부(11), 모델 구축부(12) 및 모델 학습부(13)를 포함하는 것을 특징으로 한다. 이하의 설명에 있어서 상술한 모든 내용에 대한 설명들과 중복되는 내용은 그 설명을 생략하기로 한다.
데이처 전처리부(11)는 일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보에 대한 데이터를 포함하는 유입 데이터를 전처리하는 기능을 수행한다. 이를 위하여 하수처리시설(20)에 설치되는 유입 수량 및 수질을 센싱하는 센서들과 연동되어 유입 데이터를 수신하여 전처리한다. 즉, 상술한 설명에 있어서 S10 단계에 대한 설명에서 언급된 모든 기능을 수행하는 구성으로 이해될 것이다.
모델 구축부(12)는 전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 기능을 수행한다. 즉, 상술한 설명에 있어서 S20, S211, S212, S22, S23 단계에 대한 설명에서 언급된 모든 기능을 수행하는 구성으로 이해될 것이다.
모델 학습부(13)는 유입수 예측 모델에 과거의 유입 데이터를 이용하여 모델을 평가하고 학습시키는 기능을 수행한다. 즉, 상술한 설명에 있어서 S30, S31, S32 단계에 대한 설명에서 언급된 모든 기능을 수행하는 구성으로 이해될 것이다.
도 8은 본 발명의 일 실시 예에 따른 컴퓨팅 장치의 내부 구성의 일 예를 도시하였으며, 이하의 설명에 있어서, 상술한 도 1 내지 7에 대한 설명과 중복되는 불필요한 실시 예에 대한 설명은 생략하기로 한다.
도 8에 도시한 바와 같이, 컴퓨팅 장치(10000)은 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/O subsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. 이때, 컴퓨팅 장치(10000)은 촉각 인터페이스 장치에 연결된 유저 단말이기(A) 혹은 전술한 컴퓨팅 장치(B)에 해당될 수 있다.
메모리(11200)는, 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(11200)는 컴퓨팅 장치(10000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그밖에 다양한 데이터를 포함할 수 있다.
이때, 프로세서(11100)나 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 메모리(11200)에 액세스하는 것은 프로세서(11100)에 의해 제어될 수 있다.
주변장치 인터페이스(11300)는 컴퓨팅 장치(10000)의 입력 및/또는 출력 주변장치를 프로세서(11100) 및 메모리 (11200)에 결합시킬 수 있다. 프로세서(11100)는 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 컴퓨팅 장치(10000)을 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.
입/출력 서브시스템(11400)은 다양한 입/출력 주변장치들을 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 입/출력 서브시스템(11400)은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서 등의 주변장치를 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 입/출력 주변장치들은 입/출력 서브시스템(11400)을 거치지 않고 주변장치 인터페이스(11300)에 결합될 수도 있다.
전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.
통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅 장치와 통신을 가능하게 할 수 있다.
또는 상술한 바와 같이 필요에 따라 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅 장치와 통신을 가능하게 할 수도 있다.
이러한 도 8의 실시 예는, 컴퓨팅 장치(10000)의 일례일 뿐이고, 컴퓨팅 장치(11000)은 도 8에 도시된 일부 컴포넌트가 생략되거나, 도 8에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅 장치는 도 8에도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 통신 회로(1160)에 다양한 통신방식(WiFi, 3G, LTE, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 컴퓨팅 장치(10000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨팅 장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시 예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 애플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 이용자 단말에 설치될 수 있다. 일 예로, 파일 배포 시스템은 이용자 단말이기의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시 예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술 분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅 장치상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시 예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시 예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광 기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시 예들이 비록 한정된 실시 예와 도면에 의해 설명되었으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시 예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (10)

  1. 하나 이상의 프로세서 및 상기 프로세서에서 수행 가능한 명령들을 저장하는 하나 이상의 메모리를 포함하는 컴퓨팅 장치로 구현되는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법으로서,
    일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보로서, 온도, pH, SS(부유물질량, Suspended Solids), COD(화학적 산소요구량, Chemical Oxygen Demand), TN(총질소, Total Nitrogen), TP(총인, Total Phosphors), DO(용존 산소량, Dissolved Oxygen) 및 BOD(생화학적 산소 요구량, Biochemical Oxygen Demand)에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리 단계;
    전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조에 대한 제어 정보로서, 1단계 침사지 및 유량조정조, 2단계 최초침전지, 3단계 폭기조, 4단계 최종침전지 및 5단계 방류조에서의 협잡물제거, 유량조정조의 물량 조정, 폭기조의 공기 유입을 통한 미생물 활성화, 최종침전지의 농축조의 탈수기실 및 방류조의 소독을 포함하는 공정의 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축 단계; 및
    상기 유입수 예측 모델을 이용하여 도출된 예측 유입 데이터와, 실제 측정된 유입 데이터를 이용하여 상기 유입수 예측 모델을 평가하고 학습시키는 모델 학습 단계;를 포함하고,
    상기 모델 구축 단계는,
    상기 제1 분석 알고리즘을 이용하여, 유입 데이터의 주기성을 분석함으로써, 모델 구축 단계에 입력값으로 입력할 유입 데이터를 선택하는 제1 입력 변수 선정 단계;
    상기 제2 분석 알고리즘을 이용하여, 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터 중, 유입 데이터에 영향을 미치는 것으로 파악되는 변수 데이터를 입력값으로 선택하는 제2 입력 변수 선정 단계;
    상기 제1 입력 변수 선정 단계에 의하여 선택된 유입 데이터 입력값과, 상기 제2 입력 변수 선정 단계에 의하여 선택된 변수 데이터 입력값을 포함하는 입력값을 데이터 정규화를 통해 정규화시키는 데이터 정규화 단계; 및
    정규화된 입력값과 상기 출력값을 갖는 유입수 예측 모델을 시계열 데이터 분석 모델로 구축하는 모델 구축 단계;를 포함하고,
    상기 데이터 전처리 단계는,
    실시간으로 수집된 유입 데이터에 대한 수정된 Z-score(Modified Z - Score =
    Figure 112022058947472-pat00015
    , median: 중앙값, MAD: 중앙값 절대 편차)를 이용하되, 수정된 Z-score가 기설정된 임계치를 초과한 순으로 기설정된 비율의 유입 데이터를 상기 모델 구축 단계 및 상기 모델 학습 단계에 적용할 유입 데이터로부터 제거하고,
    상기 모델 학습 단계는,
    상기 유입수 예측 모델을 통한 예측 유입 데이터와, 예측된 시점에서의 실제 측정된 유입 데이터 간의 오차값에 기반하여, 상기 유입수 예측 모델을 평가하는 모델 평가 단계; 및
    상기 유입수 예측 모델에 대한 평가 결과 및 예측된 유입 데이터를 이용하여, 상기 유입수 예측 모델을 학습시키는 모델 학습 단계;를 포함하고,
    상기 모델 평가 단계는,
    RMSE(Root Mean Squared Error) 기법으로서 (
    Figure 112022058947472-pat00016
    , n : 데이터 개수, yi : 실제 값, yi^ : 예측 값)을 이용하여 상기 유입수 예측 모델을 평가하는 것을 특징으로 하는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 모델 구축 단계는,
    상기 제1 분석 알고리즘을 이용하여, 유입 데이터의 주기성을 분석함으로써, 모델 구축 단계에 입력값으로 입력할 유입 데이터를 선택하는 제1 입력 변수 선정 단계;
    상기 제2 분석 알고리즘을 이용하여, 유입 데이터에 영향을 미치는 것으로 파악되는 변수 데이터를 입력값으로 선택하는 제2 입력 변수 선정 단계;
    상기 입력값을 데이터 정규화를 통해 정규화시키는 데이터 정규화 단계; 및
    정규화된 입력값과 상기 출력값을 갖는 유입수 예측 모델을 시계열 데이터 분석 모델로 구축하는 모델 구축 단계;를 포함하는 것을 특징으로 하는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법.
  4. 제3항에 있어서,
    상기 유입수 예측 모델은,
    장단기 메모리 저장(LSTM, Long Short Term Memory) 모델인 것을 특징으로 하는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법.
  5. 삭제
  6. 삭제
  7. 삭제
  8. 제1항에 있어서,
    상기 모델 학습 단계는,
    상기 평가 결과 및 예측된 유입 데이터를 이용하여 유입수 예측 모델에 대한 베이지안 최적화(Bayesian Optimization) 기법을 이용한 학습을 적용하여, 상기 유입수 예측 모델을 학습시키는 것을 특징으로 하는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법.
  9. 하나 이상의 프로세서 및 상기 프로세서에서 수행 가능한 명령들을 저장하는 하나 이상의 메모리를 포함하는 컴퓨팅 장치로 구현되는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 장치로서,
    일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보로서, 온도, pH, SS(부유물질량, Suspended Solids), COD(화학적 산소요구량, Chemical Oxygen Demand), TN(총질소, Total Nitrogen), TP(총인, Total Phosphors), DO(용존 산소량, Dissolved Oxygen) 및 BOD(생화학적 산소 요구량, Biochemical Oxygen Demand)에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리부;
    전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조에 대한 제어 정보로서, 1단계 침사지 및 유량조정조, 2단계 최초침전지, 3단계 폭기조, 4단계 최종침전지 및 5단계 방류조에서의 협잡물제거, 유량조정조의 물량 조정, 폭기조의 공기 유입을 통한 미생물 활성화, 최종침전지의 농축조의 탈수기실 및 방류조의 소독을 포함하는 공정의 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축부; 및
    상기 유입수 예측 모델에 과거의 유입 데이터를 이용하여 모델을 평가하고 학습시키는 모델 학습부;를 포함하고,
    상기 모델 구축부는,
    상기 제1 분석 알고리즘을 이용하여, 유입 데이터의 주기성을 분석함으로써, 모델 구축 단계에 입력값으로 입력할 유입 데이터를 선택하고, 상기 제2 분석 알고리즘을 이용하여, 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터 중, 유입 데이터에 영향을 미치는 것으로 파악되는 변수 데이터를 입력값으로 선택하고, 상기 분석 알고리즘에 의하여 선택된 유입 데이터 입력값과, 상기 제2 분석 알고리즘에 의하여 선택된 변수 데이터 입력값을 포함하는 입력값을 데이터 정규화를 통해 정규화시킨 후, 정규화된 입력값과 상기 출력값을 갖는 유입수 예측 모델을 시계열 데이터 분석 모델로 구축하고,
    상기 데이터 전처리부는,
    실시간으로 수집된 유입 데이터에 대한 수정된 Z-score(Modified Z - Score =
    Figure 112022058947472-pat00017
    , median: 중앙값, MAD: 중앙값 절대 편차)를 이용하되, 수정된 Z-score가 기설정된 임계치를 초과한 순으로 기설정된 비율의 유입 데이터를 상기 모델 구축부 및 상기 모델 학습부에 적용할 유입 데이터로부터 제거하고,
    상기 모델 학습부는,
    상기 유입수 예측 모델을 통한 예측 유입 데이터와, 예측된 시점에서의 실제 측정된 유입 데이터 간의 오차값에 기반하여, 상기 유입수 예측 모델을 평가하고, 상기 유입수 예측 모델에 대한 평가 결과 및 예측된 유입 데이터를 이용하여, 상기 유입수 예측 모델을 학습시키고,
    상기 유입수 예측 모델을 평가 시, RMSE(Root Mean Squared Error) 기법으로서 (
    Figure 112022058947472-pat00018
    , n : 데이터 개수, yi : 실제 값, yi^ : 예측 값)을 이용하여 상기 유입수 예측 모델을 평가하는 것을 특징으로 하는 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 장치.
  10. 컴퓨터-판독가능 기록매체로서,
    상기 컴퓨터-판독가능 기록매체는, 컴퓨팅 장치로 하여금 이하의 단계들을 수행하도록 하는 명령들을 저장하며, 상기 단계들은:
    일 하수처리시설에 유입되는 유입수의 유입 수량 및 수질 정보로서, 온도, pH, SS(부유물질량, Suspended Solids), COD(화학적 산소요구량, Chemical Oxygen Demand), TN(총질소, Total Nitrogen), TP(총인, Total Phosphors), DO(용존 산소량, Dissolved Oxygen) 및 BOD(생화학적 산소 요구량, Biochemical Oxygen Demand)에 대한 데이터를 포함하는 유입 데이터를 전처리하는 데이터 전처리 단계;
    전처리된 유입 데이터에 포함된 유입수의 유입 수량 및 수질 정보에 대한 자기 상관관계를 파악하는 제1 분석 알고리즘과, 전처리된 유입 데이터와 하수처리시설의 반응조에 대한 제어 정보로서, 1단계 침사지 및 유량조정조, 2단계 최초침전지, 3단계 폭기조, 4단계 최종침전지 및 5단계 방류조에서의 협잡물제거, 유량조정조의 물량 조정, 폭기조의 공기 유입을 통한 미생물 활성화, 최종침전지의 농축조의 탈수기실 및 방류조의 소독을 포함하는 공정의 운전 조건 정보 및 방류수의 수량 및 수질 데이터를 포함하는 변수 데이터 간의 상관관계를 파악하는 제2 분석 알고리즘을 이용하여 선정된 입력값과, 유입 데이터를 출력값으로 갖는 유입수 예측 모델을 구축하는 모델 구축 단계; 및
    상기 유입수 예측 모델을 이용하여 도출된 예측 유입 데이터와, 실제 측정된 유입 데이터를 이용하여 상기 유입수 예측 모델을 평가하고 학습시키는 모델 학습 단계;를 포함하고,
    상기 모델 구축 단계는,
    상기 제1 분석 알고리즘을 이용하여, 유입 데이터의 주기성을 분석함으로써, 모델 구축 단계에 입력값으로 입력할 유입 데이터를 선택하는 제1 입력 변수 선정 단계;
    상기 제2 분석 알고리즘을 이용하여, 하수처리시설의 반응조 운전 조건 정보 및 방류수의 수량 및 수질 데이터 중, 유입 데이터에 영향을 미치는 것으로 파악되는 변수 데이터를 입력값으로 선택하는 제2 입력 변수 선정 단계;
    상기 제1 입력 변수 선정 단계에 의하여 선택된 유입 데이터 입력값과, 상기 제2 입력 변수 선정 단계에 의하여 선택된 변수 데이터 입력값을 포함하는 입력값을 데이터 정규화를 통해 정규화시키는 데이터 정규화 단계; 및
    정규화된 입력값과 상기 출력값을 갖는 유입수 예측 모델을 시계열 데이터 분석 모델로 구축하는 모델 구축 단계;를 포함하고,
    상기 데이터 전처리 단계는,
    실시간으로 수집된 유입 데이터에 대한 수정된 Z-score(Modified Z - Score =
    Figure 112022058947472-pat00019
    , median: 중앙값, MAD: 중앙값 절대 편차)를 이용하되, 수정된 Z-score가 기설정된 임계치를 초과한 순으로 기설정된 비율의 유입 데이터를 상기 모델 구축 단계 및 상기 모델 학습 단계에 적용할 유입 데이터로부터 제거하고,
    상기 모델 학습 단계는,
    상기 유입수 예측 모델을 통한 예측 유입 데이터와, 예측된 시점에서의 실제 측정된 유입 데이터 간의 오차값에 기반하여, 상기 유입수 예측 모델을 평가하는 모델 평가 단계; 및
    상기 유입수 예측 모델에 대한 평가 결과 및 예측된 유입 데이터를 이용하여, 상기 유입수 예측 모델을 학습시키는 모델 학습 단계;를 포함하고,
    상기 모델 평가 단계는,
    RMSE(Root Mean Squared Error) 기법으로서 (
    Figure 112022058947472-pat00020
    , n : 데이터 개수, yi : 실제 값, yi^ : 예측 값)을 이용하여 상기 유입수 예측 모델을 평가하는 것을 특징으로 하는 컴퓨터-판독가능 기록매체.
KR1020220002536A 2022-01-07 2022-01-07 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체 KR102440372B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220002536A KR102440372B1 (ko) 2022-01-07 2022-01-07 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220002536A KR102440372B1 (ko) 2022-01-07 2022-01-07 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체

Publications (1)

Publication Number Publication Date
KR102440372B1 true KR102440372B1 (ko) 2022-09-05

Family

ID=83279829

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220002536A KR102440372B1 (ko) 2022-01-07 2022-01-07 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체

Country Status (1)

Country Link
KR (1) KR102440372B1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102465915B1 (ko) * 2022-08-23 2022-11-11 (주)에스엔테크 인공지능 기반의 수질 전광판의 수질정보 표시 시스템
CN115563487A (zh) * 2022-09-23 2023-01-03 江苏安控智汇科技股份有限公司 一种基于emd和改进lstm的水质监测方法
CN116514276A (zh) * 2023-07-03 2023-08-01 北京梅凯尼克环保科技有限公司 一种污水处理工艺的智能控制方法及系统
CN117035230A (zh) * 2023-08-08 2023-11-10 上海东振环保工程技术有限公司 一种基于大数据分析的污水处理设备运行状态评估方法
CN117236565A (zh) * 2023-11-10 2023-12-15 天津标证科技有限公司 一种流域水环境智慧化管理方法
CN117391261A (zh) * 2023-12-11 2024-01-12 深圳鼎智达表计信息科技有限公司 一种基于低功耗超声波测量的物联网ai智慧水务系统
CN118229157A (zh) * 2024-05-23 2024-06-21 南方电网调峰调频(广东)储能科技有限公司 水电效率监测方法、装置、计算机设备、可读存储介质和程序产品

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090078501A (ko) * 2008-01-15 2009-07-20 부산대학교 산학협력단 인공 신경망에 의한 하수처리장의 유입 유량 및 유입 성분농도의 예측 방법 및 장치
KR20150111672A (ko) * 2014-03-26 2015-10-06 부산대학교 산학협력단 동일한 방류수계를 공유하는 다수의 하수처리장의 통합운영관리장치 및 그 방법
KR102271069B1 (ko) * 2020-03-31 2021-06-29 조선대학교산학협력단 석탄화력발전소 보일러의 상태 예측 모델 생성 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090078501A (ko) * 2008-01-15 2009-07-20 부산대학교 산학협력단 인공 신경망에 의한 하수처리장의 유입 유량 및 유입 성분농도의 예측 방법 및 장치
KR20150111672A (ko) * 2014-03-26 2015-10-06 부산대학교 산학협력단 동일한 방류수계를 공유하는 다수의 하수처리장의 통합운영관리장치 및 그 방법
KR102271069B1 (ko) * 2020-03-31 2021-06-29 조선대학교산학협력단 석탄화력발전소 보일러의 상태 예측 모델 생성 방법 및 장치

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102465915B1 (ko) * 2022-08-23 2022-11-11 (주)에스엔테크 인공지능 기반의 수질 전광판의 수질정보 표시 시스템
CN115563487A (zh) * 2022-09-23 2023-01-03 江苏安控智汇科技股份有限公司 一种基于emd和改进lstm的水质监测方法
CN116514276A (zh) * 2023-07-03 2023-08-01 北京梅凯尼克环保科技有限公司 一种污水处理工艺的智能控制方法及系统
CN117035230A (zh) * 2023-08-08 2023-11-10 上海东振环保工程技术有限公司 一种基于大数据分析的污水处理设备运行状态评估方法
CN117035230B (zh) * 2023-08-08 2024-04-30 上海东振环保工程技术有限公司 一种基于大数据分析的污水处理设备运行状态评估方法
CN117236565A (zh) * 2023-11-10 2023-12-15 天津标证科技有限公司 一种流域水环境智慧化管理方法
CN117236565B (zh) * 2023-11-10 2024-04-05 韩宇 一种流域水环境智慧化管理方法
CN117391261A (zh) * 2023-12-11 2024-01-12 深圳鼎智达表计信息科技有限公司 一种基于低功耗超声波测量的物联网ai智慧水务系统
CN117391261B (zh) * 2023-12-11 2024-03-22 深圳鼎智达表计信息科技有限公司 一种基于低功耗超声波测量的物联网ai智慧水务系统
CN118229157A (zh) * 2024-05-23 2024-06-21 南方电网调峰调频(广东)储能科技有限公司 水电效率监测方法、装置、计算机设备、可读存储介质和程序产品

Similar Documents

Publication Publication Date Title
KR102440372B1 (ko) 빅데이터 및 인공지능 기반의 하수처리시설의 유입수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체
Newhart et al. Data-driven performance analyses of wastewater treatment plants: A review
KR102440371B1 (ko) 빅데이터 및 인공지능 기반의 하수처리시설의 방류수 환경 정보 관리 방법, 장치 및 컴퓨터-판독가능 기록매체
Asadi et al. Wastewater treatment aeration process optimization: A data mining approach
Verma et al. Predicting the total suspended solids in wastewater: a data-mining approach
Huang et al. A fast predicting neural fuzzy model for on-line estimation of nutrient dynamics in an anoxic/oxic process
CN113837356B (zh) 基于融合神经网络的污水处理智能预测方法
Sala et al. Perspectives of fuzzy systems and control
Shokry et al. Data-driven soft-sensors for online monitoring of batch processes with different initial conditions
Wan et al. Prediction of effluent quality of a paper mill wastewater treatment using an adaptive network-based fuzzy inference system
Han et al. Nonlinear systems modeling based on self-organizing fuzzy-neural-network with adaptive computation algorithm
Kusiak et al. Prediction of methane production in wastewater treatment facility: A data-mining approach
Pattanayak et al. Development of chemical oxygen on demand (COD) soft sensor using edge intelligence
Mendes et al. Automatic extraction of the fuzzy control system by a hierarchical genetic algorithm
Liu Adaptive just-in-time and relevant vector machine based soft-sensors with adaptive differential evolution algorithms for parameter optimization
JP3790129B2 (ja) プロセスシミュレータ応用制御装置及び方法
Araromi et al. Modeling of an activated sludge process for effluent prediction—a comparative study using ANFIS and GLM regression
Wang et al. A soft sensor modeling method with dynamic time-delay estimation and its application in wastewater treatment plant
Dutta et al. A survey and comparative evaluation of actor‐critic methods in process control
Yan et al. A soft-sensing method of dissolved oxygen concentration by group genetic case-based reasoning with integrating group decision making
Guo et al. A review on data-driven approaches for industrial process modelling
Bagheri et al. Analysis of variables affecting mixed liquor volatile suspended solids and prediction of effluent quality parameters in a real wastewater treatment plant
CN113838542A (zh) 化学需氧量智能预测方法和系统
Newhart et al. Data science tools to enable decarbonized water and wastewater treatment systems
Nguyen et al. Artificial intelligence for wastewater treatment

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant