KR101831316B1 - 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법 - Google Patents

앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법 Download PDF

Info

Publication number
KR101831316B1
KR101831316B1 KR1020170060683A KR20170060683A KR101831316B1 KR 101831316 B1 KR101831316 B1 KR 101831316B1 KR 1020170060683 A KR1020170060683 A KR 1020170060683A KR 20170060683 A KR20170060683 A KR 20170060683A KR 101831316 B1 KR101831316 B1 KR 101831316B1
Authority
KR
South Korea
Prior art keywords
artificial intelligence
flow rate
flow
history data
intelligence algorithm
Prior art date
Application number
KR1020170060683A
Other languages
English (en)
Inventor
임성규
김한승
이윤영
Original Assignee
(주)종성테크
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)종성테크 filed Critical (주)종성테크
Priority to KR1020170060683A priority Critical patent/KR101831316B1/ko
Application granted granted Critical
Publication of KR101831316B1 publication Critical patent/KR101831316B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03BINSTALLATIONS OR METHODS FOR OBTAINING, COLLECTING, OR DISTRIBUTING WATER
    • E03B7/00Water main or service pipe systems
    • E03B7/02Public or like main pipe systems
    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03BINSTALLATIONS OR METHODS FOR OBTAINING, COLLECTING, OR DISTRIBUTING WATER
    • E03B7/00Water main or service pipe systems
    • E03B7/04Domestic or like local pipe systems
    • EFIXED CONSTRUCTIONS
    • E03WATER SUPPLY; SEWERAGE
    • E03BINSTALLATIONS OR METHODS FOR OBTAINING, COLLECTING, OR DISTRIBUTING WATER
    • E03B7/00Water main or service pipe systems
    • E03B7/07Arrangement of devices, e.g. filters, flow controls, measuring devices, siphons or valves, in the pipe systems
    • G06F15/18
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Hydrology & Water Resources (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법은, 외부의 호스트 서버로부터 유량 이력데이터를 내부의 통신부를 통해 수집하는 제1 단계; 수집한 유량 이력데이터를 내부의 인공지능 계산부를 통해 전 처리과정을 수행하는 제2 단계; 상기 제2 단계에서 전 처리된 유량 이력데이터에 대해 앙상블 인공지능알고리즘을 사용하여 유량의 기울기를 계산하는 제3 단계; 및 상기 앙상블 인공지능 알고리즘을 통해 획득된 새로운 유량 이력데이터를 이용하여 미래의 수요량을 예측하는 제4 단계를 포함하는 기술을 제공함에 기술적 특징이 있다.

Description

앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법{METHOD OF PREDICTION OF WATER SUPPLY FLOW USING ENSEMBLE ARTIFICIAL INTELLIGENCE ALGORITHM}
본 발명은 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법에 관한 것으로, 더욱 상세하게는 상수관망의 선형성이 없는 형태 및 누락 및 오류 데이터 형태의 복잡성을 고려하여, 부트스트랩 리샘플링(Bootstrap Resampling) 방법을 통한 전 처리의 기능으로 누락 데이터의 편향을 줄이고, 앙상블 인공지능알고리즘을 적용하여 허용된 오차범위 내의 수요량 예측이 가능케 하는, 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법에 관한 것이다.
또한 본 발명은 인공지능알고리즘(앙상블기법)으로 수요량 예측과 종래의 상수관리대장과 상수관망 도면을 웹 GIS 형태로 전산화하여 누수, 수질 등의 문제를 사용자가 언제 어디서든 쉽게 파악하고 해결할 수 있도록 해주기 위한, 인공지능 상수관망운영 감지 제어 장치 및 동작 방법에 관한 것이다.
일반적으로 국가시설물인 상수관망은 국가의 제반활동을 유지하는데 필수적이며, 인구집중, 생활수준의 향상, 경제성장 등의 사회 경제학적 요소에 따라 영향을 받는 기반시설로써, 양질의 물을 안정적으로 공급하는 것이 필수적 이다.
이를 위해서는 상수관망의 국가적인 유지관리 계획이 필요하며, 향후 도시의 인구발전의 추이, 생활수준의 변화 양상 및 경제 성장 등의 요소를 고려한 지자체별 단기 상수도 수요의 효과적인 예측이 필요하다.
상수관망을 통해 공급되는 물의 수요량 예측에 대한 수요량 시계열은 선형성이 없거나, 복잡한 특성을 가지고 있다.
도 1은 종래기술에 따른 단순통계 방식을 사용한 상수도 유량 예측 방법을 순서도로 나타낸 것이다.
도 1을 참조하면, 우선 예측 시스템(미 도시)은 외부의 호스트 서버(미 도시)의 데이터베이스에 접속하여 상수도의 유량을 예측하기 위한 유량 데이터를 수집하는 제1 과정(S10)을 갖는다.
다음으로, 상기 수집한 유량 데이터에 대해 초기 처리 과정을 수행하는 제2 과정(S20)을 갖는다.
이를테면, 상기 예측 시스템은 상기 수집한 데이터에서 오류 데이터 및 결측 데이터 등을 검색하고, 검색한 오류 데이터 및 결측 데이터들에 대해 이전의 평균 값 등으로 다시 사용할 수 있도록 보정 처리하는 작업을 통해, 예측할 수 있는 데이터로 변환 시킨다.
다음으로, 상기 초기 처리한 데이터를 미리 설정된 소정의 모델 이를테면, 신경 회로망 모델 또는 시계열 모델(Auto Regressive Moving Average Model) 등에 적용하여 학습 데이터 과정을 수행하는 제3 과정(S30)을 갖는다.
마지막으로, 상기 학습 데이터를 수행한 결과를 토대로 유량을 예측을 수행하는 제4 과정(S40)을 갖는다.
하지만 종래기술에 따른 유량 예측방법은, 예측에 대한 데이터의 시간당 추이를 분석해 보면 비선형적이고, 복잡한 시계열 특성을 가지고 있음에도 불구하고, 신경망의 인공지능 방식이나 통계적 방식 등의 단위 시계열을 그대로 사용함으로써, 예측 정확도가 떨어져 관망 유수율 관리에 어려움이 많은 문제점이 있었다.
대한민국 공개특허 제10-2005-0051955호
본 발명이 해결하고자 하는 기술적 과제는, 상수관망의 선형성이 없는 형태 및 누락 및 오류 데이터 형태의 복잡성을 고려하여, 부트스트랩 리샘플링(Bootstrap Resampling) 방법을 통한 전 처리의 기능으로 누락 데이터의 편향을 줄이고, 앙상블 인공지능알고리즘을 적용하여 허용된 오차범위 내의 수요량 예측이 가능케 하는, 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법을 제공하는데 있다.
상기 기술적 과제를 이루기 위한 본 발명에 따른 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법은, 외부의 호스트 서버로부터 유량 이력데이터를 내부의 통신부를 통해 수집하는 제1 단계; 수집한 유량 이력데이터를 내부의 인공지능 계산부를 통해 전 처리과정을 수행하는 제2 단계; 상기 제2 단계에서 전 처리된 유량 이력데이터에 대해 앙상블 인공지능알고리즘을 사용하여 유량의 기울기를 계산하는 제3 단계; 및 상기 앙상블 인공지능 알고리즘을 통해 획득된 새로운 유량 이력데이터를 이용하여 미래의 수요량을 예측하는 제4 단계를 포함하는 기술을 제공한다.
본 발명은 상수관망을 통해 공급되는 물의 1일 수요량의 예측 오차를 최소화할 수 있으며, 또한 물의 1일 수요량의 예측 오차를 최소화함에 따라 후속 과정인 시간별 수요량의 예측 오차를 향상시킬 수 있고, 이를 활용하여 최적의 운영과정을 효율적으로 수행할 수 있는 기술적 효과가 있다.
도 1은 종래기술에 따른 단순통계 방식을 사용한 상수도 유량 예측 방법을 순서도로 나타낸 것이다.
도 2는 본 발명에 따른 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 시스템의 구성을 나타낸 것이다.
도 3은 본 발명에 따른 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법을 순서도로 나타낸 것이다.
도 4는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 GLM with Dummy Variables 기법을 사용하여 유량의 기울기를 예측하는 방법을 나타낸 것이다.
도 5a는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 Trigonometric Models 기법 적용을 위한 주기성 조건을 나타낸 것이다.
도 5b는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 Trigonometric Models 기법을 적용한 누가 강우량의 추세를 예측하는 방법을 나타낸 것이다.
도 6은 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 Holt-Winters Exponential Smoothing 기법을 적용한 평활 값을 예측하는 방법을 나타낸 것이다.
도 7a는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 PSF 기법 의 대략적인 진행과정을 다이어그램으로 나타낸 것이다.
도 7b는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 PSF 기법 을 통한 레벨링 및 예측 방법을 나타낸 것이다.
이하에서는 본 발명의 구체적인 실시예를 도면을 참조하여 상세히 설명하도록 한다.
도 2는 본 발명에 따른 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 시스템의 구성을 나타낸 것이다.
도 2를 참조하면, 본 발명은 상수도 유량 예측 시스템(100) 및 호스트 서버(200)를 포함하며, 이들 상호간은 통신망(300)을 통해 각종 데이터를 송수신한다.
상수도 유량 예측 시스템(100)은 입력부(110), 통신부(120), 인공지능 계산부(130), 저장부(140), 디스플레이부(150) 및 제어부(160)를 포함함으로써, 앙상블 인공지능 알고리즘을 사용하여 상수도 유량을 예측할 수 있도록 해주는데, 이에 대한 상세한 설명은 도 3에서 후술한다.
입력부(110)는 관리자의 조작 명령을 입력하기 위한 것으로써, 이를테면 자판, 마우스 등의 입력 수단을 통해 각종 명령을 입력할 수 있다.
통신부(120)는 호스트 서버(200)와 통신망(300)을 통해 통신을 수행하여, 상기 호스트 서버(200)에 구비되어 있는 데이터베이스(DB)로부터 유량 데이터를 수신한다.
이를테면, 현장의 원격단말기가 지자체의 상황실 통신취합장치로 무선의 CDMA(Code Division Multiple Access) 또는 유선 전용선 방식으로 1분 단위로 유량 데이터를 전송하면, 지자체의 상황실 통신취합장치는 수신한 유량계의 유량 데이터를 통신취합장치의 데이터베이스(DB)에 동일한 크기의 1분 주기로 유량 데이터를 생성한 후 상기 통신부(120)로 유량 데이터를 전송한다.
이 경우 통신망(300)은 이를테면, 지그비(Zigbee), CDMA(Code Division Multiple Access), 알에프(RF), 와이파이(WiFi), 3G, 4G, LTE, LTE-A, 와이브로(Wireless Broadband Internet), 블루투스(BLE, Beacon 포함), LTE-M, LORA, SUB-1Ghz 등을 활용한 시설물간의 원거리 무선 커넥티비티 무선통신 또는 이더넷(Ethernet), PLC(Power Line Communication) 등의 유선통신 또는 인터넷, SNS(Social Network Service) 등을 사용할 수 있다.
인공지능 계산부(130)는 상기 호스트 서버(200)의 데이터베이스(DB)로부터 수신한 유량의 이력 데이터에 앙상블 인공지능 알고리즘을 적용하여 상수도 유량을 예측하는데, 이에 대한 구체적인 설명은 도 3 ~ 도 7b에서 후술한다.
저장부(140)에는 상기 인공지능 계산부(130)의 동작 프로그램이 미리 저장되어 있으며, 또한 상기 인공지능 계산부(130)를 통해 계산된 각종 계산 데이터 등이 저장되는데, 이 경우 저장매체로 이를테면 플래시 메모리 등 비휘발성 메모리 소자를 사용할 수 있다.
디스플레이부(150)는 상기 인공지능 계산부(130)의 계산에 따른 결과치인 이를테면, 유량의 예측 처리 상태, 예측한 유량 값 등을 화면에 표시하는데, 이 경우 LCD, LED 디스플레이 등을 이용하여 결과를 화면에 출력할 수 있다.
제어부(160)는 입력부(110), 통신부(120), 인공지능 계산부(130), 저장부(140) 및 디스플레이부(150)를 제어한다.
도 3은 본 발명에 따른 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법을 순서도로 나타낸 것이다.
이하 도 2 및 도 3을 참조하여, 본 발명에 따른 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법을 설명한다.
우선 상수도 유량 예측 시스템(100)은 내부의 통신부(120)를 통해 호스트 서버(200)로부터 유량 이력데이터를 수집하는 제1 단계(S110)를 갖는다.
다음으로, 인공지능 계산부(130)는 수집한 유량 이력데이터에 대해 전 처리과정을 수행하는 제2 단계(S120)를 갖는다.
이 경우 전 처리과정은, 상기 수집한 유량 이력데이터에서 오류 데이터(데이터 이상치, 튐 등) 및 결측 데이터(데이터 누락 등) 등을 검색하고, 검색한 오류 데이터 및 결측 데이터 등을 부트스트랩 리샘플링(Bootstrap Resampling)으로 이상치(outlier)를 배제하고, 정규적 가정을 만족하지 않는 상황, 또는 경우에 따라서는 유량 데이터 사이즈가 작을 때에, 데이터에 대한 구체적인 전제 없이 편향(biasness)을 바로잡는 작업을 통해 유량을 예측할 수 있는 데이터로 변환하는 작업을 의미한다.
이하 본 발명의 전 처리과정에 적용된 부트스트랩 리샘플링(Bootstrap Resampling) 방법의 개념 및 유량 이력데이터에 적용을 구체적인 예를 통해 설명한다.
우선 처리해야할 데이터(X)가 하기 수학식1처럼 주어지는 경우에 대해 살펴본다.
[수학식1]
Figure 112017046603247-pat00001
이 경우 만일 부트스트랩 리샘플링(Bootstrap Resampling)을 하지 않고, 이 데이터(X)에 대한 평균을 구할 경우, 평균은 하기 수학식2처럼 표현된다.
[수학식2]
Figure 112017046603247-pat00002
이를테면, X1 = 1.5, X2 = 2, X3 = 3, X4 = 4.5, X5 = 5, X6 = 7, X7 = 100 인 경우, 데이터 X의 평균은 하기 수학식 3으로 표현된다.
[수학식3]
Figure 112017046603247-pat00003
상기 수학식3을 참조하면, 대부분의 데이터 값이 10보다 작은, 1.5 ~ 7 사이의 값임에도 불구하고, 1개의 데이터 값이 X7 = 100 이어서 평균 값이 예상보다 눈에 띨 정도로 큰 편향된 값을 나타냄을 알 수 있다.
즉 데이터에 이상치(outlier)가 있는 경우(X7 = 100), 이상치(outlier)에 대한 편향(biasness)된 결과를 출력할 수 있는 문제점이 발생한다.
따라서 평균을 구할 때 X1 ~ X7 까지 데이터 전부를 사용하지 않고, 이 중 일부를 뽑아서 활용할 필요가 있는데, 이러한 방법을 부트스트랩 리샘플링(Bootstrap Resampling) 이라고 한다.
이를테면, 상기 7개 데이터( X1 ~ X7 ) 중 임의로 3개씩만 뽑아서 부분 평균을 구해보면, 하기 수학식4로 표현된다.
[수학식4]
Figure 112017046603247-pat00004
상기 수학식4를 참조하면, ①, ②, ③, ④, …와 같이 부분 평균을 구해보면, 간헐적으로 ②와 같이 부분 평균이 확 튀어버리기도 하지만(이상치 발생), 대부분은 1~7의 값 사이에 분포된다.
이러한 과정을 무수히 반복한 다음에, 그 부분 평균의 히스토그램(미 도시)을 그리면, 어느 일정한 값(이를테면, 5)에 수렴하는 모습을 볼 수 있게 되고, 그 수렴하는 값을 선택하면, 이상치(outlier)를 배제한 결론에 어느 정도 도달할 수 있게 된다.
상기 실시예는 간단한 예이기는 하지만, 위 X는 이상치(outlier)가 1개(X7 = 100)임에도 불구하고 정규성을 만족하지 못하는 상황을 발생시킨다.
이와 같이 이상치(outlier)를 배제하고, 정규성 가정을 만족하지 않는 상황에서, 또는 경우에 따라서는 데이터 사이즈가 작을 때에, 데이터에 대한 구체적인 전제 없이 편향(biasness)을 바로잡고, 분석을 진행하는 계산 집중적(computer intensive)인 방법을 부트스트랩 리샘플링(Bootstrap Resampling) 이라고 한다.
다음으로, 상기 실시예를 유량 데이터에 적용하여 부트스트랩 리샘플링(Bootstrap Resampling)을 사용하는 방법에 대해 간단한 예를 들어 설명한다.
만일 선택된 유량 데이터가 총 7일인 경우(수학식1 참조), 1일을 분단위로 나타내면, 1일 = 24시간 = 1440분 이므로, 유량 데이터
Figure 112017046603247-pat00005
는 하기 수학식5과 같은 행렬로 표현된다.
[수학식5]
Figure 112017046603247-pat00006
이 경우 유량 데이터
Figure 112017046603247-pat00007
에 대해서, 앞에서 설명한 부트스트랩 리샘플링(Bootstrap Resampling)을 사용하기 위해, 데이터들을 각각의 열에서 하나씩 선택한 후 임의로 조합하면, 하기 수학식6처럼 표현된다.
[수학식6]
Figure 112017046603247-pat00008
상기 수학식6을 참조하면, 임의 조합된 무수한 유량 데이터 ①, ②, ③ …에 대해 상기 수학식2의 평균 또는 수학식4의 부분 평균을 적용하면, 어느 일정한 값에 수렴하는 값을 계산할 수 있고, 수렴됨 값을 선택함으로써 유량 데이터 중 이상치(outlier)를 나타내는 값을 배제하여 편향(biasness)을 바로잡는 소위 부트스트랩 리샘플링(Bootstrap Resampling)이 실행된다.
다시 도 3을 참조하면, 다음으로 인공지능 계산부(130)는 전 처리된 유량 이력데이터에 대해 앙상블 인공지능알고리즘을 사용하여 유량의 기울기를 계산하는 제3 단계(S130)를 갖는다.
이하 각각의 인공지능알고리즘 또는 인공지능알고리즘들이 선택 조합된 인공지능알고리즘들(이하 '앙상블 인공지능알고리즘'으로 칭함)을 사용하여 유량의 기울기를 계산하는 방법에 대해 설명한다.
이 경우 앙상블 인공지능알고리즘은 지도학습(Supervised Learning) 모델(이를테면, GLM with Dummy Variables 기법, Trigonometric Models 기법, Holt-Winters Exponential Smoothing 기법, Box-Jenkins 기법, VAR 기법 등) 및 자율학습(Unsupervised learning) 모델(이를테면, PSF 기법 등)과 같은 인공기능알고리즘을 포함하며, 이하 각각의 인공지능알고리즘에 대해 설명한다.
첫째, 지도학습(Supervised Learning) 모델은 상기 제2 단계(S120)에서 수행된 전 처리된 유량 이력데이터의 구분된 범주를 이용하여 레벨링(labeling)을 하여, 확증적 분석을 진행하는데 특징이 있는데, 이는 고전 통계방법(classical statistical methods)을 적용할 여지가 크고, 해석이 용이해지며, 모델(model)이 변하지 않음에 따라 학습할 때 활용한 모델(model)을 추후에 신속하게 다시 적용할 수 있는 장점을 제공하는데, 이하 지도학습(Supervised Learning) 모델 각각의 기법에 대해 설명한다.
[GLM with Dummy Variables 기법]
상기 GLM with Dummy Variables 기법을 적용하기 위해 하기 수학식7과 같은 형태로 모형을 설정한 경우,
[수학식7]
Figure 112017046603247-pat00009
정규성 가정 등의 몇 가지 전제를 하면, 이를"회귀분석"이라고도 칭할 수 있지만, 물론 분포 가정은 정규분포가 아닌 다른 분포가정을 하기도 한다.
여기서 Y는 목적함수(종속변수), β0 ~ βp는 회귀계수, X1 ~ Xp는 설명변수(독립변수), ε는 오차를 의미한다.
이 경우 유량 이력데이터는, 앞의 실시 예에서 처럼 t가 시간(분)이라고 하였을 때, 상기 모형에서 t는 (1, ..., p)로 주어짐으로써, p가 가질 수 있는 최대 값은 1440이 된다.
한편"예측(prediction)"이라는 것은 2가지 경우로 크게 나눌 수 있는데, 즉 "반응구간 안에서의 예측"및 "예측구간 안에서의 예측"으로 분류할 수 있다.
여기서 "반응구간 안에서의 예측"은 데이터가 이미 주어져 있는 구간(과거) 안에서 예측하는 것, 즉 데이터가 (1, ..., p) 구간으로 주어져있는 상황에서, 이 범주 안의 값을 예측하는 것(이를테면, 1.5분일 때의 기울기, 10.2분일 때의 기울기 등)을 의미한다.
반면 "예측구간 안에서의 예측"은 GLM에서 권장하는 방법이 아니기는 하지만, 이론적으로는 p + k (k > 0) 시점(미래)의 데이터를 알아내기 위한 예측을 의미한다.
이하 도 4를 참조하여, 반응구간 안에서의 예측" 및 "예측구간 안에서의 예측"을 부연 설명한다.
도 4는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 GLM with Dummy Variables 기법을 사용하여 유량의 기울기를 예측하는 방법을 나타낸 것이다.
도 4를 참조하면, 현재 예측 시점(이를테면, 2013년 12월 중순 경)을 기준으로 과거의 유량 이력데이터 구간(이를테면, 2012년 9월 ~ 2013년 12월 중순)에 대해 상기 수학식7의 모형을 사용하여 유량의 기울기의 변동을 예측할 수 있고(반응구간 안에서의 예측), 또한 경우에 따라서는 현재 예측 시점(이를테면, 2013년 12월 중순 경)을 기준으로 미래의 불확실한 유량 이력데이터 구간(이를테면, 2013년 12월 중순 ~ 2014년 12월)에 대해 상기 수학식7의 모형을 사용하여 유량의 기울기의 변동을 예측("예측구간 안에서의 예측")할 수도 있다.
또한 GLM with Dummy Variables 기법은 계절성, 특정 월의 구분 등의"특정 요인"에 따라 임의 구분을 하고자 할 경우, 상기 수학식7의 모형에 더미 변수(Dummy Variable)를 덧붙일 수 있다.
[Trigonometric Models 기법]
도 5a는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 Trigonometric Models 기법 적용을 위한 주기성 조건을 나타낸 것이고, 도 5b는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 Trigonometric Models 기법을 적용한 누가 강우량의 추세를 예측하는 방법을 나타낸 것이다.
Trigonometric Models 기법은 상당히 이론적인 방법으로, 데이터가 도 5a에 도시된 바대로, 삼각함수(Trigonometric)처럼 명확한 주기성을 띄고 있다고 가정할 경우에 적합하다.
도 5a를 참조하면, 사인함수(sine) 또는 코사인 함수(cosine) 형태의 주기성을 갖고 있는 경우, 모델은 하기 수학식8(제1 모델) 및 수학식9(제2 모델)와 같이 사인함수(sine)와 코사인 함수(cosine)의 조합으로 모형을 설정하면, 앞에서 설명한 GLM with Dummy Variables 기법을 유추 적용할 수 있다.
[수학식8]
Figure 112017046603247-pat00010
[수학식9]
Figure 112017046603247-pat00011
여기서 yt는 목적함수(종속변수), β0 ~ β4는 회귀계수, L은 사인함수(sine) 또는 코사인 함수(cosine)의 주기, ε는 오차를 의미한다.
이 경우 수학식8(제1 모델) 및 수학식9(제2 모델)의 각종 변수 값들을 바꿔 가면, 주기(L)가 어떤 값을 갖는 지를 예상할 수 있게 된다.
만일 상기 수학식8(제1 모델) 또는 수학식9(제2 모델)에 대한 적합도가 높다면, 이를테면 누가 강우량(cumulative rainfall)에 대해 도 5b에 도시된 바대로, 일정한 주기를 갖는 추세(기울기)가 있음을 확인할 수 있게 된다.
[Holt-Winters Exponential Smoothing 기법]
도 6은 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 Holt-Winters Exponential Smoothing 기법을 적용한 평활 값을 예측하는 방법을 나타낸 것이다.
상기 Holt-Winters 지수평활(Exponential Smoothing) 기법은 변동이 존재할 경우 이의 평활 값을 예측하는 방법으로, 하기 수학식10과 같은 모형을 설정할 수 있다.
[수학식10]
Figure 112017046603247-pat00012
여기서, lT는 시간 T에서의 레벨(level), bT는 시간 T에서의 성장률, snT는 부가적인 계절 변수(seasonal factor)를 의미하며, 하기 수학식11로 다시 표시할 수 있다.
[수학식11]
Figure 112017046603247-pat00013
이 경우 α, r, δ는 주기나 산포 증가 여부에 따라 임의로 결정할 수도 있고, 최적화 방법을 사용할 수도 있다.
한편 상기 수학식10에 따른 모델의 예측 값은 이를테면, 도 6에 도시된 바대로 일정 계절 변동(도 6 좌측) 또는 증가 계절 변동(도 6 우측)에 따른 평활 값의 반응/예측구간 값이 된다.
[Box-Jenkins 기법]
상기 Box-Jenkins 기법은 일명 ARIMA(Auto Regressive Integrated Moving Average) 모델이라고 불리며, 하기 수학식12와 같이 AR 모형과 MA 모형의 조합에 차분(differencing)을 반영하는 모델이다.
[수학식12]
Figure 112017046603247-pat00014
둘째, 자율학습(Unsupervised learning) 모델은 앞에서 설명한 지도학습(Supervised Learning) 모델이 임의로 구분한 범주로 레벨링(labeling)을 하여 분석하는 것과 달리, 이 방법은 인위적인 범주화를 최소화하고, 범주를 탐색하는 방법을 활용할 수 있다는데 특징이 있다.
즉 자율학습(Unsupervised learning) 모델은 임의의 레벨링(labeling)을 하지 않기 때문에 자율학습(Unsupervised learning) 방법을 적용함으로써, 앞의 지도학습(Supervised Learning)에서 서술한 장점을 포기할 수도 있지만, 기존의 모델(model)이 정확하지 않다고 판단될 경우에, 새로운 모델(model)을 탐색하는 데에 활용할 수 있고, 만일 새로운 모델(model)을 탐색하였다면, 탐색한 결과를 바탕으로 새롭게 레벨링(labeling)을 한 후, 고전 통계방법(classical statistical methods)을 적용할 수 있는 장점을 제공한다.
[PSF(Pattern Sequence-based Forecasting) 기법]
도 7a는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 PSF 기법 의 대략적인 진행과정을 다이어그램으로 나타낸 것이고, 도 7b는 본 발명에 따른 실시예로, 앙상블 인공지능 알고리즘 중 PSF 기법 을 통한 레벨링 및 예측 방법을 나타낸 것이다.
도 7a를 참조하면, PSF 기법은 통상 데이터 획득(Data Acquision) 과정 --> 정규화(Normalization) 과정 ---> 클러스터링(Clustering) 과정 ---> 예측(Predication) 과정 등을 가지는데, 이 과정들은 폐회로 프로세스이므로 예측을 시도 할 수 있는 이점이 있고, 특히 클러스터링(Clustering) 과정 전후에 각각 K 선택(클러스터링 선택을 위한 것임) 과정 및 W 선택(부가적인 예측을 위한 것임) 과정을 통해 여러 값을 동시에 예측할 수 있도록 해주는 특징을 가진다.
도 7b를 참조하면, 상기 클러스터링(Clustering) 과정은 동일 패턴(4, 4, 2, 2)을 보이는 기간끼리 묶는 레벨링(labeling)을 수행하며, 상기 예측(Predication) 과정은 레벨링(labeling)된 이후의 기간들(3, 4, 3)을 입력받아 이를 평균한 값(3.33)을 기초로 기간을 예측한다.
다시 도 3을 참조하면, 상기 앙상블 인공지능 알고리즘을 통해 획득된 새로운 유량 이력데이터를 이용하여 미래의 수요량을 예측하는 제4 단계(S140)를 갖는다.
여기서 미래의 수요량 이란 T 시간 후의 강우량 등의 물의 유량의 크기를 의미한다.
다음으로, 유량에 대한 예측값과 실측값의 차이가 허용된 오차범위 보다 큰지를 판단하는 제5 단계(S150)를 갖는다.
만일 제5 단계(S150)에서 유량에 대한 예측값과 실측값의 차이가 허용된 오차범위 보다 크다고 판단한 경우(예), 즉 예측이 만족스럽지 않은 경우 상기 제3 단계(S130)로 리턴 하여 상기 앙상블 인공지능알고리즘 중 새로운 인공지능알고리즘을 선택하여 이후 과정을 동일하게 진행한다.
만일 제5 단계(S150)에서 유량에 대한 예측값과 실측값의 차이가 허용된 오차범위 보다 크지 않다고 판단한 경우(아니오), 즉 예측이 만족스러운 경우 마지막 단계로 최종 예측된 유량 데이터 값을 출력하는 제6 단계(S160)를 갖는다.
이상에서는 본 발명에 대한 기술사상을 첨부 도면과 함께 서술하였지만 이는 본 발명의 바람직한 실시 예를 예시적으로 설명한 것이지 본 발명을 한정하는 것은 아니다. 또한 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구나 본 발명의 기술적 사상의 범주를 이탈하지 않는 범위 내에서 다양한 변형 및 모방이 가능함은 명백한 사실이다.
100 : 상수도 유량 예측시스템
110 : 입력부
120 : 통신부
130 : 인공지능 계산부
140 : 저장부
150 : 디스플레이부
160 : 제어부
200 : 호스트 서버

Claims (8)

  1. 외부의 호스트 서버로부터 유량 이력데이터를 내부의 통신부를 통해 수집하는 제1 단계;
    수집한 유량 이력데이터를 내부의 인공지능 계산부를 통해 전 처리과정을 수행하는 제2 단계;
    상기 제2 단계에서 전 처리된 유량 이력데이터에 대해 앙상블 인공지능알고리즘을 사용하여 유량의 기울기를 계산하는 제3 단계; 및
    상기 앙상블 인공지능 알고리즘을 통해 획득된 새로운 유량 이력데이터를 이용하여 미래의 수요량을 예측하는 제4 단계를 포함하며,
    상기 제2 단계의 전 처리 과정은,
    수집한 유량 이력데이터에서 오류 데이터 및 결측 데이터를 검색한 후 부트스트랩 리샘플링(Bootstrap Resampling) 방법을 적용하여 이상치(outlier)를 배제하는 작업을 수행하고,
    상기 부트스트랩 리샘플링(Bootstrap Resampling) 방법은,
    이상치(outlier)를 배제하기 위해, 수집한 유량 이력데이터 중 일부를 선택하여 부분 평균을 복수 회 실시하여 수렴된 값을 계산하며,
    상기 앙상블 인공지능알고리즘은,
    지도학습(Supervised Learning) 모델 또는 자율학습(Unsupervised learning) 모델을 포함하고,
    상기 지도학습(Supervised Learning) 모델이 제공하는 제1 인공지능알고리즘들 또는 상기 자율학습(Unsupervised learning) 모델이 제공하는 제2 인공지능알고리즘을 선택 조합하여 허용된 오차범위 내의 예측이 구현되도록 하며,
    상기 제1 인공지능알고리즘들은,
    GLM with Dummy Variables 기법, Trigonometric Models 기법, Holt-Winters Exponential Smoothing 기법, Box-Jenkins 기법 중 어느 하나 이상을 사용하고,
    상기 제2 인공지능알고리즘은,
    PSF(Pattern Sequence-based Forecasting) 기법을 사용하며,
    상기 GLM with Dummy Variables 기법을 적용하기 위해 하기 수학식과 같은 형태로 모형을 설정하며,
    [수학식]
    Figure 112017128772111-pat00024

    (여기서 Y는 목적함수(종속변수), β0 ~ βp는 회귀계수, X1 ~ Xp는 설명변수(독립변수), ε는 오차를 의미함)
    상기 수학식의 모형을 사용하여,
    현재 예측 시점을 기준으로 과거의 유량 이력데이터 구간에 대해 유량의 기울기의 변동을 예측하는 [반응구간 안에서의 예측] 및,
    현재 예측 시점을 기준으로 미래의 불확실한 유량 이력데이터 구간에 대해 유량의 기울기의 변동을 예측하는 [예측구간 안에서의 예측]을 수행하는 것을 특징으로 하는 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법.
  2. 삭제
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 제 1항에 있어서,
    상기 제4 단계 이후에 유량에 대한 예측값과 실측값의 차이가 허용된 오차범위 보다 큰지를 판단하는 제5 단계를 포함하는 것을 특징으로 하는 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법.
  8. 제 7항에 있어서,
    상기 제5 단계에서 유량에 대한 예측값과 실측값의 차이가 허용된 오차범위 보다 크다고 판단한 경우, 상기 제3 단계로 리턴 하여 상기 앙상블 인공지능알고리즘 중 새로운 인공지능알고리즘을 선택하여 유량의 기울기를 다시 계산하는 것을 특징으로 하는 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법.
KR1020170060683A 2017-05-16 2017-05-16 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법 KR101831316B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170060683A KR101831316B1 (ko) 2017-05-16 2017-05-16 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170060683A KR101831316B1 (ko) 2017-05-16 2017-05-16 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법

Publications (1)

Publication Number Publication Date
KR101831316B1 true KR101831316B1 (ko) 2018-02-22

Family

ID=61387144

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170060683A KR101831316B1 (ko) 2017-05-16 2017-05-16 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법

Country Status (1)

Country Link
KR (1) KR101831316B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657854A (zh) * 2018-12-13 2019-04-19 中国农业科学院农田灌溉研究所 一种作物需水量预测的方法、系统及设备
KR20210044092A (ko) * 2019-10-14 2021-04-22 울산대학교 산학협력단 실시간 앙상블 유량 예보 방법 및 장치

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657854A (zh) * 2018-12-13 2019-04-19 中国农业科学院农田灌溉研究所 一种作物需水量预测的方法、系统及设备
CN109657854B (zh) * 2018-12-13 2023-07-04 中国农业科学院农田灌溉研究所 一种作物需水量预测的方法、系统及设备
KR20210044092A (ko) * 2019-10-14 2021-04-22 울산대학교 산학협력단 실시간 앙상블 유량 예보 방법 및 장치
KR102254817B1 (ko) 2019-10-14 2021-05-21 울산대학교 산학협력단 실시간 앙상블 유량 예보 방법 및 장치

Similar Documents

Publication Publication Date Title
Zhou et al. A random forest model for inflow prediction at wastewater treatment plants
Carpinone et al. Markov chain modeling for very-short-term wind power forecasting
CN111552923B (zh) 一种基于通用分布的负荷预测方法及负荷预测系统
Islam et al. Energy demand forecasting
Nguyen et al. Multiple neural networks for a long term time series forecast
US10740773B2 (en) Systems and methods of utilizing multiple forecast models in forecasting customer demands for products at retail facilities
US20210256378A1 (en) System and method for weather dependent machine learning architecture
CN101408769A (zh) 一种基于乘积arima模型的在线能源预测系统及方法
Jang et al. On the long-term density prediction of peak electricity load with demand side management in buildings
CN110705772A (zh) 区域电网风力发电功率预测优化方法和装置
Wood Hourly-averaged solar plus wind power generation for Germany 2016: Long-term prediction, short-term forecasting, data mining and outlier analysis
BROŻYNA et al. MULTI-SEASONALITY IN THE TBATS MODEL USING DEMAND FOR ELECTRIC ENERGY AS A CASE STUDY.
Cabral et al. Using economic asset valuation to meet rehabilitation priority needs in the water sector
KR101831316B1 (ko) 앙상블 인공지능 알고리즘을 사용한 상수도 유량 예측 방법
Wang et al. An inexact irrigation water allocation optimization model under future climate change
JP2020112847A (ja) 水需要予測方法およびシステム
CN116796961A (zh) 工程项目管理方法、设备及计算机可读存储介质
Mishra et al. Performance evaluation of prophet and STL-ETS methods for load forecasting
Berrisch et al. High-resolution peak demand estimation using generalized additive models and deep neural networks
García-Díaz et al. Competitive models for the spanish short-term electricity demand forecasting
US20230259846A1 (en) Communications apparatus and method for estimating potential demand for improved forecasting and resource management
KR100724497B1 (ko) 물 수요 예측 시스템 및 방법
JP5561643B2 (ja) 需要予測装置及び水運用監視システム
Xie et al. Enhance load forecastability: Optimize data sampling policy by reinforcing user behaviors
CN118037014B (zh) 基于物联网的道路施工监测系统

Legal Events

Date Code Title Description
AMND Amendment
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant