KR102468316B1 - 과거 데이터에 기초한 시계열 예측 방법 및 장치 - Google Patents

과거 데이터에 기초한 시계열 예측 방법 및 장치 Download PDF

Info

Publication number
KR102468316B1
KR102468316B1 KR1020190096448A KR20190096448A KR102468316B1 KR 102468316 B1 KR102468316 B1 KR 102468316B1 KR 1020190096448 A KR1020190096448 A KR 1020190096448A KR 20190096448 A KR20190096448 A KR 20190096448A KR 102468316 B1 KR102468316 B1 KR 102468316B1
Authority
KR
South Korea
Prior art keywords
data
prediction
past
prediction data
time series
Prior art date
Application number
KR1020190096448A
Other languages
English (en)
Other versions
KR20210017342A (ko
Inventor
이현용
고석갑
김낙우
이병탁
이준기
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020190096448A priority Critical patent/KR102468316B1/ko
Publication of KR20210017342A publication Critical patent/KR20210017342A/ko
Application granted granted Critical
Publication of KR102468316B1 publication Critical patent/KR102468316B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Abstract

과거 데이터에 기초한 시계열 예측 방법 및 장치가 개시된다. 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계, 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계, 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다. 따라서, 재학습 없이 기존에 학습된 시계열 예측 모델을 그대로 사용하면서 더욱 정확한 예측 데이터를 획득할 수 있다.

Description

과거 데이터에 기초한 시계열 예측 방법 및 장치{TIME SERIES PREDICTION METHOD AND APPARATUS BASED ON PAST PREDICTION DATA}
본 발명은 과거 데이터에 기초한 시계열 예측 방법 및 장치에 관한 것으로, 더욱 상세하게는 시계열 예측 모델을 재학습하지 않고, 관련성이 있는 과거 데이터만을 이용하여 시계열 예측 결과를 보정함으로써, 점진적이거나 급격한 데이터 변화가 있더라도 정교한 시계열 예측을 수행하는 기술에 관한 것이다.
시계열(time serises)은 일정 시간 간격으로 배치된 데이터들의 수열을 말한다. 이때, 시계열 예측(time series prediction)이란 주어진 시계열 데이터를 이용하여 수학적 예측 모델을 만들고, 예측 모델을 이용하여 미래에 발생할 수 있는 데이터를 예측하는 것을 의미한다. 일반적으로, 이러한 시계열 예측은 공학이나 과학계산, 혹은 금융시장에서의 주가 예측 등에서 많이 사용되지만, 그 밖에도 시간에 종속적으로 측정된 모든 데이터들은 시계열로 볼 수 있다.
시계열 예측을 위한 예측 모델은 알려진 데이터(known data)의 입력과 출력 사이의 상관 관계를 학습하여 생성될 수 있다. 예를 들어 지난 3 시간 동안의 날씨와 전력 생산량 사이의 상관 관계를 학습함으로써 향후 한 시간 동안 특정 날씨에 따른 전력 생산량을 예측하는 예측 모델을 생성할 수 있다.
예측 모델은 학습에 사용된 데이터가 수집된 환경과 유사한 환경에서 사용될 때 예측 정확도가 높다. 예를 들어, 사계절이 뚜렷한 지역에서 수집된 데이터를 이용하여 생성된 전력 생산량 예측 모델은 적도 지방에서 필요한 전력 생산량을 예측하는 데에는 적합하지 않다.
한편, 예측 모델이 사용되는 환경은 점진적이거나 급격하게 변화되는 경우가 발생할 수 있다. 예를 들어, 전력 생산량을 예측하는 예측 모델이 적용되는 태양광 발전소의 생산 능력이 노후화로 인해 시간이 지남에 따라 점차 감소하거나, 태양광 패널에 일시적인 눈이나 먼지 등이 쌓여 태양광 발전소의 생산 능력이 급격히 감소할 수도 있다. 따라서, 예측 모델이 사용되는 환경의 변화를 고려하여 예측 모델의 실시간 예측 결과를 적절히 보정함으로써 예측 모델의 정확도를 유지시키는 것이 필요하다.
이러한 문제를 해결하기 위하여 종래에는 실시간으로 생성되는 데이터를 기반으로 예측 모델을 추가 학습(fine-tuning)하는 방법이 제안되었으나, 추가 학습을 위해서는 많은 컴퓨팅 자원이 요구된다. 또한, 짧은 시간 동안 간헐적으로 이벤트가 발생하는 환경에서는 신속하고 정확하게 예측 모델을 추가 학습하기 어렵고, 간헐적 이벤트로 인해 생성된 데이터를 이용하여 급격하게 추가 학습된 예측 모델은 정상적인 환경에서 부정확한 예측 데이터를 도출할 가능성이 높다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 과거 데이터에 기초한 시계열 예측 방법을 제공하는 데 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, 과거 데이터에 기초한 시계열 예측 장치를 제공하는 데 있다.
상기 목적을 달성하기 위한 본 발명의 일 측면은, 과거 데이터에 기초한 시계열 예측 방법을 제공한다.
상기 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계, 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계, 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 과거 데이터에 기초한 시계열 예측 방법은, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.
상기 목적을 달성하기 위한 본 발명의 다른 측면은, 과거 데이터에 기초한 시계열 예측 장치를 제공한다.
과거 데이터에 기초한 시계열 예측 장치는, 적어도 하나의 프로세서(processor); 및 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.
상기 적어도 하나의 단계는, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계; 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계; 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 적어도 하나의 단계는, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.
상기와 같은 본 발명에 따른 과거 데이터에 기초한 시계열 예측 방법 및 장치를 이용할 경우에는 예측 모델을 추가 학습하지 않더라도 과거 예측 데이터만을 이용하여 실시간으로 예측 데이터를 보정할 수 있다.
또한, 예기치 못한 간헐적 이벤트가 발생한 환경에서도 신속하게 예측 데이터를 보정하여 도출할 수 있는 장점이 있다.
또한, 예측 모델에 종속적이지 않으며, 특정 환경에서 학습되어 생성된 예측 모델을 곧바로 유사 환경에 바로 사용할 수 있다.
도 1은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법 및 장치에 대한 개념도이다.
도 2는 본 발명의 일 실시예에 따른 과거 데이터를 추출하는 방법에 대한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제1 방법에 대한 개념도이다.
도 4는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제2 방법에 대한 개념도이다.
도 5는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제3 방법에 대한 개념도이다.
도 6은 사이트 1에서 수집한 예측 데이터 DB 및 사이트 1에서 학습한 시계열 예측 모델을 이용하여 사이트 2에 대한 예측 데이터를 생성하는 과정을 설명하기 위한 예시도이다.
도 7은 제1 지역에서 학습된 시계열 예측 모델을 제1 지역과 유사한 기후 환경에 속하지만 전력 생산 성능이 상이한 제2 지역에 적용한 결과를 나타낸 그래프이다.
도 8은 점차 발전 성능이 감소하는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 9는 급작스러운 환경 변화를 갖는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 10은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법에 대한 대표 흐름도이다.
도 11은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 장치에 대한 하드웨어 구성도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 과거 예측 데이터에 기초한 시계열 예측 방법 및 장치에 대한 개념도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 과거 예측 데이터에 기초한 시계열 예측 방법 및 장치는, 미리 학습되어 생성한 시계열 예측 모델(10), 시계열 예측 모델(10)에서 예측한 예측 데이터들과 실제 데이터들을 저장하는 예측 데이터 DB(20) 및/또는 예측 데이터 DB(20)에서 얻은 과거 데이터를 기반으로 시계열 예측 모델(10)에 의해 출력된 1차 예측 데이터를 보정함으로써 최종 예측 데이터를 출력하는 예측 데이터 조정기(30)로 구성될 수 있다.
시계열 예측 모델(10)은 시계열 데이터를 학습하여 미래에 발생할 수 있는 결과 데이터를 예측하는 수학적 모델로서, autoregressive(AR) 모델, integrated(I) 모델, moving average(MA) 모델 등이 있을 수 있다. 이러한 시계열 예측 모델(10)은 머신 러닝(machine learning), LSTM(Long short-term memory) 등을 비롯한 다양한 학습 방법을 이용해 LSTM(Long short-term memory) 등과 같은 머신 러닝(machine learning) 알고리즘에 기반하여 각종 실제 데이터(또는 관측되거나 측정된 데이터)들을 학습하여 생성될 수 있다. 이때, 실제 데이터는 예측 대상 환경(05)에서 관측되거나 측정된 데이터들일 수 있다. 예를 들어, 예측 대상 환경(05)이 발전소인 경우, 실제 데이터는 발전소의 전력 생산량, 날씨 등일 수 있다.
따라서, 시계열 예측 모델(10)은, 이러한 각종 실제 데이터들을 입력 데이터로서 수신하여 현재 시점에서 미래의 특정 시간이나 시점을 예측한 1차 예측 데이터를 출력할 수 있다. 이때, 입력 데이터는 다양한 데이터 형태를 가질 수 있다. 예를 들어, 시계열 예측 모델(10)에 대한 입력 데이터는 임의의 n차원의 시계열 데이터이거나 지난 K개의 시간 단위(시, 분, 일 등) 동안 측정 또는 수집된 시계열 데이터일 수 있다. 또한, 시계열 예측 모델(10)의 출력 데이터에 해당하는 1차 예측 데이터는, 현재 시점에서 향후 특정 시간 단위 동안의 결과를 예측한 데이터일 수 있다.
구체적으로 예를 들면, 시계열 예측 모델(10)은 지난 3시간 동안의 날씨에 따른 발전량을 입력 데이터로 활용하여, 현재 시점부터 향후 한시간 동안 생산할 것으로 예상되는 발전량을 예측할 수 있다.
본 발명의 일 실시예에서 시계열 예측 모델(10)은 특정 형태나 방식으로 제한하여 해석되지 않으며, 다양한 형식과 알고리즘으로 구현된 임의의 시계열 예측 모델이 모두 포함될 수 있다.
또한, 시계열 예측 모델(10)에 의해 예측 대상 환경(05)에 대해 예측된 1차 예측 데이터들과 예측 대상 환경(05)에서 측정 또는 관측하여 획득한 실제 데이터는 별도로 구축된 예측 데이터 DB(20)에 저장되어 관리될 수 있다. 따라서, 예측 데이터 DB(20)는 시계열 예측 모델(10)에 의해 미래 특정 시점이나 기간에 대해 1차적으로 예측된 결과들 및 예측한 시점이나 기간에서의 실제 데이터를 축적하여 저장하고, 예측 데이터 조정기(30)에서 요구하는 과거 데이터를 제공할 수 있다.
예를 들어, 예측 데이터 DB(20)에 저장되고 관리되는 데이터는 다음의 표 1과 같을 수 있다.
Figure 112019081138713-pat00001
상기 표 1을 참조하면, 예측 데이터 DB(20)에는, 저장된 데이터의 출처(Source), 관측 또는 예측이 수행된 시간 구간(Time index), 시간 구간에 따른 예측 데이터(Forecast value, 1차 예측 데이터일 수 있고, 과거 예측 데이터로 지칭될 수도 있음), 시간 구간에 따른 실제 데이터(True value, 예측 대상 환경에서 실제로 수집한 데이터 또는 과거 실제 데이터로 지칭될 수 있음), 시간 구간에 대한 각종 추가 데이터(Additional data1, Additional data2)등이 필드(field)로서, 저장될 수 있다. 추가 데이터는 예측 타겟 지표 이외의 데이터들로서 전력 생산량을 예측할 경우 전력 생산량 이외의 날씨, 노후도 등일 수 있다.
또한, 출처는 예측 데이터 또는 실제 데이터를 획득한 예측 대상 환경을 나타내는 식별기호일 수 있다. 예를 들어, 시계열 예측 모델을 적용하고자 하는 예측 대상 환경이나 예측 대상 환경과 유사한 환경을 출처로 갖는 데이터가 예측 데이터 DB(20)에 저장될 수 있다.
예측 데이터 조정기(30)는, 예측 데이터 DB에서 제공받은 과거 데이터를 기반으로 시계열 예측 모델에 의해 출력된 1차 예측 데이터를 보정하여 최종 예측 데이터를 출력할 수 있다. 여기서 과거 데이터는 시계열 예측 모델(10)이 과거 특정 시점에서 미래의 시점이나 시간에 대해 예측한 과거 예측 데이터이거나, 과거 특정 시점에서 측정 또는 수집하거나 관찰한 과거 실제 데이터일 수 있다. 또한, 과거 데이터는 과거 예측 데이터들 또는 과거 실제 데이터들 중에서 시계열 예측 모델에 의해 예측된 1차 예측 데이터와 관련성이 높은 데이터일 수 있다.
한편, 시계열 예측 모델(10), 예측 데이터 조정기(30)는 전술한 기능이나 동작을 수행하는 소프트웨어 모듈이나 명령어로서 구현될 수 있다. 또한, 예측 데이터 DB(20)는 전술한 데이터들을 저장하고 관리하는 하드웨어 저장소, 데이터 서버, 클라우드 서버 등으로 구현될 수 있다.
도 2는 본 발명의 일 실시예에 따른 과거 예측 데이터를 추출하는 방법에 대한 개념도이다.
도 1에서 설명한 것과 같이 본 발명의 일 실시예에 따른 예측 데이터 조정기(30)는, 예측 데이터 DB(20)에 저장된 과거 데이터를 추출하고, 추출된 과거 데이터를 이용하여 시계열 예측 모델의 1차 예측 데이터를 보정할 수 있다.
여기서, 예측 데이터 DB(20)에서 추출되는 과거 데이터는, 시계열 예측 모델에 따른 1차 예측 데이터와 유사한 데이터일 수 있다. 예를 들어, 과거 데이터는, 1차 예측 데이터와 일정한 기준 범위값내에 속하거나 또는 1차 예측 데이터에 대해 일정한 비율 범위내에 내에 속하는 데이터일 수 있다.
또한, 과거 데이터는, 시계열 예측 모델에 따른 1차 예측 데이터가 도출된 현재 시점을 기준으로 결정되는 시간 구간에 속하는 데이터일 수 있다. 예를 들어, 과거 데이터는, 1차 예측 데이터가 도출된 현재 시점이 속하는 시간 구간 또는 현재 시점부터 일정한 시간 범위 내에 위치한 데이터일 수 있다. 더욱 구체적으로 예를 들면, 오후 12시의 전력 생산량을 예측한 경우라면 과거 오후 12시에 수집하였던 과거 실제 데이터이거나, 과거 오후 12시에 예측하였던 과거 예측 데이터가 과거 데이터로서 추출될 수 있다.
또한, 과거 데이터는, 시계열 예측 모델이 현재 적용되는 예측 대상 환경을 기준으로 결정되는 데이터일 수 있다. 예를 들어, 과거 데이터는, 예측 대상 환경과 유사한 환경에서 수집되거나 예측한 적이 있는 데이터일 수 있다.
과거 데이터는, 예측 데이터 DB(20)에 포함된 모든 필드(표 1에 따른 필드 참조) 또는 일부 필드를 포함할 수도 있다. 예를 들어, 과거 데이터는, 시간 구간, 과거 예측 데이터, 과거 실제 데이터를 포함할 수 있다.
또한, 과거 데이터는, 예측 데이터 DB(20)에 포함된 과거 데이터 중에서 무작위로 선택된 데이터일 수도 있다.
예측 데이터 DB(20)에서 추출되는 과거 데이터의 개수는 동적으로 결정될 수 있다. 예를 들어, 최근 예측 결과를 고려하여 과거 데이터의 개수를 동적으로 결정할 수 있다. 구체적으로, 특정한 이벤트가 발생한 것으로 판단되면, 과거 데이터의 개수를 증가 또는 감소시킬 수 있다. 또한, 시계열 예측 모델이 적용되는 예측 대상 환경에 기초하여 과거 데이터의 개수가 결정될 수 있다. 예를 들어, 예측 대상 환경이, 급작스러운 이벤트가 거의 없는 환경에 해당하는 경우, 많은 수의 과거 데이터를 전처리기(40)에 입력할 수 있다. 또한, 예측 대상 환경이 급작스러운 이벤트가 빈번한 환경에 해당하는 경우, 적은 수의 과거 데이터(또는 현재 시점을 기준으로 매우 가까운 시간 간격 내에 속하는 데이터)를 전처리기(40)에 입력할 수 있다. 이처럼, 급작스러운 이벤트가 빈번한 환경에서 예측하는 경우, 매우 짧은 시간 동안의 과거 데이터를 사용함으로써 급작스러운 이벤트로 인한 급격한 변동 사항을 신속하게 예측에 반영할 수 있다.
한편, 위와 같이 결정된 과거 데이터는 그대로 도 1에 따른 1차 예측 데이터를 예측 데이터 조정기(30)에서 보정하는 데 사용될 수도 있고, 도 2에서와 같이 전처리기(40)를 통해 전처리된 후 예측 데이터 조정기(30)에서 사용될 수 있다. 예를 들어, 전처리기(40)는, 과거 데이터를 일정한 기준에 따라 정렬하고, 정렬된 데이터의 일부를 선정하여 예측 데이터 조정기(30)에 제공할 수 있다. 또한, 전처리기(40)는, 예측 데이터 DB(20)에서 서로 다른 갯수의 시간 구간에 속하는 과거 실제 데이터를 동시에 추출하고, 추출된 과거 실제 데이터들 전처리하여 하나의 과거 실제 데이터를 도출할 수 있다. 예를 들어, 과거 1000개의 시간 구간에 속하는 과거 실제 데이터를 추출하고, 그와 동시에 과거 10개의 시간 구간에 속하는 과거 실제 데이터를 추출한 후, 추출된 데이터들을 전처리하여 하나의 과거 실제 데이터를 도출할 수 있다. 여기서 도출된 하나의 과거 실제 데이터가 예측 데이터 조정기(30)에 전달될 수 있다.
상술한 과정을 통해 전처리되거나 결정된 과거 데이터는 시계열 예측 모델에 따른 1차 예측 데이터를 보정하는 데 사용될 수 있다. 이하에서는 과거 데이터를 이용하여 1차 예측 데이터를 보정하는 방법에 대하여 상술한다.
도 3은 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제1 방법에 대한 개념도이다. 도 4는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제2 방법에 대한 개념도이다. 도 5는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제3 방법에 대한 개념도이다.
도 1을 다시 참조하면, 본 발명의 일 실시예에 따른 최종 예측 데이터는 시계열 예측 모델에 따른 1차 예측 데이터를, 예측 데이터 DB에서 획득한 과거 데이터를 이용하여 보정함으로써 도출될 수 있다. 이때, 예측 데이터 조정기(30)가 최종 예측 데이터를 도출하는 방법으로는 도 3에 따른 제1 방법, 도 4에 따른 제2 방법, 도 5에 따른 제3 방법을 고려할 수 있다.
먼저 도 3을 참조하면, 예측 데이터 DB 에서 추출한 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 도출하고, 보정된 과거 실제 데이터로부터 최종 예측 데이터를 도출할 수 있다.
예를 들어, 보정된 과거 실제 데이터는 다음의 수학식 1과 같이 결정될 수 있다.
Figure 112019081138713-pat00002
상기 수학식 1을 참조하면, 보정된 과거 실제 데이터는, 과거 실제 데이터에 보정치(수학식 1의 괄호 부분)를 더함으로써 도출될 수 있다. 여기서 보정치는 1차 예측 데이터와 과거 예측 데이터를 이용한 연산으로 결정될 수 있다. 또한, 수학식 1에서 각 데이터들에 대한 계수들(α,β,γ)은 가중치로서 사용자의 설정에 따라 변경될 수 있다.
따라서, 수학식 1에 따라 보정된 과거 실제 데이터가 도출되면, 과거 실제 데이터를 이용하여 최종 예측 데이터를 도출할 수 있다. 예를 들어, 보정된 과거 실제 데이터들의 평균값 또는 가중 평균값을 산출하여 최종 예측 데이터로 사용할 수 있다.
도 4를 참조하면, 예측 데이터 DB 에서 추출한 과거 데이터에서 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 1차 예측 데이터를 보정함으로써 최종 예측 데이터를 도출할 수 있다.
먼저, 과거 예측 오차는 다음의 수학식 2와 같이 결정될 수 있다.
Figure 112019081138713-pat00003
수학식 2를 참조하면, 과거 예측 오차는 과거 실제 데이터와 과거 예측 데이터 사이의 차분값에 의해 결정될 수 있다. 이때, 과거 실제 데이터와 과거 예측 데이터에는 각각 가중치(α,β)가 부여될 수 있다. 수학식 2에 따라 현재 시점과 동일하거나 유사한 시간 구간 등에서 과거 예측 오차들을 산출하고, 산출된 과거 예측 오차들의 평균 또는 가중 평균을 산출하여 최종적으로 과거 예측 오차로 사용할 수 있다.
다음으로, 과거 예측 오차를 이용하여 1차 예측 데이터는 다음의 수학식 3과 같이 보정될 수 있다.
Figure 112019081138713-pat00004
수학식 3을 참조하면, 1차 예측 데이터에 과거 예측 오차를 더함으로써 오차 보정 예측 데이터를 도출할 수 있고, 이러한 오차 보정 예측 데이터가 최종 예측 데이터로 사용될 수 있다.
도 5를 참조하면, 수학식 1에 따른 보정된 과거 실제 데이터 및 수학식 3에 따른 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 최종 예측 데이터를 결정할 수도 있다.
이때, 칼만 필터 기법은 두개의 가우시안 함수를 서로 곱하여 하나의 가우시안 함수를 도출하므로, 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터 각각에 대해 표준 편차를 산출할 필요가 있다.
여기서, 수학식 1에 따른 보정된 과거 실제 데이터에 대한 표준 편차는, 시계열 예측 모델로부터 제공받을 수도 있고, 시계열 예측 모델에서 제공하는 예측 구간을 표준 편차로 변형하여 얻을 수도 있으며, 과거 예측 데이터의 분포를 기반으로 직접 산출될 수도 있다.
또한, 수학식 3에 따른 오차 보정 예측 데이터에 대한 표준 편차는, 과거 실제 데이터와 과거 예측 데이터 사이의 차분값에 대하여 특정 백분위수(percentile)에 해당하는 값일 수도 있고, 과거 예측 데이터와 실제 예측 데이터 사이의 최대 차분값일 수일 수도 있으며, 과거 실제 데이터의 분포를 기반으로 직접 산출될 수도 있다.
수학식 1에 따른 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터 각각에 대해 표준 편차가 산출되면, 산출된 표준 편차들 및 수학식 1에 따른 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터를 이용하여 하나의 평균과 표준 편차를 도출할 수 있다. 이때 최종적으로 도출되는 하나의 평균값이 칼만 필터 기법에 따른 최종 예측 데이터로 사용될 수 있다.
도 5를 참조하면, 도 1에 따른 예측 데이터 조정기(30)가 과거 실제 데이터와 과거 예측 데이터를 이용하여 보정된 과거 실제 데이터 및 오차 보정 예측 데이터를 산출하고, 산출된 데이터들 각각에 대한 표준편차까지 산출한 후 칼만 필터(31)에 따른 평균값을 도출하여 최종 예측 데이터로 사용하는 경우를 확인할 수 있다.
도 3 내지 도 5에서 도시하지는 않았으나, 과거 예측 DB(20)에서 추출되는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 기준 및 개수는 도 2에 따른 방법들이 적용될 수 있는 것으로 해석되어야 한다.
도 6은 사이트 1에서 수집한 예측 데이터 DB 및 사이트 1에서 학습한 시계열 예측 모델을 이용하여 사이트 2에 대한 예측 데이터를 생성하는 과정을 설명하기 위한 예시도이다.
도 6에서 예측 데이터 DB(20)는 제1 지역(site 1)에서 수집하고 예측하였던 데이터들로 구성될 수 있고, 시계열 예측 모델(10)도 제1 지역(site 1)에서 학습한 모델일 수 있다. 이러한 전제에서 제2 지역(site)에 대한 시계열 예측을 수행하는 경우를 고려할 수 있다.
예를 들어, 제1 지역은 영암 지역에 설치된 99KWp 용량의 태양광 발전소이고, 제2 지역은 제1 지역과 거리가 인접하고 기후가 유사한 장흥에 설치되고 제1 지역과 동일한 용량(99KWp) 또는 제1 지역과 다른 용량(200KWp)의 태양광 발전소일 수 있다.
이처럼 제1 지역에서 수집하고 예측한 데이터베이스와 모델을 사용하여 제2 지역(site 2)에 대한 예측 데이터를 생성하고자 할 경우, 초기에는 제1 지역에서 수집된 데이터만을 이용하여 예측 데이터 조정기가 1차 예측 데이터를 조정하게 되므로 제2 지역에 따른 특성이 정확하게 반영되지 않을 수 있다.
다만, 예측이 지속적으로 진행될수록 예측 데이터 DB에는 제2 지역에서 수집된 과거 데이터가 포함될 수 있다. 즉, 예측 데이터 DB에는 제1 지역에서 수집된 과거 데이터와 제2 지역에서 수집된 과거 데이터를 모두 포함할 수 있다. 따라서, 시간이 지남에 따라 제2 지역에서 수집된 과거 데이터가 많아지므로 제2 지역에 대하여 더욱 예측 정확도가 높아지게 될 수 있다.
또한, 제2 지역에서 충분한 과거 데이터가 수집되면, 제2 지역에서 수집된 과거 데이터만을 사용하여 1차 예측 데이터를 보정할 수 있다. 즉, 제2 지역에서 수집된 과거 데이터만을 이용함으로써 1차 예측 데이터의 보정을 통한 최종 예측 데이터의 정확도가 향상될 수 있다.
전술한 과정과는 달리, 제1 지역에서 수집한 예측 데이터 DB 및 제1 지역에서 학습한 시계열 예측 모델을 사용하지 않고, 제2 지역에서 수집하고 학습한 예측 데이터 DB와 시계열 예측 모델을 사용하는 것도 가능하다.
도 7은 제1 지역에서 학습된 시계열 예측 모델을 제1 지역과 유사한 기후 환경에 속하지만 전력 생산 성능이 상이한 제2 지역에 적용한 결과를 나타낸 그래프이다.
도 7을 참조하면, 제1 지역(또는 제1 발전소)에 기반하여 학습된 시계열 예측 모델을, 제1 지역과 유사한 기후 환경에 속하지만 30% 정도 생산 성능이 낮은 제2 지역(또는 제2 발전소)에 적용한 경우의 결과를 확인할 수 있다.
도 7에서 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.
제1 지역에서 학습된 시계열 예측 모델을 제2 지역에 그대로 적용하는 경우, not adjusted 결과가 보여주는 것처럼 유사한 기후 환경을 보일지라도 생산 성능의 차이로 인하여 실제 전력 생산량(TURE)과 큰 오차가 발생하는 것을 볼 수 있다.
반면, 본 발명의 일 실시예에 따라 제2 지역의 과거 데이터에 기반하여 시계열 예측 모델의 1차 예측 데이터를 보정하는 경우, 데이터가 충분하지 않은 초기(time index 값 5정도 까지)에는 어느 정도 오차가 있지만, 제2 지역의 데이터가 점차 확보되어감에 따라 최종 예측 데이터(Adjusted)가 실제 전력 생산량(TURE)과 큰 오차를 보이지 않는 것을 볼 수 있다.
도 8은 점차 발전 성능이 감소하는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 8을 참조하면, 시계열 예측 모델이 학습된 지역과 적용된 지역은 동일하지만 점차 해당 지역의 환경이 변화되는(또는 노후화되어 생산 성능이 최대 30% 감소) 경우에 대하여 예측 결과를 확인할 수 있다.
도 8에서도 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.
먼저, 보정되지 않은 1차 예측 데이터의 경우 시간이 지남에 따라 실제 데이터(TRUE)와의 오차가 증가하는 것을 확인할 수 있다.
반면, 본 발명의 일 실시예에 따른 1차 예측 데이터의 보정을 수행하여 도출한 최종 예측 데이터는 시간이 지남에 따른 노후화까지 반영할 수 있어 예측 오차가 거의 발생하지 않는 것을 확인할 수 있다.
도 9는 급작스러운 환경 변화를 갖는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 9에서도 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.
예를 들어, 도 9에서는 제1 지역에 따른 태양광 발전소에서 눈이나 그림자 등과 같이 갑작스레 발생하여 발전 성능을 저해하는 경우에 대한 예측 성능을 확인할 수 있다.
도 9를 참조하면, time index의 11 ~ 40에 해당하는 시점들에서 갑작스런 외부 요인으로 실제 발전량(TURE)이 감소하여, 발전 성능이 30% 정도 저하된 경우를 확인할 수 있다.
급작스런 요인으로 성능 저하가 이루어졌을 때, 시계열 예측 결과가 보정되지 않은 경우(Not Adjusted)를 살펴보면, 실제 발전량과의 예측 오차가 크게 유지되다가 발전 성능이 복귀된 후에야 예측 오차가 다시 줄어드는 것을 볼 수 있다.
그러나, 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정한 최종 데이터는, 급작스런 성능 저하 초기에는 보정하지 않은 경우와 유사하게 오차가 크지만 점차 오차가 줄어드는 것을 볼 수 있다. 또한, 발전 성능이 복귀된 후에도 큰 오차없이 예측 결과를 도출하는 것을 볼 수 있다. 이처럼, 예측 대상 환경에서 급작스런 변화가 초래되는 경우, 이러한 변화를 빠르고 정확하게 예측 결과로 반영할 수 있도록, 보정에 사용되는 과거 데이터를 최근 단기간의 데이터로 사용하거나 적은 개수로 사용할 수 있다.
도 10은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법에 대한 대표 흐름도이다.
도 10을 참조하면, 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계(S100), 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계(S110), 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계(S120) 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계(S130)를 포함할 수 있다.
상기 과거 데이터에 기초한 시계열 예측 방법은, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.
도 11은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 장치에 대한 하드웨어 구성도이다.
도 11을 참조하면, 과거 데이터에 기초한 시계열 예측 장치(100)는, 적어도 하나의 프로세서(processor, 110); 및 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 120)를 포함할 수 있다.
여기서 적어도 하나의 프로세서(110)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(120) 및 저장 장치(160) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(120)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.
또한, 과거 데이터에 기초한 시계열 예측 장치(100)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver)(130)를 포함할 수 있다. 또한, 과거 데이터에 기초한 시계열 예측 장치(100)는 입력 인터페이스 장치(140), 출력 인터페이스 장치(150), 저장 장치(160) 등을 더 포함할 수 있다. 과거 데이터에 기초한 시계열 예측 장치(100)에 포함된 각각의 구성 요소들은 버스(bus)(170)에 의해 연결되어 서로 통신을 수행할 수 있다.
상기 적어도 하나의 단계는, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계; 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계; 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 적어도 하나의 단계는, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.
상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.
상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.
과거 데이터에 기초한 시계열 예측 장치(100)의 예를 들면, 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant) 등일 수 있다.
본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다.
상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

Claims (20)

  1. 메모리, 하드웨어 저장소, 데이터 서버 및 클라우드 서버 중 적어도 어느 하나에 저장되는 소프트웨어 모듈이나 명령어를 실행하는 프로세서가 예측 모듈에 의해 생성된 관련 과거 예측 데이터를 기반으로 시계열 데이터에 대한 실시간 예측을 보정하는 시계열 예측 방법으로서,
    예측 대상 환경에서 관측한 제1 시계열 데이터를 미리 학습된 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제1 시계열 데이터로부터 예측한 1차 예측 데이터를 생성하는 단계;
    상기 1차 예측 데이터를 예측 데이터 DB(database)에 저장하는 단계-상기 예측 데이터 DB는 상기 시계열 예측 모델이 적용되는 환경과 유사한 환경에서 획득한 데이터의 출처를 구분하기 위한 필드를 가짐-;
    상기 예측 대상 환경과 다른 예측 대상 환경에서 관측한 제2 시계열 데이터를 상기 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제2 시계열 데이터로부터 예측한 2차 예측 데이터를 생성하는 단계;
    상기 예측 데이터 DB에서 상기 2차 예측 데이터에 대해 일정한 기준 범위 값 내에 속하거나 또는 상기 2차 예측 데이터에 대해 일정한 비율 범위 내에 속하는 데이터인 과거 데이터를 추출하는 단계;
    상기 2차 예측 데이터를 입력으로 받는 예측 데이터 조정기가 상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 상기 예측 데이터 DB로부터 받는 단계; 및
    상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 이용하여 상기 2차 예측 데이터를 보정한 최종 예측 데이터를 획득하는 단계;를 포함하며,
    상기 과거 데이터는, 상기 2차 예측 데이터와 수치, 현재 예측 시점 및 상기 출처 중 적어도 하나가 인접한 범위에 속하는 과거 실제 데이터 및 과거 예측 데이터를 포함하고,
    상기 최종 예측 데이터는, 상기 2차 예측 데이터와 상기 과거 예측 데이터의 차이인 보정치를 이용하여 상기 과거 실제 데이터를 보정한, 보정된 과거 실제 데이터인, 과거 데이터에 기초한 시계열 예측 방법.
  2. 청구항 1에 있어서,
    상기 2차 예측 데이터를 보정한 최종 예측 데이터를 획득하는 단계에서 상기 보정된 과거 실제 데이터와 오차 보정 예측 데이터에 칼만 필터 기법을 추가로 적용하여 최종 예측 데이터를 획득하는 단계를 더 포함하며,
    여기서 상기 오차 보정 예측 데이터는 상기 과거 실제 데이터와 상기 과거 예측 데이터와의 과거 예측 오차를 이용하여 상기 2차 예측 데이터를 보정함으로써 얻은 데이터인, 과거 데이터에 기초한 시계열 예측 방법.
  3. 청구항 2에 있어서,
    상기 칼만 필터 기법은 상기 2차 예측 데이터와 관련하여 상기 예측 데이터 DB로부터 획득한 상기 과거 실제 데이터와 상기 과거 예측 데이터에 기초하여 얻은 상기 보정된 과거 실제 데이터의 표준 편차를 산출하고 상기 오차 보정 예측 데이터의 표준 편차를 산출하고 칼만 필터에 따른 평균값을 도출하여 상기 최종 예측 데이터로 사용하도록 구성되는, 과거 데이터에 기초한 시계열 예측 방법.
  4. 삭제
  5. 청구항 1에 있어서,
    상기 과거 데이터는, 상기 예측 대상 환경에 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터인, 과거 데이터에 기초한 시계열 예측 방법.
  6. 삭제
  7. 청구항 1에 있어서,
    상기 최종 예측 데이터는, 상기 보정된 과거 실제 데이터의 평균값 또는 가중 평균값인, 과거 데이터에 기초한 시계열 예측 방법.
  8. 메모리, 하드웨어 저장소, 데이터 서버 및 클라우드 서버 중 적어도 어느 하나에 저장되는 소프트웨어 모듈이나 명령어를 실행하는 프로세서가 예측 모듈에 의해 생성된 관련 과거 예측 데이터를 기반으로 시계열 데이터에 대한 실시간 예측을 보정하는 시계열 예측 방법으로서,
    예측 대상 환경에서 관측한 제1 시계열 데이터를 미리 학습된 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제1 시계열 데이터로부터 예측한 1차 예측 데이터를 생성하는 단계;
    상기 1차 예측 데이터를 예측 데이터 DB(database)에 저장하는 단계-상기 예측 데이터 DB는 상기 시계열 예측 모델이 적용되는 환경과 유사한 환경에서 획득한 데이터의 출처를 구분하기 위한 필드를 가짐-;
    상기 예측 대상 환경과 다른 예측 대상 환경에서 관측한 제2 시계열 데이터를 상기 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제2 시계열 데이터로부터 예측한 2차 예측 데이터를 생성하는 단계;
    상기 예측 데이터 DB에서 상기 2차 예측 데이터에 대해 일정한 기준 범위 값 내에 속하거나 또는 상기 2차 예측 데이터에 대해 일정한 비율 범위 내에 속하는 데이터인 과거 데이터를 추출하는 단계;
    상기 2차 예측 데이터를 입력으로 받는 예측 데이터 조정기가 상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 상기 예측 데이터 DB로부터 받는 단계; 및
    상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 이용하여 상기 2차 예측 데이터를 보정한 최종 예측 데이터를 획득하는 단계;를 포함하며,
    상기 과거 데이터는, 상기 2차 예측 데이터와 수치, 현재 예측 시점 및 상기 출처 중 적어도 하나가 인접한 범위에 속하는 과거 실제 데이터 및 과거 예측 데이터를 포함하고,
    상기 최종 예측 데이터는, 상기 과거 실제 데이터와 상기 과거 예측 데이터의 과거 예측 오차를 이용하여 상기 2차 예측 데이터를 보정함으로써 얻은 오차 보정 예측 데이터인, 과거 데이터에 기초한 시계열 예측 방법.
  9. 청구항 8에 있어서,
    상기 최종 예측 데이터를 획득하는 단계는, 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하며,
    여기서 상기 보정된 과거 실제 데이터는 상기 2차 예측 데이터와 상기 과거 예측 데이터의 차이인 보정치를 이용하여 상기 과거 실제 데이터를 보정한 데이터인, 과거 데이터에 기초한 시계열 예측 방법.
  10. 청구항 9에 있어서,
    상기 칼만 필터 기법은 상기 보정된 과거 실제 데이터와 상기 오차 보정 예측 데이터 각각에 대한 표준 편차를 산출하고 칼만 필터에 따른 평균값을 도출하여 상기 최종 예측 데이터로 사용하도록 구성되는, 과거 데이터에 기초한 시계열 예측 방법.
  11. 과거 데이터에 기초한 시계열 예측 장치로서,
    적어도 하나의 프로세서(processor); 및
    상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함하고,
    상기 프로세서는, 시계열 예측 모델 및 예측 데이터 조정기를 포함하고,
    상기 명령어들에 의해 상기 프로세서가:
    예측 대상 환경에서 관측한 제1 시계열 데이터를 미리 학습된 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제1 시계열 데이터로부터 예측한 1차 예측 데이터를 생성하는 단계;
    상기 1차 예측 데이터를 예측 데이터 DB(database)에 저장하는 단계-상기 예측 데이터 DB는 상기 시계열 예측 모델이 적용되는 환경과 유사한 환경에서 획득한 데이터의 출처를 구분하기 위한 필드를 가짐-;
    상기 예측 대상 환경이나 상기 예측 대상 환경과 다른 예측 대상 환경에서 관측한 제2 시계열 데이터를 상기 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제2 시계열 데이터로부터 예측한 2차 예측 데이터를 생성하는 단계;
    상기 예측 데이터 DB에서 상기 2차 예측 데이터에 대해 일정한 기준 범위 값 내에 속하거나 또는 상기 2차 예측 데이터에 대해 일정한 비율 범위 내에 속하는 데이터인 과거 데이터를 추출하는 단계;
    상기 2차 예측 데이터를 입력받는 예측 데이터 조정기가 상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 상기 예측 데이터 DB로부터 받는 단계; 및
    상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 이용하여 상기 2차 예측 데이터를 보정한 최종 예측 데이터를 획득하는 단계;를 수행하고,
    상기 과거 데이터는, 상기 2차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 실제 데이터 및 과거 예측 데이터를 포함하고,
    상기 최종 예측 데이터는, 상기 2차 예측 데이터와 상기 과거 예측 데이터의 차이인 보정치를 이용하여 상기 과거 실제 데이터를 보정한, 보정된 과거 실제 데이터인, 과거 데이터에 기초한 시계열 예측 장치.
  12. 청구항 11에 있어서,
    상기 프로세서가,
    상기 2차 예측 데이터를 보정한 최종 예측 데이터를 획득하는 단계에서 상기 보정된 과거 실제 데이터와 오차 보정 예측 데이터에 칼만 필터 기법을 추가로 적용하여 최종 예측 데이터를 획득하는 단계를 더 수행하며,
    여기서 상기 오차 보정 예측 데이터는 상기 과거 실제 데이터와 상기 과거 예측 데이터와의 과거 예측 오차를 이용하여 상기 2차 예측 데이터를 보정함으로써 얻은 데이터인, 과거 데이터에 기초한 시계열 예측 장치.
  13. 청구항 12에 있어서,
    상기 칼만 필터 기법은 상기 2차 예측 데이터와 관련하여 상기 예측 데이터 DB로부터 획득한 상기 과거 실제 데이터와 상기 과거 예측 데이터에 기초하여 얻은 상기 보정된 과거 실제 데이터의 표준 편차를 산출하고 상기 오차 보정 예측 데이터의 표준 편차를 산출하고 칼만 필터에 따른 평균값을 도출하여 상기 최종 예측 데이터로 사용하도록 구성되는, 과거 데이터에 기초한 시계열 예측 장치.
  14. 삭제
  15. 청구항 11에 있어서,
    상기 1차 예측 데이터 또는 상기 과거 데이터는, 상기 예측 대상 환경에 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터인, 과거 데이터에 기초한 시계열 예측 장치.
  16. 삭제
  17. 청구항 11에 있어서,
    상기 최종 예측 데이터는, 상기 보정된 과거 실제 데이터의 평균값 또는 가중 평균값인, 과거 데이터에 기초한 시계열 예측 장치.
  18. 과거 데이터에 기초한 시계열 예측 장치로서,
    적어도 하나의 프로세서(processor); 및
    상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함하고,
    상기 프로세서는, 시계열 예측 모델 및 예측 데이터 조정기를 포함하고,
    상기 명령어들에 의해 상기 프로세서가:
    예측 대상 환경에서 관측한 제1 시계열 데이터를 미리 학습된 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제1 시계열 데이터로부터 예측한 1차 예측 데이터를 생성하는 단계;
    상기 1차 예측 데이터를 예측 데이터 DB(database)에 저장하는 단계-상기 예측 데이터 DB는 상기 시계열 예측 모델이 적용되는 환경과 유사한 환경에서 획득한 데이터의 출처를 구분하기 위한 필드를 가짐-;
    상기 예측 대상 환경과 다른 예측 대상 환경에서 관측한 제2 시계열 데이터를 상기 시계열 예측 모델의 입력으로 받는 단계;
    상기 시계열 예측 모델에 의해 상기 제2 시계열 데이터로부터 예측한 2차 예측 데이터를 생성하는 단계;
    상기 예측 데이터 DB에서 상기 2차 예측 데이터에 대해 일정한 기준 범위 값 내에 속하거나 상기 2차 예측 데이터에 대해 일정한 비율 범위 내에 속하는 데이터인 과거 데이터를 추출하는 단계;
    상기 2차 예측 데이터를 입력받는 예측 데이터 조정기가 상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 상기 예측 데이터 DB로부터 받는 단계; 및
    상기 1차 예측 데이터를 포함하고 상기 2차 예측 데이터와 관련된 상기 과거 데이터를 이용하여 상기 2차 예측 데이터를 보정한 최종 예측 데이터를 획득하는 단계;를 수행하고,
    상기 과거 데이터는, 상기 2차 예측 데이터와 수치, 현재 예측 시점 및 상기 출처 중 적어도 하나가 인접한 범위에 속하는 과거 실제 데이터 및 과거 예측 데이터를 포함하고,
    상기 최종 예측 데이터는, 상기 과거 실제 데이터와 상기 과거 예측 데이터의 과거 예측 오차를 이용하여 상기 2차 예측 데이터를 보정함으로써 획득한 오차 보정 예측 데이터인, 과거 데이터에 기초한 시계열 예측 장치.
  19. 청구항 18에 있어서,
    상기 프로세서가, 상기 최종 예측 데이터를 획득하는 단계에서,
    보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하며,
    여기서 상기 보정된 과거 실제 데이터는 상기 2차 예측 데이터와 상기 과거 예측 데이터의 차이인 보정치를 이용하여 상기 과거 실제 데이터를 보정한 데이터인, 과거 데이터에 기초한 시계열 예측 장치.
  20. 청구항 19에 있어서,
    상기 칼만 필터 기법은 상기 보정된 과거 실제 데이터와 상기 오차 보정 예측 데이터 각각에 대한 표준 편차를 산출하고 칼만 필터에 따른 평균값을 도출하여 상기 최종 예측 데이터로 사용하도록 구성되는, 과거 데이터에 기초한 시계열 예측 장치.
KR1020190096448A 2019-08-08 2019-08-08 과거 데이터에 기초한 시계열 예측 방법 및 장치 KR102468316B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190096448A KR102468316B1 (ko) 2019-08-08 2019-08-08 과거 데이터에 기초한 시계열 예측 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190096448A KR102468316B1 (ko) 2019-08-08 2019-08-08 과거 데이터에 기초한 시계열 예측 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20210017342A KR20210017342A (ko) 2021-02-17
KR102468316B1 true KR102468316B1 (ko) 2022-11-17

Family

ID=74731561

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190096448A KR102468316B1 (ko) 2019-08-08 2019-08-08 과거 데이터에 기초한 시계열 예측 방법 및 장치

Country Status (1)

Country Link
KR (1) KR102468316B1 (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102477509B1 (ko) * 2020-12-01 2022-12-14 주식회사 동녘 기상 예측 정보 생성 방법 및 이를 수행하기 위한 컴퓨팅 장치
KR102653418B1 (ko) * 2021-05-25 2024-04-02 인하대학교 산학협력단 순위패턴매칭과 lstm을 결합한 시계열데이터 예측 방법 및 장치
KR102544621B1 (ko) * 2021-08-09 2023-06-15 배재대학교 산학협력단 시계열 데이터의 에러 값 보정을 위한 필터링 및 성능 비교 시스템 및 방법
KR102500534B1 (ko) * 2022-06-02 2023-02-16 국민대학교산학협력단 순환신경망 기반 수자원 정보 생성 장치 및 방법
KR102612561B1 (ko) * 2022-10-13 2023-12-11 디아이랩 주식회사 학습모델을 이용한 센서의 데이터 이상을 탐지하기 위한 장치 및 이를 위한 방법
KR102623020B1 (ko) * 2023-09-11 2024-01-10 주식회사 슈파스 인공지능 기반의 생체 데이터 분석을 통한 패혈성 쇼크 조기 예측방법, 장치 및 컴퓨터프로그램

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109150A (ja) * 2000-09-28 2002-04-12 Fuji Electric Co Ltd 時系列データの適応的予測方法
JP2006092106A (ja) * 2004-09-22 2006-04-06 Canon System Solutions Inc 予測装置及び予測方法並びにプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101463425B1 (ko) * 2012-11-28 2014-11-20 한국지질자원연구원 시계열 예측 모델을 이용한 이상관측자료 탐지 방법 및 지하수위의 이상관측자료 탐지 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109150A (ja) * 2000-09-28 2002-04-12 Fuji Electric Co Ltd 時系列データの適応的予測方法
JP2006092106A (ja) * 2004-09-22 2006-04-06 Canon System Solutions Inc 予測装置及び予測方法並びにプログラム

Also Published As

Publication number Publication date
KR20210017342A (ko) 2021-02-17

Similar Documents

Publication Publication Date Title
KR102468316B1 (ko) 과거 데이터에 기초한 시계열 예측 방법 및 장치
Sanjari et al. Power generation forecast of hybrid PV–wind system
US9696786B2 (en) System and method for optimizing energy consumption by processors
Ezzat et al. Spatio-temporal short-term wind forecast: A calibrated regime-switching method
US20220294218A1 (en) Method and system for predicting regional short-term energy power by taking weather into consideration
CN108573355B (zh) 模型更新后替换运行的方法、装置、及业务服务器
US10962936B2 (en) Method and device for post-correction of predicted parameters by using a H-infinity filter
CN110009140B (zh) 一种日电力负荷预测方法及预测装置
US20220407352A1 (en) Spatio-temporal probabilistic forecasting of wind power output
CN112285807B (zh) 一种气象信息预测方法及装置
US11455544B2 (en) Prediction model generation device, prediction model generation method, and recording medium
US20230267545A1 (en) Climate data processing and impact prediction systems
CN110705768B (zh) 用于风电场的风力发电功率预测优化方法和装置
US9305259B2 (en) Apparatus, program, and method for solving mathematical programming problem
Qadrdan et al. Probabilistic wind power forecasting using a single forecast
CN117096875B (zh) 一种基于Spatio-Temporal Transformer模型的短期负荷预测方法及系统
KR101927898B1 (ko) 기후변화의 불확실성을 고려하여 실물옵션분석을 기반으로 한 의사결정나무 구축 방법
JP6494258B2 (ja) 予測システム、予測方法、および予測プログラム
Lee et al. Very short-Term wind power ensemble forecasting without numerical weather prediction through the predictor design
Ermoliev et al. Robust management of heterogeneous systems under uncertainties
Muschinski et al. Predicting power ramps from joint distributions of future wind speeds
US20170004412A1 (en) Normalizing Data Sets for Predicting an Attribute of the Data Sets
Digas et al. A new version of integrated assessment model MERGE
CN112732777A (zh) 基于时间序列的头寸预测方法、装置、设备和介质
JP6552076B1 (ja) 日射量出現確率分布解析法、日射量出現確率分布解析システムおよび日射量出現確率分布解析プログラム

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant