KR20210017342A - Time series prediction method and apparatus based on past prediction data - Google Patents

Time series prediction method and apparatus based on past prediction data Download PDF

Info

Publication number
KR20210017342A
KR20210017342A KR1020190096448A KR20190096448A KR20210017342A KR 20210017342 A KR20210017342 A KR 20210017342A KR 1020190096448 A KR1020190096448 A KR 1020190096448A KR 20190096448 A KR20190096448 A KR 20190096448A KR 20210017342 A KR20210017342 A KR 20210017342A
Authority
KR
South Korea
Prior art keywords
data
prediction
past
time series
obtaining
Prior art date
Application number
KR1020190096448A
Other languages
Korean (ko)
Other versions
KR102468316B1 (en
Inventor
이현용
고석갑
김낙우
이병탁
이준기
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020190096448A priority Critical patent/KR102468316B1/en
Publication of KR20210017342A publication Critical patent/KR20210017342A/en
Application granted granted Critical
Publication of KR102468316B1 publication Critical patent/KR102468316B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Abstract

Disclosed are a time-series prediction method and device based on past data. The time-series prediction method based on past data may comprise the steps of: obtaining real data measured in a prediction target environment; inputting the obtained real data into a previously learned time-series prediction model; obtaining primary prediction data predicted by the time-series prediction model; and obtaining the final prediction data by correcting the primary prediction data using past data extracted from a prediction data database (DB). Therefore, the time-series prediction method may obtain more accurate prediction data while using the previously learned time-series prediction model without re-learning.

Description

과거 데이터에 기초한 시계열 예측 방법 및 장치{TIME SERIES PREDICTION METHOD AND APPARATUS BASED ON PAST PREDICTION DATA}Time series prediction method and apparatus based on past data {TIME SERIES PREDICTION METHOD AND APPARATUS BASED ON PAST PREDICTION DATA}

본 발명은 과거 데이터에 기초한 시계열 예측 방법 및 장치에 관한 것으로, 더욱 상세하게는 시계열 예측 모델을 재학습하지 않고, 관련성이 있는 과거 데이터만을 이용하여 시계열 예측 결과를 보정함으로써, 점진적이거나 급격한 데이터 변화가 있더라도 정교한 시계열 예측을 수행하는 기술에 관한 것이다.The present invention relates to a time series prediction method and apparatus based on past data, and more particularly, by correcting a time series prediction result using only relevant past data without retraining a time series prediction model, a gradual or rapid data change If any, it relates to a technique for performing sophisticated time series prediction.

시계열(time serises)은 일정 시간 간격으로 배치된 데이터들의 수열을 말한다. 이때, 시계열 예측(time series prediction)이란 주어진 시계열 데이터를 이용하여 수학적 예측 모델을 만들고, 예측 모델을 이용하여 미래에 발생할 수 있는 데이터를 예측하는 것을 의미한다. 일반적으로, 이러한 시계열 예측은 공학이나 과학계산, 혹은 금융시장에서의 주가 예측 등에서 많이 사용되지만, 그 밖에도 시간에 종속적으로 측정된 모든 데이터들은 시계열로 볼 수 있다.Time series refers to a sequence of data arranged at regular time intervals. At this time, time series prediction means creating a mathematical prediction model using given time series data, and predicting data that may occur in the future using the prediction model. In general, such time series prediction is widely used in engineering, scientific calculation, or stock price prediction in financial markets, but all other data measured dependent on time can be viewed as time series.

시계열 예측을 위한 예측 모델은 알려진 데이터(known data)의 입력과 출력 사이의 상관 관계를 학습하여 생성될 수 있다. 예를 들어 지난 3 시간 동안의 날씨와 전력 생산량 사이의 상관 관계를 학습함으로써 향후 한 시간 동안 특정 날씨에 따른 전력 생산량을 예측하는 예측 모델을 생성할 수 있다.A prediction model for time series prediction may be generated by learning a correlation between input and output of known data. For example, by learning the correlation between the weather for the last three hours and the amount of electricity produced, a predictive model can be generated that predicts the amount of electricity produced according to a specific weather over the next hour.

예측 모델은 학습에 사용된 데이터가 수집된 환경과 유사한 환경에서 사용될 때 예측 정확도가 높다. 예를 들어, 사계절이 뚜렷한 지역에서 수집된 데이터를 이용하여 생성된 전력 생산량 예측 모델은 적도 지방에서 필요한 전력 생산량을 예측하는 데에는 적합하지 않다.The prediction model has high prediction accuracy when it is used in an environment similar to the environment in which the data used for training was collected. For example, a model for predicting power production generated using data collected in regions with distinct four seasons is not suitable for predicting the required power production in the equatorial region.

한편, 예측 모델이 사용되는 환경은 점진적이거나 급격하게 변화되는 경우가 발생할 수 있다. 예를 들어, 전력 생산량을 예측하는 예측 모델이 적용되는 태양광 발전소의 생산 능력이 노후화로 인해 시간이 지남에 따라 점차 감소하거나, 태양광 패널에 일시적인 눈이나 먼지 등이 쌓여 태양광 발전소의 생산 능력이 급격히 감소할 수도 있다. 따라서, 예측 모델이 사용되는 환경의 변화를 고려하여 예측 모델의 실시간 예측 결과를 적절히 보정함으로써 예측 모델의 정확도를 유지시키는 것이 필요하다.Meanwhile, the environment in which the predictive model is used may change gradually or rapidly. For example, the production capacity of a solar power plant to which a predictive model for predicting power production is applied gradually decreases over time due to aging, or the solar power plant's production capacity is caused by temporary snow or dust accumulation on the solar panel. This may decrease rapidly. Therefore, it is necessary to maintain the accuracy of the prediction model by appropriately correcting the real-time prediction result of the prediction model in consideration of changes in the environment in which the prediction model is used.

이러한 문제를 해결하기 위하여 종래에는 실시간으로 생성되는 데이터를 기반으로 예측 모델을 추가 학습(fine-tuning)하는 방법이 제안되었으나, 추가 학습을 위해서는 많은 컴퓨팅 자원이 요구된다. 또한, 짧은 시간 동안 간헐적으로 이벤트가 발생하는 환경에서는 신속하고 정확하게 예측 모델을 추가 학습하기 어렵고, 간헐적 이벤트로 인해 생성된 데이터를 이용하여 급격하게 추가 학습된 예측 모델은 정상적인 환경에서 부정확한 예측 데이터를 도출할 가능성이 높다.In order to solve this problem, conventionally, a method of fine-tuning a prediction model based on data generated in real time has been proposed, but many computing resources are required for further learning. In addition, in an environment where events occur intermittently for a short period of time, it is difficult to quickly and accurately additionally learn a prediction model, and a prediction model that is rapidly additionally learned using data generated by an intermittent event can generate inaccurate prediction data in a normal environment. It is likely to be derived.

상기와 같은 문제점을 해결하기 위한 본 발명의 목적은, 과거 데이터에 기초한 시계열 예측 방법을 제공하는 데 있다.An object of the present invention for solving the above problems is to provide a method for predicting a time series based on past data.

상기와 같은 문제점을 해결하기 위한 본 발명의 다른 목적은, 과거 데이터에 기초한 시계열 예측 장치를 제공하는 데 있다.Another object of the present invention for solving the above problems is to provide an apparatus for predicting time series based on past data.

상기 목적을 달성하기 위한 본 발명의 일 측면은, 과거 데이터에 기초한 시계열 예측 방법을 제공한다.An aspect of the present invention for achieving the above object is to provide a time series prediction method based on past data.

상기 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계, 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계, 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The time series prediction method based on the past data includes: acquiring actual data observed in a prediction target environment, inputting the acquired actual data into a pre-trained time series prediction model, and a first-order prediction predicted by the time series prediction model. It may include obtaining data and correcting the first prediction data using past data extracted from a prediction data database (DB), thereby obtaining final prediction data.

상기 과거 데이터에 기초한 시계열 예측 방법은, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The time series prediction method based on past data may further include storing the actual data in the prediction data DB.

상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include extracting the past data according to a predetermined criterion from the prediction data DB.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.

상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data adjacent to the current prediction time point and belonging to a short time interval may be extracted.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.

상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final predicted data may include correcting the past actual data to obtain corrected past actual data.

상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include calculating a past prediction error using the past data, and obtaining error correction prediction data by correcting the primary prediction data using the calculated past prediction error. I can.

상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.

상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.

상기 목적을 달성하기 위한 본 발명의 다른 측면은, 과거 데이터에 기초한 시계열 예측 장치를 제공한다. Another aspect of the present invention for achieving the above object is to provide a time series prediction apparatus based on past data.

과거 데이터에 기초한 시계열 예측 장치는, 적어도 하나의 프로세서(processor); 및 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함할 수 있다.An apparatus for predicting a time series based on past data may include: at least one processor; And a memory for storing instructions instructing the at least one processor to perform at least one step.

상기 적어도 하나의 단계는, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계; 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계; 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The at least one step may include obtaining actual data observed in a prediction target environment; Inputting the acquired real data into a pre-trained time series prediction model; Obtaining primary prediction data predicted by the time series prediction model; And acquiring final prediction data by correcting the primary prediction data using past data extracted from a prediction data database (DB).

상기 적어도 하나의 단계는, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The at least one step may further include storing the actual data in the prediction data DB.

상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include extracting the past data according to a predetermined criterion from the prediction data DB.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.

상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data adjacent to the current prediction time point and belonging to a short time interval may be extracted.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.

상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final predicted data may include correcting the past actual data to obtain corrected past actual data.

상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include calculating a past prediction error using the past data, and obtaining error correction prediction data by correcting the primary prediction data using the calculated past prediction error. I can.

상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.

상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.

상기와 같은 본 발명에 따른 과거 데이터에 기초한 시계열 예측 방법 및 장치를 이용할 경우에는 예측 모델을 추가 학습하지 않더라도 과거 예측 데이터만을 이용하여 실시간으로 예측 데이터를 보정할 수 있다.In the case of using the method and apparatus for predicting time series based on past data according to the present invention as described above, prediction data may be corrected in real time using only past prediction data even without additional learning of a prediction model.

또한, 예기치 못한 간헐적 이벤트가 발생한 환경에서도 신속하게 예측 데이터를 보정하여 도출할 수 있는 장점이 있다.In addition, there is an advantage in that prediction data can be quickly corrected and derived even in an environment in which unexpected intermittent events occur.

또한, 예측 모델에 종속적이지 않으며, 특정 환경에서 학습되어 생성된 예측 모델을 곧바로 유사 환경에 바로 사용할 수 있다.In addition, it is not dependent on the prediction model, and the prediction model generated by learning in a specific environment can be used directly in a similar environment.

도 1은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법 및 장치에 대한 개념도이다.
도 2는 본 발명의 일 실시예에 따른 과거 데이터를 추출하는 방법에 대한 개념도이다.
도 3은 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제1 방법에 대한 개념도이다.
도 4는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제2 방법에 대한 개념도이다.
도 5는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제3 방법에 대한 개념도이다.
도 6은 사이트 1에서 수집한 예측 데이터 DB 및 사이트 1에서 학습한 시계열 예측 모델을 이용하여 사이트 2에 대한 예측 데이터를 생성하는 과정을 설명하기 위한 예시도이다.
도 7은 제1 지역에서 학습된 시계열 예측 모델을 제1 지역과 유사한 기후 환경에 속하지만 전력 생산 성능이 상이한 제2 지역에 적용한 결과를 나타낸 그래프이다.
도 8은 점차 발전 성능이 감소하는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 9는 급작스러운 환경 변화를 갖는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.
도 10은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법에 대한 대표 흐름도이다.
도 11은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 장치에 대한 하드웨어 구성도이다.
1 is a conceptual diagram of a method and apparatus for predicting a time series based on past data according to an embodiment of the present invention.
2 is a conceptual diagram illustrating a method of extracting past data according to an embodiment of the present invention.
3 is a conceptual diagram of a first method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
4 is a conceptual diagram of a second method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
5 is a conceptual diagram of a third method of correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.
6 is an exemplary diagram for explaining a process of generating prediction data for site 2 using a prediction data DB collected at site 1 and a time series prediction model learned at site 1;
7 is a graph showing the result of applying the time series prediction model learned in the first region to a second region belonging to a climate environment similar to that of the first region but having different power generation performance.
8 is a graph showing a result of applying a time series prediction model learned in a first region where power generation performance gradually decreases to a first region.
9 is a graph showing a result of applying a time series prediction model learned in a first region having a sudden environmental change to a first region.
10 is a representative flowchart of a method for predicting time series based on past data according to an embodiment of the present invention.
11 is a hardware configuration diagram of a time series prediction apparatus based on past data according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다. In the present invention, various modifications may be made and various embodiments may be provided, and specific embodiments will be illustrated in the drawings and described in detail in the detailed description. However, this is not intended to limit the present invention to a specific embodiment, it is to be understood to include all changes, equivalents, and substitutes included in the spirit and scope of the present invention. In describing each drawing, similar reference numerals have been used for similar elements.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다. Terms such as first, second, A, and B may be used to describe various elements, but the elements should not be limited by the terms. These terms are used only for the purpose of distinguishing one component from another component. For example, without departing from the scope of the present invention, a first element may be referred to as a second element, and similarly, a second element may be referred to as a first element. The term and/or includes a combination of a plurality of related listed items or any of a plurality of related listed items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. When a component is referred to as being "connected" or "connected" to another component, it is understood that it may be directly connected or connected to the other component, but other components may exist in the middle. Should be. On the other hand, when a component is referred to as being "directly connected" or "directly connected" to another component, it should be understood that there is no other component in the middle.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in the present application are only used to describe specific embodiments, and are not intended to limit the present invention. Singular expressions include plural expressions unless the context clearly indicates otherwise. In the present application, terms such as "comprise" or "have" are intended to designate the presence of features, numbers, steps, actions, components, parts, or combinations thereof described in the specification, but one or more other features. It is to be understood that the presence or addition of elements or numbers, steps, actions, components, parts, or combinations thereof, does not preclude in advance.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs. Terms as defined in a commonly used dictionary should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and should not be interpreted as an ideal or excessively formal meaning unless explicitly defined in this application. Does not.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 과거 예측 데이터에 기초한 시계열 예측 방법 및 장치에 대한 개념도이다.1 is a conceptual diagram of a method and apparatus for predicting time series based on past prediction data according to an embodiment of the present invention.

도 1을 참조하면, 본 발명의 일 실시예에 따른 과거 예측 데이터에 기초한 시계열 예측 방법 및 장치는, 미리 학습되어 생성한 시계열 예측 모델(10), 시계열 예측 모델(10)에서 예측한 예측 데이터들과 실제 데이터들을 저장하는 예측 데이터 DB(20) 및/또는 예측 데이터 DB(20)에서 얻은 과거 데이터를 기반으로 시계열 예측 모델(10)에 의해 출력된 1차 예측 데이터를 보정함으로써 최종 예측 데이터를 출력하는 예측 데이터 조정기(30)로 구성될 수 있다.Referring to FIG. 1, a time series prediction method and apparatus based on past prediction data according to an embodiment of the present invention includes a time series prediction model 10 that is pre-trained and generated, and prediction data predicted by a time series prediction model 10. The final predicted data is output by correcting the primary predicted data output by the time series predictive model 10 based on the past data obtained from the predicted data DB 20 and/or the predicted data DB 20 storing actual data and It may be configured with a predictive data adjuster 30.

시계열 예측 모델(10)은 시계열 데이터를 학습하여 미래에 발생할 수 있는 결과 데이터를 예측하는 수학적 모델로서, autoregressive(AR) 모델, integrated(I) 모델, moving average(MA) 모델 등이 있을 수 있다. 이러한 시계열 예측 모델(10)은 머신 러닝(machine learning), LSTM(Long short-term memory) 등을 비롯한 다양한 학습 방법을 이용해 LSTM(Long short-term memory) 등과 같은 머신 러닝(machine learning) 알고리즘에 기반하여 각종 실제 데이터(또는 관측되거나 측정된 데이터)들을 학습하여 생성될 수 있다. 이때, 실제 데이터는 예측 대상 환경(05)에서 관측되거나 측정된 데이터들일 수 있다. 예를 들어, 예측 대상 환경(05)이 발전소인 경우, 실제 데이터는 발전소의 전력 생산량, 날씨 등일 수 있다.The time series prediction model 10 is a mathematical model for predicting result data that may occur in the future by learning time series data, and may include an autoregressive (AR) model, an integrated (I) model, and a moving average (MA) model. This time series prediction model (10) is based on machine learning algorithms such as long short-term memory (LSTM) using various learning methods including machine learning and long short-term memory (LSTM). Thus, it can be generated by learning various actual data (or observed or measured data). In this case, the actual data may be data observed or measured in the environment to be predicted (05). For example, when the environment to be predicted 05 is a power plant, the actual data may be an amount of power produced by the power plant, weather, and the like.

따라서, 시계열 예측 모델(10)은, 이러한 각종 실제 데이터들을 입력 데이터로서 수신하여 현재 시점에서 미래의 특정 시간이나 시점을 예측한 1차 예측 데이터를 출력할 수 있다. 이때, 입력 데이터는 다양한 데이터 형태를 가질 수 있다. 예를 들어, 시계열 예측 모델(10)에 대한 입력 데이터는 임의의 n차원의 시계열 데이터이거나 지난 K개의 시간 단위(시, 분, 일 등) 동안 측정 또는 수집된 시계열 데이터일 수 있다. 또한, 시계열 예측 모델(10)의 출력 데이터에 해당하는 1차 예측 데이터는, 현재 시점에서 향후 특정 시간 단위 동안의 결과를 예측한 데이터일 수 있다.Accordingly, the time series prediction model 10 may receive such various types of real data as input data and output primary prediction data that predicts a specific time or time point in the future from the present time point. In this case, the input data may have various data types. For example, the input data for the time series prediction model 10 may be any n-dimensional time series data or time series data measured or collected during the last K time units (hours, minutes, days, etc.). Further, the primary prediction data corresponding to the output data of the time series prediction model 10 may be data that predicts a result for a specific time unit in the future from the current point in time.

구체적으로 예를 들면, 시계열 예측 모델(10)은 지난 3시간 동안의 날씨에 따른 발전량을 입력 데이터로 활용하여, 현재 시점부터 향후 한시간 동안 생산할 것으로 예상되는 발전량을 예측할 수 있다.Specifically, for example, the time series prediction model 10 may predict the amount of generation expected to be produced for an hour from the current point in time by using the amount of generation according to the weather for the last 3 hours as input data.

본 발명의 일 실시예에서 시계열 예측 모델(10)은 특정 형태나 방식으로 제한하여 해석되지 않으며, 다양한 형식과 알고리즘으로 구현된 임의의 시계열 예측 모델이 모두 포함될 수 있다.In an embodiment of the present invention, the time series prediction model 10 is not limited to a specific form or method and is not interpreted, and any time series prediction model implemented in various formats and algorithms may be included.

또한, 시계열 예측 모델(10)에 의해 예측 대상 환경(05)에 대해 예측된 1차 예측 데이터들과 예측 대상 환경(05)에서 측정 또는 관측하여 획득한 실제 데이터는 별도로 구축된 예측 데이터 DB(20)에 저장되어 관리될 수 있다. 따라서, 예측 데이터 DB(20)는 시계열 예측 모델(10)에 의해 미래 특정 시점이나 기간에 대해 1차적으로 예측된 결과들 및 예측한 시점이나 기간에서의 실제 데이터를 축적하여 저장하고, 예측 데이터 조정기(30)에서 요구하는 과거 데이터를 제공할 수 있다. In addition, the first prediction data predicted for the prediction target environment 05 by the time series prediction model 10 and the actual data obtained by measuring or observing the prediction target environment 05 are separately constructed prediction data DB 20 ) Can be stored and managed. Accordingly, the prediction data DB 20 accumulates and stores the results primarily predicted for a specific time or period in the future by the time series prediction model 10 and actual data at the predicted time or period. The past data required by (30) can be provided.

예를 들어, 예측 데이터 DB(20)에 저장되고 관리되는 데이터는 다음의 표 1과 같을 수 있다.For example, data stored and managed in the prediction data DB 20 may be as shown in Table 1 below.

Figure pat00001
Figure pat00001

상기 표 1을 참조하면, 예측 데이터 DB(20)에는, 저장된 데이터의 출처(Source), 관측 또는 예측이 수행된 시간 구간(Time index), 시간 구간에 따른 예측 데이터(Forecast value, 1차 예측 데이터일 수 있고, 과거 예측 데이터로 지칭될 수도 있음), 시간 구간에 따른 실제 데이터(True value, 예측 대상 환경에서 실제로 수집한 데이터 또는 과거 실제 데이터로 지칭될 수 있음), 시간 구간에 대한 각종 추가 데이터(Additional data1, Additional data2)등이 필드(field)로서, 저장될 수 있다. 추가 데이터는 예측 타겟 지표 이외의 데이터들로서 전력 생산량을 예측할 경우 전력 생산량 이외의 날씨, 노후도 등일 수 있다. Referring to Table 1, in the prediction data DB 20, a source of stored data, a time period in which observation or prediction is performed (Time index), and prediction data according to a time period (Forecast value, primary prediction data) May be, or may be referred to as past prediction data), actual data according to time intervals (True value, data actually collected in the prediction target environment or may be referred to as past actual data), various additional data on time intervals (Additional data1, Additional data2), etc. may be stored as fields. The additional data is data other than the predicted target indicator, and when predicting the amount of power generation, the additional data may be weather, age, etc. other than the amount of power generation.

또한, 출처는 예측 데이터 또는 실제 데이터를 획득한 예측 대상 환경을 나타내는 식별기호일 수 있다. 예를 들어, 시계열 예측 모델을 적용하고자 하는 예측 대상 환경이나 예측 대상 환경과 유사한 환경을 출처로 갖는 데이터가 예측 데이터 DB(20)에 저장될 수 있다.In addition, the source may be an identification symbol indicating the prediction target environment from which the prediction data or actual data is obtained. For example, data having a prediction target environment to which the time series prediction model is to be applied or an environment similar to the prediction target environment as a source may be stored in the prediction data DB 20.

예측 데이터 조정기(30)는, 예측 데이터 DB에서 제공받은 과거 데이터를 기반으로 시계열 예측 모델에 의해 출력된 1차 예측 데이터를 보정하여 최종 예측 데이터를 출력할 수 있다. 여기서 과거 데이터는 시계열 예측 모델(10)이 과거 특정 시점에서 미래의 시점이나 시간에 대해 예측한 과거 예측 데이터이거나, 과거 특정 시점에서 측정 또는 수집하거나 관찰한 과거 실제 데이터일 수 있다. 또한, 과거 데이터는 과거 예측 데이터들 또는 과거 실제 데이터들 중에서 시계열 예측 모델에 의해 예측된 1차 예측 데이터와 관련성이 높은 데이터일 수 있다.The prediction data adjuster 30 may output final prediction data by correcting the primary prediction data output by the time series prediction model based on past data provided from the prediction data DB. Here, the past data may be past prediction data that the time series prediction model 10 predicts for a future point or time from a specific point in the past, or past actual data measured, collected, or observed at a specific point in the past. In addition, the past data may be data having high relevance to primary prediction data predicted by a time series prediction model among past prediction data or past actual data.

한편, 시계열 예측 모델(10), 예측 데이터 조정기(30)는 전술한 기능이나 동작을 수행하는 소프트웨어 모듈이나 명령어로서 구현될 수 있다. 또한, 예측 데이터 DB(20)는 전술한 데이터들을 저장하고 관리하는 하드웨어 저장소, 데이터 서버, 클라우드 서버 등으로 구현될 수 있다.Meanwhile, the time series prediction model 10 and the prediction data adjuster 30 may be implemented as software modules or instructions that perform the above-described functions or operations. In addition, the prediction data DB 20 may be implemented as a hardware storage, a data server, a cloud server, or the like that stores and manages the aforementioned data.

도 2는 본 발명의 일 실시예에 따른 과거 예측 데이터를 추출하는 방법에 대한 개념도이다.2 is a conceptual diagram illustrating a method of extracting past prediction data according to an embodiment of the present invention.

도 1에서 설명한 것과 같이 본 발명의 일 실시예에 따른 예측 데이터 조정기(30)는, 예측 데이터 DB(20)에 저장된 과거 데이터를 추출하고, 추출된 과거 데이터를 이용하여 시계열 예측 모델의 1차 예측 데이터를 보정할 수 있다.As described in FIG. 1, the prediction data adjuster 30 according to an embodiment of the present invention extracts past data stored in the prediction data DB 20, and uses the extracted past data to make a first-order prediction of a time series prediction model. Data can be corrected.

여기서, 예측 데이터 DB(20)에서 추출되는 과거 데이터는, 시계열 예측 모델에 따른 1차 예측 데이터와 유사한 데이터일 수 있다. 예를 들어, 과거 데이터는, 1차 예측 데이터와 일정한 기준 범위값내에 속하거나 또는 1차 예측 데이터에 대해 일정한 비율 범위내에 내에 속하는 데이터일 수 있다.Here, the past data extracted from the prediction data DB 20 may be data similar to the first prediction data according to the time series prediction model. For example, the past data may be data that falls within a predetermined reference range value with the primary prediction data or within a predetermined ratio range with respect to the primary prediction data.

또한, 과거 데이터는, 시계열 예측 모델에 따른 1차 예측 데이터가 도출된 현재 시점을 기준으로 결정되는 시간 구간에 속하는 데이터일 수 있다. 예를 들어, 과거 데이터는, 1차 예측 데이터가 도출된 현재 시점이 속하는 시간 구간 또는 현재 시점부터 일정한 시간 범위 내에 위치한 데이터일 수 있다. 더욱 구체적으로 예를 들면, 오후 12시의 전력 생산량을 예측한 경우라면 과거 오후 12시에 수집하였던 과거 실제 데이터이거나, 과거 오후 12시에 예측하였던 과거 예측 데이터가 과거 데이터로서 추출될 수 있다.In addition, the past data may be data belonging to a time interval determined based on a current time point from which primary prediction data according to a time series prediction model is derived. For example, the past data may be a time section in which the current time point from which the primary prediction data is derived belongs or data located within a certain time range from the current time point. More specifically, for example, in the case of predicting the amount of electricity produced at 12 pm, past actual data collected at 12 pm or past prediction data predicted at 12 pm may be extracted as past data.

또한, 과거 데이터는, 시계열 예측 모델이 현재 적용되는 예측 대상 환경을 기준으로 결정되는 데이터일 수 있다. 예를 들어, 과거 데이터는, 예측 대상 환경과 유사한 환경에서 수집되거나 예측한 적이 있는 데이터일 수 있다. Also, the past data may be data determined based on a prediction target environment to which the time series prediction model is currently applied. For example, the past data may be data that has been collected or predicted in an environment similar to the environment to be predicted.

과거 데이터는, 예측 데이터 DB(20)에 포함된 모든 필드(표 1에 따른 필드 참조) 또는 일부 필드를 포함할 수도 있다. 예를 들어, 과거 데이터는, 시간 구간, 과거 예측 데이터, 과거 실제 데이터를 포함할 수 있다.The past data may include all fields (refer to fields according to Table 1) or some fields included in the prediction data DB 20. For example, past data may include time intervals, past prediction data, and past actual data.

또한, 과거 데이터는, 예측 데이터 DB(20)에 포함된 과거 데이터 중에서 무작위로 선택된 데이터일 수도 있다.Also, the past data may be randomly selected data from past data included in the prediction data DB 20.

예측 데이터 DB(20)에서 추출되는 과거 데이터의 개수는 동적으로 결정될 수 있다. 예를 들어, 최근 예측 결과를 고려하여 과거 데이터의 개수를 동적으로 결정할 수 있다. 구체적으로, 특정한 이벤트가 발생한 것으로 판단되면, 과거 데이터의 개수를 증가 또는 감소시킬 수 있다. 또한, 시계열 예측 모델이 적용되는 예측 대상 환경에 기초하여 과거 데이터의 개수가 결정될 수 있다. 예를 들어, 예측 대상 환경이, 급작스러운 이벤트가 거의 없는 환경에 해당하는 경우, 많은 수의 과거 데이터를 전처리기(40)에 입력할 수 있다. 또한, 예측 대상 환경이 급작스러운 이벤트가 빈번한 환경에 해당하는 경우, 적은 수의 과거 데이터(또는 현재 시점을 기준으로 매우 가까운 시간 간격 내에 속하는 데이터)를 전처리기(40)에 입력할 수 있다. 이처럼, 급작스러운 이벤트가 빈번한 환경에서 예측하는 경우, 매우 짧은 시간 동안의 과거 데이터를 사용함으로써 급작스러운 이벤트로 인한 급격한 변동 사항을 신속하게 예측에 반영할 수 있다.The number of past data extracted from the prediction data DB 20 may be dynamically determined. For example, it is possible to dynamically determine the number of past data in consideration of a recent prediction result. Specifically, when it is determined that a specific event has occurred, the number of past data may be increased or decreased. Also, the number of past data may be determined based on a prediction target environment to which the time series prediction model is applied. For example, when the environment to be predicted corresponds to an environment in which there are few sudden events, a large number of past data may be input to the preprocessor 40. In addition, when the prediction target environment corresponds to an environment in which sudden events are frequent, a small number of past data (or data belonging to a very close time interval based on the current time point) may be input to the preprocessor 40. As described above, when prediction is made in an environment where sudden events are frequent, rapid changes due to sudden events can be quickly reflected in prediction by using past data for a very short time.

한편, 위와 같이 결정된 과거 데이터는 그대로 도 1에 따른 1차 예측 데이터를 예측 데이터 조정기(30)에서 보정하는 데 사용될 수도 있고, 도 2에서와 같이 전처리기(40)를 통해 전처리된 후 예측 데이터 조정기(30)에서 사용될 수 있다. 예를 들어, 전처리기(40)는, 과거 데이터를 일정한 기준에 따라 정렬하고, 정렬된 데이터의 일부를 선정하여 예측 데이터 조정기(30)에 제공할 수 있다. 또한, 전처리기(40)는, 예측 데이터 DB(20)에서 서로 다른 갯수의 시간 구간에 속하는 과거 실제 데이터를 동시에 추출하고, 추출된 과거 실제 데이터들 전처리하여 하나의 과거 실제 데이터를 도출할 수 있다. 예를 들어, 과거 1000개의 시간 구간에 속하는 과거 실제 데이터를 추출하고, 그와 동시에 과거 10개의 시간 구간에 속하는 과거 실제 데이터를 추출한 후, 추출된 데이터들을 전처리하여 하나의 과거 실제 데이터를 도출할 수 있다. 여기서 도출된 하나의 과거 실제 데이터가 예측 데이터 조정기(30)에 전달될 수 있다.Meanwhile, the past data determined as described above may be used to correct the primary prediction data according to FIG. 1 as it is in the prediction data adjuster 30, or preprocessed through the preprocessor 40 as in FIG. Can be used in (30). For example, the preprocessor 40 may sort past data according to a certain criterion, select a part of the sorted data, and provide it to the predictive data adjuster 30. In addition, the preprocessor 40 may simultaneously extract past actual data belonging to different numbers of time intervals from the predicted data DB 20, and preprocess the extracted past actual data to derive one past actual data. . For example, it is possible to extract past actual data belonging to the past 1000 time intervals, extract past actual data belonging to the past 10 time intervals at the same time, and preprocess the extracted data to derive one past actual data. have. One past actual data derived here may be transmitted to the predicted data adjuster 30.

상술한 과정을 통해 전처리되거나 결정된 과거 데이터는 시계열 예측 모델에 따른 1차 예측 데이터를 보정하는 데 사용될 수 있다. 이하에서는 과거 데이터를 이용하여 1차 예측 데이터를 보정하는 방법에 대하여 상술한다.Past data preprocessed or determined through the above-described process may be used to correct primary prediction data according to a time series prediction model. Hereinafter, a method of correcting primary prediction data using past data will be described in detail.

도 3은 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제1 방법에 대한 개념도이다. 도 4는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제2 방법에 대한 개념도이다. 도 5는 본 발명의 일 실시예에 따른 예측 모델을 이용한 1차 예측 데이터를 과거 데이터를 기반으로 보정하는 제3 방법에 대한 개념도이다.3 is a conceptual diagram of a first method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention. 4 is a conceptual diagram of a second method for correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention. 5 is a conceptual diagram of a third method of correcting primary prediction data using a prediction model based on past data according to an embodiment of the present invention.

도 1을 다시 참조하면, 본 발명의 일 실시예에 따른 최종 예측 데이터는 시계열 예측 모델에 따른 1차 예측 데이터를, 예측 데이터 DB에서 획득한 과거 데이터를 이용하여 보정함으로써 도출될 수 있다. 이때, 예측 데이터 조정기(30)가 최종 예측 데이터를 도출하는 방법으로는 도 3에 따른 제1 방법, 도 4에 따른 제2 방법, 도 5에 따른 제3 방법을 고려할 수 있다.Referring again to FIG. 1, final prediction data according to an embodiment of the present invention may be derived by correcting primary prediction data according to a time series prediction model using past data obtained from a prediction data DB. In this case, as a method for the prediction data adjuster 30 to derive the final prediction data, a first method according to FIG. 3, a second method according to FIG. 4, and a third method according to FIG. 5 may be considered.

먼저 도 3을 참조하면, 예측 데이터 DB 에서 추출한 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 도출하고, 보정된 과거 실제 데이터로부터 최종 예측 데이터를 도출할 수 있다.First, referring to FIG. 3, corrected past actual data may be derived by correcting the past actual data extracted from the prediction data DB, and final predicted data may be derived from the corrected past actual data.

예를 들어, 보정된 과거 실제 데이터는 다음의 수학식 1과 같이 결정될 수 있다.For example, the corrected past actual data may be determined as in Equation 1 below.

Figure pat00002
Figure pat00002

상기 수학식 1을 참조하면, 보정된 과거 실제 데이터는, 과거 실제 데이터에 보정치(수학식 1의 괄호 부분)를 더함으로써 도출될 수 있다. 여기서 보정치는 1차 예측 데이터와 과거 예측 데이터를 이용한 연산으로 결정될 수 있다. 또한, 수학식 1에서 각 데이터들에 대한 계수들(α,β,γ)은 가중치로서 사용자의 설정에 따라 변경될 수 있다.Referring to Equation 1, the corrected past actual data can be derived by adding a correction value (the parenthesis portion of Equation 1) to the past actual data. Here, the correction value may be determined by an operation using primary prediction data and past prediction data. In addition, the coefficients α, β, and γ for each data in Equation 1 are weights and may be changed according to a user's setting.

따라서, 수학식 1에 따라 보정된 과거 실제 데이터가 도출되면, 과거 실제 데이터를 이용하여 최종 예측 데이터를 도출할 수 있다. 예를 들어, 보정된 과거 실제 데이터들의 평균값 또는 가중 평균값을 산출하여 최종 예측 데이터로 사용할 수 있다.Accordingly, when the corrected past actual data is derived according to Equation 1, the final predicted data can be derived using the past actual data. For example, an average value or a weighted average value of corrected past actual data may be calculated and used as final prediction data.

도 4를 참조하면, 예측 데이터 DB 에서 추출한 과거 데이터에서 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 1차 예측 데이터를 보정함으로써 최종 예측 데이터를 도출할 수 있다.Referring to FIG. 4, final prediction data may be derived by calculating a past prediction error from past data extracted from a prediction data DB, and correcting primary prediction data using the calculated past prediction error.

먼저, 과거 예측 오차는 다음의 수학식 2와 같이 결정될 수 있다.First, the past prediction error may be determined as in Equation 2 below.

Figure pat00003
Figure pat00003

수학식 2를 참조하면, 과거 예측 오차는 과거 실제 데이터와 과거 예측 데이터 사이의 차분값에 의해 결정될 수 있다. 이때, 과거 실제 데이터와 과거 예측 데이터에는 각각 가중치(α,β)가 부여될 수 있다. 수학식 2에 따라 현재 시점과 동일하거나 유사한 시간 구간 등에서 과거 예측 오차들을 산출하고, 산출된 과거 예측 오차들의 평균 또는 가중 평균을 산출하여 최종적으로 과거 예측 오차로 사용할 수 있다. Referring to Equation 2, the past prediction error may be determined by a difference value between past actual data and past prediction data. In this case, weights α and β may be assigned to the past actual data and past predicted data, respectively. According to Equation 2, past prediction errors may be calculated in a time interval that is the same as or similar to the current time point, and an average or weighted average of the calculated past prediction errors may be calculated and finally used as the past prediction errors.

다음으로, 과거 예측 오차를 이용하여 1차 예측 데이터는 다음의 수학식 3과 같이 보정될 수 있다.Next, the first prediction data may be corrected by using the past prediction error as shown in Equation 3 below.

Figure pat00004
Figure pat00004

수학식 3을 참조하면, 1차 예측 데이터에 과거 예측 오차를 더함으로써 오차 보정 예측 데이터를 도출할 수 있고, 이러한 오차 보정 예측 데이터가 최종 예측 데이터로 사용될 수 있다.Referring to Equation 3, error correction prediction data may be derived by adding past prediction errors to primary prediction data, and such error correction prediction data may be used as final prediction data.

도 5를 참조하면, 수학식 1에 따른 보정된 과거 실제 데이터 및 수학식 3에 따른 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 최종 예측 데이터를 결정할 수도 있다.Referring to FIG. 5, final predicted data may be determined by additionally applying a Kalman filter technique to corrected past actual data according to Equation 1 and error correction predicted data according to Equation 3.

이때, 칼만 필터 기법은 두개의 가우시안 함수를 서로 곱하여 하나의 가우시안 함수를 도출하므로, 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터 각각에 대해 표준 편차를 산출할 필요가 있다.In this case, since the Kalman filter technique multiplies two Gaussian functions to derive one Gaussian function, it is necessary to calculate a standard deviation for each of the corrected past actual data and the error-corrected predicted data according to Equation 3.

여기서, 수학식 1에 따른 보정된 과거 실제 데이터에 대한 표준 편차는, 시계열 예측 모델로부터 제공받을 수도 있고, 시계열 예측 모델에서 제공하는 예측 구간을 표준 편차로 변형하여 얻을 수도 있으며, 과거 예측 데이터의 분포를 기반으로 직접 산출될 수도 있다.Here, the standard deviation of the corrected past actual data according to Equation 1 may be provided from the time series prediction model, or may be obtained by transforming the prediction interval provided by the time series prediction model into a standard deviation, and the distribution of the past prediction data It can also be calculated directly based on.

또한, 수학식 3에 따른 오차 보정 예측 데이터에 대한 표준 편차는, 과거 실제 데이터와 과거 예측 데이터 사이의 차분값에 대하여 특정 백분위수(percentile)에 해당하는 값일 수도 있고, 과거 예측 데이터와 실제 예측 데이터 사이의 최대 차분값일 수일 수도 있으며, 과거 실제 데이터의 분포를 기반으로 직접 산출될 수도 있다.In addition, the standard deviation of the error correction predicted data according to Equation 3 may be a value corresponding to a specific percentile with respect to the difference between the past actual data and the past predicted data, or the past predicted data and the actual predicted data. It may be the number of maximum difference values, or may be directly calculated based on the distribution of actual data in the past.

수학식 1에 따른 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터 각각에 대해 표준 편차가 산출되면, 산출된 표준 편차들 및 수학식 1에 따른 보정된 과거 실제 데이터와 수학식 3에 따른 오차 보정 예측 데이터를 이용하여 하나의 평균과 표준 편차를 도출할 수 있다. 이때 최종적으로 도출되는 하나의 평균값이 칼만 필터 기법에 따른 최종 예측 데이터로 사용될 수 있다.When the standard deviation is calculated for each of the corrected past actual data according to Equation 1 and the error correction predicted data according to Equation 3, the calculated standard deviations and corrected past actual data according to Equation 1 and Equation 3 are One average and standard deviation can be derived by using the error-corrected prediction data. At this time, one average value finally derived may be used as final prediction data according to the Kalman filter technique.

도 5를 참조하면, 도 1에 따른 예측 데이터 조정기(30)가 과거 실제 데이터와 과거 예측 데이터를 이용하여 보정된 과거 실제 데이터 및 오차 보정 예측 데이터를 산출하고, 산출된 데이터들 각각에 대한 표준편차까지 산출한 후 칼만 필터(31)에 따른 평균값을 도출하여 최종 예측 데이터로 사용하는 경우를 확인할 수 있다.Referring to FIG. 5, the predicted data adjuster 30 according to FIG. 1 calculates corrected past actual data and error correction predicted data using past actual data and past predicted data, and standard deviation for each of the calculated data. After calculating to, an average value according to the Kalman filter 31 is derived and used as final prediction data can be confirmed.

도 3 내지 도 5에서 도시하지는 않았으나, 과거 예측 DB(20)에서 추출되는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 기준 및 개수는 도 2에 따른 방법들이 적용될 수 있는 것으로 해석되어야 한다.Although not shown in FIGS. 3 to 5, the criteria and number of extracting past prediction data or past actual data extracted from the past prediction DB 20 should be interpreted as being applicable to the methods according to FIG. 2.

도 6은 사이트 1에서 수집한 예측 데이터 DB 및 사이트 1에서 학습한 시계열 예측 모델을 이용하여 사이트 2에 대한 예측 데이터를 생성하는 과정을 설명하기 위한 예시도이다.6 is an exemplary diagram for explaining a process of generating prediction data for site 2 using a prediction data DB collected at site 1 and a time series prediction model learned at site 1;

도 6에서 예측 데이터 DB(20)는 제1 지역(site 1)에서 수집하고 예측하였던 데이터들로 구성될 수 있고, 시계열 예측 모델(10)도 제1 지역(site 1)에서 학습한 모델일 수 있다. 이러한 전제에서 제2 지역(site)에 대한 시계열 예측을 수행하는 경우를 고려할 수 있다.In FIG. 6, the prediction data DB 20 may be composed of data collected and predicted in the first area (site 1), and the time series prediction model 10 may also be a model learned in the first area (site 1). have. On this premise, a case of performing time series prediction on the second site may be considered.

예를 들어, 제1 지역은 영암 지역에 설치된 99KWp 용량의 태양광 발전소이고, 제2 지역은 제1 지역과 거리가 인접하고 기후가 유사한 장흥에 설치되고 제1 지역과 동일한 용량(99KWp) 또는 제1 지역과 다른 용량(200KWp)의 태양광 발전소일 수 있다.For example, the first area is a solar power plant with a capacity of 99 KWp installed in the Yeongam area, and the second area is installed in Jangheung, which has a close distance from the first area and has a similar climate, and has the same capacity as the first area (99 KWp) or It may be a solar power plant with a capacity (200 KWp) different from that of 1 area.

이처럼 제1 지역에서 수집하고 예측한 데이터베이스와 모델을 사용하여 제2 지역(site 2)에 대한 예측 데이터를 생성하고자 할 경우, 초기에는 제1 지역에서 수집된 데이터만을 이용하여 예측 데이터 조정기가 1차 예측 데이터를 조정하게 되므로 제2 지역에 따른 특성이 정확하게 반영되지 않을 수 있다. In this way, if you want to generate prediction data for the second area (site 2) by using the database and model collected and predicted in the first area, the predictive data adjuster will initially use only the data collected in the first area. Since the predicted data is adjusted, characteristics according to the second region may not be accurately reflected.

다만, 예측이 지속적으로 진행될수록 예측 데이터 DB에는 제2 지역에서 수집된 과거 데이터가 포함될 수 있다. 즉, 예측 데이터 DB에는 제1 지역에서 수집된 과거 데이터와 제2 지역에서 수집된 과거 데이터를 모두 포함할 수 있다. 따라서, 시간이 지남에 따라 제2 지역에서 수집된 과거 데이터가 많아지므로 제2 지역에 대하여 더욱 예측 정확도가 높아지게 될 수 있다.However, as the prediction continues, the prediction data DB may include past data collected in the second area. That is, the prediction data DB may include both past data collected in the first area and past data collected in the second area. Accordingly, as time passes, the number of historical data collected in the second area increases, and thus the prediction accuracy for the second area may be further increased.

또한, 제2 지역에서 충분한 과거 데이터가 수집되면, 제2 지역에서 수집된 과거 데이터만을 사용하여 1차 예측 데이터를 보정할 수 있다. 즉, 제2 지역에서 수집된 과거 데이터만을 이용함으로써 1차 예측 데이터의 보정을 통한 최종 예측 데이터의 정확도가 향상될 수 있다.In addition, when sufficient past data is collected in the second area, the first prediction data may be corrected using only the past data collected in the second area. That is, by using only past data collected in the second area, accuracy of final prediction data may be improved through correction of the primary prediction data.

전술한 과정과는 달리, 제1 지역에서 수집한 예측 데이터 DB 및 제1 지역에서 학습한 시계열 예측 모델을 사용하지 않고, 제2 지역에서 수집하고 학습한 예측 데이터 DB와 시계열 예측 모델을 사용하는 것도 가능하다.Unlike the above process, the prediction data DB collected in the first area and the time series prediction model learned in the first area are not used, but the prediction data DB collected and learned in the second area and the time series prediction model are also used. It is possible.

도 7은 제1 지역에서 학습된 시계열 예측 모델을 제1 지역과 유사한 기후 환경에 속하지만 전력 생산 성능이 상이한 제2 지역에 적용한 결과를 나타낸 그래프이다.7 is a graph showing the result of applying the time series prediction model learned in the first region to a second region belonging to a climate environment similar to that of the first region but having different power generation performance.

도 7을 참조하면, 제1 지역(또는 제1 발전소)에 기반하여 학습된 시계열 예측 모델을, 제1 지역과 유사한 기후 환경에 속하지만 30% 정도 생산 성능이 낮은 제2 지역(또는 제2 발전소)에 적용한 경우의 결과를 확인할 수 있다.Referring to FIG. 7, a time series prediction model learned based on a first region (or a first power plant) is a second region (or a second power plant) that belongs to a climate environment similar to that of the first region, but has a low production performance of about 30%. ), you can check the results.

도 7에서 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.In FIG. 7,'TRUE' is the actual power production per unit time of,'Not adjusted' is the first prediction data of the time series prediction model learned in the first region as it is, and'Adjusted' is the first prediction data of the present invention. This shows the final predicted data derived by correcting using past data according to an embodiment of

제1 지역에서 학습된 시계열 예측 모델을 제2 지역에 그대로 적용하는 경우, not adjusted 결과가 보여주는 것처럼 유사한 기후 환경을 보일지라도 생산 성능의 차이로 인하여 실제 전력 생산량(TURE)과 큰 오차가 발생하는 것을 볼 수 있다.When the time-series prediction model learned in the first region is applied to the second region as it is, it is observed that a large error from the actual power generation (TURE) occurs due to the difference in production performance, even if a similar climate environment is shown as the result of not adjusted can see.

반면, 본 발명의 일 실시예에 따라 제2 지역의 과거 데이터에 기반하여 시계열 예측 모델의 1차 예측 데이터를 보정하는 경우, 데이터가 충분하지 않은 초기(time index 값 5정도 까지)에는 어느 정도 오차가 있지만, 제2 지역의 데이터가 점차 확보되어감에 따라 최종 예측 데이터(Adjusted)가 실제 전력 생산량(TURE)과 큰 오차를 보이지 않는 것을 볼 수 있다.On the other hand, in the case of correcting the primary prediction data of the time series prediction model based on the past data of the second area according to an embodiment of the present invention, there is an error to some extent when the data is insufficient (up to a time index value of about 5). However, it can be seen that as the data of the second area is gradually secured, the final predicted data (Adjusted) does not show a large error with the actual power generation amount (TURE).

도 8은 점차 발전 성능이 감소하는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.8 is a graph showing a result of applying a time series prediction model learned in a first region where power generation performance gradually decreases to a first region.

도 8을 참조하면, 시계열 예측 모델이 학습된 지역과 적용된 지역은 동일하지만 점차 해당 지역의 환경이 변화되는(또는 노후화되어 생산 성능이 최대 30% 감소) 경우에 대하여 예측 결과를 확인할 수 있다. Referring to FIG. 8, a prediction result can be confirmed for a case in which the region from which the time series prediction model is trained and the region to which the time series prediction model is trained and applied is the same, but the environment of the region is gradually changed (or the production performance is reduced by up to 30% due to aging).

도 8에서도 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.In FIG. 8,'TRUE' is the actual power production per unit time of,'Not adjusted' is the first prediction data of the time series prediction model learned in the first region as it is, and'Adjusted' is the first prediction data of the present invention. This shows the final predicted data derived by correcting using past data according to an embodiment of

먼저, 보정되지 않은 1차 예측 데이터의 경우 시간이 지남에 따라 실제 데이터(TRUE)와의 오차가 증가하는 것을 확인할 수 있다.First, it can be seen that in the case of uncorrected primary prediction data, an error with the actual data TRUE increases over time.

반면, 본 발명의 일 실시예에 따른 1차 예측 데이터의 보정을 수행하여 도출한 최종 예측 데이터는 시간이 지남에 따른 노후화까지 반영할 수 있어 예측 오차가 거의 발생하지 않는 것을 확인할 수 있다.On the other hand, the final prediction data derived by performing correction of the primary prediction data according to an embodiment of the present invention can reflect even deterioration over time, and thus it can be seen that a prediction error hardly occurs.

도 9는 급작스러운 환경 변화를 갖는 제1 지역에서 학습된 시계열 예측 모델을 제1 지역에 적용한 결과를 나타낸 그래프이다.9 is a graph showing a result of applying a time series prediction model learned in a first region having a sudden environmental change to a first region.

도 9에서도 ‘TRUE’는 의 단위 시간당 실제 전력 생산량이며, ‘Not adjusted’는 제1 지역에서 학습된 시계열 예측 모델의 1차 예측 데이터를 그대로 나타낸 것이고, ‘Adjusted’는 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정함으로써 도출한 최종 예측 데이터를 나타낸 것이다.In FIG. 9,'TRUE' is the actual power production per unit time of,'Not adjusted' is the first prediction data of the time series prediction model learned in the first region as it is, and'Adjusted' is the first prediction data of the present invention. This shows the final predicted data derived by correcting using past data according to an embodiment of

예를 들어, 도 9에서는 제1 지역에 따른 태양광 발전소에서 눈이나 그림자 등과 같이 갑작스레 발생하여 발전 성능을 저해하는 경우에 대한 예측 성능을 확인할 수 있다.For example, in FIG. 9, prediction performance for a case in which power generation performance is impaired by sudden occurrence such as snow or shadow in a solar power plant according to the first region can be confirmed.

도 9를 참조하면, time index의 11 ~ 40에 해당하는 시점들에서 갑작스런 외부 요인으로 실제 발전량(TURE)이 감소하여, 발전 성능이 30% 정도 저하된 경우를 확인할 수 있다.Referring to FIG. 9, it can be seen that the actual power generation (TURE) decreases due to a sudden external factor at the time points corresponding to 11 to 40 of the time index, and the power generation performance decreases by about 30%.

급작스런 요인으로 성능 저하가 이루어졌을 때, 시계열 예측 결과가 보정되지 않은 경우(Not Adjusted)를 살펴보면, 실제 발전량과의 예측 오차가 크게 유지되다가 발전 성능이 복귀된 후에야 예측 오차가 다시 줄어드는 것을 볼 수 있다.Looking at the case that the time series prediction result is not corrected (Not Adjusted) when the performance deteriorates due to an abrupt factor, it can be seen that the prediction error with the actual power generation is maintained large and the prediction error decreases again only after the power generation performance is restored .

그러나, 1차 예측 데이터를 본 발명의 일 실시예에 따른 과거 데이터를 이용하여 보정한 최종 데이터는, 급작스런 성능 저하 초기에는 보정하지 않은 경우와 유사하게 오차가 크지만 점차 오차가 줄어드는 것을 볼 수 있다. 또한, 발전 성능이 복귀된 후에도 큰 오차없이 예측 결과를 도출하는 것을 볼 수 있다. 이처럼, 예측 대상 환경에서 급작스런 변화가 초래되는 경우, 이러한 변화를 빠르고 정확하게 예측 결과로 반영할 수 있도록, 보정에 사용되는 과거 데이터를 최근 단기간의 데이터로 사용하거나 적은 개수로 사용할 수 있다.However, it can be seen that the final data corrected by using the past data according to an embodiment of the present invention has a large error similar to the case not corrected in the early stage of sudden performance degradation, but gradually decreases the error. . In addition, it can be seen that even after the power generation performance is restored, prediction results are derived without significant errors. As described above, when a sudden change occurs in the environment to be predicted, the past data used for correction may be used as data for the recent short term or in a small number so that such change may be quickly and accurately reflected as a prediction result.

도 10은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 방법에 대한 대표 흐름도이다.10 is a representative flowchart of a method for predicting time series based on past data according to an embodiment of the present invention.

도 10을 참조하면, 과거 데이터에 기초한 시계열 예측 방법은, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계(S100), 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계(S110), 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계(S120) 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계(S130)를 포함할 수 있다.Referring to FIG. 10, the method of predicting a time series based on past data includes: obtaining actual data observed in a prediction target environment (S100), inputting the obtained actual data into a pre-trained time series prediction model (S110), Acquiring the first prediction data predicted by the time series prediction model (S120) and correcting the first prediction data using past data extracted from a prediction data DB (database), thereby obtaining final prediction data ( S130) may be included.

상기 과거 데이터에 기초한 시계열 예측 방법은, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The time series prediction method based on past data may further include storing the actual data in the prediction data DB.

상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.Acquiring the final prediction data (S130) may include extracting the past data according to a predetermined criterion from the prediction data DB.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.

상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data that is adjacent to the current prediction time and belongs to a short time interval may be extracted.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.

상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.Acquiring the final predicted data (S130) may include correcting the past actual data to obtain corrected past actual data.

상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.In the step of obtaining the final prediction data (S130), obtaining error correction prediction data by calculating a past prediction error using the past data and correcting the primary prediction data using the calculated past prediction error It may include.

상기 최종 예측 데이터를 획득하는 단계(S130)는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data (S130) may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data. have.

상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.

도 11은 본 발명의 일 실시예에 따른 과거 데이터에 기초한 시계열 예측 장치에 대한 하드웨어 구성도이다.11 is a hardware configuration diagram of a time series prediction apparatus based on past data according to an embodiment of the present invention.

도 11을 참조하면, 과거 데이터에 기초한 시계열 예측 장치(100)는, 적어도 하나의 프로세서(processor, 110); 및 상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory, 120)를 포함할 수 있다.Referring to FIG. 11, the apparatus 100 for predicting a time series based on past data includes at least one processor 110; And a memory 120 for storing instructions instructing the at least one processor to perform at least one step.

여기서 적어도 하나의 프로세서(110)는 중앙 처리 장치(central processing unit, CPU), 그래픽 처리 장치(graphics processing unit, GPU), 또는 본 발명의 실시예들에 따른 방법들이 수행되는 전용의 프로세서를 의미할 수 있다. 메모리(120) 및 저장 장치(160) 각각은 휘발성 저장 매체 및 비휘발성 저장 매체 중에서 적어도 하나로 구성될 수 있다. 예를 들어, 메모리(120)는 읽기 전용 메모리(read only memory, ROM) 및 랜덤 액세스 메모리(random access memory, RAM) 중에서 적어도 하나로 구성될 수 있다.Here, the at least one processor 110 means a central processing unit (CPU), a graphics processing unit (GPU), or a dedicated processor in which the methods according to the embodiments of the present invention are performed. I can. Each of the memory 120 and the storage device 160 may be configured with at least one of a volatile storage medium and a nonvolatile storage medium. For example, the memory 120 may be composed of at least one of a read only memory (ROM) and a random access memory (RAM).

또한, 과거 데이터에 기초한 시계열 예측 장치(100)는, 무선 네트워크를 통해 통신을 수행하는 송수신 장치(transceiver)(130)를 포함할 수 있다. 또한, 과거 데이터에 기초한 시계열 예측 장치(100)는 입력 인터페이스 장치(140), 출력 인터페이스 장치(150), 저장 장치(160) 등을 더 포함할 수 있다. 과거 데이터에 기초한 시계열 예측 장치(100)에 포함된 각각의 구성 요소들은 버스(bus)(170)에 의해 연결되어 서로 통신을 수행할 수 있다.In addition, the time series prediction apparatus 100 based on past data may include a transceiver 130 that performs communication through a wireless network. In addition, the time series prediction apparatus 100 based on past data may further include an input interface device 140, an output interface device 150, and a storage device 160. Each component included in the time series prediction apparatus 100 based on past data may be connected by a bus 170 to communicate with each other.

상기 적어도 하나의 단계는, 예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계; 획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계; 상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및 예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The at least one step may include obtaining actual data observed in a prediction target environment; Inputting the acquired real data into a pre-trained time series prediction model; Obtaining primary prediction data predicted by the time series prediction model; And obtaining final prediction data by correcting the primary prediction data using past data extracted from a prediction data database (DB).

상기 적어도 하나의 단계는, 상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함할 수 있다.The at least one step may further include storing the actual data in the prediction data DB.

상기 최종 예측 데이터를 획득하는 단계는, 상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include extracting the past data according to a predetermined criterion from the prediction data DB.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함할 수 있다.The extracting of the past data may include extracting, from the predicted data DB, past predicted data or past actual data belonging to a range in which at least one of the first predicted data and numerical value, a current predicted time point and a source is adjacent. have.

상기 과거 데이터를 추출하는 단계는, 상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출할 수 있다.In the extracting of the past data, when the prediction target environment is an environment in which there is a rapid environmental change, past data that is adjacent to the current prediction time and belongs to a short time interval may be extracted.

상기 과거 데이터를 추출하는 단계는, 상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함할 수 있다.The step of extracting the past data may further include pre-processing the data extracted from the prediction data DB according to a predetermined criterion.

상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final predicted data may include correcting the past actual data to obtain corrected past actual data.

상기 최종 예측 데이터를 획득하는 단계는, 상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include calculating a past prediction error using the past data, and obtaining error correction prediction data by correcting the primary prediction data using the calculated past prediction error. I can.

상기 최종 예측 데이터를 획득하는 단계는, 상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함할 수 있다.The obtaining of the final prediction data may include obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.

상기 시계열 예측 모델은, 상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습될 수 있다.The time series prediction model may be pre-trained in the same or similar environment as the prediction target environment.

과거 데이터에 기초한 시계열 예측 장치(100)의 예를 들면, 통신 가능한 데스크탑 컴퓨터(desktop computer), 랩탑 컴퓨터(laptop computer), 노트북(notebook), 스마트폰(smart phone), 태블릿 PC(tablet PC), 모바일폰(mobile phone), 스마트 워치(smart watch), 스마트 글래스(smart glass), e-book 리더기, PMP(portable multimedia player), 휴대용 게임기, 네비게이션(navigation) 장치, 디지털 카메라(digital camera), DMB(digital multimedia broadcasting) 재생기, 디지털 음성 녹음기(digital audio recorder), 디지털 음성 재생기(digital audio player), 디지털 동영상 녹화기(digital video recorder), 디지털 동영상 재생기(digital video player), PDA(Personal Digital Assistant) 등일 수 있다.Examples of the time series prediction apparatus 100 based on past data include, for example, a communicable desktop computer, a laptop computer, a notebook, a smart phone, a tablet PC, and Mobile phone, smart watch, smart glass, e-book reader, portable multimedia player (PMP), portable game console, navigation device, digital camera, DMB (digital multimedia broadcasting) player, digital audio recorder, digital audio player, digital video recorder, digital video player, PDA (Personal Digital Assistant), etc. I can.

본 발명에 따른 방법들은 다양한 컴퓨터 수단을 통해 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 컴퓨터 판독 가능 매체에 기록되는 프로그램 명령은 본 발명을 위해 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.The methods according to the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the computer-readable medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in computer software.

컴퓨터 판독 가능 매체의 예에는 롬(ROM), 램(RAM), 플래시 메모리(flash memory) 등과 같이 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 프로그램 명령의 예에는 컴파일러(compiler)에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터(interpreter) 등을 사용해서 컴퓨터에 의해 실행될 수 있는 고급 언어 코드를 포함할 수 있다. 상술한 하드웨어 장치는 본 발명의 동작을 수행하기 위해 적어도 하나의 소프트웨어 모듈로 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Examples of computer-readable media may include hardware devices specially configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions may include high-level language codes that can be executed by a computer using an interpreter as well as machine language codes such as those produced by a compiler. The above-described hardware device may be configured to operate as at least one software module to perform the operation of the present invention, and vice versa.

또한, 상술한 방법 또는 장치는 그 구성이나 기능의 전부 또는 일부가 결합되어 구현되거나, 분리되어 구현될 수 있다. In addition, the above-described method or apparatus may be implemented by combining all or part of its configuration or function, or may be implemented separately.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다. Although the above has been described with reference to preferred embodiments of the present invention, those skilled in the art will variously modify and change the present invention within the scope not departing from the spirit and scope of the present invention described in the following claims. You will understand that you can do it.

Claims (20)

과거 데이터에 기초한 시계열 예측 방법으로,
예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계;
획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계;
상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및
예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
A time series prediction method based on historical data,
Acquiring actual data observed in the environment to be predicted;
Inputting the acquired real data into a pre-trained time series prediction model;
Obtaining primary prediction data predicted by the time series prediction model; And
Comprising the step of obtaining final predicted data by correcting the primary predicted data using past data extracted from a predicted data database (DB).
청구항 1에서,
상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 1,
The method of predicting a time series based on past data, further comprising storing the actual data in the prediction data DB.
청구항 1에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 1,
Obtaining the final prediction data,
And extracting the past data according to a predetermined criterion from the prediction data DB.
청구항 3에서,
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 3,
Extracting the past data,
And extracting, from the prediction data DB, past prediction data or past actual data belonging to a range in which at least one of the first prediction data and numerical values, a current prediction time point, and a source are adjacent to each other.
청구항 3에서,
상기 과거 데이터를 추출하는 단계는,
상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 3,
Extracting the past data,
When the prediction target environment is an environment in which there is a sudden change in environment, past data adjacent to the current prediction time and belonging to a short time interval are extracted.
청구항 3에서,
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 3,
Extracting the past data,
Pre-processing the data extracted from the prediction data DB according to a predetermined criterion, a time series prediction method based on past data.
청구항 4에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 4,
Obtaining the final prediction data,
Comprising the step of obtaining corrected past actual data by correcting the past actual data, a time series prediction method based on past data.
청구항 7에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 7,
Obtaining the final prediction data,
And obtaining error correction prediction data by calculating a past prediction error using the past data and correcting the primary prediction data using the calculated past prediction error.
청구항 8에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 8,
Obtaining the final prediction data,
And obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
청구항 1에서,
상기 시계열 예측 모델은,
상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습되는, 과거 데이터에 기초한 시계열 예측 방법.
In claim 1,
The time series prediction model,
Time series prediction method based on past data, which is learned in advance in the same or similar environment as the prediction target environment.
과거 데이터에 기초한 시계열 예측 장치로서,
적어도 하나의 프로세서(processor); 및
상기 적어도 하나의 프로세서가 적어도 하나의 단계를 수행하도록 지시하는 명령어들(instructions)을 저장하는 메모리(memory)를 포함하고,
상기 적어도 하나의 단계는,
예측 대상 환경에서 관측한 실제 데이터를 획득하는 단계;
획득한 실제 데이터를 미리 학습된 시계열 예측 모델에 입력하는 단계;
상기 시계열 예측 모델에 의해 예측된 1차 예측 데이터를 획득하는 단계; 및
예측 데이터 DB(database)에서 추출한 과거 데이터를 이용하여 상기 1차 예측 데이터를 보정함으로써, 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
As a time series prediction device based on past data,
At least one processor; And
Including a memory (memory) for storing instructions (instructions) instructing the at least one processor to perform at least one step,
The at least one step,
Acquiring actual data observed in the environment to be predicted;
Inputting the acquired real data into a pre-trained time series prediction model;
Obtaining primary prediction data predicted by the time series prediction model; And
Comprising the step of obtaining final prediction data by correcting the primary prediction data using past data extracted from a prediction data DB (database).
청구항 11에서,
상기 적어도 하나의 단계는,
상기 실제 데이터를 상기 예측 데이터 DB에 저장하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 11,
The at least one step,
The time series prediction apparatus based on past data, further comprising storing the actual data in the prediction data DB.
청구항 11에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 예측 데이터 DB에서 소정의 기준에 따라 상기 과거 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 11,
Obtaining the final prediction data,
And extracting the past data according to a predetermined criterion from the prediction data DB.
청구항 13에서,
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 상기 1차 예측 데이터와 수치, 현재 예측 시점 및 출처 중 적어도 하나가 인접한 범위에 속하는 과거 예측 데이터 또는 과거 실제 데이터를 추출하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 13,
Extracting the past data,
And extracting, from the prediction data DB, past prediction data or past actual data belonging to a range in which at least one of the first prediction data and numerical values, a current prediction time point, and a source are adjacent to each other.
청구항 13에서,
상기 과거 데이터를 추출하는 단계는,
상기 예측 대상 환경이 급격한 환경 변화가 있는 환경인 경우, 현재 예측 시점과 인접하고 짧은 시간 간격에 속하는 과거 데이터를 추출하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 13,
Extracting the past data,
When the prediction target environment is an environment in which there is a rapid environmental change, the time series prediction apparatus based on past data extracts past data that is adjacent to the current prediction time and belongs to a short time interval.
청구항 13에서,
상기 과거 데이터를 추출하는 단계는,
상기 예측 데이터 DB에서 추출한 데이터를 소정의 기준에 따라 전처리하는 단계를 더 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 13,
Extracting the past data,
Pre-processing the data extracted from the prediction data DB according to a predetermined criterion, a time series prediction apparatus based on past data.
청구항 14에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 실제 데이터를 보정하여 보정된 과거 실제 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 14,
Obtaining the final prediction data,
Comprising the step of obtaining corrected past actual data by correcting the past actual data, a time series prediction apparatus based on past data.
청구항 17에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 과거 데이터를 이용하여 과거 예측 오차를 산출하고, 산출된 과거 예측 오차를 이용하여 상기 1차 예측 데이터를 보정함으로써 오차 보정 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 17,
Obtaining the final prediction data,
And obtaining error correction prediction data by calculating a past prediction error using the past data and correcting the primary prediction data using the calculated past prediction error.
청구항 18에서,
상기 최종 예측 데이터를 획득하는 단계는,
상기 보정된 과거 실제 데이터 및 상기 오차 보정 예측 데이터에 칼만 필터(Kalman filter) 기법을 추가로 적용하여 상기 최종 예측 데이터를 획득하는 단계를 포함하는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 18,
Obtaining the final prediction data,
And obtaining the final prediction data by additionally applying a Kalman filter technique to the corrected past actual data and the error correction prediction data.
청구항 11에서,
상기 시계열 예측 모델은,
상기 예측 대상 환경과 동일하거나 유사한 환경에서 미리 학습되는, 과거 데이터에 기초한 시계열 예측 장치.
In claim 11,
The time series prediction model,
A time series prediction apparatus based on past data that is learned in advance in an environment that is the same as or similar to the prediction target environment.
KR1020190096448A 2019-08-08 2019-08-08 Time series prediction method and apparatus based on past prediction data KR102468316B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190096448A KR102468316B1 (en) 2019-08-08 2019-08-08 Time series prediction method and apparatus based on past prediction data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190096448A KR102468316B1 (en) 2019-08-08 2019-08-08 Time series prediction method and apparatus based on past prediction data

Publications (2)

Publication Number Publication Date
KR20210017342A true KR20210017342A (en) 2021-02-17
KR102468316B1 KR102468316B1 (en) 2022-11-17

Family

ID=74731561

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190096448A KR102468316B1 (en) 2019-08-08 2019-08-08 Time series prediction method and apparatus based on past prediction data

Country Status (1)

Country Link
KR (1) KR102468316B1 (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220076748A (en) * 2020-12-01 2022-06-08 주식회사 동녘 Method for generating weather prediction information and computing device for executing the method
KR20230022486A (en) * 2021-08-09 2023-02-16 배재대학교 산학협력단 Filtering and performance comparison system and method for correcting error values of time series data
KR102500534B1 (en) * 2022-06-02 2023-02-16 국민대학교산학협력단 Recurrent neural network based water resource information generating device and method
KR102612561B1 (en) * 2022-10-13 2023-12-11 디아이랩 주식회사 Apparatus for detecting data error of IoT sensor based on artificial intelligence and method therefor
KR102623020B1 (en) * 2023-09-11 2024-01-10 주식회사 슈파스 Method, computing device and computer program for early predicting septic shock through bio-data analysis based on artificial intelligence

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109150A (en) * 2000-09-28 2002-04-12 Fuji Electric Co Ltd Method for adaptively predicting time series data
JP2006092106A (en) * 2004-09-22 2006-04-06 Canon System Solutions Inc Prediction device, prediction method and program
KR20140068436A (en) * 2012-11-28 2014-06-09 한국지질자원연구원 Abnormality observation data detection method using time series prediction model and abnormality observation data of ground water level

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002109150A (en) * 2000-09-28 2002-04-12 Fuji Electric Co Ltd Method for adaptively predicting time series data
JP2006092106A (en) * 2004-09-22 2006-04-06 Canon System Solutions Inc Prediction device, prediction method and program
KR20140068436A (en) * 2012-11-28 2014-06-09 한국지질자원연구원 Abnormality observation data detection method using time series prediction model and abnormality observation data of ground water level

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220076748A (en) * 2020-12-01 2022-06-08 주식회사 동녘 Method for generating weather prediction information and computing device for executing the method
KR20230022486A (en) * 2021-08-09 2023-02-16 배재대학교 산학협력단 Filtering and performance comparison system and method for correcting error values of time series data
KR102500534B1 (en) * 2022-06-02 2023-02-16 국민대학교산학협력단 Recurrent neural network based water resource information generating device and method
KR102612561B1 (en) * 2022-10-13 2023-12-11 디아이랩 주식회사 Apparatus for detecting data error of IoT sensor based on artificial intelligence and method therefor
KR102623020B1 (en) * 2023-09-11 2024-01-10 주식회사 슈파스 Method, computing device and computer program for early predicting septic shock through bio-data analysis based on artificial intelligence

Also Published As

Publication number Publication date
KR102468316B1 (en) 2022-11-17

Similar Documents

Publication Publication Date Title
KR20210017342A (en) Time series prediction method and apparatus based on past prediction data
CN109816221B (en) Project risk decision method, apparatus, computer device and storage medium
US20210295100A1 (en) Data processing method and apparatus, electronic device, and storage medium
US11461847B2 (en) Applying a trained model to predict a future value using contextualized sentiment data
CN111091196B (en) Passenger flow data determination method and device, computer equipment and storage medium
US20220407352A1 (en) Spatio-temporal probabilistic forecasting of wind power output
US20120253945A1 (en) Bid traffic estimation
JP2017142781A (en) Random quotation and sudden change prediction
CN112232495B (en) Prediction model training method, device, medium and computing equipment
CN108681751B (en) Method for determining event influence factors and terminal equipment
CN112668238B (en) Rainfall processing method, rainfall processing device, rainfall processing equipment and storage medium
CN115082920A (en) Deep learning model training method, image processing method and device
CN110674397B (en) Method, device, equipment and readable medium for training age point prediction model
US11599746B2 (en) Label shift detection and adjustment in predictive modeling
CN113052063A (en) Confidence threshold selection method, device, equipment and storage medium
US11036980B2 (en) Information processing method and information processing system
Dorado-Moreno et al. Ordinal multi-class architecture for predicting wind power ramp events based on reservoir computing
CN110929849B (en) Video detection method and device based on neural network model compression
Binter Applied probabilistic forecasting
Muschinski et al. Predicting power ramps from joint distributions of future wind speeds
CN112784165A (en) Training method of incidence relation estimation model and method for estimating file popularity
WO2017004348A1 (en) Normalizing data sets for predicting an attribute of the data sets
CN111783883A (en) Abnormal data detection method and device
Benáček et al. Postprocessing of Ensemble Weather Forecast Using Decision Tree–Based Probabilistic Forecasting Methods
KR101830090B1 (en) System and method for optimizing portfolio, and executable digital media storing computational programs implementing the same

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant