KR20220109935A - Ansemble device for predicting the power - Google Patents

Ansemble device for predicting the power Download PDF

Info

Publication number
KR20220109935A
KR20220109935A KR1020210013547A KR20210013547A KR20220109935A KR 20220109935 A KR20220109935 A KR 20220109935A KR 1020210013547 A KR1020210013547 A KR 1020210013547A KR 20210013547 A KR20210013547 A KR 20210013547A KR 20220109935 A KR20220109935 A KR 20220109935A
Authority
KR
South Korea
Prior art keywords
data
prediction value
value
prediction
ensemble
Prior art date
Application number
KR1020210013547A
Other languages
Korean (ko)
Other versions
KR102533042B1 (en
Inventor
팔라디노 프랭크
임다니엘지섭
Original Assignee
주식회사 크로커스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 크로커스 filed Critical 주식회사 크로커스
Priority to KR1020210013547A priority Critical patent/KR102533042B1/en
Publication of KR20220109935A publication Critical patent/KR20220109935A/en
Application granted granted Critical
Publication of KR102533042B1 publication Critical patent/KR102533042B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02JCIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
    • H02J3/00Circuit arrangements for ac mains or ac distribution networks
    • H02J3/004Generation forecast, e.g. methods or systems for forecasting future energy generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02SGENERATION OF ELECTRIC POWER BY CONVERSION OF INFRARED RADIATION, VISIBLE LIGHT OR ULTRAVIOLET LIGHT, e.g. USING PHOTOVOLTAIC [PV] MODULES
    • H02S50/00Monitoring or testing of PV systems, e.g. load balancing or fault identification
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/50Photovoltaic [PV] energy

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Probability & Statistics with Applications (AREA)
  • Power Engineering (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

An ensemble device of the present invention may include: a first prediction value generation unit calculating a first prediction value of a solar power generation amount by using a first parameter; a second prediction value generation unit calculating a second prediction value of a solar power generation amount by using a second parameter; and an ensemble unit combining the first prediction value and the second prediction value to calculate an ensemble prediction value, which is a future solar power generation amount.

Description

전력 예측을 위한 앙상블 장치{Ansemble device for predicting the power}Ensemble device for predicting the power

본 발명은 두 가지 다른 종류의 전력 예측 방법을 결합하여 발전량을 예측하는 앙상블 장치에 관한 것이다. The present invention relates to an ensemble device for predicting power generation by combining two different types of power prediction methods.

최근 전력 산업에서 탈원전 및 미세 먼지, 이상 기후 등의 이슈들이 대두되면서 DR(Demand Response; 수요 반응), 신재생 에너지, ESS(Energy Storage System; 에너지 저장 장치), EMS(Energy Management System; 에너지 관리 장치)와 같은 청정 에너지 및 에너지 효율화의 중요성이 나날이 높아지고 있다.Recently, as issues such as de-nuclear power generation, fine dust, and abnormal climate have emerged in the power industry, DR (Demand Response), Renewable Energy, ESS (Energy Storage System), EMS (Energy Management System; Energy Management) device), the importance of clean energy and energy efficiency is increasing day by day.

DR의 적정 용량 산정, ESS 최적 운영계획, 신재생 에너지 발전량 예측과 같은 에너지 솔루션 관련 연구가 활발히 진행되고 있다.Energy solution-related research such as DR capacity calculation, ESS optimal operation plan, and renewable energy generation prediction is being actively conducted.

본 발명은 태양광 발전량을 예측하기 위해, 두 가지 다른 방법으로 발전량을 예측한 후 각 예측량에 망각률에 의존하는 가중치를 부여하여 미래 발전량인 앙상블 예측치를 산출하는 전력 예측을 위한 앙상블 장치를 제공할 수 있다. The present invention predicts the amount of power generation in two different ways in order to predict the amount of solar power generation, and then assigns a weight dependent on the forgetting rate to each predicted amount to provide an ensemble device for power prediction that calculates an ensemble predicted value that is the amount of future power generation. can

본 발명의 앙상블 장치는 제1 파라미터를 이용하여 태양광 발전량의 제1 예측치를 산출하는 제1 예측치 생성부, 제2 파라미터를 이용하여 태양광 발전량의 제2 예측치를 산출하는 제2 예측치 생성부, 제1 예측치와 상기 제2 예측치를 조합하여 미래의 태양광 발전량인 앙상블 예측치를 산출하는 앙상블부를 포함할 수 있다. The ensemble device of the present invention includes a first predicted value generator that calculates a first predicted value of the amount of solar power generation using a first parameter, a second predicted value generator that calculates a second predicted value of the amount of solar power that uses the second parameter; The ensemble unit may include an ensemble unit for calculating an ensemble predicted value that is a future solar power generation amount by combining the first predicted value and the second predicted value.

제1 파라미터는 단수이고, 제2 파라미터는 복수인 경우에는 제1 파라미터는 상기 제2 파라미터에 포함되지 않을 수 있다. When the first parameter is singular and the second parameter is plural, the first parameter may not be included in the second parameter.

제1 예측치 생성부는 제1 파라미터로 과거 또는 현재의 발전량 데이터를 선택하고, 과거 또는 현재의 발전량 데이터를 변환을 통해 분해하며, 상기 분해된 데이터를 이용해 미래 데이터를 산출하고, 상기 미래 데이터를 역변환을 통해 복원하여 미래 발전량인 제1 예측치를 산출할 수 있다. The first prediction value generator selects past or current generation data as a first parameter, decomposes the past or current generation data through transformation, calculates future data using the decomposed data, and performs inverse transformation of the future data It is possible to calculate the first predicted value, which is the amount of future power generation, by restoring it.

제1 예측치 생성부는 제1 파라미터로 과거 또는 현재의 발전량 데이터를 선택하고, 과거 또는 현재의 발전량 데이터를 변환을 통해 분해하는 웨이블릿부가 마련되며, 변환 및 분해를 위해 이산 웨이블릿 변환(DWT, Discrete Wavelet Transform)을 이용할 수 있고, 제1 예측부는 미래 데이터 산출을 위해 ARMA(AutorRegressive Moving Average) 모델을 이용할 수 있으며, 분해된 데이터를 이용해 미래 데이터를 산출하고, 미래 데이터를 역변환을 통해 복원하는 역변환부가 마련되며, 역변환부는 상기 역변환시 역 이산 웨이블릿 변환(IDWT, Inverse Discrete Wavelet Transform)을 이용할 수 있다.The first prediction value generator selects past or present power generation data as a first parameter, and a wavelet unit for decomposing the past or present power generation data through transformation is provided, and for transformation and decomposition, a discrete wavelet transform (DWT, Discrete Wavelet Transform) ) can be used, and the first prediction unit can use an AutorRegressive Moving Average (ARMA) model for future data calculation, and an inverse transform unit that calculates future data using the decomposed data and restores the future data through inverse transformation is provided. , the inverse transform unit may use an inverse discrete wavelet transform (IDWT) during the inverse transform.

제2 파라미터는 날짜, 기온, 풍속, 구름량, 습도 또는 이슬점중 어느 하나일 수 있다. The second parameter may be any one of date, temperature, wind speed, cloud amount, humidity, or dew point.

제2 예측치 생성부는, 특정된 상기 제2 파라미터에 따른 과거 또는 현재의 발전량을 그래프에 표시하고, 상기 표시된 데이터의 경향을 나타내는 식을 계산하여 상기 제2 예측치를 산출할 수 있다. The second predicted value generating unit may display a past or present power generation amount according to the specified second parameter on a graph, calculate an expression indicating a trend of the displayed data, and calculate the second predicted value.

제2 예측치 생성부에는, 특정된 상기 제2 파라미터에 따른 과거 또는 현재의 발전량을 표시하는 그래핑부가 마련되고, 그래핑부에 의해 표시된 데이터에 대하여, 노이즈 범위에 해당하는 엡실론 튜브(ε-tube)를 설정하여 노이즈 데이터에 해당하는 서포터 벡터(support vector)를 설정하는 노이즈 설정부가 구비되며, 서포터 벡터 회귀 모델(SVR, Support Vector Regression model)을 이용하여 상기 제2 예측치를 산출하는 제2 예측부가 마련될 수 있다. The second prediction value generating unit is provided with a graphing unit displaying the amount of power generation in the past or present according to the specified second parameter, and with respect to the data displayed by the graphing unit, an epsilon tube (ε-tube) corresponding to the noise range is provided. ), a noise setting unit for setting a support vector corresponding to the noise data is provided, and a second prediction unit for calculating the second prediction value using a support vector regression model (SVR) can be provided.

그래핑부에 의해 표시된 데이터가 비선형인 경우, 맵핑(mapping)을 통해 데이터들이 선형 관계를 가지게 하는 맵핑부가 마련되고, 맵핑부는 상기 맵핑을 위해 커널 함수(kernel function)를 이용할 수 있다. When the data displayed by the graphing unit is non-linear, a mapping unit for allowing the data to have a linear relationship through mapping is provided, and the mapping unit may use a kernel function for the mapping.

앙상블부는 상기 앙상블 예측치의 최적화를 위해 콘벡스 조합(Convex combination)을 이용할 수 있다. The ensemble unit may use a convex combination to optimize the ensemble prediction value.

앙상블부에는 상기 제1 예측치와 상기 제2 예측치에 가중치를 주는 가중치부가 마련될 수 있고, 제1 예측치와 상기 제2 예측치는 상기 앙상블 예측치에 기여하는 가중치가 다르게 설정되고, 가중치는 망각률(rate of forgetting)에 의해 결정되며,망각률은 실제 발전량 데이터와 상기 각 예측치간의 정확도에 기반하여 상기 제1 예측치 및 상기 제2 예측치에 가중치를 줄 수 있다. A weighting unit may be provided in the ensemble unit to give weights to the first prediction value and the second prediction value, and the first prediction value and the second prediction value are set to have different weights contributing to the ensemble prediction value, and the weight is set to a rate of forgetting. of forgetting), and the forgetting rate may give weight to the first predicted value and the second predicted value based on the accuracy between the actual power generation data and the respective predicted values.

제1 예측치가 yn이고, 상기 제2 예측치가 zn인 경우, 앙상블 예측치(wn)는 다음의 식으로 주어질 수 있고,

Figure pat00001
, an는 상기 제1 예측치의 상기 앙상블 예측치에 대한 기여도를 나타내는 제1 가중치이며, bn는 상기 제2 예측치의 상기 앙상블 예측치에 대한 기여도를 나타내는 제2 가중치이고, 제1 예측치와 상기 제2 예측치의 예측에 사용된 과거 또는 현재 데이터가 xn이며, 각 변수의 아래첨자는 앙상블 예측의 각 단계를 의미하고, 제1 가중치 및 상기 제2 가중치는 이전 단계의 제1 예측치, 이전 단계의 제2 예측치, 또는 망각률을 독립 변수로 가지는 종속 변수일 수 있다. When the first prediction value is y n and the second prediction value is z n , the ensemble prediction value w n can be given by the following equation,
Figure pat00001
, a n is a first weight indicating the contribution of the first prediction value to the ensemble prediction value, b n is a second weight indicating the contribution of the second prediction value to the ensemble prediction value, the first prediction value and the second The past or present data used for prediction of the prediction value is x n , the subscripts of each variable mean each stage of the ensemble prediction, and the first weight and the second weight are the first prediction value of the previous stage, the second weight of the previous stage 2 It may be a predictive value or a dependent variable having the rate of forgetting as an independent variable.

과거 또는 현재 데이터가 상기 제1 예측치와 상기 제2 예측치의 사이 값인 경우, 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어질 수 있고,When the past or current data is a value between the first prediction value and the second prediction value, the first weight and the second weight may be given by the following equations,

Figure pat00002
Figure pat00002

제1 예측치와 상기 제2 예측치가 동일한 경우, 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어질 수 있으며, When the first prediction value and the second prediction value are the same, the first weight and the second weight may be given by the following equation,

Figure pat00003
Figure pat00003

과거 또는 현재의 데이터가 상기 제1 예측치보다 크거나 같고, 상기 제1 예측치는 상기 제2 예측치보다 큰 경우 또는, 과거 또는 현재의 데이터가 상기 제1 예측치보다 작거나 같고, 상기 제1 예측치는 상기 제2 예측치보다 작은 경우에는,제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어질 수 있다. When past or present data is greater than or equal to the first prediction value, and the first prediction value is greater than the second prediction value, or when past or present data is less than or equal to the first prediction value, the first prediction value is the When it is smaller than the second predicted value, the first weight and the second weight may be given by the following equation.

Figure pat00004
Figure pat00004

과거 또는 현재의 데이터가 상기 제2 예측치보다 크거나 같고, 상기 제2 예측치는 상기 제1 예측치보다 큰 경우 또는, 과거 또는 현재의 데이터가 상기 제2 예측치보다 작거나 같고, 상기 제2 예측치는 상기 제1 예측치보다 작은 경우에는, 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어질 수 있다. When past or present data is greater than or equal to the second prediction value, and the second prediction value is greater than the first prediction value, or when past or present data is less than or equal to the second prediction value, the second prediction value is the When it is smaller than the first predicted value, the first weight and the second weight may be given by the following equation.

Figure pat00005
Figure pat00005

본 발명은 태양광 발전량을 예측하는 두 가지 방법의 예측치을 앙상블하는 전력량 예측을 위한 앙상블 장치로서, 제1 방법은 단변수 모델을 이용할 수 있고, 단변수로 과거 또는 현재의 태양광 발전량을 선택할 수 있으며, 제2 방법은 다변수 모델로서, 기온, 풍속, 상대습도 등의 외생적 파라미터일 수 있다. The present invention is an ensemble device for estimating the amount of electricity that ensembles the prediction values of two methods of predicting the amount of solar power generation, the first method can use a univariate model, and the past or present solar power generation can be selected as a univariate, , the second method is a multivariate model, and may be exogenous parameters such as temperature, wind speed, and relative humidity.

단변수 모델은 더 경제적이고, 더 빠르게 수행될 수 있으며, 짧은 시간에 대한 예측에도 효과적일 수 있고, 다변수 모델은 날짜, 온도, 풍속, 구름량, 강수량, 습도, 이슬점 등의 외부 외생적 요인들에 대한 예측에 효과적일 수 있다. Univariate models are more economical, perform faster, and can be effective for forecasting over a short period of time, while multivariate models are more cost-effective than exogenous factors such as date, temperature, wind speed, cloud cover, precipitation, humidity, and dew point. It can be effective in predicting

두 개의 예측치를 앙상블하기 위해 콘벡스 최적화를 위한 콘벡스 조합을 선택할 수 있고, 이로서 문제를 간단히 하여 앙상블 예측치를 계산할 수 있다. To ensemble the two predictions, we can choose a convex combination for convex optimization, which simplifies the problem to compute the ensemble predictions.

도 1은 본 발명의 앙상블 장치의 구조를 도시한 블록도이다.
도 2는 본 발명의 웨이블릿부를 설명한 것이다.
도 3은 본 발명의 제1 예측치 생성부에 의해 산출된 제1 예측치를 도시한 것이다.
도 4는 제2 예측치를 산출하기 위해 사용될 수 있는 커널 함수의 실시 예들을 도시한 것이다.
도 5는 본 발명의 웨이블릿부에 의한 이산 웨이블릿 변환(DWT, Discrete Wavelet Transform)을 설명하는 것이다.
도 6은 본 발명의 맵핑부에 의해 실제 데이터가 맵핑된 것을 도시한 것이다.
도 7은 도 6에 오차 또는 노이즈가 포함된 실시 예를 설명한 것이다.
도 8은 과거 또는 현재의 발전량 데이터가 비선형으로 주어지는 경우, 커널 함수를 이용하여 고차원에서 선형 데이터가 생성되는 것을 설명한 것이다.
1 is a block diagram showing the structure of an ensemble device of the present invention.
2 illustrates a wavelet portion of the present invention.
3 illustrates a first predicted value calculated by the first predicted value generator of the present invention.
4 illustrates embodiments of a kernel function that may be used to calculate a second prediction value.
5 is a diagram illustrating a Discrete Wavelet Transform (DWT) by the wavelet unit of the present invention.
6 shows actual data mapped by the mapping unit of the present invention.
7 illustrates an embodiment in which an error or noise is included in FIG. 6 .
FIG. 8 illustrates that, when past or present power generation data is non-linear, linear data is generated in a high dimension using a kernel function.

본 발명은 태양광 발전양을 예측하는 두 가지 방법의 예측값을 앙상블(ensemble)하는 전력량 예측 장치에 관한 것이다. The present invention relates to an wattage prediction device that ensembles prediction values of two methods for estimating the amount of solar power generation.

비교적 짧은 시간 간격의 예측을 위해서, 태양 방사, 태양의 지속시간, 기온, 풍속, 상대 습도의 정보를 모으고 저장할 수 있는 기상관측소를 설치하고 유지하는 것은 비용이 과도하게 들 수 있다. 인공위성 사진이나 수치적 기상 예측도 또한 제한적일수 있다. 또한, 적절히 짧은 시간 간격동안, 상기의 전력량 예측에 사용될 수 있는 데이터에 대한 정보를 제공하는 중간 다리 역할을 하는 써드 파티(third party) 또한 기대하기 어려울 수 있다. For relatively short time-interval forecasts, it can be prohibitively expensive to set up and maintain a meteorological station that can collect and store information on solar radiation, solar duration, temperature, wind speed, and relative humidity. Satellite images or numerical weather forecasts may also be limited. In addition, it may be difficult to expect a third party that acts as an intermediate bridge to provide information about the data that can be used to predict the amount of electricity for a reasonably short time interval.

전력을 예측하는 제1 방법은 단변수 모델(univariate model)일 수 있고, 앙상블 조합을 위한 제1 예측치(P1)는 제1 예측치(P1) 생성부(100)를 통해 생성될 수 있다. A first method of predicting power may be a univariate model, and a first prediction value P1 for ensemble combination may be generated through the first prediction value P1 generator 100 .

단변수 모델은 매우 짧은 시간동안의 예측에 있어서, 경제적이고, 계산을 빠르게 수행할 수 있으며, 현실적일 수 있다. 단변수 모델은 기온, 풍속, 상대 습도 등과 같은 다른 요소들의 시계열 값이 아닌, 현재 또는 과거의 전력 시계열 값의 함수일 수 있고, 변수로 제1 파라미터(R1)를 이용할 수 있으며, 제1 파라미터(R1)는 과거 또는 현재의 발전량(P0)일 수 있다. Univariate models can be economical, computationally fast, and realistic for very short time predictions. The univariate model may be a function of a current or past power time series value, not a time series value of other factors such as temperature, wind speed, relative humidity, etc., may use a first parameter R1 as a variable, and may use a first parameter R1 ) may be the past or present power generation (P0).

전력을 예측하는 제2 방법은 다변수 모델(multivariate model)일 수 있고, 앙상블 조합을 위한 제2 예측치(P2)는 제2 예측치(P2) 생성부(200)를 통해 생성될 수 있고, 변수로 제2 파라미터(R2)를 이용할 수 있으며, 제2 파라미터(R2)는 날짜, 기온, 풍속, 구름량, 습도 또는 이슬점중 적어도 어느 하나를 포함할 수 있다. 대부분의 다변수 모델은 넓은 범위의 입력 데이터를 요구할 수 있다. 이러한 다변수 모델에서 입력 데이터의 제한된 사용은 낮은 정확도를 야기할 수 있다. 게다가, 입력 데이터에서의 부정확도는 출력으로 전달되고, 이러한 에러들은 축적될 수 있다. 단변수 모델은 기온, 풍속, 상대습도 등과 같은 외생적 입력에 대한 해석이 부족하고, 이는 단변수 모델이 외생적 충격 발생에 대한 예측 에러로 이어질 수 있는, 외생 변수에서의 근본 변화로부터 초래되는 변화들을 통합하거나 고려하기가 어려울 수 있다. 따라서, 이는 서로 상호보완적인 알고리즘이나 예측 방법을 앙상블 조합하는 것으로 이어질 수 있다. The second method of predicting power may be a multivariate model, and the second prediction value P2 for the ensemble combination may be generated through the second prediction value P2 generator 200 , and as a variable The second parameter R2 may be used, and the second parameter R2 may include at least one of date, temperature, wind speed, cloud amount, humidity, and dew point. Most multivariate models can require a wide range of input data. The limited use of input data in these multivariate models can lead to low accuracy. In addition, inaccuracies in the input data are propagated to the output, and these errors can accumulate. Univariate models lack interpretation of exogenous inputs, such as temperature, wind speed, relative humidity, etc. may be difficult to incorporate or consider. Thus, this can lead to ensemble combinations of algorithms or prediction methods that are complementary to each other.

가장 대략적인 시간 스텝 메쉬(the coarsest time step mesh)에 걸쳐 발생하는 볼록 조합(convex combination) 파라미터의 전개(evolution)는 예측 변수들의 볼록 조합을 생성하기 위해, 볼록 최적화 앙상블(convex optimizer ensemble)을 이용할 수 있다. 망각률(a rate of forgetting)을 가진 볼록 조합 파라미터의 전개는, 과거 정확도에 기반한 각 예측인자의 수행에 가중치를 줄 수 있다. 이는 메쉬에서 가장 최근에 구별되는 값을 가진 두 예측 변수에 있어서, 이 두 예측 변수의 국소적(localized) 선형 조합이 더 미세한 시간 스텝 메쉬(the finer time step mesh)에 적용될 수 있게 한다. Evolution of convex combination parameters occurring over the coarsest time step mesh uses a convex optimizer ensemble to generate a convex combination of predictors. can The evolution of the convex combinatorial parameters with a rate of forgetting can weight the performance of each predictor based on past accuracy. This enables the localized linear combination of the two predictors to be applied to the finer time step mesh for the two predictors with the most recent distinct values in the mesh.

이러한 방식으로, 본 발명의 앙상블 예측은 다변수 모델에서 시간 스텝사이의 중간 갭에서, 단변수 모델로부터 추가적인 정확도를 뽑아낼 수 있어 짧은 구간 추정을 가능케할 수 있다. 기본이 되는 두 개의 모델은 상호보완적인 장점을 가지고 있기 때문에, 그리고 다변수 모델은 외부 입력의 변화 발생에 특별히 강력하기 때문에, 망각을 가진 볼록 최적화 앙상블 접근은 단변수 모델의 수행이 저조한 때 다변수 모델이 보충하고 배경속으로 사라지게 하여 양쪽 모델의 장점을 모두 가질 수 있다. In this way, the ensemble prediction of the present invention can extract additional accuracy from the univariate model at the intermediate gap between time steps in the multivariate model, enabling short interval estimation. Because the underlying two models have complementary advantages, and because multivariate models are particularly robust to the occurrence of changes in external inputs, the convex optimization ensemble approach with oblivion is useful when multivariate models perform poorly. You can have the best of both models by allowing the model to supplement and disappear into the background.

제1 예측치(P1) 생성부(100)는 특정 파라미터에 대한 일련의 데이터를 원하는 기본 단위 블럭인 웨이블릿 등으로 분해하는 웨이블릿부(120), 상기 웨이블릿을 이용하여 미래의 값을 예측하는 제1 예측부(140), 상기 웨이블릿부(120)와 제1 예측부(140)를 통해 분해되고 예측된 값을 다시 조합하는 역변환부(160)를 포함할 수 있다. The first prediction value (P1) generating unit 100 includes a wavelet unit 120 that decomposes a series of data for a specific parameter into a desired basic unit block, such as a wavelet, and a first prediction that predicts a future value using the wavelet. It may include a unit 140 and an inverse transform unit 160 that recombines the values decomposed and predicted by the wavelet unit 120 and the first prediction unit 140 .

단변수 모델의 예측치는 먼저 이산 웨이블릿 변환(DWT, Discrete Wavelet Transform)을 통한 웨이블릿 분해를 통해 얻어질 수 있고, ARMA 모델(AutorRegressive Moving Average)을 이용해 파라미터를 독립적인 시계열로 예측할 수 있으며, 마지막으로 역이산 웨이블릿 변환(IDWT, Inverse Discrete Wavelet Transform)을 이용해 파라미터 시계열에 대한 예측치를 다시 조합할 수 있다. 상기 예측치는 사용자가 예측하고자 하는 시계열에 대한 특정 물리양일 수 있고, 예를 들어, 태양광 발전에서의 발전 전력량을 의미할 수 있다. 시계열에 따른 특정 파라미터 데이터를 분석함에 있어, 분해, 예측, 조합의 일련의 과정을 위한 다양한 방법이 존재할 수 있으나, DWT 및 IDWT를 수행하기 위한 코딩 패키지 프로그램이 존재하기 때문에 일련의 과정을 수행하기 쉬울 수 있다. 이러한 패키지 프로그램에 의해서 분해 레벨(level), 웨이블릿의 종류 등과 같은 모델내에서의 수많은 구조적 변화는 함수의 간단한 파라미터의 조작을 통해 수행될 수 있다. The predicted value of the univariate model can first be obtained through wavelet decomposition through the discrete wavelet transform (DWT), and the parameters can be predicted as an independent time series using the ARMA model (AutorRegressive Moving Average), and finally the inverse Predictions for the parametric time series can be reassembled using the Inverse Discrete Wavelet Transform (IDWT). The predicted value may be a specific physical quantity for a time series that the user wants to predict, for example, it may mean the amount of power generated in solar power generation. In analyzing specific parameter data according to time series, various methods for a series of processes of decomposition, prediction, and combination may exist, but since there are coding package programs for performing DWT and IDWT, it is easy to perform a series of processes can Numerous structural changes in the model such as decomposition levels and wavelet types by such a package program can be performed through simple parameter manipulation of functions.

웨이블릿 변환은 푸리에 변환(Fourier transform) 또는 윈도우 푸리에 변환(Windowed Fourier transform)과 유사하지만 메릿 함수(merit function)은 매우 다를 수 있다. 메릿 함수는 실제 데이터와 특정 파라미터의 선택에 따른 예측 모델의 예측치간의 일치성을 나타낼 수 있고, 서로 일치할수록 메릿 함수는 작을 수 있다. 파라미터들을 조정함으로서 메릿 함수를 최소로하는 조합을 찾아낼 수 있다.A wavelet transform is similar to a Fourier transform or a Windowed Fourier transform, but the merit function can be very different. The merit function may indicate the correspondence between the actual data and the prediction value of the prediction model according to the selection of a specific parameter, and the more the merit function matches each other, the smaller the merit function may be. By adjusting the parameters, one can find the combination that minimizes the merit function.

웨이블릿 변환은 높은 스케일에 해당하는 고주파 성분의 신호에 대해서는 시간 해상도를 높여 촘촘하게 될 수 있고 주파수 해상도를 낮추어 듬성하게 될 수 있다. 그러나, 낮은 스케일에 해당하는 저주파 성분의 신호에 대해서는 주파수 해상도를 높여 듬성하게 될 수 있으며 시간 해상도를 낮추어 듬성하게 될 수 있다. The wavelet transform may be dense by increasing the temporal resolution for a signal of a high-frequency component corresponding to a high scale, and may be coarse by decreasing the frequency resolution. However, for a signal of a low frequency component corresponding to a low scale, the frequency resolution may be increased to become coarser, and the temporal resolution may be decreased to become coarser.

푸리에 변환은 신호를 사인(sines)과 코사인(cosines)으로 분해할 수 있다. 다시 말해, 함수는 푸리에 공간에 국소화될 수 있다. 반대로 웨이블릿 변환은 실제 공간 및 푸리에 공간 모두에 국소화된 함수를 사용할 수 있다. 즉, 서로 다른 기초 함수(basis function)가 사용될 수 있고, 푸리에 변환의 기초 함수는 사인과 코아인이며, 웨이블릿 변환의 기초 함수는 웨이블릿일 수 있다. 웨이블릿의 기초 함수는 각 주파수 영역에 따라 다양할 수 있다. The Fourier transform can decompose a signal into sines and cosines. In other words, the function can be localized in Fourier space. Conversely, wavelet transforms can use functions localized in both real space and Fourier space. That is, different basis functions may be used, the basis functions of the Fourier transform may be sine and core, and the basis function of the wavelet transform may be a wavelet. The fundamental function of the wavelet may vary according to each frequency domain.

도 4는 상호 직교성을 갖춘 대표적 스케일링 함수와 그 웨이블릿 패밀리를 도시한 것일 수 있다. 도 4의 (a)는 하아(Haar) 스케일링 함수를 도시한 것일 수 있다. 도 4의 (b) 및 (c)는 드뷔시(Daubechies) 스케일링 함수를 나타낸 것일 수 있다. 드뷔시 스케일링 함수는 Daubechies 4, Daubechies 6 등과 같이 표현되고, 4,6의 숫자는 상기 수학식 1에서 ak의 영(zero)이 아닌 개수를 의미할 수 있다. 도 4의 (b)는 Daubechies 4를 도시한 것이고, 도 4의 (c)는 Daubechies 20을 도시한 것일 수 있다. 웨이블릿 함수의 개수가 증가함에 따라 그래프가 더 부드러워지는 것을 알 수 있다. 4 may show a representative scaling function having mutual orthogonality and a wavelet family thereof. 4A may be a diagram illustrating a Haar scaling function. 4 (b) and (c) may represent a Debussy (Daubechies) scaling function. The Debussy scaling function is expressed as Daubechies 4, Daubechies 6, and the like, and the numbers 4 and 6 may mean a non-zero number of a k in Equation 1 above. FIG. 4(b) may show Daubechies 4, and FIG. 4(c) may show Daubechies 20. FIG. It can be seen that the graph becomes smoother as the number of wavelet functions increases.

웨이블릿 변환에는 이산 웨이블릿 변환과 연속 웨이블릿 변환(CWT, continuous wavelet transform)이 포함될 수 있고, CWT에 비해 DWT는 기초 함수들간에 직교성을 부여할 수 있기에 더욱 간단할 수 있다. 따라서, DWT는 예측치 계산 시간이 충분히 빠를 수 있다. Wavelet transform can include discrete wavelet transform and continuous wavelet transform (CWT), and compared to CWT, DWT can be simpler because it can impart orthogonality between elementary functions. Therefore, the DWT can be fast enough for the prediction calculation time.

웨이블릿 변환은 웨이블릿을 스케일링(scaling)(주파수에 대한 확장과 축소)하고 함수 이동(translation)(시간축에 대한 이동)으로 신호를 분석해낼 수 있다. The wavelet transform scales the wavelet (expands and contracts with respect to frequency) and can analyze the signal by function translation (translation with respect to the time axis).

웨이블릿은 스케일의 특성을 묘사하는 스케일링 함수(scaling function)로부터 만들어질 수 있다. 스케일링 함수(φ)는 자신의 함수 이동(discrete translation)에 대해 직교해야 한다는 제한을 가질 수 있고, 예를 들어, 이러한 제한은 수학식 1의 확장 공식(dilation equation)을 만족할 수 있다. A wavelet can be created from a scaling function that describes the properties of the scale. The scaling function φ may have a constraint that it must be orthogonal to its discrete translation, for example, this constraint may satisfy the dilation equation of Equation 1.

Figure pat00006
Figure pat00006

S는 스케일링 인자(scaling factor)이고, 주로 2일 수 있으며, 함수는 정규화될 수(normalized) 있다. 스케일링 함수는 자신의 정수 이동(integer translation)에 대해 직교해야 할 수 있다. 이는 수학식 2와 같이 표현될 수 있다. S is a scaling factor, and may be mainly 2, and the function may be normalized. A scaling function may need to be orthogonal to its integer translation. This can be expressed as Equation (2).

Figure pat00007
Figure pat00007

즉, 신호는 웨이블릿으로 나누어지고, 웨이블릿은 스케일링 함수로부터 구성될 수 있으며, 상기 기초 함수를 함수 이동시키고, 스케일링하여 웨이블릿을 구성할 수 있다. DWT시 계산을 위해서 무수한 스케일링과 함수 이동이 필요할 수 있다. 웨이블릿은 경계는 축에 대한 상한과 하한이 존재하고, 이를 가지고 스펙트럼을 모두 포함시키기 위해서, 스펙트럼의 남은 빈 공간이 충분히 작아지면 그 공간을 다른 함수인 스케일링 함수로 대신할 수 있다. 즉, 스케일링 함수는 저주파 스펙트럼의 필터일 수 있다. That is, the signal is divided into wavelets, and the wavelet may be constructed from a scaling function, and the basic function may be moved and scaled to construct a wavelet. Countless scaling and function shifts may be required for calculations in DWT. A wavelet boundary has upper and lower bounds on the axis, and in order to include all spectra with it, if the remaining empty space of the spectrum becomes small enough, the space can be replaced with another function, a scaling function. That is, the scaling function may be a filter of a low frequency spectrum.

신호는 스케일링 함수 부분과 웨이블릿 함수의 합으로 표현될 수 있다. 스케일링 함수가 더해지기 전에 각 스케일링 함수에 곱해지는 계수를 스케일링 계수라고 할 수 있고, 웨이블릿 함수가 더해지기 전에 각 웨이블릿 함수에 곱해지는 계수를 웨이블릿 계수라고할 수 있다. 이는 신호를 거친 근사(approximation)와 신호와 거친 근사의 차이인 상세(detail)를 더한 것과 같을 수 있다. 이는 신호를 평균 신호와 신호와 평균의 차이로 표현한 것과 같을 수 있다. 따라서, 근사는 저주파 성분일 수 있고, 상세는 고주파 성분일 수 있다. 상기 계수는 각 대역의 필터를 통과한 값을 의미할 수 있고, 스케일링 계수는 저주파 대역을 통과한 것일 수 있으며, 웨이블릿 계수는 고주파 대역을 통과한 것일 수 있다. 결과적으로 웨이블릿 변환은 신호를 전체적인 내용을 담은 저주파 성분과 세부 사항을 담은 고주파 성분으로 분해하는 것일 수 있다. The signal can be expressed as the sum of the scaling function part and the wavelet function. A coefficient multiplied by each scaling function before the scaling function is added may be referred to as a scaling coefficient, and a coefficient multiplied by each wavelet function before the wavelet function is added may be referred to as a wavelet coefficient. This may be equivalent to adding detail, which is the difference between the signal and the coarse approximation and the signal coarse approximation. This may be the same as expressing the signal as the average signal and the difference between the signal and the average. Thus, the approximation may be a low frequency component, and the detail may be a high frequency component. The coefficient may mean a value that has passed through the filters of each band, the scaling coefficient may have passed through a low frequency band, and the wavelet coefficient may have passed through a high frequency band. As a result, the wavelet transform can decompose the signal into a low-frequency component containing the overall content and a high-frequency component containing the details.

도 2를 참조하면, 일 실시 예로, y축은 시간에 따른 태양광 발전량 데이터를 나타내고, x축은 시간을 나타낼 수 있다. 발전량 데이터(파란색)에 첫번째 웨이블릿 변환을 수행시, 근사 계수(Approximation coefficients)와 상세 계수(detail coefficients )로 나뉠 수 있고, 근사 계수는 저주파 통과 필터를 상세 계수는 고주파 통과 필터를 통과한 것일 수 있다. 고주파 대역은 관심있는 가장 작은 상세 성분을 포함하고 있으므로 분해를 멈추고, 두번째 웨이블릿 변환을 저주파 대역을 통과한 근사 계수에 대하여 행하여 다시 저주파 대역과 고주파 대역으로 나눌 수 있다. Referring to FIG. 2 , according to an embodiment, the y-axis may represent data on the amount of solar power generation according to time, and the x-axis may represent time. When the first wavelet transform is performed on the power generation data (blue), it can be divided into approximate coefficients and detail coefficients. . Since the high-frequency band contains the smallest detail component of interest, the decomposition is stopped, and a second wavelet transform is performed on the approximate coefficients that have passed the low-frequency band, and can be further divided into a low-frequency band and a high-frequency band.

도 2는 이러한 분해를 3단계 레벨까지 한것을 도시한 것이다. 예를 들어, 3단 레벨 분해는 1개의 근사 계수 결과와 3개의 상세 계수 결과를 얻을 수 있다. 상기 분해 레벨은 사용자가 결정할 수 있다. Figure 2 shows this decomposition up to three levels. For example, a three-level decomposition can yield one approximate coefficient result and three detailed coefficient results. The decomposition level may be determined by the user.

웨이블릿부(120)에 의해 웨이블릿을 분해하여 얻은 계수 데이터를 바탕으로 제1 예측부(140)는 계수(coefficents)에 대한 예측치를 생성할 수 있다. 예를 들어, 제1 예측부(140)는 ARMA 모델(Autoregressive Moving Average)을 사용할 수 있다. Based on the coefficient data obtained by decomposing the wavelet by the wavelet unit 120 , the first prediction unit 140 may generate prediction values for coefficients. For example, the first predictor 140 may use an Autoregressive Moving Average (ARMA) model.

ARMA 모델은 AR(Autocorrelation) 모델과 MA(Moving Average) 모델을 합친 것일 수 있다. AR 모델은 특정 변수에 대하여 특정 변수의 이전의 값이 이후의 값에 영향을 미치는 것을 반영한 것일 수 있다. 즉, 예측값은 이전의 값의 영향과 화이트 노이즈 영향 부분의 합으로 주어질 수 있다. MA 모델은 특정 변수의 평균값의 변화 경향을 예측치에 반영하는 모델로서, 이전 에러값으로부터 예측치를 구하는 방법이다. 따라서, 이들을 합친 ARMA 모델에서, 예측치는 이전의 자신의 값, 이전 에러의 값, 화이트 노이즈를 포함할 수 있고, 다음과 같이 표현될 수 있다. 수학식 3은 ARMA(1,1) 모델일 수 있다. The ARMA model may be a combination of an autocorrelation (AR) model and a moving average (MA) model. The AR model may reflect the influence of a previous value of a specific variable on a subsequent value with respect to a specific variable. That is, the predicted value may be given as the sum of the influence of the previous value and the part affected by the white noise. The MA model reflects the change trend of the average value of a specific variable in the predicted value, and is a method of obtaining the predicted value from the previous error value. Therefore, in the combined ARMA model, the predicted value may include the previous own value, the previous error value, and white noise, and may be expressed as follows. Equation 3 may be an ARMA(1,1) model.

Figure pat00008
Figure pat00008

따라서, 자신의 과거 데이터를 바탕으로 미래를 예측하는 통계 기법인 ARMA를 이용하여, 웨이블릿부(120)에 의해 얻은 과거 계수로부터 미래의 계수 예측치를 구할 수 있다. Accordingly, future coefficient prediction values can be obtained from the past coefficients obtained by the wavelet unit 120 using ARMA, which is a statistical technique for predicting the future based on own past data.

역변환부(160)는 상기 제1 예측부(140)에서 생성된 계수 예측치를 다시 역 이산 웨이블릿 변환(IDWT, Inverse Discrete Wavelet Transform)을 하여 원래 분해전의 시간-발전량 공간으로 되돌릴 수 있다. 따라서, 계수 예측치로부터 IDWT를 통해 복원된 데이터는 태양광 발전량일 수 있다. The inverse transform unit 160 may perform inverse discrete wavelet transform (IDWT) again on the coefficient predicted value generated by the first predictor 140 to return it to the original time-generation space before decomposition. Therefore, the data restored through the IDWT from the coefficient prediction may be the amount of solar power generation.

도 3를 참조하면, 과거의 발전량(파란색)을 기반으로 미래의 발전량(빨간색)이 예측된 것을 알 수 있다. Referring to FIG. 3 , it can be seen that the future generation amount (red) is predicted based on the past generation amount (blue color).

제2 예측치(P2) 생성부(200)는 실제 데이터를 그래프에 표시하는 그래핑부(220), 엡실론(ε) 튜브를 생성하고 서포터 벡터(V)(Support vector)를 찾는 노이즈 설정부(240), 상기 실데이터로부터 예측치인 제2 예측치(P2)를 생성하는 제2 예측부(260)를 포함할 수 있다. The second predicted value (P2) generating unit 200 includes a graphing unit 220 that displays actual data on a graph, and a noise setting unit 240 that generates an epsilon (ε) tube and finds a supporter vector (V) (Support vector). ), and a second prediction unit 260 that generates a second prediction value P2 that is a prediction value from the real data.

제2 예측치(P2) 생성부(200)는 다변수 모델을 사용하여 제2 예측치(P2)를 생성할 수 있다. 다변수 모델은 방사 기초 커널 함수를 가진 SVM(Support Vector Machine에 기반한 회귀 모델(SVR, Support Vector Regression model)일 수 있고, 다양한 파라미터들에 대하여 회귀 모델을 구현할 수 있다. 예를 들어, 회귀는 다음 7가지 파라미터에 관한 7차원 메트릭스(metrics)에 관한 것일 수 있다. 7가지 파라미터는, 한해 일수(day of the year), 기온, 풍속, 구름량(sky cover), 습도, 이슬점일 수 있다. 이러한 파라미터들은 SVR 테크닉에 적용하기 전에, 제로 평균과 단위 분산을 가지게 정규화(normalize)될 수 있다. 설정된 차원의 유용성에 따라 입력하는 차원의 수를 조절할 수 있다. The second predicted value P2 generator 200 may generate the second predicted value P2 using the multivariate model. The multivariate model may be a support vector regression model (SVR) based on a support vector machine (SVM) with a radial-based kernel function, and may implement a regression model for various parameters. For example, the regression is It may relate to seven-dimensional metrics for seven parameters, the seven parameters may be days of the year, temperature, wind speed, sky cover, humidity, dew point. The parameters can be normalized to have zero mean and unit variance before applying the SVR technique, and the number of input dimensions can be adjusted according to the usefulness of the set dimension.

SVM의 알고리즘과 주요 특징들은 SVR에도 또한 사용될 수 있다. 즉, SVR은 SVM과의 몇가지 차이를 제외하면 SVM의 분류 기본 원칙들을 사용할 수 있다. 무엇보다, 출력값이 숫자이기 때문에 무한한 가능성을 가진 정보를 예측하는 것은 어려울 수 있다. The algorithms and key features of SVM can also be used for SVR. That is, SVR can use the basic principles of classification of SVM except for some differences from SVM. First of all, it can be difficult to predict information with infinite possibilities because the output is a number.

SVR의 중요한 점은 에러를 최소화하고, 마진(margin)을 최대화하는 초평면(hyperplane)을 개별화(individualizaing)하며, 에러의 일부가 허용되는 것일 수 있다. An important point of SVR is that it minimizes errors and individualizes a hyperplane that maximizes margins, and some of the errors may be tolerated.

SVM은 분류(classification) 문제를 해결하기 위한 것이고, 이를 위해 마진과 다른 종류를 구분하기 위해 초평면을 이용할 수 있다. SVM is to solve the classification problem, and for this purpose, a hyperplane can be used to distinguish margins from other types.

SVR은 데이터가 주어진 경우, 그 데이터를 잘 설명할 수 있는 선을 찾는 것이라고 할 수 있다. 그래핑부(220)는 실제 데이터를 그래프상에 표시할 수 있고, x축은 독립 변수로서의 파라미터이며, y축은 목표치로서, 예를 들어 태양광 발전 전력량일 수 있다. 예를 들어, x축을 기온으로 선택시, 그래핑부(220)는 기온에 따른 발전량을 그래프에 표시할 수 있고, 이들 간의 관계를 가장 적절하게 나타낼 수 있는 직선 또는 곡선을 찾는 것이 SVR의 목표일 수 있다. 상기 직선 또는 곡선을 SVR 회귀식이라고 할 수 있다. SVR can be said to find a line that can explain the data well given the data. The graphing unit 220 may display actual data on a graph, an x-axis may be a parameter as an independent variable, and a y-axis may be a target value, for example, solar power generation power. For example, when the x-axis is selected as the temperature, the graphing unit 220 may display the amount of power generation according to the temperature on the graph, and the goal of the SVR is to find a straight line or curve that can most appropriately represent the relationship between them. can The straight line or curve may be referred to as an SVR regression equation.

초평면으로부터 엡실론(ε) 튜브가 설정될 수 있고, 엡실론 튜브보다 거리가 먼 데이터들은 노이즈에 해당할 수 있으며, 상기 먼 데이터들은 SVR 회귀식을 구하는데 사용되지 않을 수 있다. 상기 먼 데이터를 서포터 벡터(V)(Support Vector)라고 할 수 있다. 즉, 서포터 벡터(V)를 제외한 엡실론 튜브내에 있는 데이터만으로 가장 적절한 SVR 회귀식을 도출할 수 있다. 도면에서는 독립변수 1개와 종속 변수 한개의 2차원으로 표현하였지만, 파라미터인 독립 변수는 예를 들어, 날짜, 풍속, 구름량, 습도, 이슬점 등을 포함할 수 있어, 초평면과 서포터 벡터(V)는 고차원에서 표현될 수 있다. An epsilon (ε) tube may be set from the hyperplane, data more distant than the epsilon tube may correspond to noise, and the far data may not be used to obtain an SVR regression equation. The far data may be referred to as a support vector (V). That is, the most appropriate SVR regression equation can be derived only from the data in the epsilon tube excluding the supporter vector (V). In the drawing, one independent variable and one dependent variable are expressed in two dimensions, but the independent variable as a parameter may include, for example, date, wind speed, cloud amount, humidity, dew point, etc., so the hyperplane and supporter vector (V) are It can be expressed at a higher level.

SVM은 마진을 최대화하고 에러를 최소화하는 것이 목표일 수 있다. 예를 들어, 초평면은 직선의 식으로 주어질 수 있고, y=wx+b로 표현될 수 있다. 엡실론 튜브를 나타내는 결정 경계(decision boundary)간의 거리는 직선식의 기울기인 w에 의존할 수 있고, 2/

Figure pat00009
로 주어질 수 있다.
Figure pat00010
은 벡터 노름(vector norm)이고 다음과 같이 정의될 수 있고, SVM은 2/
Figure pat00011
을 최대화하는 문제로 귀결될 수 있다. 문제 해결에는 노름의 루트때문에 제곱을 하는것이 더 편하고 같은 결과로 유도되기 때문에, 2/
Figure pat00012
를 최대화하는 문제와 같을 수 있다. SVM may aim to maximize margin and minimize error. For example, the hyperplane may be given by the equation of a straight line, and may be expressed as y=wx+b. The distance between the decision boundaries representing the epsilon tube may depend on the slope of the straight line, w, 2/
Figure pat00009
can be given as
Figure pat00010
is the vector norm and can be defined as: SVM is 2/
Figure pat00011
can lead to the problem of maximizing Because it is more convenient to square the root of the norm for solving the problem and leads to the same result, 2/
Figure pat00012
It can be the same as the problem of maximizing .

Figure pat00013
Figure pat00013

SVR에서는 SVM과는 목적이 다르기에, SVM의 식과 형태는 같으나 다른 의미로 사용될 수 있고, 예를 들어, 데이터에 대한 미세한 설명력은 낮아질 수 있지만 미래 예측 값의 변화에 훨씬 안정적이며, 과적합(overfitting)을 피하기 위해 회귀 계수 w를 낮추어 평편하게 만들 필요가 있다. 따라서, SVR에서는

Figure pat00014
/2 를 최소화하는 문제로 바뀔 수 있고,
Figure pat00015
/2 는 회귀식의 평편도를 나타내는 것일 수 있다. 따라서, SVR의 목적은 회귀 계수의 크기를 작게하여 회귀식을 평평하게 만들지만 실제 데이터와 예측치의 차이를 되도록 작게 하는 것일 수 있다. In SVR, since the purpose is different from that of SVM, the formula and form of SVM are the same but can be used in different meanings. ), it is necessary to flatten the regression coefficient w by lowering it. Therefore, in SVR
Figure pat00014
can be turned into a problem of minimizing /2,
Figure pat00015
/2 may indicate the flatness of the regression equation. Therefore, the purpose of the SVR may be to make the regression equation flat by reducing the size of the regression coefficient, but to make the difference between the actual data and the predicted value as small as possible.

엡실론 튜브는 사용자가 지정한 값으로 설정될 수 있고, 이는 허용하고자 하는 노이즈의 정도를 의미할 수 있다. 크사이(ξ)는 엡실론 튜브 밖으로 벗어난 거리를 의미하고, 이러한 튜브 밖의 실제 값에는 가중치의 배율로 패널티를 부여할 수 있다. 즉, SVR은 데이터에 노이즈가 있음을 가정하고, 엡실론 튜브내(2ε)내에서는 실제 데이터와 예측치의 차이를 허용하는 것일 수 있다. The epsilon tube may be set to a value specified by a user, which may mean a desired level of noise. The xi (ξ) means a distance out of the epsilon tube, and a penalty may be given to an actual value outside the tube by a multiplier of the weight. That is, the SVR assumes that there is noise in the data, and may allow a difference between the actual data and the predicted value within the epsilon tube (2ε).

회귀식과 엡실론 튜브간에 제한(constraints) 조건이 생길 수 있고, 상부의 제한 조건은 튜브 위쪽에 있는 가장 가까운 서포터 벡터(V)까지의 거리(

Figure pat00016
)에 대한 제한식이고, 후부의 제한 조건은 튜브 아랫쪽의 가장 가까운 서포터 벡터(V)까지의 거리(
Figure pat00017
)에 대한 제한식일 수 있다. A constraint condition may occur between the regression equation and the epsilon tube, and the upper constraint condition is the distance to the nearest supporter vector (V) above the tube (
Figure pat00016
), and the rear limiting condition is the distance to the nearest supporter vector (V) at the bottom of the tube (
Figure pat00017
) can be a limiting expression for

따라서, SVR의 문제는 수학식 5를 수학식 6의 제한 조건에서 푸는 문제로 귀결될 수 있다. Therefore, the problem of SVR can be concluded as a problem of solving Equation 5 under the constraint condition of Equation 6.

Figure pat00018
Figure pat00018

Figure pat00019
Figure pat00019

라그랑지 멀티플라이어 등의 기법을 이용하여 상기 식을 풀면 b를 얻을 수 있고, 이로서 원하는 SVR 회귀식을 얻을 수 있다. By solving the above equation using a Lagrangian multiplier or the like, b can be obtained, thereby obtaining a desired SVR regression equation.

따라서, 제2 예측치(P2) 생성부(200)는 그래핑부(220)에서 실제 데이터를 그래프에 표시하고, 노이즈설정부에서 엡실론 튜브를 설정하여 서포터 벡터(V)를 설정할 수 있으며, 제2 예측부(260)에서는 발전량의 예측치에 해당하는 SVR 회귀식을 구할 수 있어 제2 예측치(P2) 생성부(200)에서는 두번째 예측치인 제2 예측치(P2)가 생성될 수 있다. Accordingly, the second predicted value P2 generator 200 may display the actual data on the graph in the graphing unit 220 and set the epsilon tube in the noise setting unit to set the supporter vector V, and the second The prediction unit 260 may obtain an SVR regression equation corresponding to the predicted value of the power generation, so that the second predicted value P2 generator 200 may generate a second predicted value P2 that is a second predicted value.

상기의 경우는 SVR 회귀식이 선형으로 주어지는 경우에 대한 것일 수 있고, 실제 데이터와 그 추정 예측치인 SVR 회귀식은 비선형(non-linear)으로 주어질 수 있다. 이러한 경우에는, 맵핑부(230)는 비선형인 데이터를 선형인 데이터로 변환하기 위해서, 커널 함수(kernel function)를 이용할 수 있다. 커널 함수는 실제 데이터가 곡선으로 주어지는 경우, 이 곡선을 형상 공간(feature space)으로 맵핑하여 선형식을 얻을 수 있다. 따라서, 커널 SVR은 원 공간의 데이터를 매핑함수(φ)를 이용해 더 높은 차원으로 매핑하여 데이터를 잘 설명할 수 있다. 커널 함수(K)는 매핑 함수(φ)의 내적(inner product)으로 정의될 수 있다. 식의 형태상 매핑 함수를 정확히 모르더라도 매핑 함수간의 내적으로 같은 효과를 얻을 수 있기에 매핑함수 자체를 정확히 알지 못해도 풀 수 있는 장점이 있다. The above case may be a case in which the SVR regression equation is given linearly, and the SVR regression equation that is the actual data and its estimated prediction value may be given non-linearly. In this case, the mapping unit 230 may use a kernel function to convert nonlinear data into linear data. When the actual data is given as a curve, the kernel function can obtain a linear expression by mapping the curve into a feature space. Therefore, the kernel SVR can describe the data well by mapping the data in the original space to a higher dimension using the mapping function (φ). The kernel function K may be defined as an inner product of the mapping function φ. Even if you do not know the mapping function exactly in the form of the expression, the same effect can be obtained internally between the mapping functions, so it has the advantage of being able to solve it without knowing exactly the mapping function itself.

따라서, 매핑부는 실제 데이터가 시간-발전량 그래프에서 비선형으로 주어지는 경우, 고차원으로 데이터를 맵핑하여 선형이 되도록할 수 있다. Accordingly, when the actual data is given non-linearly in the time-generation graph, the mapping unit may map the data in a high dimension to be linear.

도 6은 선형 SVR에 대한 것이고, 도 7은 오차를 포함한 비선형 SVR에 대한 것일 수 있다. 6 may be for a linear SVR, and FIG. 7 may be for a non-linear SVR including an error.

수학식 7은 선형 SVR에 관한 식일 수 있고, 수학식 8은 비선형 SVR에 관한 식일 수 있다. 알파(

Figure pat00020
)는 라그랑지안 멀티플라이어(Lagrangian multiplier)일 수 있고, 파이(
Figure pat00021
)는 맵핑 함수이며, K는 커널 함수일 수 있다. Equation 7 may be an equation for a linear SVR, and Equation 8 may be an equation for a non-linear SVR. Alpha(
Figure pat00020
) may be a Lagrangian multiplier, and pi (
Figure pat00021
) may be a mapping function, and K may be a kernel function.

Figure pat00022
Figure pat00022

Figure pat00023
Figure pat00023

커널 함수는 다양할 수 있고, 선택한 커널에 따라 형상 공간의 특징이 달라질 수 있기 때문에, 데이터의 특성에 맞게 커널 함수를 선택할 수 있다. 커널 함수에는 예를 들어, 방사 기초 함수(RBF, Radial Basis Function) 커널, 시그모이드(Sigmoid) 커널, 다항수(Polynomial) 커널 등이 있을 수 있다. Since the kernel function may vary, and the shape space characteristics may vary depending on the selected kernel, the kernel function may be selected according to the characteristics of the data. The kernel function may include, for example, a Radial Basis Function (RBF) kernel, a sigmoid kernel, and a polynomial kernel.

Figure pat00024
Figure pat00024

앙상블부(300)는 제1 예측치(P1) 생성부(100)와 제2 예측치(P2) 생성부(200)의 예측치인 제1 예측치(P1)와 제2 예측치(P2)를 조합하여 최종 예측치를 산출할 수 있다. The ensemble unit 300 combines the first predicted value P1 and the second predicted value P2, which are the prediction values of the first predicted value P1 generator 100 and the second predicted value P2 generator 200 , to obtain a final predicted value. can be calculated.

앙상블부(300)는 제1 예측치(P1)와 제2 예측치(P2)의 조합시 볼록 조합(convex combination)을 이용하여 볼록 최적화(convex optimization)를 할 수 있다. When combining the first prediction value P1 and the second prediction value P2 , the ensemble unit 300 may perform convex optimization using a convex combination.

볼록 조합은 파라미터들의 모든 계수가 음이 아니고 합이 1이 되는 선형 결합일 수 있다. 기학학적으로는 어느 집합내에 두 점을 이은 선의 모든 부분이 자기 자신에게 속하는 것일 수 있다. 즉, 오목하게 들어간 부분이나 내부에 구멍이 없는 집합일 수 있다. A convex combination may be a linear combination in which all coefficients of the parameters are non-negative and sum to one. Geometrically, all parts of a line connecting two points in a set may belong to itself. That is, it may be a concave part or an assembly without a hole therein.

먼저, 최적화(optimization) 문제란 어떤 목적 함수(objective function)의 함수값을 최적화(최대화 또는 최소화)시키는 파라미터 조합을 찾는 것을 의미할 수 있다. 이는 최대값 또는 최소값을 찾는 문제일 수 있고, 두 개는 목적 함수의 마이너스를 취함으로서 같은 문제가 될 수 있다. First, the optimization problem may mean finding a parameter combination that optimizes (maximizes or minimizes) a function value of an objective function. This could be a problem of finding a maximum or a minimum, and both could be the same problem by taking the minus of the objective function.

최소값을 찾는 최적화 문제는 현재 위치에서 함수값이 감소하는 방향을 찾아 점점 내려가는 것과 같을 수 있고, 더이상 내려갈 수 없는 곳에 다다를 때까지 반복할 수 있다. 이 경우, 어느 방향으로 내려갈 것인지, 한번에 얼마나 내려갈 것인지에 따라 다양한 방법들이 있을 수 있다. The optimization problem of finding the minimum value can be like finding the direction in which the value of a function decreases from the current position and going down, and it can be repeated until it reaches a point where it can no longer go down. In this case, there may be various methods depending on which direction to descend and how much to descend at a time.

최적화 방법중, 문제가 볼록 최적화의 문제로 귀결되면 훨씬 간단하게 풀릴 수 있다. 왜냐하면, 볼록 최적화의 국소적인(local) 최소값이 전체적인(global)한 최소값이 되기 때문이다. 또한, 최적화의 문제가 볼록 최적화로 귀결되면, 직접 복잡한 계산을 하지 않아도 볼록 최적화 솔버(solver)인 CVX(CVXPY)라는 패키지가 있기에 간단하게 해결할 수 있다. Among the optimization methods, the problem can be solved much simpler if it results in a problem of convex optimization. This is because the local minimum of the convex optimization becomes the global minimum. In addition, if the optimization problem results in convex optimization, it can be easily solved without performing complex calculations directly because there is a package called CVX (CVXPY), which is a convex optimization solver.

따라서, 앙상블부(300)는 두 개의 예측치를 볼록 조합하여 볼록 최적화 문제로 풀 수 있다. Accordingly, the ensemble unit 300 can solve the convex optimization problem by convexly combining the two prediction values.

두 개의 예측치중 하나는 제1 예측치(P1) 생성부(100)에서 산출될 수 있고, 다른 하나는 제2 예측치(P2) 생성부(200)에서 산출될 수 있다. One of the two prediction values may be calculated by the first prediction value P1 generator 100 , and the other may be calculated by the second prediction value P2 generator 200 .

앙상블부(300)에서 최종적으로 예측하고자 하는 앙상블 예측치(P3)를 wn이라고 할 수 있고, 제1 예측치(P1)를 yn, 제2 예측치(P2)를 zn이라고 할 수 있으며, wn은 yn과 zn의 합으로 주어질 수 있다. 즉, wn = anyn + bnzn 일 수 있다. The ensemble prediction value P3 to be finally predicted by the ensemble unit 300 may be referred to as w n , the first prediction value P1 may be referred to as y n , and the second prediction value P2 may be referred to as z n , and wn is It can be given as the sum of yn and zn. That is, w n = a n y n + b n z n may be.

가중치부(320)는 망각률에 의존하는 각 예측치의 계수에 가중치를 설정할 수 있다. 이하 기술하였듯이, 각 예측치에 대한 가중치는 망각률(q)을 독립 변수로 가질 수 있고, 실제 데이터(xn)가 각 예측치중 어느 하나에 더 가까운 경우, 실제 데이터에 가까운 예측치가 아닌 다른 예측치에는 더 적은 가중치를 줄 수 있다. 이 경우, 각 가중치는 망각률에 의해 그 정도를 조절할 수 있다. 예를 들어, 특정 구간에서 제1 예측치가 더 가까운 예측을 내놓은 경우에는, 제2 예측치에 더 높은 망각률을 주고, 제1 예측치에는 더 낮은 망각률을 부여함으로서, 결과적으로 그 구간에서는 제1 예측치는 더 높은 가중치를 가지고, 제2 예측치는 더 낮은 가중치를 가질 수 있게 한다. The weighting unit 320 may set a weight to the coefficient of each prediction value depending on the forgetting rate. As described below, the weight for each prediction can have the forgetting rate (q) as an independent variable, and when the actual data (xn) is closer to any one of the predictions, the predictions other than the predictions close to the actual data are more You can give it less weight. In this case, the degree of each weight can be adjusted by the forgetting rate. For example, if the first predictor gives a closer prediction in a certain interval, the second predictor gives a higher rate of forgetting, and the first predicts gives a lower rate of forgetting, so that the first predictive value in that interval is given as a result. has a higher weight, allowing the second prediction to have a lower weight.

계수 a,b는 각각의 예측치의 가중치를 나타낸 것일 수 있다. 예를 들어, 계수가 크면, 각 예측치의 앙상블 예측치(P3)에 대한 기여도가 올라 갈 수 있고, a가 b보다 크다면, 제1 예측치(P1)가 제2 예측치(P2)보다 더 많이 앙상블 예측치(P3)에 기여하는 것을 의미할 수 있다. Coefficients a and b may represent weights of respective prediction values. For example, if the coefficient is large, the contribution of each predictor to the ensemble predictive value P3 may increase. If a is greater than b, the first predictive value P1 is greater than the second predictive value P2 It can mean contributing to (P3).

이러한 기여도는 망각률에 의해서 조절될 수 있다. This contribution can be controlled by the forgetting rate.

만일 y와 z가 다른 시간 메쉬(time mesh)에 가진 경우에는, 두 개의 예측치가 정렬될 수 있는 듬성한 시간 메쉬를 찾을 수 있다. 즉, 계산을 위해 시간 간격 또는 시간 윈도우(time window)를 사용하는 경우, y 및 z가 모두 포함될 수 있는 것으로 선택할 수 있다. 예를 들어, 초 단위와 분 단위로 두 개의 파라미터가 다른 경우, 분을 선택하여 계산할 수 있다. If y and z are in different time meshes, we can find a coarse time mesh to which the two predictions can be aligned. That is, when a time interval or a time window is used for calculation, it may be selected that both y and z may be included. For example, if two parameters are different in seconds and minutes, you can select the minutes to calculate.

계수인 an, bn는 예측치 변수인 y,z, 실제 데이터 x와 망각률 q에 의존할 수 있다. 즉, 계수 a,b는 현 단계의 a,b를 예측하기 위해 전 단계의 예측치와 데이터 값을 이용할 수 있고, 망각률에 의해서 어느 변수를 점점 잊혀지게 할 것인지를 결정할 수 있다. 망각률 q는 0보다 크고 1보다 작은 수일 수 있다. The coefficients a n and b n may depend on the predictor variables y and z, the actual data x and the rate of forgetting q. That is, the coefficients a and b can use the predicted values and data values of the previous stage to predict the a and b of the current stage, and it is possible to determine which variables are to be gradually forgotten by the forgetting rate. The forgetting rate q may be a number greater than 0 and less than 1.

앙상블 예측치(P3)는 제1 예측치(P1)와 제2 예측치(P2)에 의존할 수 있고, 망각률에 따라 각 예측치의 잊혀지는 정도가 결정될 수 있다. The ensemble prediction value P3 may depend on the first prediction value P1 and the second prediction value P2 , and the degree of forgetting of each prediction value may be determined according to the forgetting rate.

앙상블 예측치(P3)는 계수 a,b에 의해서 결정되고, 특정한 전개(evolution) 규칙을 부여함으로서 특정될 수 있다. 전개 규칙은 수학식 10 내지 수학식 13로 주어질 수 있다. a,b의 초기값은 둘다 1/2로 같은 가중치를 가지고 시작할 수 있다. The ensemble prediction P3 is determined by the coefficients a and b, and can be specified by giving specific evolution rules. The expansion rule can be given by Equations 10 to 13. The initial values of a and b are both 1/2, so you can start with the same weight.

Figure pat00025
Figure pat00025

Figure pat00026
Figure pat00026

Figure pat00027
Figure pat00027

Figure pat00028
Figure pat00028

수학식 10 내지 수학식 13이 원하는 앙상블 예측치(P3)의 특성을 가지는지 알기 위해, 각 앙상블 예측치(P3)와 계수를 결정하는 지배 인자(dominated factor)를 중심으로 살펴보면, 수학식 10은 실제 데이터인 x가 예측치인 y,z사이의 값인 경우로서, a2는 (x1-z1)에 의해서 지배적이고, b2는 -(x1-y1)에 의해서 지배적일 수 있으며, a3는 (x2-z2)에 의해서 지배적이고, b3는 -(x2-y2)에 의해서 지배적일 수 있다. In order to know whether Equations 10 to 13 have the characteristics of the desired ensemble prediction value P3, looking at each ensemble prediction value P3 and the dominant factor determining the coefficient, Equation 10 is the actual data In the case where x is a value between the predicted values y and z, a2 may be dominated by (x1-z1), b2 may be dominated by -(x1-y1), and a3 may be dominated by (x2-z2) dominant, and b3 may be dominated by -(x2-y2).

따라서, x가 z보다 y에 더 가까운 값인 경우에는, (x-y)는 작아지고, (x-z)는 커질 수 있다. 즉, a2가 b2보다 크고, a3가 b3보다 클 수 있다. x가 z보다 y에 더 가깝다는 것은 실제 데이터가 제2 예측치(P2)보다 제1 예측치(P1)에 더 근사한 것이므로 앙상블 전개시 제1 예측치(P1)(y)에 가중치가 더해져야되고, 제2 예측치(P2)(z)는 점점 잊혀져 가는 것이 더 좋은 앙상블 예측치(P3)를 산출할 수 있고, a는 b보다 크므로 성질을 만족함을 알 수 있다. Accordingly, when x is a value closer to y than z, (x-y) may become small and (x-z) may become large. That is, a2 may be greater than b2, and a3 may be greater than b3. The fact that x is closer to y than z means that the actual data is closer to the first predicted value P1 than to the second predicted value P2. Therefore, a weight must be added to the first predicted value (P1)(y) when the ensemble is developed, and the second It can be seen that the predicted values P2 (z) can produce an ensemble prediction value P3 that is better to be forgotten, and a is larger than b, so it can be seen that the property is satisfied.

수학식 11는 yn와 zn이 같은 경우로서, 모든 yn 및 zn이 1/2로 초기값과 같은 값을 가질 수 있다. 즉, yn와 zn이 같다는 것은 제1 예측치(P1)와 제2 예측치(P2)와 실제 데이터간의 거리가 같다는 것으로, 어느 하나가 상대적으로 잊혀지지 않게 같은 가중치를 줄 수 있다. In Equation 11, yn and zn are the same, and all yn and zn may have the same value as the initial value by 1/2. That is, the same yn and zn means that the distance between the first predicted value P1 and the second predicted value P2 and the actual data is the same.

수학식 12은 xn

Figure pat00029
yn > zn or xn
Figure pat00030
yn < zn 인 경우로서, a2는 1-(q/2)이고, b2는 q/2이며, a3는 1-(
Figure pat00031
/2)이고, b3는
Figure pat00032
/2일 수 있다. a2에서 b2를 빼면 1-q이고, a3에서 b3를 빼면 1-
Figure pat00033
일 수 있다. 또한, q는 0보다 크고 1보다 작으므로, a2는 b2보다 크고, a3는 b3보다 클 수 있다. xn
Figure pat00034
yn > zn or xn
Figure pat00035
yn < zn 의 조건은 x가 z보다 y에 가까운 값이므로, 제1 예측치(P1)에 가중치가 주어지고, 제2 예측치(P2)는 점점 잊혀져야 할 수 있다. a가 b보다 큰 값이므로, 성질을 만족함을 알 수 있다. Equation 12 is xn
Figure pat00029
yn > zn or xn
Figure pat00030
When yn < zn, a2 is 1-(q/2), b2 is q/2, and a3 is 1-(
Figure pat00031
/2), and b3 is
Figure pat00032
It can be /2. a2 minus b2 is 1-q, a3 minus b3 is 1-
Figure pat00033
can be Also, since q is greater than 0 and less than 1, a2 may be greater than b2 and a3 may be greater than b3. xn
Figure pat00034
yn > zn or xn
Figure pat00035
Since the condition of yn < zn is that x is closer to y than z, a weight is given to the first predicted value P1 and the second predicted value P2 may have to be gradually forgotten. Since a is a larger value than b, it can be seen that the property is satisfied.

수학식 13은 xn

Figure pat00036
zn > yn or xn
Figure pat00037
zn < yn 인 경우로서, b2는 1-(q/2)이고, a2는 q/2이며, b3는 1-(
Figure pat00038
/2)이고, a3는
Figure pat00039
/2일 수 있다. b2에서 a2를 빼면 1-q이고, b3에서 a3를 빼면 1-
Figure pat00040
일 수 있다. 또한, q는 0보다 크고 1보다 작으므로, b2는 a2보다 크고, b3는 a3보다 클 수 있다. xn
Figure pat00041
zn > yn or xn
Figure pat00042
zn < yn의 조건은 x가 y보다 z에 가까운 값이므로, 제2 예측치(P2)에 가중치가 주어지고, 제1 예측치(P1)는 점점 잊혀져야 할 수 있다. b가 a보다 큰 값이므로, 성질을 만족함을 알 수 있다. Equation 13 is xn
Figure pat00036
zn > yn or xn
Figure pat00037
When zn < yn, b2 is 1-(q/2), a2 is q/2, and b3 is 1-(
Figure pat00038
/2), and a3 is
Figure pat00039
It can be /2. If b2 minus a2 is 1-q, b3 minus a3 is 1-q.
Figure pat00040
can be Also, since q is greater than 0 and less than 1, b2 may be greater than a2 and b3 may be greater than a3. xn
Figure pat00041
zn > yn or xn
Figure pat00042
Since the condition of zn < yn is that x is closer to z than y, a weight is given to the second prediction value P2, and the first prediction value P1 may have to be gradually forgotten. Since b is a larger value than a, it can be seen that the property is satisfied.

상기 방식으로 앙상블 예측치(P3)가 구해지면, 잔차보정부(400)는 에러에서 비선형 패튼을 발굴하기 위한 잔차 분석(residual analysis)을 할 수 있다. 에러에서 의미있는 비선형 패튼을 추출하는 것은 단변수 모델의 웨이블릿 ARMA 제한에 대한 보상을 할 수 있고, 예측 알고리즘을 발전시킬 수 있다. 이 경우, 잔차보정부(400)는 이를 위해 NARX(Nonlinear AutoRegressive with eXternal input)를 사용할 수 있다. When the ensemble predicted value P3 is obtained in the above manner, the residual corrector 400 may perform a residual analysis to discover a nonlinear pattern from an error. Extracting meaningful nonlinear patterns from errors can compensate for wavelet ARMA limitations of univariate models and advance prediction algorithms. In this case, the residual corrector 400 may use NARX (Nonlinear AutoRegressive with eXternal input) for this purpose.

NARX를 이용하는 경우, 각 예측치에 대하여 분석을 수행하는 것이 아니라 두 예측치가 합쳐진 앙상블 예측치(P3)에 대하여 잔차분석을 행할 수 있다. NARX는 재순환적 동적 신경망으로 시계열 기반 데이터를 예측하는 것에 있어서 다른 순환형 구조보다 적합할 수 있다. NARX 에러 모델은 매시간에 대하여, 피드백 대상으로서의 과거 에러에 대한 비선형 함수와 피드백되지 않는 입력으로서의 전력 시계열 변화로 표현될 수 있다.In the case of using NARX, the residual analysis may be performed on the ensemble predictive value P3 in which the two predictive values are combined, rather than performing the analysis on each predictive value. NARX is a recursive dynamic neural network and may be more suitable than other recursive structures in predicting time series-based data. The NARX error model can be expressed as a nonlinear function for the past error as a feedback object and a time series change of power as a non-feedback input for every hour.

100... 제1 예측치 생성부 120... 웨이블릿부
140... 제1 예측부 160... 역변환부
200... 제2 예측치 생성부 220... 그래핑부
230... 맵핑부 240... 노이즈 설정부
260... 제2 예측부 300... 앙상블부
320... 가중치부 400... 잔차보정부
P0... 현재 또는 과거 발전량 P1... 제1 예측치
P2... 제2 예측치 P3... 앙상블 예측치
V... 서포터 벡터 R1... 제1 파라미터
R2... 제2 파라미터
100... First predicted value generator 120... Wavelet unit
140... First prediction unit 160... Inverse transform unit
200... Second prediction value generating unit 220... Graphing unit
230... mapping unit 240... noise setting unit
260... Second prediction part 300... Ensemble part
320... Weight part 400... Residual correction part
P0... Current or past power generation P1... First forecast
P2... Second Prediction P3... Ensemble Prediction
V... supporter vector R1... first parameter
R2... second parameter

Claims (18)

제1 파라미터를 이용하여 태양광 발전량의 제1 예측치를 산출하는 제1 예측치 생성부;
제2 파라미터를 이용하여 태양광 발전량의 제2 예측치를 산출하는 제2 예측치 생성부;
상기 제1 예측치와 상기 제2 예측치를 조합하여 미래의 태양광 발전량인 앙상블 예측치를 산출하는 앙상블부; 를 포함하는 앙상블 장치.
a first predicted value generator for calculating a first predicted value of the amount of solar power generation by using the first parameter;
a second predicted value generator for calculating a second predicted value of the amount of solar power generation by using the second parameter;
an ensemble unit calculating an ensemble predicted value that is a future solar power generation amount by combining the first predicted value and the second predicted value; An ensemble device comprising a.
제1 항에 있어서,
상기 제1 파라미터는 단수이고, 상기 제2 파라미터는 복수인 경우,
상기 제1 파라미터는 상기 제2 파라미터에 포함되지 않는 앙상블 장치.
The method of claim 1,
When the first parameter is singular and the second parameter is plural,
The first parameter is not included in the second parameter.
제1 항에 있어서,
상기 제1 예측치 생성부는,
상기 제1 파라미터로 과거 또는 현재의 발전량 데이터를 선택하고,
상기 과거 또는 현재의 발전량 데이터를 변환을 통해 분해하며, 상기 분해된 데이터를 이용해 미래 데이터를 산출하고, 상기 미래 데이터를 역변환을 통해 복원하여 미래 발전량인 제1 예측치를 산출하는 앙상블 장치.
The method of claim 1,
The first predicted value generator,
Selecting past or current power generation data as the first parameter,
An ensemble device for decomposing the past or present power generation data through transformation, calculating future data using the decomposed data, and calculating a first predicted value that is a future power generation amount by restoring the future data through inverse transformation.
제1 항에 있어서,
상기 제1 예측치 생성부는,
상기 제1 파라미터로 과거 또는 현재의 발전량 데이터를 선택하고,
상기 과거 또는 현재의 발전량 데이터를 변환을 통해 분해하는 웨이블릿부가 마련되며,
상기 웨이블릿부는 상기 과거 또는 현재의 발전량 데이터를 웨이블릿(Wavelet)으로 분해하는 이산 웨이블릿 변환(DWT, Discrete Wavelet Transform)을 이용하는 앙상블 장치.
The method of claim 1,
The first predicted value generator,
Selecting past or current power generation data as the first parameter,
A wavelet unit for decomposing the past or present power generation data through transformation is provided,
The wavelet unit is an ensemble device using a Discrete Wavelet Transform (DWT) that decomposes the past or present power generation data into wavelets.
제1 항에 있어서,
상기 제1 예측치 생성부는,
상기 제1 파라미터로 과거 또는 현재의 발전량 데이터를 선택하고,
상기 과거 또는 현재의 발전량 데이터를 변환을 통해 분해하며, 상기 분해된 데이터를 이용해 미래 데이터를 산출하는 제1 예측부가 마련되고,
상기 제1 예측부는 이전 단계의 제1 파라미터, 이전 단계의 에러, 화이즈 노이즈(white noise)를 독립 변수로 하여 종속 변수인 상기 미래 데이터를 산출하는 ARMA(AutorRegressive Moving Average) 모델을 이용하는 앙상블 장치.
The method of claim 1,
The first predicted value generator,
Selecting past or current power generation data as the first parameter,
A first prediction unit for decomposing the past or present power generation data through transformation and calculating future data using the decomposed data is provided,
The first prediction unit is an ensemble device using an AutorRegressive Moving Average (ARMA) model that calculates the future data, which is a dependent variable, using a first parameter of a previous step, an error of a previous step, and white noise as independent variables.
제1 항에 있어서,
상기 제1 예측치 생성부는,
상기 제1 파라미터로 과거 또는 현재의 발전량 데이터를 선택하고,
상기 과거 또는 현재의 발전량 데이터를 변환을 통해 분해하며, 상기 분해된 데이터를 이용해 미래 데이터를 산출하고,
역변환을 통해 데이터를 복원하는 역변환부가 마련되며,
상기 역변환부는, 상기 웨이블릿부가 웨이블릿을 이용하여 분해하는 변환 과정의 역(inverse)에 해당하는 역변환(Inverse transform)을 통해 상기 과거 또는 현재의 발전량 데이터 및 상기 미래 데이터로부터 상기 제1 예측치를 산출하는 앙상블 장치.
The method of claim 1,
The first predicted value generator,
Selecting past or current power generation data as the first parameter,
The past or present power generation data is decomposed through transformation, and future data is calculated using the decomposed data,
An inverse transform unit for restoring data through inverse transform is provided,
The inverse transform unit is an ensemble that calculates the first predicted value from the past or present power generation data and the future data through an inverse transform corresponding to an inverse of a transform process that the wavelet unit decomposes using wavelets. Device.
제1 항에 있어서,
상기 제2 파라미터는 날짜, 기온, 풍속, 구름량, 습도 또는 이슬점중 적어도 어느 하나를 포함하는 앙상블 장치.
The method of claim 1,
The second parameter is an ensemble device including at least one of date, temperature, wind speed, cloud amount, humidity, and dew point.
제1 항에 있어서,
상기 제2 예측치 생성부는,
특정된 상기 제2 파라미터에 따른 과거 또는 현재의 발전량을 그래프에 표시하고, 상기 표시된 데이터의 경향을 나타내는 식(equation)을 계산하여 상기 제2 예측치를 산출하는 앙상블 장치.
The method of claim 1,
The second predicted value generator,
An ensemble device that displays a past or present power generation amount according to the specified second parameter on a graph, calculates an equation representing a trend of the displayed data, and calculates the second predicted value.
제1 항에 있어서,
상기 제2 예측치 생성부에는,
특정된 상기 제2 파라미터에 따른 과거 또는 현재의 발전량을 표시하는 그래핑부가 마련되고,
상기 그래핑부에 의해 표시된 데이터에 대하여, 노이즈 범위에 해당하는 엡실론 튜브(ε-tube)를 설정하여 노이즈 데이터에 해당하는 서포터 벡터(support vector)를 설정하는 노이즈 설정부가 구비되며,
상기 과거 또는 현재의 발전량의 경향을 나타내는 회귀식(Regression equation)을 도출하는 서포터 벡터 회귀 모델(SVR, Support Vector Regression model)을 이용하여 상기 제2 예측치를 산출하는 제2 예측부가 마련되는 앙상블 장치.
The method of claim 1,
In the second prediction value generator,
A graphing unit for displaying the amount of power generation in the past or present according to the specified second parameter is provided,
A noise setting unit is provided for setting an epsilon tube (ε-tube) corresponding to the noise range with respect to the data displayed by the graphing unit to set a support vector corresponding to the noise data,
and a second prediction unit for calculating the second prediction value using a support vector regression model (SVR) for deriving a regression equation representing the trend of the past or present generation amount.
제9 항에 있어서,
상기 그래핑부에 의해 표시된 데이터가 비선형(non-linear)인 경우,
맵핑(mapping)을 통해 데이터들이 선형 관계를 가지게 하는 맵핑부가 마련되고,
상기 맵핑부는 상기 맵핑을 위해, 고차원(high dimension)으로 비선형 데이터 관계를 선형 데이터 관계로 바꾸는 커널 함수(kernel function)를 이용하는 앙상블 장치.
10. The method of claim 9,
When the data displayed by the graphing unit is non-linear,
A mapping unit that allows data to have a linear relationship through mapping is provided,
The mapping unit uses a kernel function that converts a nonlinear data relationship into a linear data relationship in a high dimension for the mapping.
제1 항에 있어서,
상기 앙상블 예측치는 상기 앙상블 예측치의 콘벡스 최적화(Convex optimization)를 위해 계수의 합이 1이고, 각 계수는 0보다 큰 값을 가지는 콘벡스 조합(Convex combination)인 앙상블 장치.
The method of claim 1,
The ensemble prediction value is a convex combination in which a sum of coefficients is 1 and each coefficient has a value greater than 0 for convex optimization of the ensemble prediction value.
제1 항에 있어서,
상기 앙상블부에는 상기 제1 예측치와 상기 제2 예측치에 가중치를 주는 가중치부가 마련되는 앙상블 장치.
The method of claim 1,
The ensemble unit is provided with a weighting unit for giving weights to the first predicted value and the second predicted value.
제1 항에 있어서,
상기 제1 예측치와 상기 제2 예측치는 상기 앙상블 예측치에 기여하는 가중치가 다르게 설정되고,
상기 가중치는 망각률(rate of forgetting)에 의해 결정되며,
상기 망각률은 실제 발전량 데이터와 상기 각 예측치간의 정확도에 기반하여 상기 제1 예측치 및 상기 제2 예측치에 각각 제1 가중치 및 제2 가중치를 주고,
상기 각 가중치는 상기 망각률을 독립 변수로 가지며,
상기 제1 예측치가 상기 제2 예측치보다 상기 실제 발전량 데이터에 더 가까운 값인 경우에는, 상기 제2 가중치의 망각률보다 더 낮은 망각률을 가진 상기 제1 가중치는 상기 제2 가중치보다 큰 값을 가지는 앙상블 장치.
The method of claim 1,
The first prediction value and the second prediction value are set to have different weights contributing to the ensemble prediction value,
The weight is determined by the rate of forgetting,
The forgetting rate gives a first weight and a second weight to the first prediction value and the second prediction value, respectively, based on the accuracy between the actual power generation data and the respective prediction values,
Each weight has the forgetting rate as an independent variable,
When the first predicted value is a value closer to the actual power generation data than the second predicted value, the first weight having a forgetting rate lower than the forgetting rate of the second weight is an ensemble having a larger value than the second weight Device.
제1 항에 있어서,
상기 제1 예측치가 yn이고, 상기 제2 예측치가 zn인 경우,
상기 앙상블 예측치(wn)는 다음의 식으로 주어지고,
Figure pat00043

상기 an는 상기 제1 예측치의 상기 앙상블 예측치에 대한 기여도를 나타내는 제1 가중치이며,
상기 bn는 상기 제2 예측치의 상기 앙상블 예측치에 대한 기여도를 나타내는 제2 가중치이고,
상기 제1 예측치와 상기 제2 예측치의 예측에 사용된 과거 또는 현재 데이터가 xn이며,
상기 가중치는 망각률(q)에 의해 결정되며,
각 변수의 아래첨자는 앙상블 예측치의 예측의 각 단계를 의미하고,
상기 제1 가중치 및 상기 제2 가중치는 이전 단계의 제1 예측치, 이전 단계의 제2 예측치, 또는 망각률을 독립 변수로 가지는 종속 변수인 앙상블 장치.
The method of claim 1,
When the first prediction value is y n and the second prediction value is z n ,
The ensemble prediction value (w n ) is given by the following equation,
Figure pat00043

wherein a n is a first weight indicating the contribution of the first prediction value to the ensemble prediction value,
b n is a second weight indicating the contribution of the second prediction value to the ensemble prediction value,
Past or present data used for prediction of the first prediction value and the second prediction value is x n ,
The weight is determined by the forgetting rate (q),
The subscripts of each variable refer to each step of the prediction of the ensemble prediction,
The first weight and the second weight are dependent variables having a first prediction value of a previous stage, a second prediction value of a previous stage, or a forgetting rate as an independent variable.
제14 항에 있어서,
상기 과거 또는 현재 데이터가 상기 제1 예측치와 상기 제2 예측치의 사이 값인 경우,
상기 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어지는 앙상블 장치.
Figure pat00044

15. The method of claim 14,
When the past or present data is a value between the first prediction value and the second prediction value,
The first weight and the second weight are given by the following equation.
Figure pat00044

제14 항에 있어서,
상기 제1 예측치와 상기 제2 예측치가 동일한 경우,
상기 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어지는 앙상블 장치.
Figure pat00045

15. The method of claim 14,
When the first prediction value and the second prediction value are the same,
The first weight and the second weight are given by the following equation.
Figure pat00045

제14 항에 있어서,
상기 과거 또는 현재의 데이터가 상기 제1 예측치보다 크거나 같고, 상기 제1 예측치는 상기 제2 예측치보다 큰 경우 또는,
상기 과거 또는 현재의 데이터가 상기 제1 예측치보다 작거나 같고, 상기 제1 예측치는 상기 제2 예측치보다 작은 경우에는,
상기 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어지는 앙상블 장치.
Figure pat00046

15. The method of claim 14,
When the past or present data is greater than or equal to the first prediction value, and the first prediction value is greater than the second prediction value; or
When the past or present data is less than or equal to the first prediction value, and the first prediction value is less than the second prediction value,
The first weight and the second weight are given by the following equation.
Figure pat00046

제14 항에 있어서,
상기 과거 또는 현재의 데이터가 상기 제2 예측치보다 크거나 같고, 상기 제2 예측치는 상기 제1 예측치보다 큰 경우 또는,
상기 과거 또는 현재의 데이터가 상기 제2 예측치보다 작거나 같고, 상기 제2 예측치는 상기 제1 예측치보다 작은 경우에는,
상기 제1 가중치 및 상기 제2 가중치는 다음의 식으로 주어지는 앙상블 장치.
Figure pat00047
15. The method of claim 14,
When the past or present data is greater than or equal to the second prediction value, and the second prediction value is greater than the first prediction value; or
When the past or present data is less than or equal to the second prediction value and the second prediction value is less than the first prediction value,
The first weight and the second weight are given by the following equation.
Figure pat00047
KR1020210013547A 2021-01-29 2021-01-29 Ansemble device for predicting the power KR102533042B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210013547A KR102533042B1 (en) 2021-01-29 2021-01-29 Ansemble device for predicting the power

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210013547A KR102533042B1 (en) 2021-01-29 2021-01-29 Ansemble device for predicting the power

Publications (2)

Publication Number Publication Date
KR20220109935A true KR20220109935A (en) 2022-08-05
KR102533042B1 KR102533042B1 (en) 2023-05-17

Family

ID=82826566

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210013547A KR102533042B1 (en) 2021-01-29 2021-01-29 Ansemble device for predicting the power

Country Status (1)

Country Link
KR (1) KR102533042B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117293826A (en) * 2023-11-27 2023-12-26 山东大学 Distributed photovoltaic missing power real-time prediction method, system, medium and equipment

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101761636B1 (en) * 2010-07-20 2017-07-27 삼성디스플레이 주식회사 Organic Light Emitting Display Device
JP2018163516A (en) * 2017-03-24 2018-10-18 株式会社日立製作所 Transaction planning apparatus and transaction planning method
JP2018207668A (en) * 2017-06-05 2018-12-27 中国電力株式会社 Power generation amount prediction device and power generation amount prediction method
KR20200052432A (en) * 2018-10-29 2020-05-15 인천대학교 산학협력단 Electronic device for predicting long-term photovoltaic power generation using meteorological and seasonal information based on deep learning and operating method thereof

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101761636B1 (en) * 2010-07-20 2017-07-27 삼성디스플레이 주식회사 Organic Light Emitting Display Device
JP2018163516A (en) * 2017-03-24 2018-10-18 株式会社日立製作所 Transaction planning apparatus and transaction planning method
JP2018207668A (en) * 2017-06-05 2018-12-27 中国電力株式会社 Power generation amount prediction device and power generation amount prediction method
KR20200052432A (en) * 2018-10-29 2020-05-15 인천대학교 산학협력단 Electronic device for predicting long-term photovoltaic power generation using meteorological and seasonal information based on deep learning and operating method thereof

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117293826A (en) * 2023-11-27 2023-12-26 山东大学 Distributed photovoltaic missing power real-time prediction method, system, medium and equipment
CN117293826B (en) * 2023-11-27 2024-04-05 山东大学 Distributed photovoltaic missing power real-time prediction method, system, medium and equipment

Also Published As

Publication number Publication date
KR102533042B1 (en) 2023-05-17

Similar Documents

Publication Publication Date Title
Zhu et al. Streamflow estimation by support vector machine coupled with different methods of time series decomposition in the upper reaches of Yangtze River, China
Li et al. Short-term load-forecasting method based on wavelet decomposition with second-order gray neural network model combined with ADF test
Li et al. Interval prediction of solar power using an improved bootstrap method
Sailor et al. A neural network approach to local downscaling of GCM output for assessing wind power implications of climate change
Ouyang et al. Monthly rainfall forecasting using echo state networks coupled with data preprocessing methods
Li et al. A hybrid short-term building electrical load forecasting model combining the periodic pattern, fuzzy system, and wavelet transform
EP3314751A1 (en) Method of forecasting for solar-based power systems
CN111091233A (en) Wind power plant short-term wind power prediction modeling method based on wavelet analysis and multi-model AdaBoost depth network
Li et al. Multi-step least squares support vector machine modeling approach for forecasting short-term electricity demand with application
CN110648017A (en) Short-term impact load prediction method based on two-layer decomposition technology
WO2023103130A1 (en) Quantum walk-based time-series multiscale analysis method
Xiong et al. Forecast of natural gas consumption in the Asia-Pacific region using a fractional-order incomplete gamma grey model
CN111931983A (en) Precipitation prediction method and system
KR102533042B1 (en) Ansemble device for predicting the power
CN114564487B (en) Meteorological raster data updating method combining forecast prediction
Kosana et al. Hybrid wind speed prediction framework using data pre-processing strategy based autoencoder network
Rodríguez et al. Ensemble forecaster based on the combination of time-frequency analysis and machine learning strategies for very short-term wind speed prediction
CN117633446A (en) Wind speed prediction method and system based on CEEMD-SE-EWT double decomposition and ARIMA combined prediction
JP6562491B1 (en) Precise power generation prediction method by expected value calculation, power generation precise prediction system by expected value calculation, and power generation precise prediction program by expected value calculation
CN113222234B (en) Gas demand prediction method and system based on integrated modal decomposition
CN116566840A (en) Container cloud resource prediction method based on empirical wavelet transformation and combined model
Androulakis et al. A two-step hybrid system towards optimized wave height forecasts
Harlim et al. Diffusion forecasting model with basis functions from QR-decomposition
CN111523258B (en) Microseism effective signal first arrival pickup method and system based on MS-Net network
Yang et al. A hybrid vmd-based ARIMA-LSTM model for day-ahead pv prediction and uncertainty analysis

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right