KR20230088967A - Anomaly detiection and repair based electrical load forecasting device and method - Google Patents
Anomaly detiection and repair based electrical load forecasting device and method Download PDFInfo
- Publication number
- KR20230088967A KR20230088967A KR1020210177250A KR20210177250A KR20230088967A KR 20230088967 A KR20230088967 A KR 20230088967A KR 1020210177250 A KR1020210177250 A KR 1020210177250A KR 20210177250 A KR20210177250 A KR 20210177250A KR 20230088967 A KR20230088967 A KR 20230088967A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- power
- unit
- power demand
- weather
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 11
- 238000007781 pre-processing Methods 0.000 claims abstract description 49
- 238000013450 outlier detection Methods 0.000 claims abstract description 31
- 238000013480 data collection Methods 0.000 claims abstract description 25
- 230000002159 abnormal effect Effects 0.000 claims abstract description 17
- 238000007637 random forest analysis Methods 0.000 claims abstract description 17
- 238000001514 detection method Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 11
- 230000000737 periodic effect Effects 0.000 claims description 9
- 230000001953 sensory effect Effects 0.000 claims description 8
- 238000010801 machine learning Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 13
- 238000001556 precipitation Methods 0.000 description 4
- 238000010276 construction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000002250 progressing effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H02—GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
- H02J—CIRCUIT ARRANGEMENTS OR SYSTEMS FOR SUPPLYING OR DISTRIBUTING ELECTRIC POWER; SYSTEMS FOR STORING ELECTRIC ENERGY
- H02J3/00—Circuit arrangements for ac mains or ac distribution networks
- H02J3/003—Load forecast, e.g. methods or systems for forecasting future load demand
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S40/00—Systems for electrical power generation, transmission, distribution or end-user application management characterised by the use of communication or information technologies, or communication or information technology specific aspects supporting them
- Y04S40/20—Information technology specific aspects, e.g. CAD, simulation, modelling, system security
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Economics (AREA)
- Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Water Supply & Treatment (AREA)
- General Health & Medical Sciences (AREA)
- Power Engineering (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
본 발명은 전략 수요량을 예측할 수 있는 장치 및 방법에 관한 것으로, 좀 더 자세하게는 기계학습을 통하여 미래의 전략 수요를 정확하게 예측할 수 있는 장치 및 방법에 관한 것이다. The present invention relates to an apparatus and method for predicting strategic demand, and more particularly, to an apparatus and method for accurately predicting future strategic demand through machine learning.
스마트 그리드는 전 세계적으로 발생하는 환경문제 및 자원고갈 문제에 대한 실현 가능한 솔루션으로 많은 주목을 받고 있으며, 스마트 그리드를 구성하는 에너지 저장 시스템, 에너지 관리 시스템, 신재생 에너지 시스템 등 다양한 시스템들을 효율적으로 사용하기 위해서는 정확도 높은 전력 수요 예측이 필요하다.Smart Grid is receiving a lot of attention as a feasible solution to environmental and resource depletion problems occurring all over the world, and it efficiently uses various systems such as energy storage system, energy management system, and renewable energy system that make up the smart grid. To do this, it is necessary to forecast electricity demand with high accuracy.
최근 컴퓨터 기술이 발전함에 따라 기계학습 및 딥러닝 기반의 예측 모델들에 대한 연구가 활발하게 진행되고 있으며 좋은 성능을 보여주고 있다. 이러한 기계학습 및 딥러닝 기반의 예측 모델들은 데이터의 양과 질의 영향을 많이 받는다.As computer technology develops recently, research on machine learning and deep learning-based predictive models is actively progressing and showing good performance. These machine learning and deep learning-based prediction models are greatly affected by the quantity and quality of data.
예측 모델의 학습에 사용되는 데이터에 이상치 혹은 결측치가 많이 존재할 경우 모델의 학습에 방해가 되어 예측 정확도가 낮아질 수 있다. 학습하기에 충분한 양의 데이터가 수집된 경우에는 이상치와 결측치를 제거한 후에 모델을 학습하여도 문제가 되지 않지만, 데이터 수가 충분하지 않을 때 이상치와 결측치를 제거하게 되면 오버 피팅으로 인하여 모델의 학습 자체가 어려워질 수 있다.If there are many outliers or missing values in the data used for learning the predictive model, it may interfere with model learning and lower the prediction accuracy. If a sufficient amount of data is collected for learning, it is not a problem to train the model after removing outliers and missing values. It can get difficult.
본 발명은 데이터 수가 충분하지 않은 상황에서 이상치 탐지 및 복원을 통하여 오버 피팅 없이 예측 모델의 성능을 향상시킬 수 있는 전략 수요량 예측 장치를 제공하는데 있다. An object of the present invention is to provide a strategic demand forecasting device capable of improving the performance of a predictive model without overfitting through outlier detection and restoration in a situation where the number of data is insufficient.
본 출원의 실시 예에 따른 전력 수요량 예측 장치는 기상 데이터, 전력 데이터 및 시간 데이터를 수집하는 데이터 수집부; 상기 기상 데이터, 상기 전력 데이터 및 상기 시간 데이터에 대한 전처리 동작을 수행하는 데이터 전처리부; 변분 오토인코더를 통하여 구현되며, 상기 전처리된 전력 데이터를 이상 데이터와 정상 데이터로 분류하는 이상치 탐지부; 랜덤 포레스트 모델을 통하여 구현되며, 상기 이상 데이터를 복원하여 복원 데이터를 생성하는 이상치 복원부; 및 슬라이딩 윈도우 기반의 LightGBM 모델을 통하여 구현되며, 상기 정상 데이터와 상기 복원 데이터에 기초하여 예측 모델을 학습하고 전력 수요량을 예측하는 전력 수요 예측부를 포함한다.An apparatus for predicting power demand according to an embodiment of the present application includes a data collection unit that collects weather data, power data, and time data; a data preprocessing unit performing a preprocessing operation on the weather data, the power data, and the time data; an anomaly detection unit implemented through a variational autoencoder and classifying the preprocessed power data into abnormal data and normal data; an outlier restoration unit implemented using a random forest model and restoring the abnormal data to generate restored data; and a power demand prediction unit implemented using a sliding window-based LightGBM model, learning a prediction model based on the normal data and the restored data, and estimating power demand.
실시 예에 있어서, 상기 데이터 전처리부는 상기 기상 데이터에 대한 정규화 동작을 수행하는 기상 데이터 전처리부; 상기 전력 데이터에 대한 정규화 동작을 수행하는 전력 데이터 전처리부; 및 상기 시간 데이터를 2차원의 시간 데이터로 변환하는 시간 데이터 전처리부를 포함한다.In an embodiment, the data pre-processing unit may include a weather data pre-processing unit performing a normalization operation on the weather data; a power data pre-processing unit performing a normalization operation on the power data; and a time data pre-processing unit that converts the time data into two-dimensional time data.
실시 예에 있어서, 상기 기상 데이터 전처리부는 상기 기상 데이터 중 기온, 습도, 풍속 데이터에 기초하여 체감 온도 데이터와 불쾌지수 데이터를 생성하고, 생성된 체감 온도 데이터와 불쾌지수 데이터에 대한 정규화 동작을 수행한다.In an embodiment, the meteorological data pre-processing unit generates sensory temperature data and discomfort index data based on temperature, humidity, and wind speed data among the meteorological data, and performs a normalization operation on the generated sensory temperature data and discomfort index data. .
실시 예에 있어서, 상기 시간 데이터 전처리부는 주기 함수를 이용하여 상기 시간 데이터를 서로 다른 두 개의 2차원 시간 데이터로 변환한다.In an embodiment, the time data pre-processing unit converts the time data into two different two-dimensional time data using a periodic function.
실시 예에 있어서, 상기 데이터 수집부가 수집하는 기상 데이터는 기상 예보 데이터 및 측정 기상 데이터 중 어느 하나이다.In an embodiment, the weather data collected by the data collector is any one of weather forecast data and measured weather data.
실시 예에 있어서, 상기 전력 수요 예측부는 7의 윈도우 사이즈를 갖는다.In an embodiment, the power demand predictor has a window size of 7.
본 출원의 실시 예에 따른 전력 수요량 예측 방법은 데이터 수집부에서, 기상 데이터, 시간 데이터 및 전력 데이터를 수집하는 단계; 데이터 전처리부에서, 상기 기상 데이터, 상기 시간 데이터 및 상기 전력 데이터에 대한 전처리 동작을 수행하는 단계; 이상치 탐지부에서, 상기 전처리된 전력 데이터 중 이상치를 탐지하는 단계; 이상치 복원부에서, 상기 이상치를 복원하여 복원 데이터를 생성하는 단계; 및 전력 수요 예측부에서, 상기 복원 데이터를 학습 데이터로 하여 예측 모델을 학습하고, 상기 학습된 예측 모델에 기초하여 전력 수요량을 예측하는 단계를 포함한다.A method for predicting power demand according to an embodiment of the present application includes collecting weather data, time data, and power data in a data collection unit; performing a pre-processing operation on the weather data, the time data, and the power data in a data pre-processing unit; detecting an outlier among the preprocessed power data in an outlier detection unit; restoring the outliers in an outlier restoring unit to generate restoration data; and learning a prediction model using the restored data as learning data in a power demand prediction unit, and estimating power demand based on the learned prediction model.
실시 예에 있어서, 상기 전처리 동작을 수행하는 단계는 상기 기상 데이터 및 상기 전력 데이터를 정규화하는 단계; 및 상기 시간 데이터를 주기함수를 이용하여 서로 다른 두 개의 시간 데이터로 변환하는 단계를 포함한다.In an embodiment, the performing of the preprocessing operation may include normalizing the weather data and the power data; and converting the time data into two different time data using a periodic function.
실시 예에 있어서, 상기 기상 데이터를 정규화하는 단계는 상기 기상 데이터 중 기온, 습도, 풍속 데이터에 기초하여 체감 온도 데이터와 불쾌지수 데이터를 생성하는 단계; 및 상기 생성된 체감 온도 데이터와 상기 생성된 불쾌지수 데이터에 대한 정규화 동작을 수행하는 단계를 포함한다.In an embodiment, the normalizing of the meteorological data may include generating sensory temperature data and discomfort index data based on temperature, humidity, and wind speed data among the meteorological data; and performing a normalization operation on the generated sensory temperature data and the generated discomfort index data.
실시 예에 있어서, 상기 기상 데이터는 기상 예보 데이터 및 측정 기상 데이터 중 어느 하나이다.In an embodiment, the weather data is any one of weather forecast data and measured weather data.
실시 예에 있어서, 상기 이상치 탐지부는 변분 오토인코더를 통하여 구현된다.In an embodiment, the outlier detection unit is implemented through a variational autoencoder.
실시 예에 있어서, 상기 이상치 복원부는 랜덤 포레스트 모델을 통하여 구현된다.In an embodiment, the outlier restoration unit is implemented through a random forest model.
실시 예에 있어서, 상기 전력 수요량 예측부는 슬라이딩 윈도우 기반의 LightGBM을 통하여 구현된다.In an embodiment, the power demand estimation unit is implemented through LightGBM based on a sliding window.
실시 예에 있어서, 상기 전력 수요량 예측부는 7의 윈도우 사이즈를 갖는다.In an embodiment, the power demand estimation unit has a window size of 7.
본 출원의 실시 예에 따른 전력 수요량 예측 장치는 이상치를 탐지하고 이를 복원하여 학습 데이터로 사용한다. 데이터 수가 충분하지 않은 상황에서 이상치를 복원하여 학습 데이터로 사용함으로써, 본 출원의 실시 예에 따른 전략 수요량 예측 장치는 오버 피팅 없이 향상된 예층 성능을 제공할 수 있다. An apparatus for predicting power demand according to an embodiment of the present application detects an outlier and restores it to use it as learning data. By restoring outliers and using them as training data in a situation where the number of data is not sufficient, the apparatus for predicting strategic demand according to an embodiment of the present application can provide improved layer performance without overfitting.
도 1은 본 출원의 실시 예에 따른 전략 수요량 예측 장치(10)를 보여주는 블록도이다.
도 2는 도 1의 데이터 전처리부(200)를 좀 더 자세히 보여주는 블록도이다.
도 3a는 범주형 시간 데이터(Data_T)의 일 예를 보여주는 도면이다.
도 3b는 2차원 시간 데이터(Data_T1, Data_T2)의 일 예를 보여주는 도면이다.
도 4는 도 1의 이상치 탐지부(300)를 좀 더 자세히 보여주는 도면이다.
도 5는 이상치 탐지부(300)의 이상치 탐지 실험 결과를 보여주는 그래프이다.
도 6은 도 1의 이상치 복원부(400)를 좀 더 자세히 보여주는 도면이다.
도 7은 이상치 복원부(400)의 복원 실험 결과를 보여주는 그래프이다.
도 8은 도 1의 전력 수요 예측부(500)를 좀 더 자세히 보여주는 도면이다.
도 9는 전력 수요 예측부(500)의 윈도우 사이즈 결정을 위한 실험 결과를 보여주는 그래프이다.
도 10은 본 출원의 실시 예에 따른 전력 수요량 예측 장치(10)의 예측 결과를 다른 모델과 비교하는 그래프이다.
도 11은 도 1의 전력 수요량 예측 장치(10)의 동작을 보여주는 순서도이다.1 is a block diagram showing an
FIG. 2 is a block diagram showing the data pre-processing
3A is a diagram showing an example of categorical time data Data_T.
3B is a diagram showing an example of two-dimensional time data Data_T1 and Data_T2.
FIG. 4 is a diagram showing the
5 is a graph showing the results of the outlier detection experiment performed by the
FIG. 6 is a diagram showing the
7 is a graph showing results of restoration experiments performed by the
FIG. 8 is a diagram showing the
9 is a graph showing experimental results for determining the window size of the
10 is a graph comparing prediction results of the power
FIG. 11 is a flowchart showing the operation of the
이하에서는, 본 출원의 기술 분야에서 통상의 지식을 가진 자가 본 출원의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 출원의 실시 예들이 첨부된 도면을 참조하여 좀 더 자세히 설명될 것이다.Hereinafter, embodiments of the present application will be described in more detail with reference to the accompanying drawings in order to explain in detail enough that a person skilled in the art of the present application can easily practice the technical idea of the present application. will be.
도 1은 본 출원의 실시 예에 따른 전략 수요량 예측 장치(10)를 보여주는 블록도이다.1 is a block diagram showing an
도 1을 참조하면, 전략 수요량 예측 장치(10)는 데이터 수집부(100), 데이터 전처리부(200), 이상치 탐지부(300), 이상치 복원부(400) 및 전력수요 예측부(500)를 포함한다. Referring to FIG. 1, the strategic
데이터 수집부(100)는 전력 수요량 예측에 필요한 각종 데이터를 수집한다. 예를 들어, 데이터 수집부(100)는 기상 데이터, 전력 데이터 및 시간 데이터를 수집할 수 있다. The
예를 들어, 데이터 수집부(100)는 외부로부터 각종 기상에 대한 데이터를 수집할 수 있다. 데이터 수집부(100)가 수집하는 기상 데이터는, 예를 들어, 일 최고 기온, 일 최저 기온, 기온, 습도, 풍속, 전운량, 강수량에 대한 데이터일 수 있다. 데이터 수집부(100)는, 예를 들어, 기상청의 기상자료개방포털 등을 통하여 기상 데이터를 수집할 수 있다. For example, the
예를 들어, 데이터 수집부(100)는 적어도 하나의 클러스터로부터 소모한 전력량에 대한 전력 데이터를 수집할 수 있다. 이 경우, 클러스터는 데이터의 편향을 방지하기 위하여 서로 다른 용도의 건물일 수 있다. 예를 들어, 데이터 수집부(100)는 교육용 건물들로 이루어진 클러스터 A, 기숙사들로 이루어진 클러스터 B, 공과대학 연구실로 이루어진 클러스터 C 및 이과대학 연구실로 이루어진 클러스터 D로부터 전력 데이터를 수집할 수 있다. 다만, 이는 예시적인 것이며, 클러스터의 개수 및 종류는 다양하게 설정될 수 있다.For example, the
예를 들어, 데이터 수집부(100)는 각종 기상 및 전력 데이터를 수집할 때에, 이에 대응하는 시간 데이터를 함께 수집할 수 있다. 예를 들어, 데이터 수집부(100)는 기상 데이터를 수집할 때에 월(month), 일(day), 시(hour), 분(minute)에 대한 시간 데이터를 함께 수집할 수 있다. 또한, 데이터 수집부(100)는 전력 데이터를 수집할 때에 월(month), 일(day), 시(hour), 분(minute)에 대한 시간 데이터를 함께 수집할 수 있다.For example, when collecting various weather and power data, the
본 출원의 일 실시 예에 있어서, 데이터 수집부(100)는 실제로 측정된 기상 데이터 뿐만 아니라, 과거 시점으로부터 소정 기간 전에 예보된 기상 예보 데이터를 함께 수집할 수 있다. 예를 들어, 2018년 5월 5일에 소모된 전력 데이터 및 기상 데이터를 수집할 때에, 해당 2018년 5월 5일에 대응하는 기상 데이터는 하루 전인 2018년 5월 4일에 예보된 일 최소 기온, 일 최고 기온, 일 평균기온, 기온, 습도, 풍속, 전운량, 강수량 등에 대한 기상 예보 데이터일 수 있다. 이와 같이, 실제 측정된 기상 데이터 뿐만 아니라 기상 예보 데이터를 함께 수집하고, 이를 학습 모델 구현을 위한 학습 데이터로 제공함으로써, 본 출원의 실시 예에 따른 전력 수요량 예측 장치(10)는 기상 예보 데이터와 실제 기상 데이터 사이의 오차까지 함께 고려하여 학습 동작을 수행할 수 있다.In one embodiment of the present application, the
다만, 이는 예시적인 것이며, 데이터 수집부(100)는 실제로 측정된 기상 데이터만을 수집할 수도 있으며, 이 경우에 학습 동작은 실제 측정된 기상 데이터만을 이용하여 수행될 수 있다. 다른 예로, 데이터 수집부(100)는 기상 예보 데이터만을 수집할 수 있으며, 이 경우에 학습 동작은 기상 예보 데이터만을 이용하여 수행될 수도 있다.However, this is exemplary, and the
데이터 전처리부(200)는 데이터 수집부(100)로부터 기상 데이터, 시간 데이터 및 전력 데이터를 수신한다. 데이터 전처리부(200)는 이상 탐지부(300)에서 활용될 수 있도록 수신한 기상 데이터, 전력 데이터 및 시간 데이터에 대한 전처리 동작을 수행한다.The
예를 들어, 데이터 전처리부(200)는 데이터 수집부(100)로부터 기상 데이터 및 전력 데이터를 수신하고, 수신한 기상 데이터 및 전력 데이터에 대한 정규화 동작을 수행할 수 있다. 또한, 데이터 전처리부(200)는 데이터 수집부(100)로부터 1차원의 시간 데이터를 수신하고, 수신한 1차원의 시간 데이터를 2차원의 시간 데이터로 변환할 수 있다. 데이터 전처리부(200)의 구성 및 동작은 이하의 도 2 및 도 3에서 좀 더 자세히 설명될 것이다.For example, the data pre-processor 200 may receive weather data and power data from the
이상치 탐지부(300)는 데이터 전처리부(200)로부터 전처리된 전력 데이터를 수신한다. 이상치 탐지부(300)는 전처리된 전력 데이터에서 이상치를 탐지할 수 있다. The
본 출원의 일 실시 예에 있어서, 이상치 탐지부(300)는 변분 오토인코더(Variational Autoencoder, VAE)를 통하여 이상치를 탐지할 수 있다. 변분 오토인코더는 입력 값의 분포를 학습하여 출력 값을 생성하기 때문에, 이상치 탐지부(300)는 일반적인 전력 수요 분포에서 벗어난 이상치를 좀 더 잘 탐지할 수 있다. 이상치 탐지부(300)는 이하의 도 4 및 도 5에서 좀 더 자세히 설명될 것이다. In one embodiment of the present application, the
이상치 복원부(400)는 이상치 탐지부(300)로부터 이상 데이터를 수신한다. 이상치 복원부(400)는 이상 데이터에 대응하는 시점의 다른 입력 변수를 기반으로 하여, 이상 데이터를 복원하여 복원 데이터를 생성한다.The
본 출원의 일 실시 예에 있어서, 이상치 복원부(400)는 랜덤 포레스트(RF) 모델을 통하여 이상치 데이터로부터 복원 데이터를 복원할 수 있다. 이상치 복원부(400)는 이하의 도 6 및 도 7에서 좀 더 자세히 설명될 것이다.In an embodiment of the present application, the
전력수요 예측부(500)는 이상치 복원부(500)로부터 복원 데이터를 포함하는 입력 데이터를 수신한다. 여기서, 입력 데이터는 데이터 전처리부(200)에서 전처리된 데이터 및 이상치 복원부(400)에서 복원된 데이터를 포함한다. 전력수요 예측부(500)는 입력 데이터를 사용하여 전력수요량 예측을 위한 모델을 학습시킬 수 있다. The
본 출원의 일 실시 예에 있어서, 전력수요 예측부(500)는 슬라이딩 윈도우(sliding window) 기반의 Light GBM 모델을 통하여 구현될 수 있다. 전력수요 예측부(500)는 이하의 도 8 및 도 9에서 좀 더 자세히 설명될 것이다.In an embodiment of the present application, the
상술한 바와 같이, 본 출원의 실시 예에 따른 전력 수요량 예측 장치(10)는 변분 오토인코더를 통하여 이상치를 탐지하고, 랜덤 포레스트 모델을 통하여 이상치를 복원한다. 따라서, 데이터 수가 충분하지 않은 상황에서도 안정적인 학습 데이터 제공이 가능하며, 이에 따라 전력 수요량 예측 장치(10)는 오버 피팅 없이 향상된 예측 성능을 제공할 수 있다. 아울러, 전력 수요량 예측 장치(10)는 슬라이딩 윈도우 기반의 Light GBM 모델을 통하여 예측 모델을 구현하며, 이에 따라 예측 시점과 가까운 최신 데이터 패턴을 적절히 반영할 수 있어서 예측 성능을 더욱 향상시킬 수 있다.As described above, the power
도 2는 도 1의 데이터 전처리부(200)를 좀 더 자세히 보여주는 블록도이다.FIG. 2 is a block diagram showing the
도 2를 참조하면, 데이터 전처리부(200)는 기상 데이터 전처리부(210), 전력 데이터 전처리부(220) 및 시간 데이터 전처리부(230)를 포함한다.Referring to FIG. 2 , the
기상 데이터 전처리부(210)는 데이터 수집부(100)로부터 기상 데이터(Data_W)를 수신한다. 기상 데이터 전처리부(210)는 수신된 기상 데이터(Data_W)에 대한 전처리 동작을 수행하여 제1 기상 데이터(Data_W1)를 생성한다.The weather data
예를 들어, 기상 데이터 전처리부(210)는 데이터 수집부(100)로부터 일 최고 기온, 일 최저 기온, 기온, 습도, 풍속, 전운량, 강수량 등의 데이터를 수신할 수 있다. 기상 데이터 전처리부(210)는 수신된 기상 데이터들에 대한 정규화 동작을 수행하는 것을 통해 제1 기상 데이터(Data_W1)를 생성할 수 있다. For example, the meteorological
또한, 기상 데이터 전처리부(210)는 수신된 기온, 습도, 풍속 데이터에 기초하여 체감 온도 데이터와 불쾌지수 데이터를 생성할 수 있다. 이후, 기상 데이터 전처리부(210)는 체감 온도 데이터와 불쾌지수 데이터를 정규화하여 제2 기상 데이터(Data_W2)를 생성할 수 있다.Also, the meteorological
전력 데이터 전처리부(220)는 데이터 수집부(100)로부터 적어도 하나의 클러스터에서 소모된 전력량에 대한 전력 데이터를 수신할 수 있다. 전력 데이터 전처리부(220)는 수신된 전력 데이터에 대한 전처리 동작을 수행하여 전처리된 전력 데이터(Data_Pp)를 생성할 수 있다.The
시간 데이터 전처리부(230)는 데이터 수집부(100)로부터 시간 데이터(Data_T)를 수신한다. 여기서, 시간 데이터는 범주형 데이터를 반영하는데 좋은 1차원 데이터일 수 있다. 시간 데이터 전처리부(230)는 1차원의 시간 데이터(Data_T)를 그대로 출력하거나, 1차원의 시간 데이터(Data_T)를 주기성 정보를 반영할 수 있는 2차원의 시간 데이터((Data_T1, Data_T2)로 변환할 수 있다.The time
좀 더 자세히 설명하면, 1차원 시간 데이터는 1월, 2월과 같은 월(month)을 나타내는 범주형 정보, 1일, 2일과 같이 일(day)을 나타내는 범주형 정보 및 1시, 2시와 같이 시(hour)를 나타내는 범주형 정보는 잘 반영한다. 그러나, 1차원 시간 데이터는 주기성 정보는 잘 반영하지 못한다는 문제가 있다. 예를 들어, 23시와 0시는 연속적인 시간임에도 불구하고, 1차원 데이터 상으로는 23의 차이가 발생하게 된다.In more detail, one-dimensional time data includes categorical information representing months such as January and February, categorical information representing days such as 1st and 2nd, and 1:00, 2:00 and Similarly, categorical information representing hours is well reflected. However, there is a problem that one-dimensional time data does not reflect periodicity information well. For example, although 23 o'clock and 0 o'clock are consecutive times, a difference of 23 occurs on one-dimensional data.
따라서, 시간의 주기성 정보가 잘 반영될 수 있도록, 시간 데이터 전처리부(230)는 1차원의 시간 데이터(Data_T)를 2차원의 시간 데이터((Data_T1, Data_T2)로 변환할 수 있다. 이때, 시간 데이터 전처리부(230)는 사인(sin) 함수와 코사인 함수(cos)와 같은 주기 함수를 통하여 변환 동작을 수행할 수 있다. 예를 들어, 시간 데이터 전처리부(230)는 다음의 수식을 통하여 1차원의 시간 데이터(Data_T)를 2차원의 시간 데이터(Data_T1, Data_T2)로 변환할 수 있다.Accordingly, the time
여기서, "cycle"은 시간 데이터의 주기를 나타낸다. 예를 들어, "time"이 월(month) 데이터인 경우에 "cycle"은 "12"일 수 있고, "time"이 일(day) 데이터인 경우에 "cycle"은 해달 월의 일수(Day of the Month)일 수 있으며, "time"이 시(hour) 데이터인 경우에 "cycle"은 "24"일 수 있다. 또한, 여기서, ""와 ""는 각각 도 2의 Data_T1과 Data_T2에 대응할 수 있다.Here, "cycle" represents a period of time data. For example, when "time" is month data, "cycle" can be "12", and when "time" is day data, "cycle" is the number of days of the month. the Month), and when "time" is hour data, "cycle" may be "24". Also, here, " "and " " may correspond to Data_T1 and Data_T2 of FIG. 2 , respectively.
한편, 시간 데이터 전처리부(230)가 2개의 삼각함수 값을 통해 2차원으로 표현하는 이유는, 예를 들어 주기가 12인 하나의 삼각함수 값을 통해 표현할 경우에는 두 개의 x값에 대해서 같은 y값이 결정되며, 이 경우에 y값만으로 시기를 특정하기 어렵기 때문이다. 따라서, 동일한 x값이라도 서로 다른 y값을 갖는 두 개의 삼각함수를 사용하여 이러한 문제를 해결할 수 있도록, 시간 데이터 전처리부(230)는 2개의 삼각함수를 이용하여 2차원 데이터(Data_T1, Data_T2)를 생성한다.On the other hand, the reason why the
상술한 바와 같이, 데이터 전처리부(200)는 기상 데이터(Data_W), 전력 데이터(Data_P) 및 시간 데이터(Data_T)에 대한 전처리 동작을 수행할 수 있다. 특히, 데이터 전처리부(200)는 특히 범주형 정보를 잘 반영하는 1차원의 시간 데이터(Data_T)와 주기성 정보를 잘 반영하는 2차원의 시간 데이터(Data_T1, Data_T2)를 함께 출력할 수 있다.As described above, the
도 3은 도 2의 시간 데이터 전처리부(230)에 의하여 출력되는 시간 데이터의 일 예를 보여주는 도면이다. 구체적으로, 도 3a는 범주형 시간 데이터(Data_T)의 일 예를 보여주며, 도 3b는 2차원 시간 데이터(Data_T1, Data_T2)의 일 예를 보여준다.FIG. 3 is a diagram showing an example of time data output by the
도 3에 도시된 바와 같이, 시간 데이터 전처리부(230)는 시간 데이터(Data_T)에 대한 전처리 동작을 수행하여 2차원 시간 데이터(Data_T1, Data_T2)를 생성할 수 있다. As shown in FIG. 3 , the
도 4는 도 1의 이상치 탐지부(300)를 좀 더 자세히 보여주는 도면이고, 도 5는 이상치 탐지부(300)의 이상치 탐지 실험 결과를 보여주는 그래프이다.FIG. 4 is a diagram showing the
도 4를 참조하면, 이상치 탐지부(300)는 데이터 전처리부(200)로부터 전처리된 전력 데이터(Data_Pp)를 수신한다. 이상치 탐지부(300)는 전처리된 전력 데이터(Data_Pp)에서 이상치를 탐지하여, 정상 데이터(Normal Data)와 이상 데이터(Abnormal Data)로 구분할 수 있다.Referring to FIG. 4 , the
본 출원의 실시 예에 있어서, 이상치 탐지부(300)는 변분 오토인코더를 통하여 구현될 수 있다. 즉, 이상치 탐지부(300)는 전처리된 전력 데이터를 이용하여 변분 인코더를 학습하고, 학습된 변분 오토인코더를 통해 재구성된 출력 값과 입력 값의 차이를 이용하여 이상치를 탐지할 수 있다. In an embodiment of the present application, the
만약 이상치 탐지부가 일반 오토인코더(AE)를 통하여 구현한다면, 오토인코더 기반의 이상 탐지부는 모든 입력 변수를 재구성한 후에 각 입력 변수들의 재구성 오류를 모두 더한다. 이후, 오토인코더 기반의 이상 탐지부는 재구성 오류의 합이 일정 값 이상이 될 경우에 이상치라고 판단한다. 그러나, 이 경우, 실제 전력 소모량에 이상치가 발생한 경우가 아닐 때에도, 오토인코더 기반의 이상치 탐지부는 이상치라고 판단할 수 있는 위험이 있다. If the anomaly detection unit is implemented using a general autoencoder (AE), the autoencoder-based anomaly detection unit reconstructs all input variables and then adds reconstruction errors of each input variable. Thereafter, the anomaly detection unit based on the autoencoder determines that the sum of the reconstruction errors is an outlier when it exceeds a certain value. However, in this case, even when an outlier does not occur in actual power consumption, there is a risk that the autoencoder-based outlier detection unit may determine the outlier as an outlier.
예를 들어, 여름철에 장마로 인하여 갑작스럽게 어느 한 시점에 비가 많이 내렸다고 가정하자. 이 경우, 오토인코더에 기반의 이상 탐지부는 모든 입력 변수들의 재구성 오류를 고려하기 때문에, 전력 사용량을 비롯하여 재구성된 입력 변수들이 정상임에도 불구하고 재구성된 강수량 관련 변수에서 차이가 많이 발생하여 결과적으로 이상치라고 잘못 판단할 수 있다.For example, let's assume that a lot of rain suddenly fell at a certain point in the summer due to the rainy season. In this case, since the anomaly detection unit based on the autoencoder considers the reconstruction error of all input variables, even though the reconstructed input variables including power consumption are normal, there is a large difference in the reconstructed precipitation-related variables, resulting in outliers. may misjudge.
이러한 오류 위험성을 방지하기 위하여, 본 출원의 실시 예에 따른 이상치 탐지부(300)는 변분 오토인코더를 통하여 구현될 수 있다. 이 경우, 모든 입력 변수의 재구성 오류를 더하는 것을 통해 이상치를 판단하는 것이 아니라, 전처리된 전력 데이터(Data_Pp)의 재구성 오류만을 이용하여 이상치가 판단되기 때문에, 본 출원의 실시 예에 따른 이상치 탐지부(300)는 좀 더 향상된 이상치 탐지 성능을 가질 수 있다. In order to prevent such a risk of error, the
도 5를 참조하면, 본 출원의 실시 예에 따른 변분 오토인코더 기반의 이상치 탐지부(300)가 다른 모델에 비하여 좀 더 향상된 성능을 갖는 것을 확인할 수 있다. 도 5에서, IQR, IForest, LOF는 각각 사분위수 범위(interquartile range, IQR)를 활용한 이상치 탐지 모델, Isolation Forest 이상치 탐지 모델 및 Local Outlier Factor 이상치 탐지 모델을 의미한다.Referring to FIG. 5 , it can be seen that the
도 6은 도 1의 이상치 복원부(400)를 좀 더 자세히 보여주는 도면이고, 도 7은 이상치 복원부(400)의 복원 실험 결과를 보여주는 그래프이다.FIG. 6 is a diagram showing the
도 6을 참조하면, 이상치 복원부(400)는 이상치 탐지부(300)로부터 정상 데이터(Normal Data)와 이상 데이터(Abnormal Data)를 수신한다. 이상치 복원부(400)는 이상 데이터가 탐지된 시점의 다른 입력 변수를 기반으로 하여 이상 데이터를 복원 데이터(Repair Data)로 복원할 수 있다.Referring to FIG. 6 , the
본 출원의 일 실시 예에 있어서, 이상치 복원부(400)는 랜덤 포레스트(RF) 모델을 사용하여 구현될 수 있다. 즉, 이상치 복원부(400)는 정상 데이터를 사용하여 랜덤 포레스트 모델을 학습하고, 학습된 랜덤 포레스트 모델에 이상치가 발생한 시점의 입력 변수들을 넣었을 때에 도출된 값으로 복원 데이터를 생성할 수 있다. 랜덤 포레스트 모델은 부분 데이터 셋을 사용하여 각각의 의사 결정 트리를 학습한다. 따라서, 이상치 복원부(400)는 오버 피팅이 발생하지 않을 뿐 아니라, 입력 변수가 많음에도 불구하고 향상된 성능을 가질 수 있다.In one embodiment of the present application, the
도 7을 참조하면, 본 출원의 실시 예에 따른 랜덤 포레스트 기반의 이상치 복원부(400)가 다른 모델에 비하여 좀 더 향상된 성능을 갖는 것을 확인할 수 있다. 도 7에서, Zero, Linear, RF 는 각각 zero interpolation을 사용하여 이상치를 복원하였을 때, Linear interpolation을 사용하여 이상치를 복원하였을 때 및 Random Forest를 사용하여 이상치를 복원하였을 때를 나타낸다.Referring to FIG. 7 , it can be confirmed that the random forest-based
도 8은 도 1의 전력 수요 예측부(500)를 좀 더 자세히 보여주는 도면이고, 도 9는 전력 수요 예측부(500)의 윈도우 사이즈 결정을 위한 실험 결과를 보여주는 그래프이다. 8 is a diagram showing the power
도 8을 참조하면, 전력 수요 예측부(500)는 이상치 복원부(400)부로부터 전력 소모량에 대한 정상 데이터 및 복원 데이터를 수신하고, 데이터 전처리부(200)로부터 제1 및 제2 기상 데이터(Data_W1, Data_W2), 범주형 시간 데이터(Data_T) 및 주기성 시간 데이터(Data_T1, Data_T2)를 수신할 수 있다. 전력 수요 예측부(500)는 수신된 입력 데이터들에 기초하여, 전력 수요량 예측 모델을 학습하고, 학습된 전력 수요량 예측 모델을 통하여 미래의 전력 수요량을 예측할 수 있다.Referring to FIG. 8 , the power
본 출원의 일 실시 예에 있어서, 전력 수요 예측부(500)는 슬라이딩 윈도우(sliding window) 기반의 Light GBM 모델을 통하여 구현될 수 있다. 슬라이딩 윈도우 기법을 적용함으로써, 전력 수요 예측부(500)는 최신 추세 및 패턴을 적절하게 반영할 수 있다. In one embodiment of the present application, the power
예를 들어, 도 8에서, 점들은 각각 하루치의 입력 데이터를 의미할 수 있다. 이 경우, 전력 수요 예측부(500)는 예측하고자 하는 시점으로부터 이전 일주일의 입력 데이터를 사용하기 때문에, 최신 데이터를 반영할 수 있어 좋은 성능을 가질 수 있다. For example, in FIG. 8 , each dot may mean one day's worth of input data. In this case, since the power
본 출원의 일 실시 예에 있어서, 전력 수요 예측부(500)는 윈도우 사이즈(window size)로 '7'을 설정할 수 있다. 도 9를 참조하면, 윈도우 사이즈가 '1'에서부터 '7'로 증가하는 동안에는 그 성능이 향상되지만, 윈도우 사이즈가 '7'을 초과하는 경우부터는 성능 향상은 미미한 반면에 학습 시간만 늘어나는 것을 확인할 수 있다. 이는 전력 수요량에 대한 데이터가 일정 부분 주기적 패턴으로 반복되는 경향을 보이기 때문이다. 즉, 예측하고자 하는 시점이 월요일인 경우, 입력 변수로 지난주 월요일의 데이터를 입력하면 주기적 패턴을 반영할 수 있어서 성능이 향상될 수 있다. 본 출원의 실시 예에 따른 전력 수요 예측부(500)는 전력 수요량에 대한 이러한 주기적 패턴을 반영하기 위하여, 윈도우 사이즈를 '7'로 설정한다.In one embodiment of the present application, the
한편, 슬라이딩 윈도우 기법을 적용하는 경우, 예측하고자 하는 시점마다 모델을 새롭게 구성해야 하는 단점이 존재한다. 본 출원의 실시 예에 따른 전력 수요 예측부(500)는 이러한 단점을 보완하기 위하여 모델 구성 속도가 빠르면서도 예측 성능이 뛰어난 Light GBM 모델을 사용하여 구현될 수 있다. 이 경우, 전력 수요 예측부(500)는 데이터 중 기울기가 큰 부분만을 사용하여 정보를 얻는 GOSS(Gradient-based One Side Sampling) 기법과 상호 배타적 변수들을 묶어서 처리하는 EFB(Exclusive Featuree Bundling) 기법을 사용하여 모델의 구성 속도를 좀 더 빠르게 할 수 있다. On the other hand, when the sliding window technique is applied, there is a disadvantage in that a model must be newly constructed at each point in time to be predicted. The power
도 10은 본 출원의 실시 예에 따른 전력 수요량 예측 장치(10)의 예측 결과를 다른 모델과 비교하는 그래프이다. 10 is a graph comparing prediction results of the power
도 10에 도시된 바와 같이, 서로 다른 클러스터 4개에 대한 전력 수요를 예측한 결과, 전력 수요량 예측 장치(10)의 MAPE(Mean Absolute Percentage Error)는 각각 4.545%, 3.755%, 2.7%, 2.144%를 기록하였으며, 다른 모델에 비하여 뛰어난 예측 성능을 갖는 것을 확인할 수 있다.As shown in FIG. 10, as a result of predicting power demand for four different clusters, the mean absolute percentage error (MAPE) of the power
도 11은 도 1의 전력 수요량 예측 장치(10)의 동작을 보여주는 순서도이다.FIG. 11 is a flowchart showing the operation of the
S110 단계에서, 데이터 수집부(100)는 기상 데이터, 시간 데이터 및 전력 데이터를 수집할 수 있다. In step S110, the
S120 단계에서, 데이터 전처리부(200)는 수집된 기상 데이터, 시간 데이터 및 전력 데이터에 대한 전처리 동작을 수행할 수 있다. 예를 들어, 데이터 전처리부(200)는 기상 데이터 및 전력 데이터에 대한 정규화 동작을 수행할 수 있다. 예를 들어, 데이터 전처리부(200)는 1차원의 시간 데이터를 2차원의 시간 데이터로 변환할 수 있다. In step S120 , the
S130 단계에서, 이상치 탐지부(300)는 전처리된 전력 데이터 중 이상치를 탐지하는 동작을 수행할 수 있다. 예를 들어, 이상치 탐지부(300)는 전력 데이터를 이상 데이터와 정상 데이터로 분류할 수 있으며, 이상치 탐지부(300)는 변분 오토인코더(VAE)를 통하여 구현될 수 있다.In step S130, the
S140 단계에서, 이상치 복원부(400)는 이상 데이터를 복원할 수 있다. 예를 들어, 이상치 복원부(400)는 랜덤 포레스트 모델을 통하여 이상 데이터를 복원하여 복원 데이터를 생성할 수 있다. In step S140, the abnormal
S150 단계에서, 전력 수요 예측부(500)는 복원 데이터를 포함하는 입력 데이터에 기초하여 예측 모델을 학습할 수 있다. 예를 들어, 전력 수요 예측부(500)는 슬라이딩 윈도우 기반 LightGBM을 통하여 구현될 수 있다. 학습된 예측 모델을 통하여, 전력 수요 예측부(500)는 미래 시점의 전력 수요량을 정확하게 예측할 수 있다. In step S150, the
이상에서는 본 발명에 따른 바람직한 실시 예들에 대하여 도시하고 또한 설명하였다. 그러나 본 발명은 상술한 실시 예에 한정되지 아니하며, 특허 청구의 범위에서 첨부하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변형 실시가 가능할 것이다.In the above, preferred embodiments according to the present invention have been shown and described. However, the present invention is not limited to the above-described embodiments, and various modifications can be made by anyone having ordinary knowledge in the technical field to which the present invention belongs without departing from the gist of the present invention appended within the scope of the claims. .
100: 데이터 수집부
200: 데이터 전처리부
300: 이상치 탐지부
400: 이상치 복원부
500: 전력 수요 예측부100: data collection unit
200: data pre-processing unit
300: outlier detection unit
400: outlier restoration unit
500: power demand forecasting unit
Claims (14)
상기 기상 데이터, 상기 전력 데이터 및 상기 시간 데이터에 대한 전처리 동작을 수행하는 데이터 전처리부;
변분 오토인코더를 통하여 구현되며, 상기 전처리된 전력 데이터를 이상 데이터와 정상 데이터로 분류하는 이상치 탐지부;
랜덤 포레스트 모델을 통하여 구현되며, 상기 이상 데이터를 복원하여 복원 데이터를 생성하는 이상치 복원부; 및
슬라이딩 윈도우 기반의 LightGBM 모델을 통하여 구현되며, 상기 정상 데이터와 상기 복원 데이터에 기초하여 예측 모델을 학습하고 전력 수요량을 예측하는 전력 수요 예측부를 포함하는, 전력 수요량 예측 장치.a data collection unit that collects weather data, power data, and time data;
a data preprocessing unit performing a preprocessing operation on the weather data, the power data, and the time data;
an anomaly detection unit implemented through a variational autoencoder and classifying the preprocessed power data into abnormal data and normal data;
an outlier restoration unit implemented using a random forest model and restoring the abnormal data to generate restored data; and
An apparatus for predicting power demand, which is implemented using a sliding window-based LightGBM model, and includes a power demand prediction unit that learns a prediction model based on the normal data and the restored data and predicts power demand.
상기 데이터 전처리부는
상기 기상 데이터에 대한 정규화 동작을 수행하는 기상 데이터 전처리부;
상기 전력 데이터에 대한 정규화 동작을 수행하는 전력 데이터 전처리부; 및
상기 시간 데이터를 2차원의 시간 데이터로 변환하는 시간 데이터 전처리부를 포함하는, 전력 수요량 예측 장치.According to claim 1,
The data pre-processing unit
a weather data pre-processing unit performing a normalization operation on the weather data;
a power data pre-processing unit performing a normalization operation on the power data; and
and a time data pre-processing unit that converts the time data into two-dimensional time data.
상기 기상 데이터 전처리부는 상기 기상 데이터 중 기온, 습도, 풍속 데이터에 기초하여 체감 온도 데이터와 불쾌지수 데이터를 생성하고, 생성된 체감 온도 데이터와 불쾌지수 데이터에 대한 정규화 동작을 수행하는, 전력 수요량 예측 장치.According to claim 2,
The meteorological data pre-processing unit generates felt temperature data and discomfort index data based on temperature, humidity, and wind speed data among the meteorological data, and performs a normalization operation on the generated felt temperature data and discomfort index data. .
상기 시간 데이터 전처리부는 주기 함수를 이용하여 상기 시간 데이터를 서로 다른 두 개의 2차원 시간 데이터로 변환하는, 전력 수요량 예측 장치.According to claim 2,
The time data pre-processing unit converts the time data into two different two-dimensional time data using a periodic function.
상기 데이터 수집부가 수집하는 기상 데이터는 기상 예보 데이터 및 측정 기상 데이터 중 어느 하나인, 전략 수요량 예측 장치.According to claim 1,
The weather data collected by the data collection unit is any one of weather forecast data and measured weather data, strategic demand forecasting device.
상기 전력 수요 예측부는 7의 윈도우 사이즈를 갖는, 전력 수요량 예측 장치.According to claim 1,
The power demand prediction unit has a window size of 7, power demand prediction device.
데이터 전처리부에서, 상기 기상 데이터, 상기 시간 데이터 및 상기 전력 데이터에 대한 전처리 동작을 수행하는 단계;
이상치 탐지부에서, 상기 전처리된 전력 데이터 중 이상치를 탐지하는 단계;
이상치 복원부에서, 상기 이상치를 복원하여 복원 데이터를 생성하는 단계; 및
전력 수요 예측부에서, 상기 복원 데이터를 학습 데이터로 하여 예측 모델을 학습하고, 상기 학습된 예측 모델에 기초하여 전력 수요량을 예측하는 단계를 포함하는, 전력 수요량 예측 방법. Collecting weather data, time data, and power data in a data collection unit;
performing a pre-processing operation on the weather data, the time data, and the power data in a data pre-processing unit;
detecting an outlier among the preprocessed power data in an outlier detection unit;
restoring the outliers in an outlier restoring unit to generate restoration data; and
In a power demand prediction unit, learning a prediction model using the restored data as learning data, and predicting power demand based on the learned prediction model.
상기 전처리 동작을 수행하는 단계는
상기 기상 데이터 및 상기 전력 데이터를 정규화하는 단계; 및
상기 시간 데이터를 주기함수를 이용하여 서로 다른 두 개의 시간 데이터로 변환하는 단계를 포함하는, 전력 수요량 예측 방법. According to claim 7,
The step of performing the preprocessing operation is
normalizing the meteorological data and the power data; and
and converting the time data into two different time data using a periodic function.
상기 기상 데이터를 정규화하는 단계는
상기 기상 데이터 중 기온, 습도, 풍속 데이터에 기초하여 체감 온도 데이터와 불쾌지수 데이터를 생성하는 단계; 및
상기 생성된 체감 온도 데이터와 상기 생성된 불쾌지수 데이터에 대한 정규화 동작을 수행하는 단계를 포함하는, 전력 수요량 예측 방법.According to claim 8,
Normalizing the meteorological data
generating sensory temperature data and discomfort index data based on temperature, humidity, and wind speed data among the meteorological data; and
And performing a normalization operation on the generated sensory temperature data and the generated discomfort index data.
상기 기상 데이터는 기상 예보 데이터 및 측정 기상 데이터 중 어느 하나인, 전력 수요량 예측 방법.According to claim 9,
The weather data is any one of weather forecast data and measured weather data, power demand prediction method.
상기 이상치 탐지부는 변분 오토인코더를 통하여 구현되는, 전력 수요량 예측 방법.According to claim 7,
Wherein the outlier detection unit is implemented through a variational autoencoder.
상기 이상치 복원부는 랜덤 포레스트 모델을 통하여 구현되는, 전력 수요량 예측 방법.According to claim 7,
Wherein the outlier restoration unit is implemented through a random forest model.
상기 전력 수요량 예측부는 슬라이딩 윈도우 기반의 LightGBM을 통하여 구현되는, 전력 수요량 예측 방법.According to claim 7,
Wherein the power demand prediction unit is implemented through a sliding window-based LightGBM.
상기 전력 수요량 예측부는 7의 윈도우 사이즈를 갖는, 전력 수요량 예측 방법.
According to claim 13,
Wherein the power demand prediction unit has a window size of 7.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210177250A KR102593144B1 (en) | 2021-12-13 | 2021-12-13 | Anomaly detiection and repair based electrical load forecasting device and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210177250A KR102593144B1 (en) | 2021-12-13 | 2021-12-13 | Anomaly detiection and repair based electrical load forecasting device and method |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20230088967A true KR20230088967A (en) | 2023-06-20 |
KR102593144B1 KR102593144B1 (en) | 2023-10-23 |
Family
ID=86995099
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210177250A KR102593144B1 (en) | 2021-12-13 | 2021-12-13 | Anomaly detiection and repair based electrical load forecasting device and method |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102593144B1 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102650227B1 (en) | 2023-09-26 | 2024-03-20 | 전남대학교산학협력단 | Power consumption prediction device through edge device-based data abnormality detection and missing data supplementation and method for controlling the same |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200123310A (en) * | 2019-04-18 | 2020-10-29 | 한국전력공사 | Apparatus and method for predicting short term electrical load |
JP2021002311A (en) * | 2019-06-25 | 2021-01-07 | 国立大学法人大阪大学 | Analyzer |
KR20210126378A (en) * | 2020-04-10 | 2021-10-20 | (주)쓰리뷰 | Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment |
KR102321767B1 (en) * | 2020-11-16 | 2021-11-03 | 충북대학교 산학협력단 | Energy Data Preprocessing Platform System based on Deep Learning Algorithm |
-
2021
- 2021-12-13 KR KR1020210177250A patent/KR102593144B1/en active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200123310A (en) * | 2019-04-18 | 2020-10-29 | 한국전력공사 | Apparatus and method for predicting short term electrical load |
JP2021002311A (en) * | 2019-06-25 | 2021-01-07 | 国立大学法人大阪大学 | Analyzer |
KR20210126378A (en) * | 2020-04-10 | 2021-10-20 | (주)쓰리뷰 | Real-time sliding window based anomaly detection system for multivariate data generated by manufacturing equipment |
KR102321767B1 (en) * | 2020-11-16 | 2021-11-03 | 충북대학교 산학협력단 | Energy Data Preprocessing Platform System based on Deep Learning Algorithm |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102650227B1 (en) | 2023-09-26 | 2024-03-20 | 전남대학교산학협력단 | Power consumption prediction device through edge device-based data abnormality detection and missing data supplementation and method for controlling the same |
Also Published As
Publication number | Publication date |
---|---|
KR102593144B1 (en) | 2023-10-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Tan et al. | Ultra-short-term industrial power demand forecasting using LSTM based hybrid ensemble learning | |
Jebli et al. | Prediction of solar energy guided by pearson correlation using machine learning | |
Ogliari et al. | Physical and hybrid methods comparison for the day ahead PV output power forecast | |
Liu et al. | Super resolution perception for smart meter data | |
Dhanya et al. | Multivariate nonlinear ensemble prediction of daily chaotic rainfall with climate inputs | |
Singh et al. | Data driven day-ahead electrical load forecasting through repeated wavelet transform assisted SVM model | |
Paoli et al. | Solar radiation forecasting using ad-hoc time series preprocessing and neural networks | |
CN114707688A (en) | Photovoltaic power ultra-short-term prediction method based on satellite cloud chart and space-time neural network | |
Wang et al. | Study on wavelet neural network based anomaly detection in ocean observing data series | |
Singla et al. | A hybrid solar irradiance forecasting using full wavelet packet decomposition and bi-directional long short-term memory (BiLSTM) | |
Mokarram et al. | Net-load forecasting of renewable energy systems using multi-input LSTM fuzzy and discrete wavelet transform | |
Al-Ja’afreh et al. | An enhanced CNN-LSTM based multi-stage framework for PV and load short-term forecasting: DSO scenarios | |
KR102593144B1 (en) | Anomaly detiection and repair based electrical load forecasting device and method | |
Malik et al. | Multi-step ahead time-series wind speed forecasting for smart-grid application | |
CN117893057A (en) | Deep learning-based photovoltaic string dust accumulation degree evaluation method and system | |
Song et al. | Sea level simulation with signal decomposition and machine learning | |
Ibrahim et al. | LSTM neural network model for ultra-short-term distribution zone substation peak demand prediction | |
Wu et al. | Overview of Day-ahead Solar Power Forecasts Based on Weather Classifications and a Case Study in Taiwan | |
Gupta et al. | Harnessing the power of hybrid deep learning algorithm for the estimation of global horizontal irradiance | |
Maalej et al. | Sensor data augmentation strategy for load forecasting in smart grid context | |
Bantupalli et al. | Wind Speed forecasting using empirical mode decomposition with ANN and ARIMA models | |
Das et al. | Estimation of long range correlations and FARIMA modelling of wind speed in Maharashtra | |
CN114629103A (en) | Building load decomposition method based on acceptance structure load decomposition model | |
Zhang et al. | Spatial-temporal Offshore Current Field Forecasting Using Residual-learning Based Purely CNN Methodology with Attention Mechanism | |
Sahani et al. | Precise single step and multistep short-term photovoltaic parameters forecasting based on reduced deep convolutional stack autoencoder and minimum variance multikernel random vector functional network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |