KR102413415B1 - 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법 - Google Patents

태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법 Download PDF

Info

Publication number
KR102413415B1
KR102413415B1 KR1020210167191A KR20210167191A KR102413415B1 KR 102413415 B1 KR102413415 B1 KR 102413415B1 KR 1020210167191 A KR1020210167191 A KR 1020210167191A KR 20210167191 A KR20210167191 A KR 20210167191A KR 102413415 B1 KR102413415 B1 KR 102413415B1
Authority
KR
South Korea
Prior art keywords
value
power generation
data
equation
solar power
Prior art date
Application number
KR1020210167191A
Other languages
English (en)
Inventor
홍석훈
전재성
최영민
박철영
임수창
정하영
박승현
장선진
윤상희
김창헌
Original Assignee
홍석훈
(주) 티이에프
재단법인 녹색에너지연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 홍석훈, (주) 티이에프, 재단법인 녹색에너지연구원 filed Critical 홍석훈
Priority to KR1020210167191A priority Critical patent/KR102413415B1/ko
Application granted granted Critical
Publication of KR102413415B1 publication Critical patent/KR102413415B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H02GENERATION; CONVERSION OR DISTRIBUTION OF ELECTRIC POWER
    • H02SGENERATION OF ELECTRIC POWER BY CONVERSION OF INFRARED RADIATION, VISIBLE LIGHT OR ULTRAVIOLET LIGHT, e.g. USING PHOTOVOLTAIC [PV] MODULES
    • H02S50/00Monitoring or testing of PV systems, e.g. load balancing or fault identification
    • H02S50/10Testing of PV devices, e.g. of PV modules or single PV cells
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E10/00Energy generation through renewable energy sources
    • Y02E10/50Photovoltaic [PV] energy
    • Y02E10/56Power conversion systems, e.g. maximum power point trackers

Landscapes

  • Supply And Distribution Of Alternating Current (AREA)

Abstract

태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법이 개시된다. 본 발명은 태양광 발전량 데이터를 수신하는 단계, 상기 태양광 발전량 데이터의 결측치 정보를 생성하는 단계, 칼만 필터를 이용하여 상기 결측치 정보에 대응한 예측치 정보를 생성하는 단계 및 상기 예측치 정보를 기초로 상기 태양광 발전량 데이터를 수정하는 단계를 포함할 수 있다.

Description

태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법{METHOD OF INTERPOLATION OF MISSING VALUES IN A TIME SERIES MODEL FOR SOLAR POWER GENERATION DATA}
본 발명은 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법에 관한 것이다. 보다 상세하게는, 결측치를 예측치로 대치하여 보간하기 위한 결측치 보간 방법에 대한 것이다.
일반적으로, 태양광 발전 시스템은 태양광을 직접 전력으로 변환시키는 발전으로, 태양빛에 의해 전기 에너지를 발생하는 태양광모듈로부터 전력을 공급받아 상전계통과 주택에 안정된 전력을 공급하는 발전설비로, 고품질의 전기를 정전없이 저렴하고, 안전하게 사용할 수 있는 자연 친화적인 발전시스템이다. 특히, 태양광 발전 시스템은 기존 에너지원과는 달리 온실가스 배출 또는 환경 파괴 요인을 발생시키지 않는 무공해 에너지원으로 크게 대두되고 있는 실정이다.
최근 신재생 에너지의 핵심 중 하나로 볼 수 있는 태양광 에너지 발전 분야에서도 시계열 모형을 이용한 연구가 진행되고 있다. 태양광 발전 시스템의 성능 손실 분석, 인버터 효율 분석, 태양광 패널의 오염 예측 등 주로 발전 손실을 줄이고 효율을 개선하기 위한 연구들이 시계열 모형을 이용하여 진행되고 있다.
시계열 모형은 데이터의 변동을 설명하는 설명 변수(Explanatory Variable) 사이의 관계를 측정하기 어려운 경우 특히 유용하며, 일사량이나 태양광 패널의 출력과 같이 태양광 발전량에 영향을 주는 요소들의 예측은 스마트 그리드와 PV 시스템 간의 원활한 연계 측면에서도 중요하다. 또한, 정확한 분석 결과를 얻기 위해서는 결측치를 데이터의 특성을 고려하여 처리할 필요가 있다. 이에, 결측치를 예측치로 대체할 수 있는 기술의 필요성이 증가하고 있다.
대한민국 공개특허공보 제10-2021-0006874호 (발명의 명칭: 칼만필터 및 심층강화학습 기반의 풍력발전기 요 오정렬 제어 방법)
본 발명의 목적은 시계열 모형에 있어서 태양광 발전량 데이터 중 결측치를 보다 정확한 예측치로 보간할 수 있는 방법을 제공하는 것이다.
또한, 본 발명의 목적은 예측치를 검증하는 단계를 통하여 보다 정확한 예측치로 보간할 수 있는 방법을 제공하는 것이다.
상술한 문제점을 해결하기 위하여, 본 발명은 컴퓨팅 장치가 수행하는 결측치 보간 방법에 있어서, 태양광 발전량 데이터를 수신하는 단계, 상기 태양광 발전량 데이터의 결측치 정보를 생성하는 단계, 칼만 필터를 이용하여 상기 결측치 정보에 대응한 예측치 정보를 생성하는 단계 및 상기 예측치 정보를 기초로 상기 태양광 발전량 데이터를 수정하는 단계를 포함할 수 있다.
또한, 상기 태양광 발전량 데이터는 누적 발전량(Cumulative Power) 데이터일 수 있다.
또한, 상기 결측치 정보를 생성하는 단계는 상기 누적 발전량 데이터의 하루 주기를 기준으로 전처리 과정을 진행하되, 상기 전처리 과정은 1분 단위의 빈 데이터 목록을 생성하고, 상기 빈 데이터 목록과 상기 누적 발전량 데이터를 병합한 누적 발전량 데이터 목록을 생성할 수 있다.
또한, 상기 결측치 정보는 상기 누적 발전량 데이터 목록에 포함된 결측치에 대한 정보일 수 있다.
또한, 상기 빈 데이터 목록은 하루 중 발전이 시작된 가장 이른 시점과 발전이 종료된 가장 늦은 시점 사이를 1분 단위로 나눈 데이터 목록일 수 있다.
본 발명은 시계열 모형에 있어서 태양광 발전량 데이터 중 결측치를 보다 정확한 예측치로 보간할 수 있는 방법을 제공할 수 있다.
본 발명에 따라 얻을 수 있는 효과는 이상에서 언급한 효과로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 명세서가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명에 따른 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법을 나타낸 것이다.
도 2는 7일간 태양광 발전을 통한 전력량 그래프이다.
도 3은 실제 누적 발전량과 이동 평균 예측치로 보정한 누적 발전량 그래프이다.
도 4는 이동 평균 예측치와 측정치의 시간별 그래프이다.
도 5는 실제 누적 발전량과 칼만 필터 예측치로 보정한 누적 발전량 그래프이다.
도 6은 이동 평균 예측치와 측정치의 시간별 그래프이다.
도 7은 각 데이터의 상대 오차를 시각적으로 나타낸 그래프이다.
도 8은 방식별 예측치와 측정값의 오차를 이용한 그래프이다.
도 9는 본 발명에 따른 데이터 검증 과정을 군집과 과정을 통하여 수행한 것이다.
본 명세서에 관한 이해를 돕기 위해 상세한 설명의 일부로 포함되는, 첨부 도면은 본 명세서에 대한 실시예를 제공하고, 상세한 설명과 함께 본 명세서의 기술적 특징을 설명한다.
이하, 첨부된 도면을 참조하여 본 명세서에 개시된 실시 예를 상세히 설명하되, 도면 부호에 관계없이 동일하거나 유사한 구성요소는 동일한 참조 번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.
또한, 본 명세서에 개시된 실시 예를 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 명세서에 개시된 실시 예의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
또한, 첨부된 도면은 본 명세서에 개시된 실시 예를 쉽게 이해할 수 있도록 하기 위한 것일 뿐, 첨부된 도면에 의해 본 명세서에 개시된 기술적 사상이 제한되지 않으며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다.
본 출원에서, "포함한다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
이하, 상술한 내용들을 바탕으로 본 명세서의 바람직한 일 실시예에 따른, 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법에 관하여 상세히 설명하면 다음과 같다.
도 1은 본 발명에 따른 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법을 나타낸 것이다.
도 1에 따르면, 본 발명에 따른 결측치 보간 방법은 태양광 발전량 데이터를 수신하는 단계(S1100), 상기 태양광 발전량 데이터의 결측치 정보를 생성하는 단계(S1200), 칼만 필터를 이용하여 상기 결측치 정보에 대응한 예측치 정보를 생성하는 단계(S1300) 및 상기 예측치 정보를 기초로 상기 태양광 발전량 데이터를 수정하는 단계(S1400)를 포함할 수 있다.
본 발명에 따른 결측치 보간 방법의 주체는 메모리와 프로세서를 포함하는 서버, 사용자 단말 등의 컴퓨팅 장치 또는 컴퓨팅 장치에 포함된 프로세서일 수 있다.
태양광 발전량 데이터를 수신하는 단계(S1100)는, 태양광을 이용한 발전 장치 또는 모듈로부터 미리 정해진 기간 동안 생성된 전력량을 모니터링한 데이터를 수신하는 단계일 수 있다. 해당 데이터는 단위 시간별로 생성되는 전력량에 대한 데이터일 수 있다. 또한, 해당 데이터는 누적 발전량(Cumulative Power) 데이터일 수 있다.
태양광 발전량 데이터의 결측치 정보를 생성하는 단계(S1200)는 특정 시점의 전력량 데이터가 측정되지 않은 시점에 대한 정보를 생성하는 단계일 수 있다.
특히 결측치는 예측 모델에서 편향(Bias)을 발생시킬 수 있으며, 편향은 데이터 분석에서 왜곡된 결과를 초래할 수 있다. 정확한 분석 결과를 얻기 위해서는 결측치를 데이터의 특성을 고려하여 처리할 필요성이 존재한다.
결측 메커니즘의 종류는 결측치 발생 확률과 다른 변수들의 관련성에 따라 3가지로 나뉠 수 있다. 결측치 발생 확률이 다른 변수들과 관계없는 독립 변수면 완전 무작위 결측(Missing Completely At Random, MCAR), 관측치에만 의존을 하면 무작위 결측(Missing At Random, MAR), 결측치가 결측치에 영향을 주면 비 무작위 결측(Missing Not At Random, MNAR)이라 할 수 있다.
태양광 발전량 데이터의 결측치 정보를 생성하는 단계(S1200)는 누적 발전량 데이터의 하루 주기를 기준으로 전처리 과정을 진행하되, 상기 전처리 과정은 1분 단위의 빈 데이터 목록을 생성하고, 상기 빈 데이터 목록과 상기 누적 발전량 데이터를 병합한 누적 발전량 데이터 목록을 생성하는 과정을 포함할 수 있다.
이때, 결측치 정보는 누적 발전량 데이터 목록에 포함된 결측치에 대한 정보일 수 있으며, 상기 빈 데이터 목록은 하루 중 발전이 시작된 가장 이른 시점과 발전이 종료된 가장 늦은 시점 사이를 1분 단위로 나눈 데이터 목록일 수 있다.
칼만 필터를 이용하여 상기 결측치 정보에 대응한 예측치 정보를 생성하는 단계(S1300)는, 칼만 필터 알고리즘을 통하여 결측치에 대한 예측치를 추정하는 단계일 수 있다.
칼만 필터는 시계열 데이터에서 전 시간의 상태와 다음 시간의 상태가 선형적인 상태를 가지며 상태 값에 확률 오차가 포함된 경우 사용이 가능한 알고리즘이다.
칼만 필터 알고리즘은 예측과정과 수정과정의 두 단계로 나뉠 수 있다. 예측과정은 S1300 단계에서 사용될 수 있고, 수정과정은 S1400 단계에서 사용될 수 있다.
예측과정에서는 현재의 상태와 오차 공분산을 이용하여 다음 값의 상태와 오차 공분산을 예측할 수 있고, 이때 칼만 필터는 다음과 같은 식으로 나타낼 수 있다.
[수학식 1]
Figure 112021137950811-pat00001
[수학식 2]
Figure 112021137950811-pat00002
수학식 1은 현재 상태
Figure 112021137950811-pat00003
에 시간에 따른 상태 변화를 나타내는
Figure 112021137950811-pat00004
와 외압
Figure 112021137950811-pat00005
으로 다음 상태에 대한 예측치
Figure 112021137950811-pat00006
을 도출하는 수학식일 수 있다.
수학식 2는 현재 상태에 대한 공분산을 바탕으로 다음 공분산을 예측하기 위한 수학식일 수 있다. 현재 공분산
Figure 112021137950811-pat00007
에 상태 변화
Figure 112021137950811-pat00008
를 반영한 후 상태에 대한 오차
Figure 112021137950811-pat00009
로 보정하여 다음 상태에 대한 예측 공분산
Figure 112021137950811-pat00010
을 도출한다. 수정과정에서는 칼만 이득을 계산하여 예측치를 측정값으로 보정할 수 있다.
[수학식 3]
Figure 112021137950811-pat00011
[수학식 4]
Figure 112021137950811-pat00012
[수학식 5]
Figure 112021137950811-pat00013
수학식 3은 수학식 2에서 계산한 공분산 예측치, 측정 데이터와 상태 데이터와의 관계
Figure 112021137950811-pat00014
, 측정 데이터에 포함된 오차
Figure 112021137950811-pat00015
를 반영하여 칼만 이득을 계산하는 식이다. 수학식 3의 칼만 이득으로 수학식 4의 측정치에 상태 예측치를 보정하여 상태 값을 도출한다. 상태 값과 마찬가지로 수학식 5에서 공분산 예측치도 칼만 이득을 반영하여 다음 상태의 공분산을 도출한다. 이 오차 공분산 값은 예측치가 얼마나 정확한지 알려주는 척도로도 사용할 수 있다.
또한, 본 발명은 칼만 필터를 이용하여 결측치 정보에 대응하는 예측치 정보를 생성할 수 있고, 칼만 필터 외에 이동 평균법을 이용하여 결측치 정보에 대응하는 예측치 정보를 생성할 수 있다.
통계학에서 단순 이동 평균은 m개의 원소에 대한 비가중 평균법을 이야기하며, 하기 수학식 6과 같이 나타낼 수 있다.
[수학식 6]
Figure 112021137950811-pat00016
이동 평균은 시계열 데이터의 측정 오류나 이상치와 같은 잡음을 제거하는 특성 때문에 이동 평균 평활(Smoothing)이라고 한다. 이동 평균은 자기회귀누적이동평균(Autogressive Integrated Moving Average, ARIMA) 분석법의 이동 평균 모델과는 다를 수 있다. 이동 평균은 과거 값들이 변화하는 추세를 추출하여 주기를 측정하기 위한 방법인 반면, 이동 평균 모델은 미랫값을 예측하기 위한 방법일 수 있다.
예측치 정보를 기초로 상기 태양광 발전량 데이터를 수정하는 단계(S1400)는 칼만 필터 알고리즘의 수정과정을 통하여 결측치를 예측치로 대체하는 단계일 수 있다.
수정된 태양광 발전량 데이터를 검증하는 단계(S1500)는 아래의 2가지 방식 중하나를 이용하여 이루어질 수 있다.
일 방식은 상대 오차를 통한 검증 방식일 수 있다. 상대 오차는 측정치와 예측치 사이의 절대값에을 예측치로 나누어 도출될 수 있다. 이때, 실제 수치와 예측치가 유사할수록 상대 오차는 0에 가까워진다.
[표 1]
Figure 112021137950811-pat00017
표 1은 측정값과 이동 평균을 이용한 예측치, 칼만 필터를 이용한 예측치의 상대 오차를 이용하여 기초 통계 분석한 표일 수 있다. 칼만 필터 예측치를 이용한 상대 오차의 중간값과 이동 평균 예측치를 이용한 상대 오차의 중간값의 차이는 6.47e-05이며, 각각의 상대 오차의 표준편차는 6.40e-06으로 근소한 차이를 보임을 확인할 수 있다.
도 2는 7일간 태양광 발전을 통한 전력량 그래프이고, 도 3은 실제 누적 발전량과 이동 평균 예측치로 보정한 누적 발전량 그래프이며, 도 4는 이동 평균 예측치와 측정치의 시간별 그래프이다.
도 2에 따르면, 하루 단위 발전량 데이터가 확인된다. 하루 단위 발전량 데이터는 시간에 따라 증가했다가 최고점을 찍은 이후 감소하며 종 모양 그래프를 그릴 수 있다.
따라서, 데이터 주기를 1일 기준으로 전처리를 진행하고, 데이터를 한 달 단위로 나누고, 그 데이터의 가장 이른 발전 시간부터 가장 늦은 발전 시간까지를 주기로 하는, 1분 간격 빈 데이터 목록이 확인된다.
그 후 생성된 빈 리스트를 기존 데이터와 병합한다. 하루를 기준으로 한 동주기를 가지는 결측치가 포함된 1분 단위 데이터 목록이 생성된다. 이 과정에서 생긴 결측치는 이동 평균과 칼만 필터 방법으로 채워질 수 있다.
도 3에 따르면, 2018년 5월 23일의 실제 누적 발전량과 이동 평균 예측치로 보정한 누적 발전량 그래프가 확인된다. 도 3의 그래프를 확대해 보면 예측치가 측정값과 값은 일정 수준의 차이를 보이다 측정값을 만나며 값이 보정되는 형태를 보인다. 측정값과 만났을 때 예측치가 보정되는 양상은 도 4의 발전량의 이동 평균을 이용한 예측치, 측정값 그래프에서 더 잘 관찰할 수 있다.
도 4에 따르면, 발전량의 이동 평균 예측치와 측정값의 시간별 그래프가 확인된다. 이때, y축인 Power는 분당 발전량을 나타낸다. 도 4(a)에 따르면, 이동 평균 예측치가 측정값을 반영하기 위하여, 예측치가 증가했다가 변화량의 중간값으로 수렴하는 계단 형태가 확인된다. 최대한 순간 변화를 반영하기 위해 원소 개수를 2개로 설정했음에도 급격한 변화에 빠르게 대응하지 못함을 알 수 있다. 도 4(b)에 따르면, 지속해서 유사한 값을 받아 예측치가 측정값에 가까워지는 모습이 확인된다.
도 5는 실제 누적 발전량과 칼만 필터 예측치로 보정한 누적 발전량 그래프이며, 도 6은 이동 평균 예측치와 측정치의 시간별 그래프이다.
도 5에 따르면, 018년 5월 23일 데이터의 실제 누적 발전량과 칼만 필터 예측치로 보정한 누적 발전량 그래프가 확인된다. 도 5의 그래프를 살펴보면, 측정값의 변화에 비율과 유사하게 예측치들이 변화하고 있으며, 각 측정값 사이에 예측치들이 존재하고 있음을 알 수 있다.
도 6에 따르면, y축인 Power는 분당 발전량을 나타냄이 확인된다. 이때, 예측치들은 대체로 측정값들 사이에 존재하고 있다. 도 6(a)에 따르면, 예측치가 직선에 가까운 모습으로 나타나다가 다음 측정값과 차이가 클 경우 예측치가 급격히 보정될 수 있다. 이때, 기록된 데이터의 시간 간격이 크고 이전 데이터가 감소 추세를 가질 경우 그래프는 계속 감소할 수 있고, 감소 추세는 다음 값을 만날 때까지 계속될 수 있으나, 도 6(b)처럼 0 미만으로 내려가기도 한다는 점에서 한계를 가지고 있다.
도 7은 각 데이터의 상대 오차를 시각적으로 나타낸 그래프이고, 도 8은 방식별 예측치와 측정값의 오차를 이용한 그래프이다.
도 7에 따르면, 데이터의 상대 오차를 시각적으로 나타낸 그래프가 확인되며, 칼만 필터를 이용한 예측치의 오차들이 0에 더 가깝게 분포해 있음이 확인된다.
도 7(a)는 이동 평균을 이용한 예측치와 측정값의 오차를 이용한 그래프로서, 0.4e-04부터 0.6e-04 사이에서 최고점이 나타나는 좌경분포(Skewed Right)가 확인된다. 이동 평균 예측치의 상대 오차는 0에서 1.26e-04 사이에 분포해 있다.
도 8(b)는 칼만 필터를 이용한 예측치와 측정값의 오차를 이용한 그래프로서, 0부터 0.2e-04 사이에서 최고점이 나타나며 고 8(a)와 마찬가지로 좌경분포를 보인다. 칼만 필터 예측치의 상대 오차는 0에서 1.18e-04 사이에 분포해 있음이 확인된다.
[표 2]
Figure 112021137950811-pat00018
표 2는 이동 평균과 칼만 필터를 이용한 예측치와 측정값을 이용해 평균 제곱근 오차(RMSE)와 평균 절대비 오차(MAPE)를 계산한 표이다. 단순 이동 평균으로 도출한 예측치들은 약 0.00737%, 칼만 필터 예측치들은 약 0.00078% 정도의 오차율을 보인다.
상기 실시예에서 활용한 누적 태양광 발전량 데이터는 통신, 장비 등의 문제로 인해 일정하지 않은 시간 간격으로 기록되었다. 이를 이용하여 시계열 분석을 하기 위해서는 일정한 시간 간격으로 보정할 필요가 있으므로, 데이터의 시간 간격을 1분 단위로 맞춘 후 결측치를 처리하였다.
상기 실시예에서 결측치는 단순 이동 평균과 칼만 필터로 대치하였고, 각 방법으로 도출된 예측치의 오차를 비교했다. 단순 이동 평균은 측정값의 변화는 잘 반영하지만, 시간 지연(Lag) 현상을 보인다. 또한 측정값을 만나는 지점에서 급격한 변동을 보이는 점에서 한계가 있다. 반면 칼만 필터를 이용한 그래프는 시간 지연 없이 값의 변동을 반영하고 있고 예측치들도 측정값 사이에 분포한다.
상기 실시예에서 각 방법을 이용한 누적 발전량 예측치와 측정값과의 상대 오차는 단순 이동 평균 예측치와의 상대 오차가 0부터 1.26e-04 사이에 분포하고, 칼만 필터는 0부터 1.18e-04로 0과 가깝게 분포한다. 이는 칼만 필터의 오차가 이동평균보다 보편적으로 더 적음을 의미할 수 있다. 평균 절대비 오차도 이동 평균 예측치와 측정값은 0.00737%, 칼만 필터는 0.00078%로 칼만 필터가 더 적게 나타났다.
도 9는 본 발명에 따른 데이터 검증 과정을 군집과 과정을 통하여 수행한 것이다.
도 9에 따르면, 수정된 태양광 발전량 데이터를 검증하는 단계(S1500)는 K-중심 군집화 과정을 통하여 수행될 수 있다. 이는 상술한 상대 오차를 이용한 검증 단계와 병행될 수도 있고, 상대 오차를 이용한 검증 단계를 대체할 수도 있다.
K-중심 군집화 과정은 주어진 데이터를 K개의 군집으로 군집화하는 것을 말한다. 이러한 K-중심 군집화 과정은, 주어진 데이터 표본에서 임의로 샘플값 하나를 고른 후 해당 샘플값에서 다른 샘플 데이터까지의 거리를 측정한다. 이때, 각 데이터 샘플에서 가장 가까운 중심을 선택하여, 다시 해당 샘플을 중심으로 다른 데이터 샘플값까지의 거리를 계산한다. 이러한 과정을 반복하여, 군집화를 이룬다. 즉, 복수의 클러스터(cluster)를 생성한다. 이러한 클러스터링 기법은 주로 파이썬(Python)으로 구현될 수 있다. 클러스터링은 신호 분석에서 사용될 수 있는 알고리즘 중 하나로서 이용되고 있다.
도 9에 따르면, K-중심 군집화 과정을 수행한 결과, 최종적으로 2개의 클러스터가 생성된다. 본 발명에 따른 K-중심 군집화 과정을 수행한 결과, 클러스터링 1과 클러스터링 2로 측정값들이 분류될 수 있다.
이때, 클러스터링의 대상이 되는 데이터들은 복수의 좌표 정보일 수 있다. 즉, 본 발명은 복수의 좌표 정보에 대하여 K-중심 군집화 과정을 수행할 수 있다.
본 발명은 K-중심 군집화 과정을 기초로 최종적으로 2개의 클러스터를 생성하며, 2개의 클러스터 사이의 유클리드 거리를 기초로 유사도를 도출할 수 있다. 본 발명은 2개의 클러스터 각각의 평균값을 추출하고, 각각의 평균값 간의 최종 거리값을 추출하며, 최종 거리값을 기초로 오차 여부를 판단할 수 있다.
본 발명에 따른 K-중심 군집화 과정은 클러스터링 1의 제1 중심값을 평균 계산법을 통하여 산출하고, 클러스터링 2의 제2 중심값을 평균 계산법을 통하여 산출할 수 있다. 본 발명에 따른 K-중심 군집화 과정 수행 모듈은 제1 중심값과 제2 중심값의 최종 거리값을 산출하고, 최종 거리값의 크기가 미리 정해진 값보다 큰 경우, 각각의 클러스터의 유사도가 미리 정해진 값보다 낮은 것으로 판단할 수 있다. 반대로, 최종 거리값의 크기가 미리 정해진 값보다 작은 경우, 각각의 클러스터의 유사도가 미리 정해진 값보다 높은 것으로 판단할 수 있다.
즉, 본 발명에 따른 K-중심 군집화 과정은 제1 중심값과 제2 중심값의 최종 거리값을 산출하고, 최종 거리값의 크기가 미리 정해진 값보다 작은 경우, 예측치는 검증된 것으로 정의될 수 있다. 또한, 제1 중심값과 제2 중심값의 최종 거리값의 크기가 미리 정해진 값보다 큰 경우, 예측치는 검증되지 못한 것으로 정의될 수 있다.
본 발명에 따른 K-중심 군집화 과정은 특징 1을 x축 좌표로, 특징 2를 y축 좌표로 하여 K-중심 군집화 과정을 수행할 수 있다. 본 발명에 따른 K-중심 군집화 과정은 클러스터 1의 제1 중심값과 클러스터 2의 제2 중심값을 산출하고, 제1 중심값과 제2 중심값 사이의 유클리드 거리를 산출할 수 있다. 유클리드 거리는 하기 수학식 3에 의하여 정의될 수 있다.
[수학식 3]
Figure 112021137950811-pat00019
(단, d는 거리값, (x, y)는 좌표값으로서, x는 발전량 데이터가 수집된 시간 정보이고, y는 발전량 데이터, 즉 생성된 전력량임)
본 발명에 따른 시스템은 클러스터 1과 클러스터 2의 최종 거리값을 추출하고, 최종 거리값을 기초로 예측치를 검증할 수 있다.
이때, 본 발명에 따른 최종 거리값은 다음과 같은 순서로 추출될 수 있다.
(1) 클러스터 1의 제1 평균값(x1, y1) 및 클러스터 2의 제2 평균값(x2, y2)을 추출
(2) 제1 평균값 및 제2 평균값은 각각 좌표값이고, 제1 평균값 및 제2 평균값 사이의 최종 거리값(L)을 하기 수학식 4를 기초로 추출
[수학식 4]
Figure 112021137950811-pat00020
(단, (x1, y1)은 클러스터 1의 평균값(=제1 중심값)을 기초로 생성된 좌표값이고, (x2, y2)은 클러스터 2의 평균값(=제2 중심값)을 기초로 생성된 좌표값임)
본 발명은 추출된 최종 거리값(L)의 크기가 미리 정해진 값보다 작은 경우, 예측치는 검증된 것으로 정의될 수 있다. 또한, 최종 거리값(L)의 크기가 미리 정해진 값보다 큰 경우, 예측치는 검증되지 못한 것으로 정의될 수 있다.
또한, 본 발명에 따른 최종 거리값(L)에 보정 계수를 곱하고, 이를 기초로 미리 설정된 거리값과 비교하는 것이 보다 효율적이다. 이를 보정된 최종 거리값(L')이라고 하고 하기 수학식 5 및 수학식 6을 기초로 추출될 수 있다.
[수학식 5]
Figure 112021137950811-pat00021
(단, (x1, y1)은 클러스터 1의 평균값을 기초로 생성된 좌표값이고, (x2, y2)은 클러스터 2의 평균값을 기초로 생성된 좌표값임)
[수학식 6]
Figure 112021137950811-pat00022
이때, α는 보다 정확한 검증을 위한 보정 상수로서, α의 단위는 무시될 수 있다.
이처럼, 수학식 5 및 수학식 6을 이용한 보정된 최종 거리값(L')을 기초로 예측치를 검증하는 경우 보다 정확한 검증이 가능하다.
[실험 예]
본 발명에 따른 보정 상수를 사용하여 생성된 유클리드 거리를 기초로 예측치의 검증을 수행한 결과는 다음과 같다.
먼저, 칼만 필터를 이용하여 예측치를 생성하고, 데이터 중 결측치를 예측치로 대체한 제1 데이터 셋이 준비될 수 있다. 또한, 로우 데이터로서 시간 단위를 상기 제1 데이터 셋과 동기화한 제2 데이터 셋이 준비될 수 있다. 제2 데이터 셋은 다음과 같이 구성될 수 있다.
도 2와 같이 7일 동안 태양광 발전량 데이터(누적 발전량)를 1일 주기로 나누고, 발전이 시작된 가장 이른 시점을 기준으로 7일간의 데이터의 시간 단위를 동기화할 수 있다. 즉, 7일간의 각각의 데이터들의 시작점이 동일선 상에 놓일 수 있다.
이때, 7일간의 각각의 데이터들의 단위 시간대 별 발전량을 총합하고 이를 7로 나눌 수 있다. 즉, 7일 동안의 태양광 발전량 데이터의 시작점을 일치시킨 후, 이를 7로 나눈 평균값을 도출할 수 있다. 이때 도출된 평균값이 상기 제2 데이터 셋이 될 수 있다.
이처럼, 제2 데이터 셋에 대응하기 위하여 제1 데이터 셋은 1일 동안의 태양광 발전량 데이터일 수 있다.
본 실시예는 제1 데이터 셋과 제2 데이터 셋을 동일한 좌표 평면 위에 배치하고, 이에 대하여 상술한 보정 상수를 적용한 K-중심 군집화 과정을 적용한 예시이다. 이를 통하여 최종 거리값(L)을 산출하여, 미리 설정된 거리값과 비교하고, 최종 거리값(L)이 미리 설정된 거리값보다 작은 경우 예측치는 검증된 것으로 정의될 수 있다.
이때, 미리 설정된 거리값은 다음과 같이 도출될 수 있다.
제3 데이터 셋은 칼만 필터에 의한 예측치를 포함하는 데이터 셋이고, 이는 상기 제1 데이터 셋과 동일할 수 있다.
제4 데이터 셋은 제3 데이터 셋과 동일한 로우 데이터에 대하여 이동 평균에 의한 예측치를 포함하는 데이터 셋일 수 있다. 미리 설정된 거리값은 제3 데이터 셋과 제4 데이터 셋을 동일한 좌표 평면 위에 배치하고, 이에 대하여 상술한 K-중심 군집화 과정(보정 상수 적용 X)을 적용하여 도출된 최종 거리값(L)일 수 있다.
하기 정확도는 결측치의 실제 측정값과 예측치를 대조한 것으로서, 검증된 예측치와 실제 측정값의 오차가 2% 미만인 경우 정확하게 예측된 것으로 정의할 수 있다. 즉, 정확도가 90%라는 것은 검증된 데이터 셋에 포함된 예측치와 실제 측정값의 오차가 2% 미만일 확률을 의미할 수 있다.
[표 3]
Figure 112021137950811-pat00023
표 3은 본 발명에 따른 케이스들의 정확도를 나타낸 것이다. 실험 결과, 보정 계수 α를 사용한 경우가, 보정 계수 α를 사용하지 않은 경우보다 현저히 높은 정확도를 가진다.
즉, 바람직하게 본 발명에 따른 결측치 보간 방법은 수정된 태양광 발전량 데이터를 검증하는 단계(S1500)를 더 포함할 수 있고, 이때 검증하는 단계(S1500)는 K-중심 군집화 과정을 통하여 이루어질 수 있다.
[제1 예시]
검증하는 단계(S1500)는,
상기 제1 데이터 셋과 상기 제2 데이터 셋을 하나의 좌표 평면에 배치하고 K-중심 군집화 과정을 수행하는 단계;
상기 K-중심 군집화 과정을 기초로 최종적인 2개의 클러스터를 생성하는 단계;
상기 2개의 클러스터 각각의 평균값을 추출하는 단계;
상기 각각의 평균값 간의 최종 거리값을 추출하는 단계; 및
상기 최종 거리값과 미리 설정된 거리값을 기초로 수정된 태양광 발전량 데이터를 검증하는 단계;를 포함할 수 있다.
단, 미리 설정된 거리값은 상기 제3 데이터 셋과 상기 제4 데이터 셋을 기초로 도출된 거리값일 수 있다.
전술한 본 발명은, 프로그램이 기록된 매체에 컴퓨터가 읽을 수 있는 코드로서 모델링하는 것이 가능하다. 컴퓨터가 읽을 수 있는 매체는, 컴퓨터 시스템에 의하여 읽힐 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 매체의 예로는, HDD(Hard Disk Drive), SSD(Solid State Disk), SDD(Silicon Disk Drive), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장 장치 등이 있으며, 또한 캐리어 웨이브(예를 들어, 인터넷을 통한 전송)의 형태로 모델링되는 것도 포함한다. 따라서, 상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 명세서의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 명세서의 등가적 범위 내에서의 모든 변경은 본 명세서의 범위에 포함된다.
앞에서 설명된 본 발명의 어떤 실시 예들 또는 다른 실시 예들은 서로 배타적이거나 구별되는 것은 아니다. 앞서 설명된 본 발명의 어떤 실시 예들 또는 다른 실시 예들은 각각의 구성 또는 기능이 병용되거나 조합될 수 있다.
상기의 상세한 설명은 모든 면에서 제한적으로 해석되어서는 아니되고 예시적인 것으로 고려되어야 한다. 본 발명의 범위는 첨부된 청구항의 합리적 해석에 의해 결정되어야 하고, 본 발명의 등가적 범위 내에서의 모든 변경은 본 발명의 범위에 포함된다.

Claims (5)

  1. 컴퓨팅 장치가 수행하는 결측치 보간 방법에 있어서,
    태양광 발전량 데이터를 수신하는 단계;
    상기 태양광 발전량 데이터의 결측치 정보를 생성하는 단계;
    칼만 필터를 이용하여 상기 결측치 정보에 대응한 예측치 정보를 생성하는 단계; 및
    상기 예측치 정보를 기초로 상기 태양광 발전량 데이터를 수정하는 단계;를 포함하되,
    상기 태양광 발전량 데이터는 누적 발전량(Cumulative Power) 데이터이고,
    상기 결측치 정보를 생성하는 단계는,
    상기 누적 발전량 데이터의 하루 주기를 기준으로 전처리 과정을 진행하되,
    상기 전처리 과정은,
    1분 단위의 빈 데이터 목록을 생성하고, 상기 빈 데이터 목록과 상기 누적 발전량 데이터를 병합한 누적 발전량 데이터 목록을 생성하며,
    상기 결측치 정보는,
    상기 누적 발전량 데이터 목록에 포함된 결측치에 대한 정보이고,
    상기 예측치 정보를 생성하는 단계는,
    오차 공분산을 이용한 하기 수학식 1 및 수학식 2를 이용하여 상기 예측치 정보를 생성하는 것인,
    태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법.
    [수학식 1]
    Figure 112022046063063-pat00033

    [수학식 2]
    Figure 112022046063063-pat00034

    단, 상기 수학식 1은 현재 상태
    Figure 112022046063063-pat00035
    에 시간에 따른 상태 변화를 나타내는
    Figure 112022046063063-pat00036
    와 외압
    Figure 112022046063063-pat00037
    으로 다음 상태에 대한 예측치
    Figure 112022046063063-pat00038
    을 도출함.
    또한, 상기 수학식 2는 현재 상태에 대한 공분산을 바탕으로 다음 공분산을 예측하기 위한 수학식으로서,
    Figure 112022046063063-pat00039
    는 전치를 의미하고, 현재 공분산
    Figure 112022046063063-pat00040
    에 상태 변화
    Figure 112022046063063-pat00041
    를 반영한 후 상태에 대한 오차
    Figure 112022046063063-pat00042
    로 보정하여 다음 상태에 대한 예측 공분산
    Figure 112022046063063-pat00043
    을 도출함.
  2. 제1항에 있어서,
    상기 태양광 발전량 데이터를 수정하는 단계는,
    하기 수학식 3 내지 수학식 5를 이용하여 상기 태양광 발전량 데이터를 수정하는 것인,
    태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법.
    [수학식 3]
    Figure 112022046063063-pat00044

    [수학식 4]
    Figure 112022046063063-pat00045

    [수학식 5]
    Figure 112022046063063-pat00046

    단, 상기 수학식 3은 상기 수학식 2에서 계산한 공분산 예측치, 측정 데이터와 상태 데이터와의 관계
    Figure 112022046063063-pat00047
    , 측정 데이터에 포함된 오차
    Figure 112022046063063-pat00048
    를 반영하여 칼만 이득
    Figure 112022046063063-pat00049
    을 계산함.
    또한, 상기 수학식 4는 상기 수학식 3의 칼만 이득으로 상기 수학식 4의 측정치에 상태 예측치를 보정하여 상태 값을 도출함.
    또한, 상기 수학식 5는 칼만 이득을 반영하여 다음 상태의 공분산을 도출함.
  3. 제1항에 있어서,
    상기 결측치 보간 방법은,
    수정된 상기 태양광 발전량 데이터를 검증하는 단계;를 더 포함하고,
    상기 검증하는 단계는,
    K-중심 군집화 과정을 수행하여 최종적으로 생성된 2개의 클러스터 사이의 최종 거리값(L)을 기초로 검증하며, 상기 최종 거리값(L)은 하기 수학식 7에 의하여 도출되는 것인,
    태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법.
    [수학식 7]
    Figure 112022046063063-pat00050

    (단, (x, y)는 좌표값으로서, x는 발전량 데이터가 수집된 시간 정보이고, y는 발전량 데이터(생성된 전력량)이며, (x1, y1)은 클러스터 1의 평균값(=제1 중심값)을 기초로 생성된 좌표값이고, (x2, y2)은 클러스터 2의 평균값(=제2 중심값)을 기초로 생성된 좌표값임)
  4. 제3항에 있어서,
    상기 검증하는 단계는,
    상기 최종 거리값(L)에 보정 계수를 곱한 보정된 최종 거리값(L')을 기초로 검증하며, 상기 보정된 최종 거리값(L')는 하기 수학식 8 및 수학식 9에 의하여 도출되는 것인,
    태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법.
    [수학식 8]
    Figure 112022046063063-pat00051

    (단, (x1, y1)은 클러스터 1의 평균값을 기초로 생성된 좌표값이고, (x2, y2)은 클러스터 2의 평균값을 기초로 생성된 좌표값임)
    [수학식 9]
    Figure 112022046063063-pat00052

    (단. α는 보다 정확한 검증을 위한 보정 상수로서, α의 단위는 무시될 수 있음)
  5. 제1항에 있어서,
    상기 빈 데이터 목록은,
    하루 중 발전이 시작된 가장 이른 시점과 발전이 종료된 가장 늦은 시점 사이를 1분 단위로 나눈 데이터 목록인 것인,
    태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법.
KR1020210167191A 2021-11-29 2021-11-29 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법 KR102413415B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210167191A KR102413415B1 (ko) 2021-11-29 2021-11-29 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210167191A KR102413415B1 (ko) 2021-11-29 2021-11-29 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법

Publications (1)

Publication Number Publication Date
KR102413415B1 true KR102413415B1 (ko) 2022-06-27

Family

ID=82247167

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210167191A KR102413415B1 (ko) 2021-11-29 2021-11-29 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법

Country Status (1)

Country Link
KR (1) KR102413415B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117154724A (zh) * 2023-10-31 2023-12-01 山东中瑞电气有限公司 光伏发电功率预测方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102014339B1 (ko) * 2019-02-26 2019-08-26 포스컨트롤 주식회사 머신러닝을 이용한 태양광 발전 시스템의 이상 감지 방법 및 장치
KR20200040448A (ko) * 2018-10-10 2020-04-20 (주)솔보텍 태양광 에너지 발전량 예측 시뮬레이션 장치 및 방법
KR20210006874A (ko) 2020-12-30 2021-01-19 정인우 칼만필터 및 심층강화학습 기반의 풍력발전기 요 오정렬 제어 방법
KR102230548B1 (ko) * 2020-09-02 2021-03-22 주식회사 케이디티 Frbfnn 모델을 이용한 태양광 발전설비의 발전예측 및 효율진단 시스템
KR20210132446A (ko) * 2020-04-27 2021-11-04 주식회사 에이치에너지 예측제고 정산금 수익 극대화를 위한 저비용 태양광 예측 시스템 및 방법

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200040448A (ko) * 2018-10-10 2020-04-20 (주)솔보텍 태양광 에너지 발전량 예측 시뮬레이션 장치 및 방법
KR102014339B1 (ko) * 2019-02-26 2019-08-26 포스컨트롤 주식회사 머신러닝을 이용한 태양광 발전 시스템의 이상 감지 방법 및 장치
KR20210132446A (ko) * 2020-04-27 2021-11-04 주식회사 에이치에너지 예측제고 정산금 수익 극대화를 위한 저비용 태양광 예측 시스템 및 방법
KR102230548B1 (ko) * 2020-09-02 2021-03-22 주식회사 케이디티 Frbfnn 모델을 이용한 태양광 발전설비의 발전예측 및 효율진단 시스템
KR20210006874A (ko) 2020-12-30 2021-01-19 정인우 칼만필터 및 심층강화학습 기반의 풍력발전기 요 오정렬 제어 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117154724A (zh) * 2023-10-31 2023-12-01 山东中瑞电气有限公司 光伏发电功率预测方法
CN117154724B (zh) * 2023-10-31 2024-02-23 山东中瑞电气有限公司 光伏发电功率预测方法

Similar Documents

Publication Publication Date Title
US11043808B2 (en) Method for identifying pattern of load cycle
EP3489508B1 (en) Method and device for automatically calibrating wind alignment error of wind power generation unit
Sturt et al. Efficient stochastic scheduling for simulation of wind-integrated power systems
Dvorkin et al. Assessing flexibility requirements in power systems
CN110321934B (zh) 一种检测用户用电异常数据的方法及系统
US20190064392A1 (en) Forecasting solar power output
JP6003247B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
CN114792156B (zh) 基于曲线特征指标聚类的光伏输出功率预测方法和系统
Pham et al. A novel short-term load forecasting method by combining the deep learning with singular spectrum analysis
KR102413415B1 (ko) 태양광 발전량 데이터에 대한 시계열 모델의 결측치 보간 방법
CN103049609B (zh) 一种风功率多阶段场景模拟方法
CN116361986A (zh) 利用预测模型的太阳能发电量预测方法
CN112186761B (zh) 一种基于概率分布的风电功率场景生成方法及系统
CN114202129A (zh) 风电出力预测方法、电子设备、存储介质及系统
CN113626767B (zh) 一种风机限电识别方法、系统、设备和存储介质
CN116089777A (zh) 一种基于信息智能匹配的新能源智能结算方法及系统
JP6782181B2 (ja) 太陽光発電量推定装置および方法
CN114594398A (zh) 储能锂离子电池数据预处理方法
CN106529060B (zh) 一种负荷序列建模方法及系统
Liu et al. Embedded scenario clustering for wind and photovoltaic power, and load based on multi-head self-attention
CN116191412A (zh) 电力负荷预测方法
Hoffmann Temporal aggregation methods for energy system modeling
CN111382763A (zh) 一种光伏集群划分方法及系统
CN114243696A (zh) 光伏发电典型日光伏出力的大概率场景生成方法
CN115456265A (zh) 一种分布式光伏用户发电功率短期预测方法及装置

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant