KR102478684B1

KR102478684B1 - 앙상블 학습을 이용한 에너지 소비 예측 방법 및 상기 방법을 수행하는 컴퓨팅 장치

Info

Publication number: KR102478684B1
Application number: KR1020220057732A
Authority: KR
Inventors: 김법렬; 이동은
Original assignee: 경북대학교 산학협력단
Priority date: 2022-05-11
Filing date: 2022-05-11
Publication date: 2022-12-19

Abstract

본 발명은 에너지 소비 예측 방법을 개시한다. 보다 자세하게, 에너지 소비 예측 방법은 그래디언트 부스팅 앙상블 접근 방식을 사용하여 에너지 활용에 대한 예측 모델을 육성함으로써, 건물에서 소비되는 전기 에너지에 액세스할 수 있도록 자동으로 에너지의 소비 전력을 예측한다.

Description

앙상블 학습을 이용한 에너지 소비 예측 방법 및 상기 방법을 수행하는 컴퓨팅 장치{METHOD FOR PREDICTING ENERGY CONSUMPTION FOR USING ENSEMBLE LEARNING, AND COMPUTING APPARATUS FOR PERFORMING THE METHOD}

본 발명은 건물의 에너지 소비 예측 방법 및 컴퓨팅 장치에 관한 것으로, 보다 구체적으로는 앙상블 학습 모델을 이용하여 건물에서 사용되는 에너지 소비를 줄이기 위한 방법에 관한 것이다.

최근에는 전 세계의 탄소 배출량 중 39%가 건물과 건축 분야에서 발생하며, 그 중 28%가 건물 운영, 즉 냉난방, 조명 등을 운영하는 데서 발생함에 따라 통신 기술을 활용해 건물 내 전력 소모를 경제적으로 줄이는 스마트 빌딩 시스템(Smart Building System)이 채택되었다.

여기서, 스마트 빌딩은 냉난방 시스템, 조명 및 전기 시스템, 화재 감시 장치, 보안 설비 및 경비, 정보 통신망과 네트워크, 사무 자동화 등이 통합된 첨단 서비스 기능을 제공하는 것으로, 보다 효율적인 생활 환경과 쾌적하고 안락한 삶을 제공해 주는 빌딩이다. 스마트 빌딩은 자동화된 제어 외에도 에너지 효율성을 위한 부하 소비 예측을 제공하는 지능형 기술이 포함된다. 이에 따른 건물의 에너지 사용이 증가하고 있으며 이미 핵심 에너지의 40% 이상을 차지하는 선진국에서 사용되므로 스마트한 에너지 소비 예측이 중요하다.

다만, 매일 증가하는 건물의 에너지 소비로 인해 전세계는 에너지 효율성을 높이기 위해 본질적으로 실현 가능한 부하 활용을 관리하고 줄여야 하는 문제를 갖고 있다. 이에, 사회적 변화, 경제적 변수 및 날씨 변화는 모두 부하 예측에서 역할을 합니다. 선형 AR 모델, 퍼지 기술(FT), 신경망(NN), 지원 벡터 머신(SVM) 등과 같은 다양한 방법이 예측 정확도를 높이는 데 사용되었다.

그러나, 상술한 방법들은 휴일 하중과 기상 변화로 인한 부하 변동이 흔하고 쉽게 큰 예상오차를 발생시킬 수 있어 부하예측의 어려운 문제로 여겨진다.

본 발명은 앙상블 학습 방식 기반의 특정 건물에 대한 스테레오 타입을 이용하여 특정 건물에서 발생되는 부하에 의한 소비 전력을 자동으로 예측함으로써, 특정 건물에서 관찰된 다양한 요소에 의한 부하의 변화를 높은 정확도 및 정밀도로 예측하는 에너지 소비 예측 방법을 제공한다.

본 발명의 일실시예에 따른 에너지 소비 예측 방법은 특정 건물에 포함된 복수의 관리 구역 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터를 수집하는 단계; 서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 학습 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하는 단계; 앙상블 학습이 수행된 학습 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하는 단계; 및 재 학습된 결과 데이터를 이용하여 특정 건물에서 소비되는 에너지의 소비 전력을 시간대 별로 예측하는 단계; 를 포함할 수 있다.

본 발명의 실시예에 따른 학습 데이터를 수집하는 단계는, 특정 건물의 각 층에 구획된 복수의 관리 구역 별로 설치되는 적어도 하나의 부하 기기에서 N 분 간격으로 사용된 소비 전력 데이터; 상기 복수의 관리 구역 별 내부의 온도, 비교 습도, 주변광 중 적어도 하나를 포함하는 내부 환경 데이터; 내부 환경 데이터를 수집한 시점에서의 특정 건물의 실외 환경 데이터; 및 소정 기간의 날짜·시간에 관한 공휴일 데이터; 중 적어도 하나를 포함하는 학습 데이터를 수집할 수 있다.

본 발명의 실시예에 따른 학습 데이터를 수집하는 단계는, 통합 지표면 시간별(ISH: Incorporated Surface Hourly)로 제공되는 일별 요소를 고려하여 외부 환경 데이터 및 공휴일 데이터를 수집할 수 있다.

본 발명의 실시예에 따른 앙상블 학습을 수행하는 단계는, 학습 데이터에서 랜덤하게 복수의 샘플 데이터를 추출하는 단계; 및 기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 앙상블 학습을 수행하는 단계; 를 포함할 수 있다.

본 발명의 실시예에 따른 복수의 샘플 데이터를 추출하는 단계는, 학습 데이터로부터 순열 형태를 갖는 n개의 고유 트리를 생성하고, 생성된 n개의 고유 트리의 레벨에 따른 복수의 샘플 데이터를 추출할 수 있다.

본 발명의 실시예에 따른 재 학습하는 단계는, 상기 앙상블 학습이 수행된 서로 다른 분류 알고리즘 각각에 적용된 복수의 샘플 데이터를 순차적으로 결합하는 단계; 및 복수의 샘플 데이터가 순차적으로 결합된 결과 데이터를 부하 예측 모델에 적용하여 결과 데이터를 재 학습하는 단계; 를 포함할 수 있다.

본 발명의 실시예에 따른 샘플 데이터를 순차적으로 결합하는 단계는, 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용하여 복수의 샘플 데이터를 순차적으로 결합할 수 있다.

본 발명의 실시예에 따른 샘플 데이터를 순차적으로 결합하는 단계는, 샘플 데이터들의 가중치에 따른 샘플 데이터에 각각 적용된 제1 알고리즘과 제2 알고리즘 간의 오차를 보완하여 복수의 샘플 데이터를 순차적으로 결합할 수 있다.

본 발명의 다른 실시예에 따른 에너지 소비 예측 방법은 특정 건물에 포함된 복수의 관리 구역 별로 소비 전력 데이터 및 내부 환경 데이터를 수집하는 단계; 내부 환경 데이터를 수집한 시점에서의 특정 건물의 실외 환경 데이터 및 소정 기간의 날짜·시간에 관한 공휴일 데이터를 수집하는 단계; 학습 데이터로부터 복수의 샘플 데이터를 생성하는 단계; 기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하는 단계; 앙상블 학습된 복수의 샘플 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하는 단계; 및 재 학습된 결과 데이터를 이용하여 특정 건물에서 소비되는 에너지의 소비 전력을 시간대 별로 예측하는 단계; 를 포함할 수 있다.

본 발명의 실시예에 따른 소비 전력 데이터 및 내부 환경 데이터를 수집하는 단계는, i) 특정 건물의 각 층에 구획된 복수의 관리 구역 별로 설치되는 적어도 하나의 부하 기기에서 N 분 간격으로 사용된 소비 전력 데이터, 및 ii) 복수의 관리 구역 별 내부의 온도, 비교 습도, 주변광 중 적어도 하나를 포함하는 내부 환경 데이터를 수집할 수 있다.

본 발명의 실시예에 따른 공휴일 데이터를 수집하는 단계는, 통합 지표면 시간별 일별 정보에 기초하여 온도, 이슬점, 해수면, 기압, 풍속 중 적어도 하나의 기상 매개 변수를 이용하여 상기 시점에서의 특정 건물의 실외 환경 데이터를 수집할 수 있다.

본 발명의 실시예에 따른 결과 데이터를 재 학습하는 단계는, 알고리즘이 적용된 샘플 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용하여 순차적으로 복수의 샘플 데이터를 결과 데이터로 결합할 수 있다.

본 발명의 실시예에 따른 결과 데이터를 재 학습하는 단계는, 복수의 샘플 데이터에 각각 부여된 가중치를 기반으로 서로 다른 분류 알고리즘 간의 오차를 보완하여 순차적으로 복수의 샘플 데이터를 결과 데이터로 결합할 수 있다.

본 발명의 일실시예에 따른 에너지 소비 예측 방법을 수행하는 컴퓨팅 장치에 있어서, 상기 컴퓨팅 장치는 프로세서를 포함하고, 상기 프로세서는, 특정 건물에 포함된 복수의 관리 구역 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터를 수집하고, 서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 학습 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하고, 앙상블 학습이 수행된 학습 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하고, 재 학습된 결과 데이터를 이용하여 특정 건물에서 소비되는 에너지의 소비 전력을 시간대 별로 예측할 수 있다.

본 발명의 다른 실시예에 따른 에너지 소비 예측 방법을 수행하는 컴퓨팅 장치에 있어서, 상기 컴퓨팅 장치는 프로세서를 포함하고, 상기 프로세서는, 특정 건물에 포함된 복수의 관리 구역 별로 소비 전력 데이터 및 내부 환경 데이터를 수집하고, 내부 환경 데이터를 수집한 시점에서의 특정 건물의 실외 환경 데이터 및 소정 기간의 날짜·시간에 관한 공휴일 데이터를 수집하고, 학습 데이터로부터 복수의 샘플 데이터를 생성하고, 기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하고, 앙상블 학습된 복수의 샘플 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하고, 재 학습된 결과 데이터를 이용하여 특정 건물에서 소비되는 에너지의 소비 전력을 시간대 별로 예측할 수 있다.

본 발명의 일실시예에 따른 에너지 소비 예측 방법은 앙상블 학습 방식 기반의 특정 건물에 대한 스테레오 타입을 이용하여 특정 건물에서 발생되는 부하에 의한 소비 전력을 자동으로 예측함으로써, 특정 건물에서 관찰된 다양한 요소에 의한 부하의 변화를 높은 정확도 및 정밀도로 예측할 수 있다.

도 1은 본 발명의 일실시예에 따른 특정 건물에서 소비되는 에너지의 소비 전력을 예측하는 전반적인 동작을 설명하기 위해 도시한 도면이다.
도 2는 본 발명의 일실시예에 따른 학습 데이터를 수집하는 일련의 과정을 설명하기 위해 도시한 도면이다.
도 3은 본 발명의 일실시예에 따른 전처리된 학습 데이터를 앙상블 학습하여 특정 건물의 소비 전력을 예측하는 세부 동작을 설명하기 위해 도시한 도면이다.
도 4는 본 발명의 일실시예에 따른 앙상블 학습 기반의 모델 학습 및 모델 검증을 수행하는 과정을 설명하기 위해 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 앙상블 학습의 다양한 알고리즘을 통해 실제로 측정된 전력 수요와 예측된 전력 수요를 비교한 결과를 나타낸 그래프이다.
도 6은 본 발명의 일실시예에 따른 에너지 소비 예측 방법을 설명하기 위해 나타낸 흐름도이다.

이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일실시예에 따른 특정 건물에서 소비되는 에너지의 소비 전력을 예측하는 전반적인 동작을 설명하기 위해 도시한 도면이다.

도 1을 참고하면, 컴퓨팅 장치(101)는 서로 다른 분류 알고리즘을 사용하는 앙상블 학습 방식을 기반으로 특정 건물(102) 내 소비 부하를 예측할 수 있다. 컴퓨팅 장치(101)는 특정 건물(102)에 대한 에너지의 소비 전력을 예측하는데 사용 가능한 스테레오 타입(Stereo Type)을 생성할 수 있다. 컴퓨팅 장치(101)는 스테레오 타입을 활용함으로써, 다양한 특정 건물(102) 내 부하에 의한 소비 전력을 보다 정확하게 예측할 수 있다. 일례로, 컴퓨팅 장치(101)는 앙상블 학습 방식 중 그래디언트 부스팅 앙상블 기술(Gradient Boosting Ensemble)을 활용하여 주거용에서 산업용까지 서로 다른 생활 패턴으로 나타나는 특정 건물(102) 내 에너지의 소비 전력을 예측할 수 있다.

컴퓨팅 장치(101)는 특정 건물(102)의 에너지를 최적으로 관리하기 위해 특정 건물(102)에서 관찰된 학습 데이터(103)를 사용하여 특정 건물(102) 내에서 소비되는 에너지를 자동으로 예측할 수 있다. 이때, 컴퓨팅 장치(101)는 특정 건물(102)의 각 층 및 각 층의 관리 영역에서 수집한 학습 데이터(103)를 활용함으로써, 소비 전력의 예측 정확도를 높일 수 있다.

보다 구체적으로, 컴퓨팅 장치(101)는 특정 건물에 포함된 복수의 관리 구역 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터를 수집할 수 있다. 학습 데이터(103)는 크게 4 가지의 종류로 구분될 수 있으며, ① 소비 전력 데이터(104), ② 내부 환경 데이터(105), ③ 외부 환경 데이터(106), ④ 공휴일 데이터(107)을 포함할 수 있다. 학습 데이터(103)는 단일 형태로 구성되는 데이터 베이스(108)에 일괄 저장 및 관리될 수 있다. 이때, 본 발명은 특정 건물(102)의 모든 관리 구역 및 각 층으로 분류된 데이터 세트 형태로 학습 데이터(103)를 구분하여 일괄 저장할 수 있다.

컴퓨팅 장치(101)는 서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 학습 데이터(103)를 적용하여 특정 건물(102)의 전력 부하를 예측하기 위한 앙상블 학습을 수행할 수 있다. 컴퓨팅 장치(101)는 학습 데이터(103)로부터 순열 형태를 갖는 n개의 고유 트리를 생성할 수 있다. 컴퓨팅 장치(101)는 생성된 n개의 고유 트리의 레벨에 따른 복수의 샘플 데이터를 추출할 수 있다. 컴퓨팅 장치(101)는 기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 앙상블 학습을 수행할 수 있다.

컴퓨팅 장치(101)는 앙상블 학습이 수행된 서로 다른 분류 알고리즘 각각에 적용된 복수의 샘플 데이터를 순차적으로 결합할 수 있다. 컴퓨팅 장치(101)는 분류 알고리즘이 각각 적용된 샘플 데이터 간에 가중치를 상호 작용하여 복수의 샘플 데이터를 순차적으로 결합할 수 있다. 컴퓨팅 장치(101)는 복수의 샘플 데이터가 순차적으로 결합된 결과 데이터를 부하 예측 모델에 적용하여 결과 데이터를 재 학습할 수 있다. 이후, 컴퓨팅 장치(101)는 재 학습된 결과 데이터를 이용하여 특정 건물(102)에서 소비되는 에너지의 소비 전력을 시간대 별로 예측할 수 있다.

도 2는 본 발명의 일실시예에 따른 학습 데이터를 수집하는 일련의 과정을 설명하기 위해 도시한 도면이다.

도 2의 (a)를 참고하면, 컴퓨팅 장치(101)는 특정 건물(102)에 포함된 복수의 관리 구역(202) 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터로, ① 소비 전력 데이터(104), ② 내부 환경 데이터(105)를 수집할 수 있다.

① 소비 전력 데이터

컴퓨팅 장치(101)는 특정 건물(102)의 각 층(201)에 구획된 복수의 관리 구역(202) 각각에 설치된 부하 기기(204), (205)에서 사용된 소비 전력 데이터(104, kW)를 수집할 수 있다. 컴퓨팅 장치(101)는 특정 건물(102) 내 교류 장치(AC: Alternating Current), 튜브 조명, 팬, 및 플러그 등의 전기 부하가 특정 건물(102)의 복수의 관리 구역(202) 각각에서 보시되는 소비 전력 데이터(104)를 수집할 수 있다. 컴퓨팅 장치(101)는 N 분 간격으로 소비 전력 데이터(104)를 수집할 수 있다.

여기서, 컴퓨팅 장치(101)는 특정 건물(102)의 내 모든 관리 구역들(202)과 각 층(201)으로 분류할 수 있으며, 이를 소비 전력 데이터(104)의 고유한 데이터 세트의 형태로 구현할 수 있다 이에 따른, 데이터 세트는 N 분 간격으로 특정 건물(102)의 모든 관리 구역(202)에서 교류 장치, 튜브 조명, 팬 및 플러그 등에서 발생하는 전기 부하의 기능을 기록할 수 있다.

② 내부 환경 데이터

컴퓨팅 장치(101)는 복수의 관리 구역들(202) 각각의 온도(°C), 비교 습도(%), 주변광(lux) 중 적어도 하나를 포함하는 내부 환경 데이터(105)를 수집할 수 있다. 관리 구역들(202)은 각 관리 구역(203)에 설치된 부하 기기의 종류 및 사용량에 따라 서로 다른 내부 환경이 조성됨에 따라 각 관리 구역(203)에 설치된 환경 센서 또는, 사물 인터넷 디바이스로부터 온도(°C), 비교 습도(%), 주변광(lux) 중 적어도 하나를 포함하는 내부 환경 데이터(105)를 수집할 수 있다.

이후, 컴퓨팅 장치(101)는 소비 전력 데이터(104) 및 내부 환경 데이터(105)를 기반으로 각 수준에 따른 단위 별 전력 사용량을 분석할 수 있다. 이는 아래의 표 1과 같이 나타낼 수 있다.

층수	관리 구역	교류 장치	튜브 조명	플러그	센서	Total
1층	구역-1	0	1	0	0	11
	구역-2	4	1	1	0
	구역-3	0	1	1	0
	구역-4	0	1	1	0
2층	구역-1	1	1	1	3	36
	구역-2	14	1	1	3
	구역-3	0	1	1	3
	구역-4	11	1	1	3
3층	구역-1	4	1	1	3	29
	구역-2	1	1	1	3
	구역-3	0	1	1	0
	구역-4	1	1	1	3
	구역-5	1	1	1	3
Total	전체 구역	37	13	12	24	86

컴퓨팅 장치(101)는 소비 전력 데이터(104) 및 내부 환경 데이터(105)를 기반으로 층수, 레벨 및 날짜에 따른 전력 사용량을 전체의 데이터 세트로 구성할 수 있다. 또한, 컴퓨팅 장치(101)는 특정 건물(102)의 각 층을 별도의 데이터 세트로 구성할 수 있다. 일례로, 전체의 데이터 세트는 14개의 CSV 파일로 배포될 수 있으며, 특정 건물(102)의 각 층은 별도의 CSV 파일로 표시될 수 있다. 여기서, CSV(Comma Separated Value)는 각 항목마다 쉼표로 구분된 값을 갖는 파일 형식일 수 있다.

본 발명에서 모든 CSV 파일은 층 별 각 레벨에 대한 통계가 포함될 수 있다. 이에 따라, 연도를 포함하는 모든 CSV 파일은 특정 건물(102)과 서로 다른 건물의 동일한 층에 있는 모든 수준에서 액세스할 수 있는 데이터를 집계할 수 있다.

도 2의 (b)를 참고하면, 컴퓨팅 장치(101)는 내부 환경 데이터(105)를 수집한 시점에서의 특정 건물(102)의 실외 환경 데이터(106)를 수집할 수 있다.

③ 실외 환경 데이터

컴퓨팅 장치(101)는 기상 예보 사이트, 또는 기상 예보 정보를 제공하는 서버로부터 내부 환경 데이터(105)를 수집한 시점에서의 현재의 기상 정보(206)를 수신할 수 있다. 일례로, 컴퓨팅 장치(101)는 기상청, 국립기상과학원, 지역/전국/세계 일일 날씨 예보 중 적어도 하나로부터 현재의 기상 정보(206)를 수신할 수 있다. 이때, 컴퓨팅 장치(101)는 사이트 또는, 서버가 응용 프로그램 인터페이스(API: Application Program Interface)를 제공하는 경우, 실시간으로 기상 정보(206)를 수신할 수 있다.

또한, 컴퓨팅 장치(101)는 통합 지표면 시간별(ISH: Incorporated Surface Hourly)로 글로벌 지역의 기상 정보(206)를 요약하기 위한 데이터 세트를 구성할 수 있다. 여기서, 본 발명은 국립기후정보센터(NCDC: National Climatic Data Center)와 결합된 연방 기후 단지(Federal Climate Complex)의 하위 부서인 USAF 기후학 부서로부터 ISH 기반의 데이터 세트를 활용할 수 있다.

ISH 기반의 데이터 세트는 다음의 일별 정보 요소를 포함할 수 있다. 일별 정보 요소는 평균 온도(.1 화씨(f)를 단위로 사용) 이슬점 평균(.1(f)) 평균 해수면 밀도(.1 mb) 평균 위치의 기압(0.1 mb) 평균 식별도(0.1 마일) 평균 풍속(0.1 노트) 최고점의 풍속(. 1노트) 최대 돌풍(0.1노트) 최대 온도(0.1화씨) 영하의 온도(0.1화씨) 강수량(0.01인치) 눈 깊이(0.1인치) 안개, 눈 또는 얼음 알갱이, 비 또는 이슬비, 우박, 천둥, 토네이도/깔때기 구름, 우박, 천둥, 토네이도/깔때기 구름 18개 위치 기상 매개 변수(ISH)에 대한 글로벌 지역의 기상 정보(206)를 포함할 수 있다.

이에, 컴퓨팅 장치(101)는 상술한 데이터 세트로부터 내부 환경 데이터(105)를 수집한 시점에서의 실외 환경 데이터(106)를 수집할 수 있다.

도 2의 (c)를 참고하면, 컴퓨팅 장치(101)는 소정 기간의 날짜 · 시간에 관한 공휴일 데이터(107)를 수집할 수 있다.

④ 공휴일 데이터

컴퓨팅 장치(101)는 시놉틱(Synoptic), 즉 시간 기반 데이터(207)로부터 제공된 그리니치 평균시(GMT: Greenwich Mean Time) 및 현대 기준으로 통용되는 달력(208)을 기반으로 공휴일 데이터(107)를 수집할 수 있다.

도 3은 본 발명의 일실시예에 따른 전처리된 학습 데이터를 앙상블 학습하여 특정 건물의 소비 전력을 예측하는 세부 동작을 설명하기 위해 도시한 도면이다.

도 3을 참고하면, 컴퓨팅 장치(101)는 앙상블 학습 모델을 이용하여 건물에서 사용되는 에너지 소비를 줄이기 위한 소비 전력을 예측할 수 있다. 이에, 컴퓨팅 장치(101)는 본 발명에서 제공하는 프레임 워크로, 다음의 동작을 수행할 수 있다.

컴퓨팅 장치(101)는 환경 센서, 소비 부하, 달력 중 적어도 하나를 포함하는 세부 정보와 같은 기타 데이터 소스에서 학습 데이터(103)를 수집할 수 있다. 학습 데이터(103)는 단일 데이터 베이스를 통해 보관 및 관리될 수 있다.

컴퓨팅 장치(101)는 학습 데이터(103)를 활용하여 데이터 전처리(301) 과정을 수행할 수 있다. 컴퓨팅 장치(101)는 그래디언트 부스팅 앙상블 기법을 수행하기 이전 단계로 학습 데이터(103)를 사전 처리할 수 있다.

S1(302)에서 컴퓨팅 장치(101)는 표본 평균값, 표준 편차, 평균 제곱근, 평균 절대 중 적어도 하나의 통계적인 기술을 통해 학습 데이터(103)를 보강시킬 수 있다.

S2(303)에서 컴퓨팅 장치(101)는 보강된 학습 데이터(103) 중 텍스트, 그림 등 불필요한 데이터를 정리하는 과정을 수행할 수 있다.

S3(304)에서 컴퓨팅 장치(101)는 앙상블 학습 방식의 목표에 따라 불필요한 데이터가 정리된 학습 데이터(103)에서 올바른 기능을 추출할 수 있다. 다시 말해, 컴퓨팅 장치(101)는 불필요한 데이터가 정리된 학습 데이터(103)로부터 특징 선택 및 차원 축소에 가장 많이 사용되는 방법으로써, 주성분 분석(PCA: Principal Component Analysis)을 수행할 수 있다.

S4(305)에서 컴퓨팅 장치(101)는 주성분 분석이 완료된 학습 데이터(103)에 대한 정규화를 수행할 수 있다. 여기서, 본 발명은 S1(302)에서 S4(305)에 이르기는 일련의 과정을 수행함으로써, 복수의 분류 알고리즘을 포함하는 기본 예측 모델의 입력 데이터로 활용 가능한 학습 데이터를 생성할 수 있다.

컴퓨팅 장치(101)는 데이터 전처리 과정이 수행된 학습 데이터를 이용하여 특정 건물에서 소비되는 에너지의 소비 전력을 예측하기 위한 모델 학습(306)을 수행할 수 있다.

S5(307)에서 컴퓨팅 장치(101)는 서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 학습 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행할 수 있다. 여기서, 앙상블 학습은 ① CGBoost, ② LGBoost, ③ HGBoost, 및 ④ XGBoost의 알고리즘을 포함할 수 있으며, 본 발명은 그래디언트 부스팅 앙상블 기법을 이용할 수 있다. 여기서, 본 발명에서 적용된 그래디언트 부스팅 모델은 각 학습 과정에서 학습자를 생성하는 단계별 학습 모델을 따를 수 있다.

S6(308)에서 컴퓨팅 장치(101)는 앙상블 학습이 수행된 학습 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습할 수 있다. 다시 말해, 컴퓨팅 장치(101)는 훈련된 부하 예측 모델이 전력 부하를 추정하면 새로운 학습 데이터로 결과 데이터 추정치를 재학습할 수 있다. 모든 그래디언트 부스팅 앙상블 학습 모델은 나무와 같은 패턴을 따를 수 있다. 이때, 모델 훈련 중에 새 학습 트리는 한 번에 하나씩 추가되고, 모델의 기존 트리는 변경되지 않은 상태로 유지될 수 있다. 마찬가지로, 본 발명에서 복수의 샘플 데이터를 가지고 있는 현재 결과 데이터를 재학습하는 것은 전력 부하를 예측하기 위한 새로운 순차 학습 데이터와 결합될 수 있다. 본 발명은 전체 오류를 최소화하고 학습자가 최적화된 예측을 생성하도록 하기 위해 결과로부터 다시 학습하는 과정을 따를 수 있다. 이러한 재학습 방식은 기존 학습자가 제대로 수행하지 못한 잘못 분류된 데이터에 더 많은 중요성을 부여하는 대안적 방법일 수 있다.

따라서, 컴퓨팅 장치(101)는 앙상블 학습이 수행된 서로 다른 분류 알고리즘 각각에 적용된 복수의 샘플 데이터를 순차적으로 결합할 수 있다. 컴퓨팅 장치(101)는 복수의 샘플 데이터가 순차적으로 결합된 결과 데이터를 부하 예측 모델에 적용하여 결과 데이터를 재 학습할 수 있다. 이때, 컴퓨팅 장치(101)는 부하 예측 모델에 따른 이전의 샘플 데이터의 가중치를 크게 의존하면서, 결과 데이터를 재 학습할 수 있다. 다시 말해, 컴퓨팅 장치(101)는 의존도에 따른 이전 단계의 학습에 대한 해석으로써, 결과 데이터를 재 학습할 수 있다.

S7(309)에서 컴퓨팅 장치(101)는 재 학습된 결과 데이터를 이용하여 특정 건물에서 소비되는 에너지의 소비 전력을 시간대 별로 예측할 수 있다. 컴퓨팅 장치(101)는 특정 건물의 각 층에 구축된 관리 영역 별로 부하 기기(310)에 의한 소비 전력을 예측할 수 있다.

보다 자세하게, 컴퓨팅 장치(101)는 특정 건물의 총 부하 수요를 추정할 수 있다. 총 부하 수요는 다음의 세 가지 요소에 따라 달라질 수 있다.

① 요소 1: 부하 날씨에 따른 외부 온도

② 요소 2: 부하 기기당 소비량

③ 요소 3: 건물의 하루당 전력 소비량

일례로, 요소 1은 부하 날씨에 따른 부하 화창한 날, 비오는 날 또는 외부의 추운 날씨 중 외부 온도를 나타낼 수 있다. 요소 2는 부하 기기당 환기 장치, 조명, 팬, AC, 데스크탑 시스템, CPU 중 적어도 하나를 포함하는 가전 제품이 매일 시간당 얼마나 많은 부하 기기를 소비하는지를 나타낼 수 있다. 요소 3은 부하 요구, 전체 건물이 하루에 소비하는 전력의 양을 나타낼 수 있다.

컴퓨팅 장치(101)는 총 부하 수요로부터 에너지의 소비 전력을 시간대 별로 예측할 수 있다. 이때, 컴퓨팅 장치(101)는 에너지 소비 전력을 예측함에 있어, 건물의 복수의 층을 포함하는 전체, 건물의 각 층별 및 각 층에 구획된 관리 영역별 중 적어도 하나에 해당하는 에너지의 소비 전력을 예측할 수 있다.

컴퓨팅 장치(101)는 에너지 소비를 예측하기 위해 CGBoost, LGBoost, HGBoost 및 XGBoost를 포함하는 앙상블 학습 알고리즘에 대한 작업을 수행할 수 있다. 에너지 소비 예측은 전적으로 총 부하 수요를 기반으로 하는 모델 학습에 의존할 수 있다. 본 발명에서 요구되는 총 부하는 상술한 세 가지 요소에 따라 다를 수 있다. 여기서, 부스팅 알고리즘의 기본 원리는 나무와 같은 학습자를 추가하여 모델의 손실 함수를 최소화하는 것일 수 있다. 즉, 그래디언트 부스팅 앙상블 학습 모델이 트리와 같은 패턴을 따르기 때문에 새로운 학습 트리가 한 번에 하나씩 추가되고 모델의 기존 트리는 변경되지 않은 상태로 유지될 수 있다.

컴퓨팅 장치(101)는 매시간에 요구되는 총 부하를 취하고 에너지 소비를 예측할 수 있다. 또한, 예측 모델은 예상 결과를 학습 데이터로 사용하여 다음 시간의 에너지 소비량을 추정할 수 있다. 본 발명은 에너지 소모량을 예측하면서 결과 데이터로부터 재학습하는 과정이 완료되면 학습자가 생성되기 때문에 그 시간에 학습자는 기존 학습자가 제대로 수행하지 못한 오분류 정보에 더 집중할 수 있다. 본 발명은 결과 데이터에서 에너지 소비를 예측하는 방법을 제안할 수 있다.

따라서, 본 발명은 건물에 입주하여 에너지를 소비하는 사용자에 따라 에너지 사용량이 서로 다르게 분포되어 있음을 확인할 수 있다. 본 발명은 건물 내 서로 다르게 사용되는 층 별 또는, 각 관리 영역에 대응하여 서로 다른 소비 전력을 예측함으로써, 보다 효율적으로 에너지를 절약할 수 있다.

또한, 본 발명은 에너지의 소비 전력을 예측함에 있어, 년, 분기, 월, 주와 같은 다양한 간격 시리즈를 통해 서로 다른 시간 범위의 준주기성을 제공함으로써, 단기 또는, 장기적으로 전기 부하의 특성을 확인할 수 있다.

도 4는 본 발명의 일실시예에 따른 앙상블 학습 기반의 모델 학습 및 모델 검증을 수행하는 과정을 설명하기 위해 도시한 도면이다.

도 4를 참고하면, 컴퓨팅 장치(101)는 학습 데이터를 초기 입력으로 받아들여 부하 예측을 위한 모델 학습 및 모델 검증을 수행할 수 있다. 본 발명에서 컴퓨팅 장치(101)는 부하 예측을 위한 예상 모델이 CU-BEMS 및 GSOC의 학습 데이터를 초기 입력으로 활용하는 기술을 제안할 수 있다.

컴퓨팅 장치(101)는 학습 데이터(103)를 이용하여 앙상블 학습을 수행할 수 있으며, 앙상블 학습은 ① CGBoost, ② LGBoost, ③ HGBoost, 및 ④ XGBoost의 알고리즘을 포함할 수 있다. 여기서, CGBoost는 본 발명에서 제안하는 부하 예측 방법을 생성하기 위한 앙상블 학습에 활용될 수 있다. 또한, CGBoost 프로시저는 회귀 트리를 분해하고, 임의의 하위 집합으로 구성된 샘플 데이터(401)를 사용하여 회귀 트리 컬렉션을 구성할 수 있다. 컴퓨팅 장치(101)는 회귀 트리 컬렉션으로 구성된 샘플 데이터(401)를 컴파일하여 기본 예측 모델 및 부하 예측 모델을 생성할 수 있다.

① CGBoost

CGBoost는 범주형 기능을 갖춘 편향되지 않은 그래디언트 부스팅 기술을 나타낼 수 있다. CGBoost는 범주 속성과 이동을 예측하지 않는 혁신적인 주문 부스팅 접근 방식으로, 분류된 다양한 기능과 솔루션을 제공할 수 있다. 또한, CGBoost는 현재 전처리가 아닌 트리 분할에 수행할 수 있다. 따라서 본 발명은 하나의 컨볼루션 레이어를 사용하여 범주형 기능을 많은 수의 관측치가 있는 숫자형 기능으로 변환할 수 있다. 또한, 하이브리드 기능에 대한 클래스는 중앙값 대상으로 전환시킬 수 있다. 이는 수학식 1과 같이 나타낼 수 있다.

수학식 1을 참고하면, 과적합을 피하기 위해 평균 샘플

은

이전 샘플 데이터의 주요 매개 변수에 의해 결정될 수 있다. 임의의 순열

은 데이터 세트로부터 도출될 수 있다. 또한, 수학식 1의 경우가 충족되면,

은 값 1을 사용하며,

는 이전 값을 지정하며, 이전 값의 가중치를 나타낼 수 있다.

본 발명은 회귀 할당을 완료하고 사전 가능한 확률을 계산하기 위해 전체 데이터 세트의 평균 P를 사용할 수 있다. 이는 기능 변경으로 카테고리 캐릭터 간의 상호 작용 정보 손실이 표시될 수 있다.

결과적으로, CGBoost는 나머지 범주적 특성과 함께 기능 조합의 이전 상태를 검사할 수 있다. CGBoost는 과적합을 방지할 수 있는 범주형 기능을 얻기 위해 동일한 유형의 주문 접근 방식을 기반으로 하는 구성 가능한 부스팅 절차를 사용할 수 있다. 이러한 유형의 트리는 보다 안정적이고 과대 적합되지 않음에 따라 보다 효과적일 수 있다.

본 발명은 정렬된 부스팅 트리 만들기 절차에서 n개의 고유한 트리가 T₁,..., T_n으로 생성되며, 트리 T_i는 순열의 첫 번째 샘플을 활용하여 생성될 수 있다. 훈련 데이터 세트의 j번째 데이터 세트 샘플의 나머지는 트리 T_j-1을 사용하여 계산될 수 있다. 데이터 예측을 위한 모델은 훈련 데이터 세트를 기반으로 모든 순열에서 구축되는 트리일 수 있다.

CGBoost는 훈련 데이터 세트에서 체계적인 부스팅 방식을 활용하는 트리 구성을 통해 p + 1 독립적인 무작위 순열을 제공할 수 있다. 트리 구성의 내부 노드에서 분할 평가는

순열로 정의될 수 있다. 빌드된 트리의 리프 데이터 l_j는

순열을 사용하여 선택됩니다. CGBoost는 훈련 단계 동안 지원 트리 T_r,j를 유지합니다. 여기서 T_q,j(i)는 편차

의 j개 예제의 시작 값에 구성된 i번째 발생에 대한 현재 예측 값일 수 있다. CGBoost는 아래의 표 2와 같이 나타낼 수 있다.

RF 기반 부스팅 접근 방식은 CGBoost 알고리즘을 사용하여 효과적으로 훈련될 수 있다. CGBoost는 정규화 샘플링 프레임워크의 균형 샘플링 변형인 MVS(Minimal Variance Sample)라고도 하는 새로운 학습 방법이 포함될 수 있다.또한, CGBoost 접근 방식에는 각 의사 결정 트리를 구성하기 위한 설정과 랜덤 포레스트 모델을 구성하기 위한 매개 변수가 포함될 수 있다. 본 발명은 훈련할 부스팅 방법을 구성하기 위해 명확한 하이퍼 매개변수를 사용할 수 있다. CGBoost 기술은 훈련 중 작업 모델 훈련을 향상시키기 위해 하이퍼 팩터를 최적화할 수 있다. 적용된 매개 변수는 훈련된 모델이 검증된 후에도 유지될 수 있다.

LGBoost, HGBoost 및 XGBoost은 메커니즘을 포함한 수많은 앙상블 분류기에 대한 다양한 앙상블 접근 방식과 비교하여 본 발명에서 제안한 학습 모델의 기능을 보완적으로 검증하기 위해 활용될 수 있다.

컴퓨팅 장치(101)는 RF(Random Forest) 학습에 따른 최적화 및 정규화와 같은 딥 러닝 방식을 보다 효율적으로 수행하기 위해 부스팅 기술을 사용할 수 있다. 컴퓨팅 장치(101)는 부스팅 모델을 정규화 하기 위해 CGBoost 접근 방식을 활용하며, 일례로, CGBoost 접근 방식은 주로 MVS(Minimal Variance Sampling)로 알려진 고유한 단면 접근 방식과 결합될 수 있다. 여기서, MVS 기술을 사용하여 부스팅을 반복할 때마다 필요한 인스턴스 수와 모델의 품질은 다양한 그래디언트 부스팅 접근 방식과 연관될 때 극적으로 향상될 수 있다.

컴퓨팅 장치(101)는 점수 분할 정확도를 향상시키기 위해 각 부스팅 트리의 기능을 샘플링 할 수 있다. 컴퓨팅 장치(101)는 CGBoost의 정교함을 활용하여 교차 검증 정보 포인트에 대한 설명에 맞춤형 교육 주기가 수행될 수 있다. 또한, 컴퓨팅 장치는 새로운 학습 데이터의 포인트를 최적화하기 위해 체크포인트가 구현될 수 있다. 컴퓨팅 장치(101)는 각 학습 데이터에 대한 체크포인트를 저장하면 훈련과 관련하여 CGBoost 기술의 다양성이 향상될 수 있다.

② LGBoost

LGBoost는 메모리 사용을 줄이면서 모델 효율성을 높이는 데 도움이 되는 의사 결정 트리 기반 그래디언트 부스팅 프레임워크일 수 있다. 1-Sided Gradient Boosting-based Sampling process와 Exclusive Feature Bundling은 Light Gradient-based Boosting machine에서 사용되는 두 가지 고유한 기술일 수 있다. 이때, 지식 획득 계산에서 서로 다른 데이터 인스턴스는 서로 다른 역할을 수행할 수 있다.

지식 획득은 기울기가 더 큰 경우(즉, 훈련이 덜 된 인스턴스)에서 더 우수할 수 있다. 지식 획득 추정의 정확도를 유지하기 위해 GOSS는 기울기가 큰 예제를 보존하고 기울기가 작은 예제만 무작위로 거부할 수 있다. 정보 이득 값의 범위가 클 때, LGBoost는 특정 목표 샘플 레이트로 균일하게 무작위 샘플링하는 것보다 더 정확한 이득 추정을 얻기 위해 집중될 수 있다. 트리를 레벨별로 개발하는 다른 부스팅 알고리즘과 달리 LGBoost는 트리를 리프 별로 분할하며, 분할된 리브에 따른 델타 손실을 최소화할 수 있다.

리프 방식 알고리즘은 리프가 고정되어 있으므로 레벨 방식 알고리즘보다 손실이 적을 수 있다. 작은 데이터 세트에서 리브 트리 개발은 모델의 복잡성을 증가시키고 과적합으로 이어질 수 있다. 자세하게, n 번 발생하는 훈련 세트의 경우

여기서, 각 x_i는 차원이 s인 공간 X_s의 벡터일 수 있다. 모델 출력에 대한 손실 함수의 음의 기울기는 기울기 부스팅의 각 반복에서

으로 표시될 수 있다. 훈련 인스턴스는 이 GOSS 방법에서 기울기의 정확한 수준을 기반으로 특정 차수를 기울이도록 정렬될 수 있다.

이후, 본 발명은 가장 높은 기울기를 가진 100% 인스턴스가 유지되며 인스턴스 하위 집합 A를 생성할 수 있다. 본 발명은 크기가 b |Ac|인 하위 집합 B를 무작위로 선택할 수 있다. 마지막으로 본 발명은 벡터 V_j(d)에서 예상되는 분산 이득을 기반으로 사례를 그룹으로 분류할 수 있다. 이는 아래의 수학식 2와 같이 나타낼 수 있다.

여기서, A_l과 B_l는 리프 값이고, A_r과 B_r은 리프 값의 변형이며, (1-a)/b는 B에 걸친 총 그라디언트를 Ac 크기로 정규화하는 데 사용될 수 있다. 이때, 본 발명은 고차원 데이터가 희소하기 때문에 전체 기능 세트 수를 줄이기 위해 실질적으로 무손실 전략을 활용할 수 있다. 희소 특성 공간에 있는 다양한 유형의 특성은 공동으로 제한될 수 있다. 즉, 0이 아닌 값, 즉 NaN 값을 동시에 고려하지 않는다는 의미할 수 있다. 이는 고유한 특성을 하나의 기능으로 안전하게 결합할 수 있다.

③ HGBoost

본 발명에서 제안된 모든 부스팅 알고리즘은 분류된 앙상블 모델을 생성하는 데 사용되는 ML 방법 집합일 수 있다. 여기서, 손실 함수는 각 반복에서 가장 큰 하강 최소화로 최적화될 수 있으며, 함수 공간의 많은 최적화가 예측 함수를 생성하는데 사용될 수 있다. 모든 출력 샘플의 무작위 F_0(x)으로 시작할 수 있다.

이때, 본 발명은 기 결정된 분류기의 수에 도달할 때까지 그래디언트 부스팅 적합 훈련 트리를 생성할 수 있으며, 모든 회귀 또는 분류 문제는 파생된 손실 함수의 도움으로 HGBoost를 사용하여 해결할 수 있다.

또한, 이항 로그 기반 확률 또는 다항식 기반 손실 함수는 이진 분류에 사용될 수 있으며, HGBoost는 손실 함수를 사용하여 다중 클래스 회귀 상황에서 각 클래스 l에 대한 덧셈 함수 F1(x)를 추정할 수 있다. 이는 아래의 수학식 3과 같이 나타낼 수 있다.

여기서 ø는 클래스의 총 개수를 나타내며, y_{_1}은 샘플 x가 클래스 l에 속할 가능성을 나타내고, p__l(x)은 샘플 x가 클래스 l에 맞는 확률을 나타낼 수 있다. 확률 p__l(x)를 계산하기 위해 아래의 수학식 4이 사용될 수 있다.

확률의 의사 잔차는 회귀 트리를 훈련하는 데 사용되며, 리프 계산 결과는 아래의 수학식 5와 같이 나타낼 수 있다.

회귀 세분화의 견고성은 예측 변수에 대해 생성된 다양한 값 데이터 유형이 지향 앙상블 접근법을 향상시키기 위해 모든 계층에서 생성된 회귀 트리에 통합될 것임을 감독하는데 사용될 수 있다.

④ XGBoost

XGBoost(Extreme-Gradient Boosting)는 가장 널리 사용되는 ML 부스팅을 위한 알고리즘일 수 있다. XGBoost 기술은 휴대 가능하고 정밀한 트리 부스팅 솔루션을 위해 설계되었으며, 병렬 트리 학습 및 캐시 민감도 열 블록을 사용한 규정 시연, 분할 기능을 기반으로 부하를 근사화할 수 있다. XGBoost는 성능 작업과 메모리 볼륨을 높여 교육 과정을 빠르게 극대화할 수 있다. XGBoost에는 과적합을 방지하기 위한 변형과 다양한 유형의 더 큰 어려움이 포함되어 있지만, 주요 기능은 과적합에 반대하는 것이 정규화 된 모델 해석이 가능할 수 있다.

또한, XGBoost는 축소 및 인스턴스 하위 샘플링과 같은 다른 정규화 접근 방식도 포함됩니다. XGBoost의 대상 함수에는 계산 부담을 조절하는 정규화 표현식이 포함될 수 있다. 이는 예측 모델의 개발과 고귀한 편향 분산 트레이드 오프의 발견을 허용하며, XGBoost의 목적 함수는 수학식 6과 같이 나타낼 수 있다.

여기서 T는 트리 f의 리브 개수이며, 트리 f의 j번째 리브의 추정 점수를 나타낼 수 있다. 해당 함수는 f(x) = w_q(x)를 의미하고, q는 그래프 샘플 x를 병렬 리프로 전복시키는 트리로 표시될 수 있다.

는 엄격한 정규화 최적화 요인을 나타내며 예측의 분산을 줄여 학습 데이터에 덜 민감하게 만들 수 있다. 매개변수

는 트리를 나누는 등급 함수의 임계값일 수 있다. 아래의 수학식 7은 새로운 트리의 계산에 대한 목표 함수를 줄여 XGBoost 학습을 상징할 수 있다.

개인화된 손실 함수는 Taylor의 2차 추정을 사용하여 손실 함수를 최적화하는 XGBoost에서 지원될 수 있다. XGBoost은 매개 변수를 삭제하여 리프 노드의 w 등급에 공정한 함수를 맞춤화할 수 있다. 사용자 정의된 XGBoost 손실 함수는 아래의 수학식 8과 같이 나타낼 수 있다.

손실 함수의 기울기 값은

및

이며, 리프 j에 할당된 샘플은

로 표시될 수 있다. 본 발명은 아래의 수학식 9를 사용하여 트리 q에 대한 리프 j의 최적 점수

를 계산할 수 있다.

본 발명은 데이터의 정확도를 향상시키기 위해 압축된 열 패턴으로 메모리 슬래브에 저장될 수 있다. 모든 열은 분할 값을 결정하기 위해 점진적으로 스캔될 수 있다. 본 발명은 기울기 수치 정보 수집에서 단일 검사를 통해 나누어진 값이 누적되어 모든 리브에 적용되며, 분할 접근 방식을 생성할 수 있다. 여기서, 분할 접근 방식은 경사 값을 사용하여 인접하지 않은 메모리에 액세스한 후 여러 번 캐시 데이터가 손실될 수 있다. XGBoost는 사전 버퍼링을 사용하고 해당 값을 분석하여 문제에 대한 솔루션을 제공할 수 있다.

도 5는 본 발명의 일실시예에 따른 앙상블 학습의 다양한 알고리즘을 통해 실제로 측정된 전력 수요와 예측된 전력 수요를 비교한 결과를 나타낸 그래프이다.

도 5를 참고하면, 컴퓨팅 장치는 앙상블 학습 모델에 의해 예측된 값에 대한 실제 전력 수요 값의 플롯을 나타낼 수 있다.

도 5의 (a)는 실제 값과 예측 값의 곡선이 거의 겹치는 CGBoost 알고리즘에 의한 성능을 나타내며, 실제값과 예측값의 편차가 점점 작아지고 있음을 나타낼 수 있다. 도 5의 (b)는 생성된 실제 곡선과 예측 곡선 사이의 경향을 나타내며, 이는 CGBoost 알고리즘에 의해 약간 어긋난 상태일 수 있다. LGBoost 및 XGBoost에 의한 예측 모델을 나타내는 도 5의 (c) 및 도 5의 (d)는 CGBoost 및 HGBoost 모델보다 정확도가 낮은 것을 나타내는 곡선 간의 편차가 더 많이 나타낼 수 있다.

본 발명에서 건물의 에너지 활용에 대한 예측 모델은 부스팅 앙상블 알고리즘인 ① CGBoost, ② LGBoost, ③ HGBoost, 및 ④ XGBoost를 사용할 수 있다. 본 발명에서 다양한 학습 모델의 구현은 분산 계수, 표준 편차, R 제곱근, 평균 제곱근 오차, 평균 제곱 오차, 평균 절대 % 오차, 평균 제곱 평균 제곱근 오차, 평균 절대 편차 및 평균과 같은 많은 평가 메트릭과 비교 및 판단될 수 있다. 평균 제곱 오차는 에너지 활용도가 가장 좋은 예측 모델을 찾기 위한 것일 수 있다.

(1) 평균 제곱 오차(AMSE)

평균 제곱 오차는 실제 값과 예측 모델에 의한 예측 값 간의 차이의 평균 제곱일 수 있다. 평균 제곱 오차는 오류 값이 낮을수록 데이터 포인트가 선 회귀선에 더 가깝다는 것을 나타낼 수 있다. 여기서, 평균 제곱 오차는 AMSE이 0에 가까울수록 학습 모델이 완벽한 것으로 판단될 수 있으며, 아래의 표 3은 전력 부하 추정을 위한 CGB, LGB, HSB 및 XSB 각각의 예측 모델이 나타낸 AMSE 값을 나열한 것이다.

알고리즘	CGBoost	LGBoost	HGBoost	XGBoost
AMSE	0.13	0.27	0.28	0.59

(2) 평균 제곱근 오차(ARMSE)평균 제곱근 오차는 예측 모델의 오차를 측정하는 메트릭으로, 모든 제곱 평균 제곱근 오차의 평균일 수 있다. ARMSE는 큰 오류에 큰 가중치를 제공할 수 있다. 아래의 표 4는 CGB, LGB, HSB 및 XSB 각각의 예측 모델이 나타낸 ARMSE를 나열한 것이다.

알고리즘	CGBoost	LGBoost	HGBoost	XGBoost
ARMSE	0.13	0.27	0.28	0.59

(3) 평균 절대 편차(MAD)평균 절대 편차는 평균과 데이터 포인트 사이의 평균 거리로, 데이터 포인트의 분산을 설명할 수 있다. 예측 모델에 의해 생성된 MAD 값은 아래의 표 5와 같이 나타낼 수 있다.

알고리즘	CGBoost	LGBoost	HGBoost	XGBoost
MAD	12.89	20.53	20.89	30.98

(4) R 제곱 값R 제곱 값은 모델의 오차가 아니라 모델의 성능을 나타내며, 입력 변수와 출력 변수 사이의 의존성의 측정 강도일 수 있다. 값 범위는 0과 1 사이이고, 값이 1에 가까울수록 모델의 성능이 향상되었음을 나타낼 수 있다. 예측 모델의 R 제곱 값은 아래의 표 6과 같이 나타낼 수 있다.

알고리즘	CGBoost	LGBoost	HGBoost	XGBoost
R 제곱 값	0.99	0.97	0.97	0.94

(5) 표준 편차표준 편차는 데이터 포인트의 분포 정도에 사용되며, 데이터 세트의 실제 값의 표준 편차는 164.324로 계산될 수 있다. 예측 모델의 표준 편차는 표 5와 같이 나타낼 수 있다.

알고리즘	CGBoost	LGBoost	HGBoost	XGBoost
표준편차	161.07	158.75	158.64	153.37

(6) 분산 계수분산 계수는 데이터 포인트의 표준 편차와 평균 간의 비율을 나타내며, 분산 계수는 데이터 포인트의 분산을 찾는 데 사용될 수 있다. 분산 계수는 값이 클수록 실제 값과 예측 값 사이의 표준 편차가 작아질 수 있다. 분산 계수가 많은 학습 모델은 실제 값과 예측 값 사이의 편차가 적은 것으로 나타낼 수 있다. 분산 계수는 표 6과 같이 나타낼 수 있다.

알고리즘	CGBoost	LGBoost	HGBoost	XGBoost
분산계수	0.72	0.71	0.71	0.67

도 6은 본 발명의 일실시예에 따른 에너지 소비 예측 방법을 설명하기 위해 나타낸 흐름도이다.

단계(601)에서 컴퓨팅 장치는 특정 건물에 포함된 복수의 관리 구역 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터를 수집할 수 있다. 컴퓨팅 장치는 소비 전력 데이터, 내부 환경 데이터, 실외 환경 데이터, 및 공휴일 데이터 중 적어도 하나를 포함하는 학습 데이터를 수집할 수 있다.

단계(602)에서 컴퓨팅 장치는 서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 학습 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행할 수 있다. 컴퓨팅 장치는 학습 데이터로부터 복수의 샘플 데이터를 랜덤하게 추출할 수 있다. 여기서, 컴퓨팅 장치는 학습 데이터로부터 순열 형태를 갖는 n개의 고유 트리를 생성하고, 생성된 n개의 고유 트리의 레벨에 따른 복수의 샘플 데이터를 추출할 수 있다. 컴퓨팅 장치는 기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 앙상블 학습을 수행할 수 있다.

단계(603)에서 컴퓨팅 장치는 앙상블 학습이 수행된 학습 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습할 수 있다. 컴퓨팅 장치는 앙상블 학습이 수행된 서로 다른 분류 알고리즘 각각에 적용된 복수의 샘플 데이터를 순차적으로 결합할 수 있다. 여기서, 컴퓨팅 장치는 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용하여 복수의 샘플 데이터를 순차적으로 결합할 수 있다.

컴퓨팅 장치는 복수의 샘플 데이터가 순차적으로 결합된 결과 데이터를 부하 예측 모델에 적용하여 결과 데이터를 재 학습할 수 있다. 컴퓨팅 장치는 샘플 데이터들의 가중치에 따른 샘플 데이터에 각각 적용된 제1 알고리즘과 제2 알고리즘 간의 오차를 보완하여 복수의 샘플 데이터를 순차적으로 결합할 수 있다.

단계(604)에서 컴퓨팅 장치는 재학습된 결과 데이터를 이용해 특정 건물에서 소비되는 에너지의 소비 전력을 시간대 별로 예측할 수 있다. 컴퓨팅 장치는 재학습된 결과 데이터로부터 각 층 및 각 층에 구획된 관리 구역 별 에너지의 소비 전력을 예측할 수 있다.

한편, 본 발명에 따른 방법은 컴퓨터에서 실행될 수 있는 프로그램으로 작성되어 마그네틱 저장매체, 광학적 판독매체, 디지털 저장매체 등 다양한 기록 매체로도 구현될 수 있다.

본 명세서에 설명된 각종 기술들의 구현들은 디지털 전자 회로조직으로, 또는 컴퓨터 하드웨어, 펌웨어, 소프트웨어로, 또는 그들의 조합들로 구현될 수 있다. 구현들은 데이터 처리 장치, 예를 들어 프로그램가능 프로세서, 컴퓨터, 또는 다수의 컴퓨터들의 동작에 의한 처리를 위해, 또는 이 동작을 제어하기 위해, 컴퓨터 프로그램 제품, 즉 정보 캐리어, 예를 들어 기계 판독가능 저장 장치(컴퓨터 판독가능 매체) 또는 전파 신호에서 유형적으로 구체화된 컴퓨터 프로그램으로서 구현될 수 있다. 상술한 컴퓨터 프로그램(들)과 같은 컴퓨터 프로그램은 컴파일된 또는 인터프리트된 언어들을 포함하는 임의의 형태의 프로그래밍 언어로 기록될 수 있고, 독립형 프로그램으로서 또는 모듈, 구성요소, 서브루틴, 또는 컴퓨팅 환경에서의 사용에 적절한 다른 유닛으로서 포함하는 임의의 형태로 전개될 수 있다. 컴퓨터 프로그램은 하나의 사이트에서 하나의 컴퓨터 또는 다수의 컴퓨터들 상에서 처리되도록 또는 다수의 사이트들에 걸쳐 분배되고 통신 네트워크에 의해 상호 연결되도록 전개될 수 있다.

컴퓨터 프로그램의 처리에 적절한 프로세서들은 예로서, 범용 및 특수 목적 마이크로프로세서들 둘 다, 및 임의의 종류의 디지털 컴퓨터의 임의의 하나 이상의 프로세서들을 포함한다. 일반적으로, 프로세서는 판독 전용 메모리 또는 랜덤 액세스 메모리 또는 둘 다로부터 명령어들 및 데이터를 수신할 것이다. 컴퓨터의 요소들은 명령어들을 실행하는 적어도 하나의 프로세서 및 명령어들 및 데이터를 저장하는 하나 이상의 메모리 장치들을 포함할 수 있다. 일반적으로, 컴퓨터는 데이터를 저장하는 하나 이상의 대량 저장 장치들, 예를 들어 자기, 자기-광 디스크들, 또는 광 디스크들을 포함할 수 있거나, 이것들로부터 데이터를 수신하거나 이것들에 데이터를 송신하거나 또는 양쪽으로 되도록 결합될 수도 있다. 컴퓨터 프로그램 명령어들 및 데이터를 구체화하는데 적절한 정보 캐리어들은 예로서 반도체 메모리 장치들, 예를 들어, 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(Magnetic Media), CD-ROM(Compact Disk Read Only Memory), DVD(Digital Video Disk)와 같은 광 기록 매체(Optical Media), 플롭티컬 디스크(Floptical Disk)와 같은 자기-광 매체(Magneto-Optical Media), 롬(ROM, Read Only Memory), 램(RAM, Random Access Memory), 플래시 메모리, EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM) 등을 포함한다. 프로세서 및 메모리는 특수 목적 논리 회로조직에 의해 보충되거나, 이에 포함될 수 있다.

또한, 컴퓨터 판독가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용매체일 수 있고, 컴퓨터 저장매체 및 전송매체를 모두 포함할 수 있다.

본 명세서는 다수의 특정한 구현물의 세부사항들을 포함하지만, 이들은 어떠한 발명이나 청구 가능한 것의 범위에 대해서도 제한적인 것으로서 이해되어서는 안되며, 오히려 특정한 발명의 특정한 실시형태에 특유할 수 있는 특징들에 대한 설명으로서 이해되어야 한다. 개별적인 실시형태의 문맥에서 본 명세서에 기술된 특정한 특징들은 단일 실시형태에서 조합하여 구현될 수도 있다. 반대로, 단일 실시형태의 문맥에서 기술한 다양한 특징들 역시 개별적으로 혹은 어떠한 적절한 하위 조합으로도 복수의 실시형태에서 구현 가능하다. 나아가, 특징들이 특정한 조합으로 동작하고 초기에 그와 같이 청구된 바와 같이 묘사될 수 있지만, 청구된 조합으로부터의 하나 이상의 특징들은 일부 경우에 그 조합으로부터 배제될 수 있으며, 그 청구된 조합은 하위 조합이나 하위 조합의 변형물로 변경될 수 있다.

마찬가지로, 특정한 순서로 도면에서 동작들을 묘사하고 있지만, 이는 바람직한 결과를 얻기 위하여 도시된 그 특정한 순서나 순차적인 순서대로 그러한 동작들을 수행하여야 한다거나 모든 도시된 동작들이 수행되어야 하는 것으로 이해되어서는 안 된다. 특정한 경우, 멀티태스킹과 병렬 프로세싱이 유리할 수 있다. 또한, 상술한 실시형태의 다양한 장치 컴포넌트의 분리는 그러한 분리를 모든 실시형태에서 요구하는 것으로 이해되어서는 안되며, 설명한 프로그램 컴포넌트와 장치들은 일반적으로 단일의 소프트웨어 제품으로 함께 통합되거나 다중 소프트웨어 제품에 패키징 될 수 있다는 점을 이해하여야 한다.

한편, 본 명세서와 도면에 개시된 본 발명의 실시 예들은 이해를 돕기 위해 특정 예를 제시한 것에 지나지 않으며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상에 바탕을 둔 다른 변형 예들이 실시 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 자명한 것이다.

101: 컴퓨팅 장치
102: 특정 건물
103: 학습 데이터
104: 소비 전력 데이터
105: 내부 환경 데이터
106: 외부 환경 데이터
107: 공휴일 데이터
108: 학습 데이터

Claims

특정 건물의 각 층 및 상기 각 층 별로 상이하게 구획된 복수의 관리 구역 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터를 수집하는 단계;
서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 적용된 학습 데이터에서 랜덤하게 추출되는 복수의 샘플 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하는 단계;
앙상블 학습이 수행된 복수의 샘플 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하는 단계; 및
재 학습된 결과 데이터를 이용하여 복수의 층을 포함하는 특정 건물의 전체, 특정 건물의 각 층 또는, 상기 각 층에 구획된 복수의 관리 구역별 중 적어도 하나에서 서로 다르게 소비되는 에너지의 소비 전력을 시간대 별로 예측하는 단계;
를 포함하고,
상기 재 학습하는 단계는,
상기 서로 다른 분류 알고리즘 중 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용함으로써, 앙상블 학습이 수행된 복수의 샘플 데이터를 순차적으로 결합하여 결과 데이터로 생성하는 단계; 및
상기 생성된 결과 데이터를 구성하는 샘플 데이터의 가중치에 대한 의존도를 고려하여 상기 의존도에 따른 부하 예측 모델을 통해 상기 결과 데이터를 생성하는 단계의 학습에 대한 해석으로써, 상기 결과 데이터를 재 학습하는 단계
를 포함하는 에너지 소비 예측 방법.
제1항에 있어서,
상기 학습 데이터를 수집하는 단계는,
특정 건물의 각 층에 구획된 복수의 관리 구역 별로 설치되는 적어도 하나의 부하 기기에서 N 분 간격으로 사용된 소비 전력 데이터;
상기 복수의 관리 구역 별 내부의 온도, 비교 습도, 주변광 중 적어도 하나를 포함하는 내부 환경 데이터;
내부 환경 데이터를 수집한 시점에서의 특정 건물의 실외 환경 데이터; 및
소정 기간의 날짜·시간에 관한 공휴일 데이터;
중 적어도 하나를 포함하는 학습 데이터를 수집하는 에너지 소비 예측 방법.
제2항에 있어서,
상기 학습 데이터를 수집하는 단계는,
통합 지표면 시간별(ISH: Incorporated Surface Hourly)로 제공되는 일별 요소를 고려하여 외부 환경 데이터 및 공휴일 데이터를 수집하는 에너지 소비 예측 방법.
제1항에 있어서,
상기 앙상블 학습을 수행하는 단계는,
학습 데이터에서 랜덤하게 복수의 샘플 데이터를 추출하는 단계; 및
기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 앙상블 학습을 수행하는 단계;
를 포함하는 에너지 소비 예측 방법.
제4항에 있어서,
상기 복수의 샘플 데이터를 추출하는 단계는,
학습 데이터로부터 순열 형태를 갖는 n개의 고유 트리를 생성하고, 생성된 n개의 고유 트리의 레벨에 따른 복수의 샘플 데이터를 추출하는 에너지 소비 예측 방법.
삭제
삭제
제1항에 있어서,
상기 샘플 데이터를 순차적으로 결합하는 단계는,
샘플 데이터들의 가중치에 따른 샘플 데이터에 각각 적용된 제1 알고리즘과 제2 알고리즘 간의 오차를 보완하여 복수의 샘플 데이터를 순차적으로 결합하는 에너지 소비 예측 방법.
특정 건물의 각 층 및 상기 각 층 별로 상이하게 구획된 복수의 관리 구역 별로 소비 전력 데이터 및 내부 환경 데이터를 수집하는 단계;
내부 환경 데이터를 수집한 시점에서의 특정 건물의 실외 환경 데이터 및 소정 기간의 날짜·시간에 관한 공휴일 데이터를 수집하는 단계;
학습 데이터로부터 랜덤하게 복수의 샘플 데이터를 생성하는 단계;
기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하는 단계;
앙상블 학습된 복수의 샘플 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하는 단계; 및
재 학습된 결과 데이터를 이용하여 복수의 층을 포함하는 특정 건물의 전체, 특정 건물의 각 층 또는, 상기 각 층에 구획된 복수의 관리 구역별 중 적어도 하나에서 서로 다르게 소비되는 에너지의 소비 전력을 시간대 별로 예측하는 단계;
를 포함하고,
상기 재 학습하는 단계는,
상기 서로 다른 분류 알고리즘 중 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용함으로써, 앙상블 학습이 수행된 복수의 샘플 데이터를 순차적으로 결합하여 결과 데이터로 생성하는 단계; 및
상기 생성된 결과 데이터를 구성하는 샘플 데이터의 가중치에 대한 의존도를 고려하여 상기 의존도에 따른 부하 예측 모델을 통해 상기 결과 데이터를 생성하는 단계의 학습에 대한 해석으로써, 상기 결과 데이터를 재 학습하는 단계
를 포함하는 에너지 소비 예측 방법.
제9항에 있어서,
상기 소비 전력 데이터 및 내부 환경 데이터를 수집하는 단계는,
i) 특정 건물의 각 층에 구획된 복수의 관리 구역 별로 설치되는 적어도 하나의 부하 기기에서 N 분 간격으로 사용된 소비 전력 데이터, 및 ii) 복수의 관리 구역 별 내부의 온도, 비교 습도, 주변광 중 적어도 하나를 포함하는 내부 환경 데이터를 수집하는 에너지 소비 예측 방법.
제9항에 있어서,
상기 공휴일 데이터를 수집하는 단계
통합 지표면 시간별 일별 정보에 기초하여 온도, 이슬점, 해수면, 기압, 풍속 중 적어도 하나의 기상 매개 변수를 이용하여 상기 시점에서의 특정 건물의 실외 환경 데이터를 수집하는 에너지 소비 예측 방법.
제9항에 있어서,
상기 복수의 샘플 데이터를 추출하는 단계는,
학습 데이터로부터 순열 형태를 갖는 n개의 고유 트리를 생성하고, 생성된 n개의 고유 트리의 레벨에 따른 복수의 샘플 데이터를 추출하는 에너지 소비 예측 방법.
삭제
제9항에 있어서,
상기 결과 데이터를 재 학습하는 단계는,
복수의 샘플 데이터에 각각 부여된 가중치를 기반으로 서로 다른 분류 알고리즘 간의 오차를 보완하여 순차적으로 복수의 샘플 데이터를 결과 데이터로 결합하는 에너지 소비 예측 방법.
에너지 소비 예측 방법을 수행하는 컴퓨팅 장치에 있어서,
상기 컴퓨팅 장치는 프로세서를 포함하고,
상기 프로세서는,
특정 건물의 각 층 및 상기 각 층 별로 상이하게 구획된 복수의 관리 구역 별로 에너지의 소비 전력을 예측하기 위한 학습 데이터를 수집하고,
서로 다른 분류 알고리즘을 사용하는 기본 예측 모델에 적용된 학습 데이터에서 랜덤하게 추출되는 복수의 샘플 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하고,
앙상블 학습이 수행된 복수의 샘플 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하고,
재 학습된 결과 데이터를 이용하여 복수의 층을 포함하는 특정 건물의 전체, 특정 건물의 각 층 또는, 상기 각 층에 구획된 복수의 관리 구역별 중 적어도 하나에서 서로 다르게 소비되는 에너지의 소비 전력을 시간대 별로 예측하며,
상기 결과 데이터를 재 학습함에 있어,
상기 서로 다른 분류 알고리즘 중 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용함으로써, 앙상블 학습이 수행된 복수의 샘플 데이터를 순차적으로 결합하여 결과 데이터로 생성하고,
상기 생성된 결과 데이터를 구성하는 샘플 데이터의 가중치에 대한 의존도를 고려하여 상기 의존도에 따른 부하 예측 모델을 통해 상기 결과 데이터를 생성하는 단계의 학습에 대한 해석으로써, 상기 결과 데이터를 재 학습하는 컴퓨팅 장치.
에너지 소비 예측 방법을 수행하는 컴퓨팅 장치에 있어서,
상기 컴퓨팅 장치는 프로세서를 포함하고,
상기 프로세서는,
특정 건물의 각 층 및 상기 각 층 별로 상이하게 구획된 복수의 관리 구역 별로 소비 전력 데이터 및 내부 환경 데이터를 수집하고,
내부 환경 데이터를 수집한 시점에서의 특정 건물의 실외 환경 데이터 및 소정 기간의 날짜·시간에 관한 공휴일 데이터를 수집하고,
학습 데이터로부터 랜덤하게 복수의 샘플 데이터를 생성하고,
기본 예측 모델에 포함된 서로 다른 분류 알고리즘 각각에 복수의 샘플 데이터를 적용하여 특정 건물의 전력 부하를 예측하기 위한 앙상블 학습을 수행하고,
앙상블 학습된 복수의 샘플 데이터를 결과 데이터로 결합하여 부하 예측 모델에 따른 결과 데이터를 재 학습하고,
재 학습된 결과 데이터를 이용하여 복수의 층을 포함하는 특정 건물의 전체, 특정 건물의 각 층 또는, 상기 각 층에 구획된 복수의 관리 구역별 중 적어도 하나에서 서로 다르게 소비되는 에너지의 소비 전력을 시간대 별로 예측하고,
상기 결과 데이터를 재 학습함에 있어,
상기 서로 다른 분류 알고리즘 중 제1 알고리즘이 적용된 샘플 데이터의 가중치를 제2 알고리즘이 적용된 샘플 데이터의 가중치로 활용함으로써, 앙상블 학습이 수행된 복수의 샘플 데이터를 순차적으로 결합하여 결과 데이터로 생성하고,
상기 생성된 결과 데이터를 구성하는 샘플 데이터의 가중치에 대한 의존도를 고려하여 상기 의존도에 따른 부하 예측 모델을 통해 상기 결과 데이터를 생성하는 단계의 학습에 대한 해석으로써, 상기 결과 데이터를 재 학습하는 컴퓨팅 장치.