KR102087026B1 - Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis - Google Patents
Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis Download PDFInfo
- Publication number
- KR102087026B1 KR102087026B1 KR1020180033026A KR20180033026A KR102087026B1 KR 102087026 B1 KR102087026 B1 KR 102087026B1 KR 1020180033026 A KR1020180033026 A KR 1020180033026A KR 20180033026 A KR20180033026 A KR 20180033026A KR 102087026 B1 KR102087026 B1 KR 102087026B1
- Authority
- KR
- South Korea
- Prior art keywords
- power consumption
- data
- consumption data
- time series
- subsequences
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012731 temporal analysis Methods 0.000 title abstract description 13
- 238000000700 time series analysis Methods 0.000 title abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 20
- 238000004364 calculation method Methods 0.000 claims description 13
- 238000003066 decision tree Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 7
- 230000008901 benefit Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000001932 seasonal effect Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002547 anomalous effect Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q20/00—Payment architectures, schemes or protocols
- G06Q20/08—Payment architectures
- G06Q20/14—Payment architectures specially adapted for billing systems
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Finance (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Water Supply & Treatment (AREA)
- Development Economics (AREA)
- Public Health (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
시계열 분석 기법을 이용한 소비전력 패턴 분류 방법 및 장치가 제시된다. 본 발명에서 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법은 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계를 포함한다.A method and apparatus for classifying power consumption patterns using time series analysis are presented. In the power consumption pattern classification method using the time series analysis technique proposed in the present invention, a step of processing data to collect total power consumption data for a predetermined period and to represent the power consumption data in the form of a plurality of sequences, sliding window (Sliding) extracting all subsequences of the power-processed data in the form of time-processed data, learning all the extracted subsequences, generating a Shapes Dictionary, and generating the shapelet dictionary. And classifying the power consumption data in the form of time series into respective patterns.
Description
본 발명은 효율적인 에너지 관리에 관한 것으로, 수용가에 대하여 시간에 따라 수집되는 소규모 또는 중, 소형의 부하를 가지는 냉장고의 소비전력 데이터를 기준으로 각각 평일과 토요일, 그리고 일요일의 패턴으로 구분하는 방법으로 소비전력의 패턴을 분석하는 방법에 관한 것이다. The present invention relates to efficient energy management, and consumed in a manner of dividing into patterns of weekdays, Saturdays, and Sundays, respectively, based on power consumption data of a refrigerator having a small, medium, or small load collected over time for a customer. A method of analyzing a pattern of power.
기존의 공급 중심에서 수요와 관리, 그리고 서비스로 이어지는 에너지 정책이 대두되면서, 스마트 그리드 즉, 지능형 전력망을 포함한 스마트 에코 등의 에너지 관리와 절약에 대한 논제가 강조되고 있는 실정이다. 스마트 그리드를 통하여 전력 수용가는 전력계통운영자(이하, 계통운영자)에 의해 전력 사용 패턴의 변화를 유도됨으로써 피크 수요 절감 및 전력계통 운영의 안정화를 도모하며, 불필요한 전력 사용을 줄이고, 전기요금 절감 및 감축한 전력수요 판매 등을 통해 경제적인 이득을 취할 수 있다. 상기한 바를 위해, 계통운영 기관에서는 여러 상황의 전력 수용가를 대상으로 한 다양한 에너지 관리시스템들이 개발되고 있다. With the emergence of energy policies that lead to demand, management, and service from the supply center, the issue of energy management and saving, such as smart grid, smart eco including intelligent power grid, is being emphasized. Through the smart grid, power consumers induce changes in power usage patterns by power system operators (hereinafter referred to as system operators), which aims to reduce peak demand and stabilize power system operations, reduce unnecessary power usage, and reduce and reduce electricity bills. Economic benefits can come from selling power demand. To this end, a variety of energy management systems are being developed by grid operators for power consumers in different situations.
최근 에너지의 효율적인 사용을 위하여 도입된 에너지관리시스템(Energy Management System, EMS)를 통하여 소규모를 포함한 중, 대규모 부하에서도 안정적이고 경제적인 부하 운용 및 전력 수급을 위해 부하의 정확한 수요 예측이 요구된다.The energy management system (EMS), which was recently introduced for efficient use of energy, requires accurate demand forecasting of loads for stable and economical load management and power supply even for small to medium and large loads.
한국공개특허번호 10-2012-0040314에는 지능형 콘센트를 이용하여 전력소비량을 측정 및 저장하며 월별 혹은 실시간으로 표시하고, 감시함으로써 대기전력을 자동 또는 수동으로 차단시키는 방법이 제시되고 있다. Korean Patent Publication No. 10-2012-0040314 proposes a method of automatically and manually shutting off standby power by measuring and storing power consumption using an intelligent outlet, displaying monthly or real time, and monitoring the power.
한국공개특허번호 10-2014-0066819에서는 전력소모패턴 학습을 이용한 가전기기 판단 시스템으로, 미리 지정한 임계값을 이용하여 가전기기를 분류하는 방법 및 기술을 제시하고 있다.Korean Patent Laid-Open No. 10-2014-0066819 proposes a method and technology for classifying home appliances using a predetermined threshold as a home appliance determination system using power consumption pattern learning.
한국공개특허번호 10-2016-0112736에는 외부요인에 따라 가전기기의 우선순위를 조절하여 수용가의 독거노인의 위기 상황 여부를 판별할 수 있도록 한 가전기기 소비전력 패턴과 소셜 정보를 이용한 안전관리 시스템 및 방법이 제시되고 있다. Korean Patent Application Publication No. 10-2016-0112736 describes a safety management system using consumer electronics power consumption patterns and social information to determine whether a crisis situation of elderly people living alone is adjusted by adjusting the priority of home appliances according to external factors. The method is presented.
이와 같은 방법들은 소비전력 데이터를 이용하여 임계값이나 기계학습을 통하여 각각의 가전기기를 분류하는 방법으로, 각각의 가전기기의 변칙적인 소비전력 특징을 감안해야 하는 점이 있으며, 상기 이유로 인해 정확한 판단이 어려운 문제를 초례할 수 있다. These methods are to classify each household appliance by threshold value or machine learning by using power consumption data, and it is necessary to take into account the anomalous power consumption characteristics of each household appliance. We can present difficult problems.
본 발명이 이루고자 하는 기술적 과제는 중, 소형의 부하를 가지는 가전기기(예를 들어, 냉장고)의 소비전력 데이터를 시계열 분석 기법 중 하나인 세이플릿(Shapelets) 기법을 적용하여 평일과 토요일, 그리고 일요일의 3 가지 패턴으로 분류하는 효율적인 분류방법 및 장치를 제공하는데 있다. The technical problem of the present invention is to apply power consumption data of home appliances (for example, refrigerators) having a small and medium load by using the Shapelets technique, one of time series analysis techniques, on weekdays, Saturdays, and Sundays. The present invention provides an efficient classification method and apparatus for classifying into three patterns.
일 측면에 있어서, 본 발명에서 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법은 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계를 포함한다. In one aspect, the power consumption pattern classification method using the time series analysis method proposed in the present invention is a step of processing the data to collect the total power consumption data for a period of time to represent the power consumption data in the form of a time series consisting of a plurality of sequences Extracting all subsequences of the power-processed data in the form of time-processed data through a sliding window technique; learning all the extracted subsequences to generate a Shapes Dictionary; and And classifying the power consumption data in a time series form into each pattern through the safety dictionary.
상기 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. Collecting the total power consumption data for the predetermined period and processing the data to represent the power consumption data in the form of a time series consisting of a plurality of sequences assumes the total power consumption data set of the power consumption data of a time series consisting of a plurality of sequences. And a subsequence among the power consumption data in the form of time series.
상기 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계는 시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. Extracting all subsequences of the power-processed power consumption data in the time series form through the sliding window technique may include a length of the power consumption data in the time series form and a subsequence constituting the power consumption data in the time series form. Given a length of, subdivide the power consumption data in the form of time series, extract each subsequence of the power consumption data in the form of time series, and define a set of all extracted subsequences.
상기 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The classifying the power consumption data in the time series form into each pattern through the shape dictionary may include the entire power consumption data set of the time series form power consumption data composed of a plurality of sequences using information obtained through entropy calculation. Extraction point that can classify each class by information gain operation.
상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다. By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. The total power consumption is calculated and divided.
또 다른 일 측면에 있어서, 본 발명에서 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치는 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 데이터 처리부, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 서브시퀀스 추출부, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 학습부 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 패턴 분류부를 포함한다. In another aspect, the power consumption pattern classification apparatus using the time series analysis technique proposed by the present invention collects the total power consumption data for a predetermined period of time to process the data to represent the power consumption data in the form of a time series consisting of a plurality of sequences A subsequence extractor for extracting all subsequences of the power-processed data in the form of time-processed data through a sliding window technique; And a pattern classifier for classifying power consumption data in a time series form into each pattern through the learner dictionary.
상기 데이터 처리부는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. The data processor assumes an entire power consumption data set of power consumption data in the form of a plurality of sequences and represents a subsequence among the power consumption data in the form of a time series.
상기 서브시퀀스 추출부는 시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. The subsequence extractor may divide the length of the subsequence into power series data by dividing the length of the subsequence by the length of the sub-sequence constituting the time series power consumption data and the length of the sub sequence constituting the time series power consumption data Each subsequence of power consumption data is extracted and a set of all extracted subsequences is defined.
상기 패턴 분류부는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The pattern classifier extracts a split point that can classify each class by an information gain operation using a value obtained through entropy calculation for the entire power consumption data set of time series power consumption data composed of a plurality of sequences. .
상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다.By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. The total power consumption is calculated and divided.
본 발명의 실시예들에 따르면 획득한 데이터를 각각 평일과 토요일, 그리고 일요일로 구분함으로써 개별 수용가의 전력 사용패턴을 확인하며, 상업용뿐만 아니라 일반 가정의 실시간 에너지 사용 모니터링 시스템에 적용되어 원활한 서비스를 제공할 수 있을 것으로 기대한다. According to the embodiments of the present invention, the obtained data is divided into weekdays, Saturdays, and Sundays, respectively, to identify power consumption patterns of individual consumers, and are applied to a real-time energy use monitoring system of a general household as well as commercially to provide a smooth service. I expect to be able to.
도 1은 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 소비전력 데이터를 의사결정 나무를 통해 각각의 패턴으로 분류하는 방법을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 일주일 전체 동안의 소비전력 데이터를 전체, 평일, 토요일, 그리고 일요일로 구분한 그래프이다.
도 4는 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치이다. 1 is a flowchart illustrating a power consumption pattern classification method using a time series analysis technique according to an embodiment of the present invention.
2 is a view for explaining a method of classifying power consumption data into respective patterns through a decision tree according to an embodiment of the present invention.
3 is a graph of power consumption data for a whole week, divided into weekdays, Saturdays, and Sundays according to an embodiment of the present invention.
4 is a power consumption pattern classification apparatus using a time series analysis technique according to an embodiment of the present invention.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법을 설명하기 위한 흐름도이다. 1 is a flowchart illustrating a power consumption pattern classification method using a time series analysis technique according to an embodiment of the present invention.
시계열 분석 기법을 이용한 소비전력 패턴 분류 방법은 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계(110), 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계(120), 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계(130) 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계(140)를 포함한다. In the power consumption pattern classification method using a time series analysis method, a
본 발명은 일 실시예에 따른 물류센터에 설치한 상업용 냉장고에서 실측한 데이터를 기반으로 활용한다. 냉장고의 전체적인 구성으로는, 내부에 냉풍기가 설치되어 있고 외부의 실외기는 3.3KW ~ 4.1KW의 소비전력을 가진다. 또한, 실내기의 성애 제거 방식은 오픈 싸이클 방식을 사용한다.The present invention utilizes based on data measured in a commercial refrigerator installed in a distribution center according to an embodiment. In the overall configuration of the refrigerator, the cooler is installed inside and the external outdoor unit has a power consumption of 3.3KW ~ 4.1KW. In addition, the defrosting method of the indoor unit uses an open cycle method.
단계(110)에서, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리한다. In
수용가의 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타낸다. 이때, 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. The power consumption data of the customer is collected and represented as time series power consumption data composed of a plurality of sequences. In this case, it is assumed that the entire power consumption data set of the power consumption data in the form of a plurality of sequences is assumed, and the sub-sequence of the power consumption data in the time series is represented.
더욱 상세하게는, 본 발명은 일 실시예에 따르면 다음과 같은 수학식을 통해 상기 수집된 소비전력 데이터를 처리, 분류를 수행한다. 여기서, ''는 1부터 m개의 시퀀스로 구성된() 시계열 형태의 소비전력 데이터이며, 이러한 소비전력 데이터로 구성된 전체 소비전력 데이터 셋을 'D'라고 가정한다. 또한, 시계열 데이터(T) 중 서브시퀀스를 'S'로 표현한다. More specifically, the present invention processes and classifies the collected power consumption data through the following equation. here, ' 'Consists of 1 to m sequences ( ) It is assumed that power consumption data in the form of time series and the entire power consumption data set composed of such power consumption data is 'D'. In addition, the subsequence of the time series data T is represented by 'S'.
단계(120)에서, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출한다. In
시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나눈다. 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. Given the length of time series power consumption data and the length of the subsequence constituting the time series power consumption data, the length of the sub sequence is divided by the time series power consumption data. Each subsequence of power consumption data in a time series form is extracted, and a set of all extracted subsequences is defined.
먼저, 슬라이딩 윈도우(Sliding window) 기법을 통해 모든 서브시퀀스를 추출한다. 이는 m의 길이를 갖는 T와 서브시퀀스의 길이인 ''이 주어지면, 을 기준으로 를 자르고 이러한 의 각 서브시퀀스인 를 추출하게 된다. 여기서, 는 슬라이딩 윈도우의 시작 위치를 나타낸다. 이렇게 추출된 모든 서브시퀀스의 집합을 수학식 1과 같이 로 정의한다. First, all subsequences are extracted through a sliding window technique. This is T and the length of the subsequence 'm' Is given, based on this Cut these Each subsequence of is extracted. here, Represents the starting position of the sliding window. The set of all subsequences extracted as shown in
[수학식 1] [Equation 1]
단계(130)에서, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성한다. In
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The entire power consumption data set of the time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by using an information gain operation using a value obtained through entropy calculation.
상기 과정을 통하여 추출된 여러 개의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터 ''와 가장 가까운 서브시퀀스를 찾는다. 이 때, 는 소비전력 데이터에 대하여 전체 데이터의 수만큼의 서브시퀀스이고, 아래 수학식 2와 같이 나타낸다. Time series power consumption data learned from a plurality of subsequence candidates extracted through the above process. Finds the nearest subsequence. At this time, Is the subsequence of the total number of data for the power consumption data, as shown in
[수학식 2][Equation 2]
패턴 분류부(440)는 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류한다. The pattern classifier 440 classifies power consumption data in a time series form into each pattern through the safety dictionary.
추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다. By specifying the segmentation area through the extracted split points and classifying them through the decision tree, the total power consumption data for a certain period of time is collected, extracted into subsequences with a predetermined pattern, and extracted through the subsequences. Calculate and classify the total power consumption.
결합된 전체 소비전력 데이터 집합을 추출된 서브시퀀스를 이용하여 3 가지의 클래스(예를 들어, 평일, 토요일, 일요일)로 잘 분류 할 수 있는지 평가를 위한 방법으로 정보 이득(Information gain) 기법을 적용하기에 앞서 먼저, 엔트로피 계산을 실시한다. 여기서, p(Class)는 각 Class의 데이터 수를 전체 소비전력 데이터 셋(D)으로 나눈 값이다. 클래스(예를 들어, 평일, 토요일, 일요일) 각각을 A, B, 그리고 C로 간략하게 나타낸다.Apply the information gain technique to evaluate whether the combined total power consumption data set can be well classified into three classes (eg, weekdays, Saturdays, Sundays) using the extracted subsequences. Before doing so, entropy calculation is first performed. Here, p (Class) is a value obtained by dividing the number of data of each class by the total power consumption data set (D). Each of the classes (eg, weekday, Saturday, Sunday) is briefly represented by A, B, and C.
[수학식 3][Equation 3]
전체 소비전력 데이터 셋(D)은 엔트로피 계산을 통해 얻어진, 수학식 3에 나타낸 를 활용하여 정보 이득(Information gain) 연산으로 각 클래스(예를 들어, 평일, 토요일, 일요일)를 구분할 수 있는 분할 점(Split Point; sp)을 추출한다. 얻어진 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류한다. 여기서, , , 그리고 는 각 클래스의 데이터 셋을 의미하고, 이득을 수학식 4와 같이 나타낼 수 있다. The total power consumption data set (D) is shown in
[수학식 4][Equation 4]
도 2는 본 발명의 일 실시예에 따른 소비전력 데이터를 의사결정 나무를 통해 각각의 패턴으로 분류하는 방법을 설명하기 위한 도면이다. 2 is a view for explaining a method of classifying power consumption data into respective patterns through a decision tree according to an embodiment of the present invention.
도 2는 상기 설명된 수학식을 통하여 각각의 패턴을 분류할 수 있는 소비전력 의사 결정 나무(Decision tree)(220)를 나타낸다. 먼저 세이플릿 딕셔너리(Shapelets Dictionary)(210) 중 의 대표 서브시퀀스(Shapelet)를 이용하여 입력되는 소비전력 데이터의 객체가 Class1(평일)에 속하는지 거리를 계산하게 되며 이를 구분 점(Split point: sp)의 값 범위 내에 위치할 경우, 평일로 구분한다. 반면에, 속하지 않으면 다음 대표 서브시퀀스인 과의 계산을 다시 실시하며 이에 따라 토요일과 일요일로 구분하게 된다.2 illustrates a power
다시 도 1을 참조하면, 먼저, 대상이 되는 수용가의 소비전력을 측정한 데이터를 수집 및 저장한다(110). 이 때 외부 조건(계절, 날씨 등)은 고려하지 않는다. 이후 수집 및 저장된 소비전력 데이터의 서브시퀀스를 추출하고(120), 수집된 데이터로부터 상기 설명한 학습 과정을 통하여 세이플릿 딕셔너리를 생성하게 된다(130). 생성한 모델을 통해 새로운 입력 데이터를 각각의 패턴(평일, 토요일, 그리고 일요일)으로 분류하게 된다(140). Referring back to FIG. 1, first, data of measuring power consumption of a target consumer is collected and stored (110). External conditions (seasonal, weather, etc.) are not taken into account. Subsequently, a subsequence of the collected and stored power consumption data is extracted (120), and a shape dictionary is generated from the collected data through the above-described learning process (130). The generated model classifies new input data into patterns (weekdays, Saturdays, and Sundays) (140).
예를 들어, 입력 데이터가 평일인지 여부를 판단하여(141), 평일이 맞을 경우 평일 패턴의 데이터로 분류하고(142) 과정을 종료한다. 반면에 평일이 아닐 경우, 입력 데이터가 토요일인지 여부를 판단하여(143), 토요일이 맞을 경우 토요일 패턴의 데이터로 분류하고(144) 과정을 종료한다. 반면에 토요일이 아닐 경우, 일요일 패턴의 데이터로 분류하고(145) 과정을 종료한다.For example, it is determined whether the input data is a weekday (141), and if the weekday is correct, it is classified as data of the weekday pattern (142) and the process ends. On the other hand, if it is not a weekday, it is determined whether the input data is Saturday (143), and if the Saturday is correct, it is classified as data of the Saturday pattern (144) and the process ends. On the other hand, if it is not Saturday, it is classified as data of the Sunday pattern (145) and the process ends.
상기 설명한 방법을 통하여 세이플릿(Shapelets) 기법은 기존의 시계열 데이터 분류에 사용되는 알고리즘들과 같이 전체 데이터를 매핑하여 분류하는 방법 대신, 일정한 패턴을 가진 서브시퀀스를 추출하고 이를 통해 전체를 계산하여 구분함으로써, 수행속도가 우수하며 직관적인 수행결과를 얻을 수 있다는 장점이 있다. Through the above-described method, the Shapelets technique extracts subsequences having a predetermined pattern and calculates the whole by using them instead of mapping and classifying the entire data like the algorithms used in the existing time series data classification. By doing so, there is an advantage that the execution speed is excellent and an intuitive execution result can be obtained.
도 3은 본 발명의 일 실시예에 따른 일주일 전체 동안의 소비전력 데이터를 전체, 평일, 토요일, 그리고 일요일로 구분한 그래프이다. 3 is a graph of power consumption data for a whole week, divided into weekdays, Saturdays, and Sundays according to an embodiment of the present invention.
도 3에 도시되어 있는 바와 같이, 일주일 전체 동안의 소비전력 데이터를 전체(310), 평일(320), 토요일(330), 그리고 일요일(340)로 구분한 그래프를 보여준다. 이는 80일간의 소비전력 데이터를 하루 15분마다 측정한 데이터이며 00:00부터 23:45까지의 총 96개의 데이터가 한 세트로 구성된다. 즉, 전체 80일이므로 총 7,680개의 데이터를 사용한다. 상기 데이터에서 '평일'은 월요일부터 금요일까지 총 5일의 데이터를 의미하고, 주말에서 각각의 토요일, 일요일을 따로 구분한다. As shown in FIG. 3, power consumption data for the whole week is divided into a total 310, a weekday 320, a Saturday 330, and a Sunday 340. This is a measurement of 80 days of power consumption data every 15 minutes per day. It consists of 96 sets of data from 00:00 to 23:45. That is, the total 80 days, 7,680 data are used. In the above data, 'weekday' means data of a total of 5 days from Monday to Friday, and separates each Saturday and Sunday from the weekend.
도 4는 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치이다.4 is a power consumption pattern classification apparatus using a time series analysis technique according to an embodiment of the present invention.
시계열 분석 기법을 이용한 소비전력 패턴 분류 장치(400)는 일정 데이터 처리부(410), 서브시퀀스 추출부(420), 학습부(430) 및 패턴 분류부(440)를 포함한다. The power consumption
일정 데이터 처리부(410)는 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리한다. The constant data processor 410 collects total power consumption data for a predetermined period and processes the data to represent power consumption data in the form of a time series composed of a plurality of sequences.
수용가의 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타낸다. 이때, 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. The power consumption data of the customer is collected and represented as time series power consumption data composed of a plurality of sequences. In this case, it is assumed that the entire power consumption data set of the power consumption data in the form of a plurality of sequences is assumed, and the sub-sequence of the power consumption data in the time series is represented.
더욱 상세하게는, 본 발명은 일 실시예에 따르면 다음과 같은 수학식을 통해 상기 수집된 소비전력 데이터를 처리, 분류를 수행한다. 여기서, ''는 1부터 m개의 시퀀스로 구성된() 시계열 형태의 소비전력 데이터이며, 이러한 소비전력 데이터로 구성된 전체 소비전력 데이터 셋을 'D'라고 가정한다. 또한, 시계열 데이터(T) 중 서브시퀀스를 'S'로 표현한다. More specifically, the present invention processes and classifies the collected power consumption data through the following equation. here, ' 'Consists of 1 to m sequences ( ) It is assumed that power consumption data in the form of time series and the entire power consumption data set composed of such power consumption data is 'D'. In addition, the subsequence of the time series data T is represented by 'S'.
서브시퀀스 추출부(420)는 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출한다. The subsequence extractor 420 extracts all the subsequences of the power consumption data in the form of time-processed data through a sliding window technique.
시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나눈다. 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. Given the length of time series power consumption data and the length of the subsequence constituting the time series power consumption data, the length of the sub sequence is divided by the time series power consumption data. Each subsequence of power consumption data in a time series form is extracted, and a set of all extracted subsequences is defined.
먼저, 슬라이딩 윈도우(Sliding window) 기법을 통해 모든 서브시퀀스를 추출한다. 이는 m의 길이를 갖는 T와 서브시퀀스의 길이인 ''이 주어지면, 을 기준으로 를 자르고 이러한 의 각 서브시퀀스인 를 추출하게 된다. 여기서, 는 슬라이딩 윈도우의 시작 위치를 나타낸다. 이렇게 추출된 모든 서브시퀀스의 집합을 위 수학식 1과 같이 로 정의한다. First, all subsequences are extracted through a sliding window technique. This is T and the length of the subsequence 'm' Is given, based on this Cut these Each subsequence of is extracted. here, Represents the starting position of the sliding window. The set of all extracted subsequences is expressed as in
학습부(430)는 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성한다. The learner 430 learns all the extracted subsequences to generate a Shapelets Dictionary.
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The entire power consumption data set of time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by using an information gain operation using a value obtained through entropy calculation.
상기 과정을 통하여 추출된 여러 개의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터 ''와 가장 가까운 서브시퀀스를 찾는다. 이 때, 는 소비전력 데이터에 대하여 전체 데이터의 수만큼의 서브시퀀스이고, 위 수학식 2와 같이 나타낸다. Time series power consumption data learned from a plurality of subsequence candidates extracted through the above process. Finds the nearest subsequence. At this time, Is the subsequence of the total number of data for the power consumption data, as shown in
패턴 분류부(440)는 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류한다. The pattern classifier 440 classifies power consumption data in a time series form into each pattern through the safety dictionary.
추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다. By specifying the segmentation area through the extracted split points and classifying them through the decision tree, the total power consumption data for a certain period of time are collected, extracted into subsequences with a predetermined pattern, and extracted through the subsequences. Calculate and classify the total power consumption.
결합된 전체 소비전력 데이터 집합을 추출된 서브시퀀스를 이용하여 3 가지의 클래스(예를 들어, 평일, 토요일, 일요일)로 잘 분류 할 수 있는지 평가를 위한 방법으로 정보 이득(Information gain) 기법을 적용하기에 앞서 먼저, 엔트로피 계산을 실시한다. 여기서, p(Class)는 각 Class의 데이터 수를 전체 소비전력 데이터 셋(D)으로 나눈 값이다. 클래스(예를 들어, 평일, 토요일, 일요일) 각각을 A, B, 그리고 C로 간략하게 나타낸다.Apply the information gain technique to evaluate whether the combined total power consumption data set can be well classified into three classes (eg, weekdays, Saturdays, Sundays) using the extracted subsequences. Before doing so, entropy calculation is first performed. Here, p (Class) is a value obtained by dividing the number of data of each class by the total power consumption data set (D). Each of the classes (eg, weekday, Saturday, Sunday) is briefly represented by A, B, and C.
전체 소비전력 데이터 셋(D)은 엔트로피 계산을 통해 얻어진, 위 수학식 3과 같이 나타낸 를 활용하여 정보 이득(Information gain) 연산으로 각 클래스(예를 들어, 평일, 토요일, 일요일)를 구분할 수 있는 분할 점(Split Point; sp)을 추출한다. 얻어진 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류한다. 여기서, , , 그리고 는 각 클래스의 데이터 셋을 의미하고, 이득을 위 수학식 4와 같이 나타낼 수 있다.The total power consumption data set (D) is represented by
이와 같이 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치는 대상이 되는 수용가의 소비전력을 측정한 데이터를 수집 및 저장한다. 이 때 외부 조건(계절, 날씨 등)은 고려하지 않는다. 이후 수집 및 저장된 소비전력 데이터의 서브시퀀스를 추출하고, 수집된 데이터로부터 상기 설명한 학습 과정을 통하여 세이플릿 딕셔너리를 생성하게 된다. 생성한 모델을 통해 새로운 입력 데이터를 각각의 패턴(평일, 토요일, 그리고 일요일)으로 분류하게 된다. The power consumption pattern classification apparatus using the proposed time series analysis technique collects and stores data measuring power consumption of a target consumer. External conditions (seasonal, weather, etc.) are not taken into account. Subsequently, a subsequence of the collected and stored power consumption data is extracted, and a shape dictionary is generated from the collected data through the learning process described above. The generated model will classify the new input data into individual patterns (weekdays, Saturdays, and Sundays).
예를 들어, 입력 데이터가 평일인지 여부를 판단하여, 평일이 맞을 경우 평일 패턴의 데이터로 분류하고 과정을 종료한다. 반면에 평일이 아닐 경우, 입력 데이터가 토요일인지 여부를 판단하여, 토요일이 맞을 경우 토요일 패턴의 데이터로 분류하고 과정을 종료한다. 반면에 토요일이 아닐 경우, 일요일 패턴의 데이터로 분류하고 과정을 종료한다.For example, it is determined whether the input data is a weekday, and if the weekday is correct, it is classified as data of the weekday pattern and the process ends. On the other hand, if it is not a weekday, it is determined whether the input data is Saturday, and if Saturday is correct, it is classified as data of the Saturday pattern and the process ends. On the other hand, if it is not Saturday, classify as data of Sunday pattern and finish the process.
상기 설명한 방법을 통하여 세이플릿(Shapelets) 기법은 기존의 시계열 데이터 분류에 사용되는 알고리즘들과 같이 전체 데이터를 매핑하여 분류하는 방법 대신, 일정한 패턴을 가진 서브시퀀스를 추출하고 이를 통해 전체를 계산하여 구분함으로써, 수행속도가 우수하며 직관적인 수행결과를 얻을 수 있다는 장점이 있다. Through the above-described method, the Shapelets technique extracts subsequences having a predetermined pattern and calculates the whole by using them instead of mapping and classifying the entire data like the algorithms used in the existing time series data classification. By doing so, there is an advantage that the execution speed is excellent and an intuitive execution result can be obtained.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the devices and components described in the embodiments may include, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable arrays (FPAs), It may be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to the execution of the software. For the convenience of understanding, the processing apparatus may be described as one used, but those skilled in the art will appreciate that the processing apparatus includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as parallel processors.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the above, and may configure the processing device to operate as desired, or process independently or collectively. You can command the device. Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. It can be embodied in. The software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner. Software and data may be stored on one or more computer readable recording media.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. The method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.Although the embodiments have been described by the limited embodiments and the drawings as described above, various modifications and variations are possible to those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and / or components of the described systems, structures, devices, circuits, etc. may be combined or combined in a different form than the described method, or other components. Or even by substitution or replacement by equivalents, an appropriate result can be achieved.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다. Therefore, other implementations, other embodiments, and equivalents to the claims are within the scope of the claims that follow.
Claims (10)
서브시퀀스 추출부를 통해 슬라이딩 윈도우(Sliding window) 기법을 이용하여 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계;
상기 추출된 모든 서브시퀀스들을 학습부를 통해 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계; 및
패턴 분류부를 통해 상기 세이플릿 딕셔너리를 이용하여 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계
를 포함하고,
패턴 분류부를 통해 상기 세이플릿 딕셔너리를 이용하여 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출하고,
추출된 모든 서브시퀀스들 중 복수의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터와 가장 가까운 서브시퀀스를 찾고,
상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분하는
소비전력 패턴 분류 방법.Collecting data of total power consumption for a predetermined period through a data processing unit and processing the data to represent power consumption data in a time series form having a plurality of sequences;
Extracting all subsequences of the power processed data in the form of time-processed data using a sliding window technique through a subsequence extractor;
Learning all of the extracted subsequences through a learner to generate a Shapes Dictionary; And
Classifying power consumption data in a time series form into each pattern by using the safety dictionary through a pattern classification unit
Including,
The classifying the power consumption data in the time series form into each pattern by using the shape dictionary through the pattern classification unit may include:
The entire power consumption data set of the time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by information gain calculation using the value obtained through entropy calculation.
Find a subsequence closest to the trained time series power consumption data among a plurality of subsequence candidates among all extracted subsequences,
By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. To calculate the total power consumption
Power consumption pattern classification method.
데이터 처리부를 통해 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타내는
소비전력 패턴 분류 방법. The method of claim 1,
Collecting the total power consumption data for a period of time through the data processing unit and processing the data to represent the power consumption data in the form of a time series consisting of a plurality of sequences,
Assuming a total power consumption data set of power consumption data in the form of a plurality of sequences, and representing a subsequence among the power consumption data of the time series.
Power consumption pattern classification method.
서브시퀀스 추출부를 통해 슬라이딩 윈도우(Sliding window) 기법을 이용하여 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계는,
시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의하는
소비전력 패턴 분류 방법. The method of claim 1,
Extracting all subsequences of the power-processed data in the form of time-processed data using a sliding window technique through a subsequence extractor,
Given the length of the power consumption data in the form of time series and the length of the subsequence constituting the power consumption data in the form of time series, the length of the subsequence is divided by the power consumption data in the form of time series, Extract subsequences and define a set of all extracted subsequences
Power consumption pattern classification method.
슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 서브시퀀스 추출부;
상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 학습부; 및
상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 패턴 분류부
를 포함하고,
패턴 분류부는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출하고,
추출된 모든 서브시퀀스들 중 복수의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터와 가장 가까운 서브시퀀스를 찾고,
상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분하는
소비전력 패턴 분류 장치. A data processing unit which collects total power consumption data for a predetermined period and processes the data to be represented as power consumption data in the form of a time series composed of a plurality of sequences;
A subsequence extractor configured to extract all subsequences of power consumption data in the form of time-processed data through a sliding window technique;
A learner configured to learn all of the extracted subsequences to generate a Shapelets Dictionary; And
Pattern classification unit for classifying the power consumption data of the time series form into each pattern through the safety dictionary
Including,
The pattern classification unit,
The entire power consumption data set of the time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by information gain calculation using the value obtained through entropy calculation.
Find a subsequence closest to the trained time series power consumption data among a plurality of subsequence candidates among all extracted subsequences,
By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. To calculate the total power consumption
Power consumption pattern classification device.
상기 데이터 처리부는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타내는
소비전력 패턴 분류 장치. The method of claim 6,
The data processing unit,
Assuming a total power consumption data set of power consumption data in the form of a plurality of sequences, and representing a subsequence among the power consumption data of the time series.
Power consumption pattern classification device.
상기 서브시퀀스 추출부는,
시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의하는
소비전력 패턴 분류 장치.The method of claim 6,
The subsequence extractor,
Given the length of the power consumption data in the form of time series and the length of the subsequence constituting the power consumption data in the form of time series, the length of the subsequence is divided by the power consumption data in the form of time series, Extract subsequences and define a set of all extracted subsequences
Power consumption pattern classification device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180033026A KR102087026B1 (en) | 2018-03-22 | 2018-03-22 | Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180033026A KR102087026B1 (en) | 2018-03-22 | 2018-03-22 | Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20190111210A KR20190111210A (en) | 2019-10-02 |
KR102087026B1 true KR102087026B1 (en) | 2020-03-10 |
Family
ID=68422692
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180033026A KR102087026B1 (en) | 2018-03-22 | 2018-03-22 | Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102087026B1 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210127358A (en) | 2020-04-14 | 2021-10-22 | 삼성에스디에스 주식회사 | Method and apparatus for extracting a pattern of time series data |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000299945A (en) * | 1999-04-12 | 2000-10-24 | Adoin Kenkyusho:Kk | Remote automated diagnostic system for power consumption conditions |
JP2017138929A (en) * | 2016-02-05 | 2017-08-10 | 株式会社東芝 | Time series data waveform analyzer, method, and program |
-
2018
- 2018-03-22 KR KR1020180033026A patent/KR102087026B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000299945A (en) * | 1999-04-12 | 2000-10-24 | Adoin Kenkyusho:Kk | Remote automated diagnostic system for power consumption conditions |
JP2017138929A (en) * | 2016-02-05 | 2017-08-10 | 株式会社東芝 | Time series data waveform analyzer, method, and program |
Also Published As
Publication number | Publication date |
---|---|
KR20190111210A (en) | 2019-10-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Basu et al. | Time series distance-based methods for non-intrusive load monitoring in residential buildings | |
Zhai et al. | Appliance flexibility analysis considering user behavior in home energy management system using smart plugs | |
Chae et al. | Artificial neural network model for forecasting sub-hourly electricity usage in commercial buildings | |
Li et al. | Classification of energy consumption in buildings with outlier detection | |
US9753477B2 (en) | Load forecasting for residential sector demand response | |
JP6455431B2 (en) | Monitoring device, monitoring method and program | |
Selakov et al. | Hybrid PSO–SVM method for short-term load forecasting during periods with significant temperature variations in city of Burbank | |
KR101875329B1 (en) | Forecasting apparatus and method for power consumption | |
US20150371151A1 (en) | Energy infrastructure sensor data rectification using regression models | |
Chou et al. | Hybrid machine learning system to forecast electricity consumption of smart grid-based air conditioners | |
Serrano-Guerrero et al. | Statistical methodology to assess changes in the electrical consumption profile of buildings | |
JP6280485B2 (en) | Energy saving support system and energy saving support method | |
Viegas et al. | Electricity demand profile prediction based on household characteristics | |
KR102150170B1 (en) | Method and System for Power Load Forecasting based on Pattern Tagging | |
KR20180028583A (en) | A customized electronic power scheduling system for consumer in an environment of intelligent power usage | |
KR20200074825A (en) | Method and System for Power Data Outlier Detection Based on Pattern Tagging | |
KR102472573B1 (en) | Method of clustering and analyzing data of customer using electricity | |
KR102495494B1 (en) | Method and apparatus for predicting home energy usage | |
CN103140763A (en) | Systems, methods, and devices for analyzing utility usage with load duration curves | |
JP6076242B2 (en) | Distribution system load prediction device and distribution system load prediction method | |
Laib et al. | A Gaussian process regression for natural gas consumption prediction based on time series data | |
Brusokas et al. | HeatFlex: Machine learning based data-driven flexibility prediction for individual heat pumps | |
Dinesh et al. | Residential power forecasting based on affinity aggregation spectral clustering | |
Saad et al. | Data analytics-based anomaly detection in smart distribution network | |
CN111179108A (en) | Method and device for predicting power consumption |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |