KR102087026B1 - Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis - Google Patents

Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis Download PDF

Info

Publication number
KR102087026B1
KR102087026B1 KR1020180033026A KR20180033026A KR102087026B1 KR 102087026 B1 KR102087026 B1 KR 102087026B1 KR 1020180033026 A KR1020180033026 A KR 1020180033026A KR 20180033026 A KR20180033026 A KR 20180033026A KR 102087026 B1 KR102087026 B1 KR 102087026B1
Authority
KR
South Korea
Prior art keywords
power consumption
data
consumption data
time series
subsequences
Prior art date
Application number
KR1020180033026A
Other languages
Korean (ko)
Other versions
KR20190111210A (en
Inventor
이성주
김윤빈
Original Assignee
고려대학교 세종산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 세종산학협력단 filed Critical 고려대학교 세종산학협력단
Priority to KR1020180033026A priority Critical patent/KR102087026B1/en
Publication of KR20190111210A publication Critical patent/KR20190111210A/en
Application granted granted Critical
Publication of KR102087026B1 publication Critical patent/KR102087026B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/08Payment architectures
    • G06Q20/14Payment architectures specially adapted for billing systems

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Accounting & Taxation (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Finance (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Water Supply & Treatment (AREA)
  • Development Economics (AREA)
  • Public Health (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

시계열 분석 기법을 이용한 소비전력 패턴 분류 방법 및 장치가 제시된다. 본 발명에서 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법은 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계를 포함한다.A method and apparatus for classifying power consumption patterns using time series analysis are presented. In the power consumption pattern classification method using the time series analysis technique proposed in the present invention, a step of processing data to collect total power consumption data for a predetermined period and to represent the power consumption data in the form of a plurality of sequences, sliding window (Sliding) extracting all subsequences of the power-processed data in the form of time-processed data, learning all the extracted subsequences, generating a Shapes Dictionary, and generating the shapelet dictionary. And classifying the power consumption data in the form of time series into respective patterns.

Description

시계열 분석 기법을 이용한 소비전력 패턴 분류 방법 및 장치{Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis}Method and Apparatus for Classifying Power Consumption Patterns Using Time Series Analysis Techniques {Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis}

본 발명은 효율적인 에너지 관리에 관한 것으로, 수용가에 대하여 시간에 따라 수집되는 소규모 또는 중, 소형의 부하를 가지는 냉장고의 소비전력 데이터를 기준으로 각각 평일과 토요일, 그리고 일요일의 패턴으로 구분하는 방법으로 소비전력의 패턴을 분석하는 방법에 관한 것이다. The present invention relates to efficient energy management, and consumed in a manner of dividing into patterns of weekdays, Saturdays, and Sundays, respectively, based on power consumption data of a refrigerator having a small, medium, or small load collected over time for a customer. A method of analyzing a pattern of power.

기존의 공급 중심에서 수요와 관리, 그리고 서비스로 이어지는 에너지 정책이 대두되면서, 스마트 그리드 즉, 지능형 전력망을 포함한 스마트 에코 등의 에너지 관리와 절약에 대한 논제가 강조되고 있는 실정이다. 스마트 그리드를 통하여 전력 수용가는 전력계통운영자(이하, 계통운영자)에 의해 전력 사용 패턴의 변화를 유도됨으로써 피크 수요 절감 및 전력계통 운영의 안정화를 도모하며, 불필요한 전력 사용을 줄이고, 전기요금 절감 및 감축한 전력수요 판매 등을 통해 경제적인 이득을 취할 수 있다. 상기한 바를 위해, 계통운영 기관에서는 여러 상황의 전력 수용가를 대상으로 한 다양한 에너지 관리시스템들이 개발되고 있다. With the emergence of energy policies that lead to demand, management, and service from the supply center, the issue of energy management and saving, such as smart grid, smart eco including intelligent power grid, is being emphasized. Through the smart grid, power consumers induce changes in power usage patterns by power system operators (hereinafter referred to as system operators), which aims to reduce peak demand and stabilize power system operations, reduce unnecessary power usage, and reduce and reduce electricity bills. Economic benefits can come from selling power demand. To this end, a variety of energy management systems are being developed by grid operators for power consumers in different situations.

최근 에너지의 효율적인 사용을 위하여 도입된 에너지관리시스템(Energy Management System, EMS)를 통하여 소규모를 포함한 중, 대규모 부하에서도 안정적이고 경제적인 부하 운용 및 전력 수급을 위해 부하의 정확한 수요 예측이 요구된다.The energy management system (EMS), which was recently introduced for efficient use of energy, requires accurate demand forecasting of loads for stable and economical load management and power supply even for small to medium and large loads.

한국공개특허번호 10-2012-0040314에는 지능형 콘센트를 이용하여 전력소비량을 측정 및 저장하며 월별 혹은 실시간으로 표시하고, 감시함으로써 대기전력을 자동 또는 수동으로 차단시키는 방법이 제시되고 있다. Korean Patent Publication No. 10-2012-0040314 proposes a method of automatically and manually shutting off standby power by measuring and storing power consumption using an intelligent outlet, displaying monthly or real time, and monitoring the power.

한국공개특허번호 10-2014-0066819에서는 전력소모패턴 학습을 이용한 가전기기 판단 시스템으로, 미리 지정한 임계값을 이용하여 가전기기를 분류하는 방법 및 기술을 제시하고 있다.Korean Patent Laid-Open No. 10-2014-0066819 proposes a method and technology for classifying home appliances using a predetermined threshold as a home appliance determination system using power consumption pattern learning.

한국공개특허번호 10-2016-0112736에는 외부요인에 따라 가전기기의 우선순위를 조절하여 수용가의 독거노인의 위기 상황 여부를 판별할 수 있도록 한 가전기기 소비전력 패턴과 소셜 정보를 이용한 안전관리 시스템 및 방법이 제시되고 있다. Korean Patent Application Publication No. 10-2016-0112736 describes a safety management system using consumer electronics power consumption patterns and social information to determine whether a crisis situation of elderly people living alone is adjusted by adjusting the priority of home appliances according to external factors. The method is presented.

이와 같은 방법들은 소비전력 데이터를 이용하여 임계값이나 기계학습을 통하여 각각의 가전기기를 분류하는 방법으로, 각각의 가전기기의 변칙적인 소비전력 특징을 감안해야 하는 점이 있으며, 상기 이유로 인해 정확한 판단이 어려운 문제를 초례할 수 있다. These methods are to classify each household appliance by threshold value or machine learning by using power consumption data, and it is necessary to take into account the anomalous power consumption characteristics of each household appliance. We can present difficult problems.

본 발명이 이루고자 하는 기술적 과제는 중, 소형의 부하를 가지는 가전기기(예를 들어, 냉장고)의 소비전력 데이터를 시계열 분석 기법 중 하나인 세이플릿(Shapelets) 기법을 적용하여 평일과 토요일, 그리고 일요일의 3 가지 패턴으로 분류하는 효율적인 분류방법 및 장치를 제공하는데 있다. The technical problem of the present invention is to apply power consumption data of home appliances (for example, refrigerators) having a small and medium load by using the Shapelets technique, one of time series analysis techniques, on weekdays, Saturdays, and Sundays. The present invention provides an efficient classification method and apparatus for classifying into three patterns.

일 측면에 있어서, 본 발명에서 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법은 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계를 포함한다. In one aspect, the power consumption pattern classification method using the time series analysis method proposed in the present invention is a step of processing the data to collect the total power consumption data for a period of time to represent the power consumption data in the form of a time series consisting of a plurality of sequences Extracting all subsequences of the power-processed data in the form of time-processed data through a sliding window technique; learning all the extracted subsequences to generate a Shapes Dictionary; and And classifying the power consumption data in a time series form into each pattern through the safety dictionary.

상기 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. Collecting the total power consumption data for the predetermined period and processing the data to represent the power consumption data in the form of a time series consisting of a plurality of sequences assumes the total power consumption data set of the power consumption data of a time series consisting of a plurality of sequences. And a subsequence among the power consumption data in the form of time series.

상기 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계는 시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. Extracting all subsequences of the power-processed power consumption data in the time series form through the sliding window technique may include a length of the power consumption data in the time series form and a subsequence constituting the power consumption data in the time series form. Given a length of, subdivide the power consumption data in the form of time series, extract each subsequence of the power consumption data in the form of time series, and define a set of all extracted subsequences.

상기 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The classifying the power consumption data in the time series form into each pattern through the shape dictionary may include the entire power consumption data set of the time series form power consumption data composed of a plurality of sequences using information obtained through entropy calculation. Extraction point that can classify each class by information gain operation.

상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다. By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. The total power consumption is calculated and divided.

또 다른 일 측면에 있어서, 본 발명에서 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치는 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 데이터 처리부, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 서브시퀀스 추출부, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 학습부 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 패턴 분류부를 포함한다. In another aspect, the power consumption pattern classification apparatus using the time series analysis technique proposed by the present invention collects the total power consumption data for a predetermined period of time to process the data to represent the power consumption data in the form of a time series consisting of a plurality of sequences A subsequence extractor for extracting all subsequences of the power-processed data in the form of time-processed data through a sliding window technique; And a pattern classifier for classifying power consumption data in a time series form into each pattern through the learner dictionary.

상기 데이터 처리부는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. The data processor assumes an entire power consumption data set of power consumption data in the form of a plurality of sequences and represents a subsequence among the power consumption data in the form of a time series.

상기 서브시퀀스 추출부는 시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. The subsequence extractor may divide the length of the subsequence into power series data by dividing the length of the subsequence by the length of the sub-sequence constituting the time series power consumption data and the length of the sub sequence constituting the time series power consumption data Each subsequence of power consumption data is extracted and a set of all extracted subsequences is defined.

상기 패턴 분류부는 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The pattern classifier extracts a split point that can classify each class by an information gain operation using a value obtained through entropy calculation for the entire power consumption data set of time series power consumption data composed of a plurality of sequences. .

상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다.By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. The total power consumption is calculated and divided.

본 발명의 실시예들에 따르면 획득한 데이터를 각각 평일과 토요일, 그리고 일요일로 구분함으로써 개별 수용가의 전력 사용패턴을 확인하며, 상업용뿐만 아니라 일반 가정의 실시간 에너지 사용 모니터링 시스템에 적용되어 원활한 서비스를 제공할 수 있을 것으로 기대한다. According to the embodiments of the present invention, the obtained data is divided into weekdays, Saturdays, and Sundays, respectively, to identify power consumption patterns of individual consumers, and are applied to a real-time energy use monitoring system of a general household as well as commercially to provide a smooth service. I expect to be able to.

도 1은 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 소비전력 데이터를 의사결정 나무를 통해 각각의 패턴으로 분류하는 방법을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 일주일 전체 동안의 소비전력 데이터를 전체, 평일, 토요일, 그리고 일요일로 구분한 그래프이다.
도 4는 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치이다.
1 is a flowchart illustrating a power consumption pattern classification method using a time series analysis technique according to an embodiment of the present invention.
2 is a view for explaining a method of classifying power consumption data into respective patterns through a decision tree according to an embodiment of the present invention.
3 is a graph of power consumption data for a whole week, divided into weekdays, Saturdays, and Sundays according to an embodiment of the present invention.
4 is a power consumption pattern classification apparatus using a time series analysis technique according to an embodiment of the present invention.

이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 방법을 설명하기 위한 흐름도이다. 1 is a flowchart illustrating a power consumption pattern classification method using a time series analysis technique according to an embodiment of the present invention.

시계열 분석 기법을 이용한 소비전력 패턴 분류 방법은 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계(110), 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계(120), 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계(130) 및 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계(140)를 포함한다. In the power consumption pattern classification method using a time series analysis method, a data processing step 110 is performed to collect total power consumption data for a predetermined period and to represent power consumption data in the form of a time series composed of a plurality of sequences, and a sliding window. Extracting 120 all subsequences of the power-processed data in the form of time-processed data, and learning the extracted subsequences to generate a Shapes Dictionary (130); and The method may further include classifying power consumption data in the form of time series into respective patterns through the safety dictionary.

본 발명은 일 실시예에 따른 물류센터에 설치한 상업용 냉장고에서 실측한 데이터를 기반으로 활용한다. 냉장고의 전체적인 구성으로는, 내부에 냉풍기가 설치되어 있고 외부의 실외기는 3.3KW ~ 4.1KW의 소비전력을 가진다. 또한, 실내기의 성애 제거 방식은 오픈 싸이클 방식을 사용한다.The present invention utilizes based on data measured in a commercial refrigerator installed in a distribution center according to an embodiment. In the overall configuration of the refrigerator, the cooler is installed inside and the external outdoor unit has a power consumption of 3.3KW ~ 4.1KW. In addition, the defrosting method of the indoor unit uses an open cycle method.

단계(110)에서, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리한다. In step 110, the total power consumption data for a certain period of time is collected and processed to represent power consumption data in the form of time series consisting of a plurality of sequences.

수용가의 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타낸다. 이때, 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. The power consumption data of the customer is collected and represented as time series power consumption data composed of a plurality of sequences. In this case, it is assumed that the entire power consumption data set of the power consumption data in the form of a plurality of sequences is assumed, and the sub-sequence of the power consumption data in the time series is represented.

더욱 상세하게는, 본 발명은 일 실시예에 따르면 다음과 같은 수학식을 통해 상기 수집된 소비전력 데이터를 처리, 분류를 수행한다. 여기서, '

Figure 112018028554692-pat00001
'는 1부터 m개의 시퀀스로 구성된(
Figure 112018028554692-pat00002
) 시계열 형태의 소비전력 데이터이며, 이러한 소비전력 데이터로 구성된 전체 소비전력 데이터 셋을 'D'라고 가정한다. 또한, 시계열 데이터(T) 중 서브시퀀스를 'S'로 표현한다. More specifically, the present invention processes and classifies the collected power consumption data through the following equation. here, '
Figure 112018028554692-pat00001
'Consists of 1 to m sequences (
Figure 112018028554692-pat00002
) It is assumed that power consumption data in the form of time series and the entire power consumption data set composed of such power consumption data is 'D'. In addition, the subsequence of the time series data T is represented by 'S'.

단계(120)에서, 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출한다. In step 120, all subsequences of power consumption data in the form of the data processed time series are extracted through a sliding window technique.

시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나눈다. 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. Given the length of time series power consumption data and the length of the subsequence constituting the time series power consumption data, the length of the sub sequence is divided by the time series power consumption data. Each subsequence of power consumption data in a time series form is extracted, and a set of all extracted subsequences is defined.

먼저, 슬라이딩 윈도우(Sliding window) 기법을 통해 모든 서브시퀀스를 추출한다. 이는 m의 길이를 갖는 T와 서브시퀀스의 길이인 '

Figure 112018028554692-pat00003
'이 주어지면,
Figure 112018028554692-pat00004
을 기준으로
Figure 112018028554692-pat00005
를 자르고 이러한
Figure 112018028554692-pat00006
의 각 서브시퀀스인 를 추출하게 된다. 여기서,
Figure 112018028554692-pat00007
는 슬라이딩 윈도우의 시작 위치를 나타낸다. 이렇게 추출된 모든 서브시퀀스의 집합을 수학식 1과 같이
Figure 112018028554692-pat00008
로 정의한다. First, all subsequences are extracted through a sliding window technique. This is T and the length of the subsequence 'm'
Figure 112018028554692-pat00003
Is given,
Figure 112018028554692-pat00004
based on this
Figure 112018028554692-pat00005
Cut these
Figure 112018028554692-pat00006
Each subsequence of is extracted. here,
Figure 112018028554692-pat00007
Represents the starting position of the sliding window. The set of all subsequences extracted as shown in Equation 1
Figure 112018028554692-pat00008
Defined as

[수학식 1] [Equation 1]

Figure 112018028554692-pat00009
Figure 112018028554692-pat00009

단계(130)에서, 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성한다. In step 130, all of the extracted subsequences are learned to generate a Shapelets Dictionary.

복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The entire power consumption data set of the time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by using an information gain operation using a value obtained through entropy calculation.

상기 과정을 통하여 추출된 여러 개의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터 '

Figure 112018028554692-pat00010
'와 가장 가까운 서브시퀀스를 찾는다. 이 때,
Figure 112018028554692-pat00011
는 소비전력 데이터에 대하여 전체 데이터의 수만큼의 서브시퀀스이고, 아래 수학식 2와 같이 나타낸다. Time series power consumption data learned from a plurality of subsequence candidates extracted through the above process.
Figure 112018028554692-pat00010
Finds the nearest subsequence. At this time,
Figure 112018028554692-pat00011
Is the subsequence of the total number of data for the power consumption data, as shown in Equation 2 below.

[수학식 2][Equation 2]

Figure 112018028554692-pat00012
Figure 112018028554692-pat00012

패턴 분류부(440)는 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류한다. The pattern classifier 440 classifies power consumption data in a time series form into each pattern through the safety dictionary.

추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다. By specifying the segmentation area through the extracted split points and classifying them through the decision tree, the total power consumption data for a certain period of time is collected, extracted into subsequences with a predetermined pattern, and extracted through the subsequences. Calculate and classify the total power consumption.

결합된 전체 소비전력 데이터 집합을 추출된 서브시퀀스를 이용하여 3 가지의 클래스(예를 들어, 평일, 토요일, 일요일)로 잘 분류 할 수 있는지 평가를 위한 방법으로 정보 이득(Information gain) 기법을 적용하기에 앞서 먼저, 엔트로피 계산을 실시한다. 여기서, p(Class)는 각 Class의 데이터 수를 전체 소비전력 데이터 셋(D)으로 나눈 값이다. 클래스(예를 들어, 평일, 토요일, 일요일) 각각을 A, B, 그리고 C로 간략하게 나타낸다.Apply the information gain technique to evaluate whether the combined total power consumption data set can be well classified into three classes (eg, weekdays, Saturdays, Sundays) using the extracted subsequences. Before doing so, entropy calculation is first performed. Here, p (Class) is a value obtained by dividing the number of data of each class by the total power consumption data set (D). Each of the classes (eg, weekday, Saturday, Sunday) is briefly represented by A, B, and C.

[수학식 3][Equation 3]

Figure 112018028554692-pat00013
Figure 112018028554692-pat00013

전체 소비전력 데이터 셋(D)은 엔트로피 계산을 통해 얻어진, 수학식 3에 나타낸

Figure 112018028554692-pat00014
를 활용하여 정보 이득(Information gain) 연산으로 각 클래스(예를 들어, 평일, 토요일, 일요일)를 구분할 수 있는 분할 점(Split Point; sp)을 추출한다. 얻어진 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류한다. 여기서,
Figure 112018028554692-pat00015
,
Figure 112018028554692-pat00016
, 그리고
Figure 112018028554692-pat00017
는 각 클래스의 데이터 셋을 의미하고, 이득을 수학식 4와 같이 나타낼 수 있다. The total power consumption data set (D) is shown in Equation 3, obtained through entropy calculation
Figure 112018028554692-pat00014
A split point (sp) for classifying each class (for example, weekdays, Saturdays, and Sundays) is extracted by using an information gain operation. The division point is specified through the obtained splitting points and classified through the decision tree. here,
Figure 112018028554692-pat00015
,
Figure 112018028554692-pat00016
, And
Figure 112018028554692-pat00017
Denotes a data set of each class, and the gain may be expressed as in Equation 4.

[수학식 4][Equation 4]

Figure 112018028554692-pat00018
Figure 112018028554692-pat00018

도 2는 본 발명의 일 실시예에 따른 소비전력 데이터를 의사결정 나무를 통해 각각의 패턴으로 분류하는 방법을 설명하기 위한 도면이다. 2 is a view for explaining a method of classifying power consumption data into respective patterns through a decision tree according to an embodiment of the present invention.

도 2는 상기 설명된 수학식을 통하여 각각의 패턴을 분류할 수 있는 소비전력 의사 결정 나무(Decision tree)(220)를 나타낸다. 먼저 세이플릿 딕셔너리(Shapelets Dictionary)(210) 중

Figure 112018028554692-pat00019
의 대표 서브시퀀스(Shapelet)를 이용하여 입력되는 소비전력 데이터의 객체가 Class1(평일)에 속하는지 거리를 계산하게 되며 이를 구분 점(Split point: sp)의 값 범위 내에 위치할 경우, 평일로 구분한다. 반면에, 속하지 않으면 다음 대표 서브시퀀스인
Figure 112018028554692-pat00020
과의 계산을 다시 실시하며 이에 따라 토요일과 일요일로 구분하게 된다.2 illustrates a power consumption decision tree 220 that can classify each pattern through the equations described above. First out of the Shapelets Dictionary (210)
Figure 112018028554692-pat00019
Using the representative subsequence of, the distance of the input power consumption data belongs to Class1 (Weekday) and calculates the distance, and if it is within the range of the split point (sp), it is divided into weekdays. do. On the other hand, if it does not belong, the next representative subsequence is
Figure 112018028554692-pat00020
The calculation of the lessons is performed again, thus distinguishing between Saturday and Sunday.

다시 도 1을 참조하면, 먼저, 대상이 되는 수용가의 소비전력을 측정한 데이터를 수집 및 저장한다(110). 이 때 외부 조건(계절, 날씨 등)은 고려하지 않는다. 이후 수집 및 저장된 소비전력 데이터의 서브시퀀스를 추출하고(120), 수집된 데이터로부터 상기 설명한 학습 과정을 통하여 세이플릿 딕셔너리를 생성하게 된다(130). 생성한 모델을 통해 새로운 입력 데이터를 각각의 패턴(평일, 토요일, 그리고 일요일)으로 분류하게 된다(140). Referring back to FIG. 1, first, data of measuring power consumption of a target consumer is collected and stored (110). External conditions (seasonal, weather, etc.) are not taken into account. Subsequently, a subsequence of the collected and stored power consumption data is extracted (120), and a shape dictionary is generated from the collected data through the above-described learning process (130). The generated model classifies new input data into patterns (weekdays, Saturdays, and Sundays) (140).

예를 들어, 입력 데이터가 평일인지 여부를 판단하여(141), 평일이 맞을 경우 평일 패턴의 데이터로 분류하고(142) 과정을 종료한다. 반면에 평일이 아닐 경우, 입력 데이터가 토요일인지 여부를 판단하여(143), 토요일이 맞을 경우 토요일 패턴의 데이터로 분류하고(144) 과정을 종료한다. 반면에 토요일이 아닐 경우, 일요일 패턴의 데이터로 분류하고(145) 과정을 종료한다.For example, it is determined whether the input data is a weekday (141), and if the weekday is correct, it is classified as data of the weekday pattern (142) and the process ends. On the other hand, if it is not a weekday, it is determined whether the input data is Saturday (143), and if the Saturday is correct, it is classified as data of the Saturday pattern (144) and the process ends. On the other hand, if it is not Saturday, it is classified as data of the Sunday pattern (145) and the process ends.

상기 설명한 방법을 통하여 세이플릿(Shapelets) 기법은 기존의 시계열 데이터 분류에 사용되는 알고리즘들과 같이 전체 데이터를 매핑하여 분류하는 방법 대신, 일정한 패턴을 가진 서브시퀀스를 추출하고 이를 통해 전체를 계산하여 구분함으로써, 수행속도가 우수하며 직관적인 수행결과를 얻을 수 있다는 장점이 있다. Through the above-described method, the Shapelets technique extracts subsequences having a predetermined pattern and calculates the whole by using them instead of mapping and classifying the entire data like the algorithms used in the existing time series data classification. By doing so, there is an advantage that the execution speed is excellent and an intuitive execution result can be obtained.

도 3은 본 발명의 일 실시예에 따른 일주일 전체 동안의 소비전력 데이터를 전체, 평일, 토요일, 그리고 일요일로 구분한 그래프이다. 3 is a graph of power consumption data for a whole week, divided into weekdays, Saturdays, and Sundays according to an embodiment of the present invention.

도 3에 도시되어 있는 바와 같이, 일주일 전체 동안의 소비전력 데이터를 전체(310), 평일(320), 토요일(330), 그리고 일요일(340)로 구분한 그래프를 보여준다. 이는 80일간의 소비전력 데이터를 하루 15분마다 측정한 데이터이며 00:00부터 23:45까지의 총 96개의 데이터가 한 세트로 구성된다. 즉, 전체 80일이므로 총 7,680개의 데이터를 사용한다. 상기 데이터에서 '평일'은 월요일부터 금요일까지 총 5일의 데이터를 의미하고, 주말에서 각각의 토요일, 일요일을 따로 구분한다. As shown in FIG. 3, power consumption data for the whole week is divided into a total 310, a weekday 320, a Saturday 330, and a Sunday 340. This is a measurement of 80 days of power consumption data every 15 minutes per day. It consists of 96 sets of data from 00:00 to 23:45. That is, the total 80 days, 7,680 data are used. In the above data, 'weekday' means data of a total of 5 days from Monday to Friday, and separates each Saturday and Sunday from the weekend.

도 4는 본 발명의 일 실시예에 따른 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치이다.4 is a power consumption pattern classification apparatus using a time series analysis technique according to an embodiment of the present invention.

시계열 분석 기법을 이용한 소비전력 패턴 분류 장치(400)는 일정 데이터 처리부(410), 서브시퀀스 추출부(420), 학습부(430) 및 패턴 분류부(440)를 포함한다. The power consumption pattern classification apparatus 400 using the time series analysis technique includes a schedule data processor 410, a subsequence extractor 420, a learner 430, and a pattern classifier 440.

일정 데이터 처리부(410)는 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리한다. The constant data processor 410 collects total power consumption data for a predetermined period and processes the data to represent power consumption data in the form of a time series composed of a plurality of sequences.

수용가의 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타낸다. 이때, 복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타낸다. The power consumption data of the customer is collected and represented as time series power consumption data composed of a plurality of sequences. In this case, it is assumed that the entire power consumption data set of the power consumption data in the form of a plurality of sequences is assumed, and the sub-sequence of the power consumption data in the time series is represented.

더욱 상세하게는, 본 발명은 일 실시예에 따르면 다음과 같은 수학식을 통해 상기 수집된 소비전력 데이터를 처리, 분류를 수행한다. 여기서, '

Figure 112018028554692-pat00021
'는 1부터 m개의 시퀀스로 구성된(
Figure 112018028554692-pat00022
) 시계열 형태의 소비전력 데이터이며, 이러한 소비전력 데이터로 구성된 전체 소비전력 데이터 셋을 'D'라고 가정한다. 또한, 시계열 데이터(T) 중 서브시퀀스를 'S'로 표현한다. More specifically, the present invention processes and classifies the collected power consumption data through the following equation. here, '
Figure 112018028554692-pat00021
'Consists of 1 to m sequences (
Figure 112018028554692-pat00022
) It is assumed that power consumption data in the form of time series and the entire power consumption data set composed of such power consumption data is 'D'. In addition, the subsequence of the time series data T is represented by 'S'.

서브시퀀스 추출부(420)는 슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출한다. The subsequence extractor 420 extracts all the subsequences of the power consumption data in the form of time-processed data through a sliding window technique.

시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나눈다. 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의한다. Given the length of time series power consumption data and the length of the subsequence constituting the time series power consumption data, the length of the sub sequence is divided by the time series power consumption data. Each subsequence of power consumption data in a time series form is extracted, and a set of all extracted subsequences is defined.

먼저, 슬라이딩 윈도우(Sliding window) 기법을 통해 모든 서브시퀀스를 추출한다. 이는 m의 길이를 갖는 T와 서브시퀀스의 길이인 '

Figure 112018028554692-pat00023
'이 주어지면,
Figure 112018028554692-pat00024
을 기준으로
Figure 112018028554692-pat00025
를 자르고 이러한
Figure 112018028554692-pat00026
의 각 서브시퀀스인 를 추출하게 된다. 여기서,
Figure 112018028554692-pat00027
는 슬라이딩 윈도우의 시작 위치를 나타낸다. 이렇게 추출된 모든 서브시퀀스의 집합을 위 수학식 1과 같이
Figure 112018028554692-pat00028
로 정의한다. First, all subsequences are extracted through a sliding window technique. This is T and the length of the subsequence 'm'
Figure 112018028554692-pat00023
Is given,
Figure 112018028554692-pat00024
based on this
Figure 112018028554692-pat00025
Cut these
Figure 112018028554692-pat00026
Each subsequence of is extracted. here,
Figure 112018028554692-pat00027
Represents the starting position of the sliding window. The set of all extracted subsequences is expressed as in Equation 1 above.
Figure 112018028554692-pat00028
Defined as

학습부(430)는 상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성한다. The learner 430 learns all the extracted subsequences to generate a Shapelets Dictionary.

복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출한다. The entire power consumption data set of time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by using an information gain operation using a value obtained through entropy calculation.

상기 과정을 통하여 추출된 여러 개의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터 '

Figure 112018028554692-pat00029
'와 가장 가까운 서브시퀀스를 찾는다. 이 때,
Figure 112018028554692-pat00030
는 소비전력 데이터에 대하여 전체 데이터의 수만큼의 서브시퀀스이고, 위 수학식 2와 같이 나타낸다. Time series power consumption data learned from a plurality of subsequence candidates extracted through the above process.
Figure 112018028554692-pat00029
Finds the nearest subsequence. At this time,
Figure 112018028554692-pat00030
Is the subsequence of the total number of data for the power consumption data, as shown in Equation 2 above.

패턴 분류부(440)는 상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류한다. The pattern classifier 440 classifies power consumption data in a time series form into each pattern through the safety dictionary.

추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분한다. By specifying the segmentation area through the extracted split points and classifying them through the decision tree, the total power consumption data for a certain period of time are collected, extracted into subsequences with a predetermined pattern, and extracted through the subsequences. Calculate and classify the total power consumption.

결합된 전체 소비전력 데이터 집합을 추출된 서브시퀀스를 이용하여 3 가지의 클래스(예를 들어, 평일, 토요일, 일요일)로 잘 분류 할 수 있는지 평가를 위한 방법으로 정보 이득(Information gain) 기법을 적용하기에 앞서 먼저, 엔트로피 계산을 실시한다. 여기서, p(Class)는 각 Class의 데이터 수를 전체 소비전력 데이터 셋(D)으로 나눈 값이다. 클래스(예를 들어, 평일, 토요일, 일요일) 각각을 A, B, 그리고 C로 간략하게 나타낸다.Apply the information gain technique to evaluate whether the combined total power consumption data set can be well classified into three classes (eg, weekdays, Saturdays, Sundays) using the extracted subsequences. Before doing so, entropy calculation is first performed. Here, p (Class) is a value obtained by dividing the number of data of each class by the total power consumption data set (D). Each of the classes (eg, weekday, Saturday, Sunday) is briefly represented by A, B, and C.

전체 소비전력 데이터 셋(D)은 엔트로피 계산을 통해 얻어진, 위 수학식 3과 같이 나타낸

Figure 112018028554692-pat00031
를 활용하여 정보 이득(Information gain) 연산으로 각 클래스(예를 들어, 평일, 토요일, 일요일)를 구분할 수 있는 분할 점(Split Point; sp)을 추출한다. 얻어진 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류한다. 여기서,
Figure 112018028554692-pat00032
,
Figure 112018028554692-pat00033
, 그리고
Figure 112018028554692-pat00034
는 각 클래스의 데이터 셋을 의미하고, 이득을 위 수학식 4와 같이 나타낼 수 있다.The total power consumption data set (D) is represented by Equation 3, obtained through entropy calculation
Figure 112018028554692-pat00031
A split point (sp) for classifying each class (for example, weekdays, Saturdays, and Sundays) is extracted by using an information gain operation. The division point is specified through the obtained splitting points and classified through the decision tree. here,
Figure 112018028554692-pat00032
,
Figure 112018028554692-pat00033
, And
Figure 112018028554692-pat00034
Denotes a data set of each class, and the gain may be expressed as in Equation 4 above.

이와 같이 제안하는 시계열 분석 기법을 이용한 소비전력 패턴 분류 장치는 대상이 되는 수용가의 소비전력을 측정한 데이터를 수집 및 저장한다. 이 때 외부 조건(계절, 날씨 등)은 고려하지 않는다. 이후 수집 및 저장된 소비전력 데이터의 서브시퀀스를 추출하고, 수집된 데이터로부터 상기 설명한 학습 과정을 통하여 세이플릿 딕셔너리를 생성하게 된다. 생성한 모델을 통해 새로운 입력 데이터를 각각의 패턴(평일, 토요일, 그리고 일요일)으로 분류하게 된다. The power consumption pattern classification apparatus using the proposed time series analysis technique collects and stores data measuring power consumption of a target consumer. External conditions (seasonal, weather, etc.) are not taken into account. Subsequently, a subsequence of the collected and stored power consumption data is extracted, and a shape dictionary is generated from the collected data through the learning process described above. The generated model will classify the new input data into individual patterns (weekdays, Saturdays, and Sundays).

예를 들어, 입력 데이터가 평일인지 여부를 판단하여, 평일이 맞을 경우 평일 패턴의 데이터로 분류하고 과정을 종료한다. 반면에 평일이 아닐 경우, 입력 데이터가 토요일인지 여부를 판단하여, 토요일이 맞을 경우 토요일 패턴의 데이터로 분류하고 과정을 종료한다. 반면에 토요일이 아닐 경우, 일요일 패턴의 데이터로 분류하고 과정을 종료한다.For example, it is determined whether the input data is a weekday, and if the weekday is correct, it is classified as data of the weekday pattern and the process ends. On the other hand, if it is not a weekday, it is determined whether the input data is Saturday, and if Saturday is correct, it is classified as data of the Saturday pattern and the process ends. On the other hand, if it is not Saturday, classify as data of Sunday pattern and finish the process.

상기 설명한 방법을 통하여 세이플릿(Shapelets) 기법은 기존의 시계열 데이터 분류에 사용되는 알고리즘들과 같이 전체 데이터를 매핑하여 분류하는 방법 대신, 일정한 패턴을 가진 서브시퀀스를 추출하고 이를 통해 전체를 계산하여 구분함으로써, 수행속도가 우수하며 직관적인 수행결과를 얻을 수 있다는 장점이 있다. Through the above-described method, the Shapelets technique extracts subsequences having a predetermined pattern and calculates the whole by using them instead of mapping and classifying the entire data like the algorithms used in the existing time series data classification. By doing so, there is an advantage that the execution speed is excellent and an intuitive execution result can be obtained.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the devices and components described in the embodiments may include, for example, processors, controllers, arithmetic logic units (ALUs), digital signal processors, microcomputers, field programmable arrays (FPAs), It may be implemented using one or more general purpose or special purpose computers, such as a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to the execution of the software. For the convenience of understanding, the processing apparatus may be described as one used, but those skilled in the art will appreciate that the processing apparatus includes a plurality of processing elements and / or a plurality of types of processing elements. It can be seen that it may include. For example, the processing device may include a plurality of processors or one processor and one controller. In addition, other processing configurations are possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the above, and may configure the processing device to operate as desired, or process independently or collectively. You can command the device. Software and / or data may be any type of machine, component, physical device, virtual equipment, computer storage medium or device in order to be interpreted by or to provide instructions or data to the processing device. It can be embodied in. The software may be distributed over networked computer systems so that they may be stored or executed in a distributed manner. Software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.  The method according to the embodiment may be embodied in the form of program instructions that can be executed by various computer means and recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions recorded on the media may be those specially designed and constructed for the purposes of the embodiments, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer readable recording media include magnetic media such as hard disks, floppy disks and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.Although the embodiments have been described by the limited embodiments and the drawings as described above, various modifications and variations are possible to those skilled in the art from the above description. For example, the described techniques may be performed in a different order than the described method, and / or components of the described systems, structures, devices, circuits, etc. may be combined or combined in a different form than the described method, or other components. Or even by substitution or replacement by equivalents, an appropriate result can be achieved.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다. Therefore, other implementations, other embodiments, and equivalents to the claims are within the scope of the claims that follow.

Claims (10)

데이터 처리부를 통해 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계;
서브시퀀스 추출부를 통해 슬라이딩 윈도우(Sliding window) 기법을 이용하여 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계;
상기 추출된 모든 서브시퀀스들을 학습부를 통해 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 단계; 및
패턴 분류부를 통해 상기 세이플릿 딕셔너리를 이용하여 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계
를 포함하고,
패턴 분류부를 통해 상기 세이플릿 딕셔너리를 이용하여 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 단계는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출하고,
추출된 모든 서브시퀀스들 중 복수의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터와 가장 가까운 서브시퀀스를 찾고,
상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분하는
소비전력 패턴 분류 방법.
Collecting data of total power consumption for a predetermined period through a data processing unit and processing the data to represent power consumption data in a time series form having a plurality of sequences;
Extracting all subsequences of the power processed data in the form of time-processed data using a sliding window technique through a subsequence extractor;
Learning all of the extracted subsequences through a learner to generate a Shapes Dictionary; And
Classifying power consumption data in a time series form into each pattern by using the safety dictionary through a pattern classification unit
Including,
The classifying the power consumption data in the time series form into each pattern by using the shape dictionary through the pattern classification unit may include:
The entire power consumption data set of the time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by information gain calculation using the value obtained through entropy calculation.
Find a subsequence closest to the trained time series power consumption data among a plurality of subsequence candidates among all extracted subsequences,
By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. To calculate the total power consumption
Power consumption pattern classification method.
제1항에 있어서,
데이터 처리부를 통해 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 단계는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타내는
소비전력 패턴 분류 방법.
The method of claim 1,
Collecting the total power consumption data for a period of time through the data processing unit and processing the data to represent the power consumption data in the form of a time series consisting of a plurality of sequences,
Assuming a total power consumption data set of power consumption data in the form of a plurality of sequences, and representing a subsequence among the power consumption data of the time series.
Power consumption pattern classification method.
제1항에 있어서,
서브시퀀스 추출부를 통해 슬라이딩 윈도우(Sliding window) 기법을 이용하여 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 단계는,
시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의하는
소비전력 패턴 분류 방법.
The method of claim 1,
Extracting all subsequences of the power-processed data in the form of time-processed data using a sliding window technique through a subsequence extractor,
Given the length of the power consumption data in the form of time series and the length of the subsequence constituting the power consumption data in the form of time series, the length of the subsequence is divided by the power consumption data in the form of time series, Extract subsequences and define a set of all extracted subsequences
Power consumption pattern classification method.
삭제delete 삭제delete 일정 기간 동안의 전체 소비전력 데이터를 수집하여 복수의 시퀀스로 구성된 시계열 형태의 소비전력 데이터로 나타내도록 데이터 처리하는 데이터 처리부;
슬라이딩 윈도우(Sliding window) 기법을 통해 상기 데이터 처리된 시계열 형태의 소비전력 데이터의 모든 서브시퀀스들을 추출하는 서브시퀀스 추출부;
상기 추출된 모든 서브시퀀스들을 학습하여 세이플릿 딕셔너리(Shapelets Dictionary)를 생성하는 학습부; 및
상기 세이플릿 딕셔너리를 통해 시계열 형태의 소비전력 데이터를 각각의 패턴으로 분류하는 패턴 분류부
를 포함하고,
패턴 분류부는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋은 엔트로피 계산을 통해 얻어진 값을 활용하여 정보 이득(Information gain) 연산으로 각 클래스를 구분할 수 있는 분할 점을 추출하고,
추출된 모든 서브시퀀스들 중 복수의 서브시퀀스 후보들 중에서 학습된 시계열 소비전력 데이터와 가장 가까운 서브시퀀스를 찾고,
상기 추출된 분할 점을 통해 구분 영역을 명시하고 의사결정 나무(Decision tree)를 통하여 분류함으로써, 일정 기간 동안의 전체 소비전력 데이터를 수집하여 일정한 패턴을 가진 서브시퀀스로 추출하고, 추출된 서브시퀀스를 통해 전체 소비전력을 계산하여 구분하는
소비전력 패턴 분류 장치.
A data processing unit which collects total power consumption data for a predetermined period and processes the data to be represented as power consumption data in the form of a time series composed of a plurality of sequences;
A subsequence extractor configured to extract all subsequences of power consumption data in the form of time-processed data through a sliding window technique;
A learner configured to learn all of the extracted subsequences to generate a Shapelets Dictionary; And
Pattern classification unit for classifying the power consumption data of the time series form into each pattern through the safety dictionary
Including,
The pattern classification unit,
The entire power consumption data set of the time series power consumption data composed of a plurality of sequences is used to extract a splitting point that can classify each class by information gain calculation using the value obtained through entropy calculation.
Find a subsequence closest to the trained time series power consumption data among a plurality of subsequence candidates among all extracted subsequences,
By specifying the division region through the extracted split points and classifying them through a decision tree, the total power consumption data for a predetermined period is collected, extracted into subsequences having a predetermined pattern, and the extracted subsequences are extracted. To calculate the total power consumption
Power consumption pattern classification device.
제6항에 있어서,
상기 데이터 처리부는,
복수 개의 시퀀스로 구성된 시계열 형태의 소비전력 데이터의 전체 소비전력 데이터 셋을 가정하고, 상기 시계열 형태의 소비전력 데이터 중 서브시퀀스를 나타내는
소비전력 패턴 분류 장치.
The method of claim 6,
The data processing unit,
Assuming a total power consumption data set of power consumption data in the form of a plurality of sequences, and representing a subsequence among the power consumption data of the time series.
Power consumption pattern classification device.
제6항에 있어서,
상기 서브시퀀스 추출부는,
시계열 형태의 소비전력 데이터의 길이 및 상기 시계열 형태의 소비전력 데이터를 구성하는 서브시퀀스의 길이가 주어지면, 상기 서브시퀀스의 길이를 시계열 형태의 소비전력 데이터를 나누고, 시계열 형태의 소비전력 데이터의 각 서브시퀀스를 추출하고, 추출된 모든 서브시퀀스의 집합을 정의하는
소비전력 패턴 분류 장치.
The method of claim 6,
The subsequence extractor,
Given the length of the power consumption data in the form of time series and the length of the subsequence constituting the power consumption data in the form of time series, the length of the subsequence is divided by the power consumption data in the form of time series, Extract subsequences and define a set of all extracted subsequences
Power consumption pattern classification device.
삭제delete 삭제delete
KR1020180033026A 2018-03-22 2018-03-22 Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis KR102087026B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180033026A KR102087026B1 (en) 2018-03-22 2018-03-22 Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180033026A KR102087026B1 (en) 2018-03-22 2018-03-22 Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis

Publications (2)

Publication Number Publication Date
KR20190111210A KR20190111210A (en) 2019-10-02
KR102087026B1 true KR102087026B1 (en) 2020-03-10

Family

ID=68422692

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180033026A KR102087026B1 (en) 2018-03-22 2018-03-22 Method and Apparatus for Classifying Power Consumption Patterns using Time Series Analysis

Country Status (1)

Country Link
KR (1) KR102087026B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20210127358A (en) 2020-04-14 2021-10-22 삼성에스디에스 주식회사 Method and apparatus for extracting a pattern of time series data

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000299945A (en) * 1999-04-12 2000-10-24 Adoin Kenkyusho:Kk Remote automated diagnostic system for power consumption conditions
JP2017138929A (en) * 2016-02-05 2017-08-10 株式会社東芝 Time series data waveform analyzer, method, and program

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000299945A (en) * 1999-04-12 2000-10-24 Adoin Kenkyusho:Kk Remote automated diagnostic system for power consumption conditions
JP2017138929A (en) * 2016-02-05 2017-08-10 株式会社東芝 Time series data waveform analyzer, method, and program

Also Published As

Publication number Publication date
KR20190111210A (en) 2019-10-02

Similar Documents

Publication Publication Date Title
Basu et al. Time series distance-based methods for non-intrusive load monitoring in residential buildings
Zhai et al. Appliance flexibility analysis considering user behavior in home energy management system using smart plugs
Chae et al. Artificial neural network model for forecasting sub-hourly electricity usage in commercial buildings
Li et al. Classification of energy consumption in buildings with outlier detection
US9753477B2 (en) Load forecasting for residential sector demand response
JP6455431B2 (en) Monitoring device, monitoring method and program
Selakov et al. Hybrid PSO–SVM method for short-term load forecasting during periods with significant temperature variations in city of Burbank
KR101875329B1 (en) Forecasting apparatus and method for power consumption
US20150371151A1 (en) Energy infrastructure sensor data rectification using regression models
Chou et al. Hybrid machine learning system to forecast electricity consumption of smart grid-based air conditioners
Serrano-Guerrero et al. Statistical methodology to assess changes in the electrical consumption profile of buildings
JP6280485B2 (en) Energy saving support system and energy saving support method
Viegas et al. Electricity demand profile prediction based on household characteristics
KR102150170B1 (en) Method and System for Power Load Forecasting based on Pattern Tagging
KR20180028583A (en) A customized electronic power scheduling system for consumer in an environment of intelligent power usage
KR20200074825A (en) Method and System for Power Data Outlier Detection Based on Pattern Tagging
KR102472573B1 (en) Method of clustering and analyzing data of customer using electricity
KR102495494B1 (en) Method and apparatus for predicting home energy usage
CN103140763A (en) Systems, methods, and devices for analyzing utility usage with load duration curves
JP6076242B2 (en) Distribution system load prediction device and distribution system load prediction method
Laib et al. A Gaussian process regression for natural gas consumption prediction based on time series data
Brusokas et al. HeatFlex: Machine learning based data-driven flexibility prediction for individual heat pumps
Dinesh et al. Residential power forecasting based on affinity aggregation spectral clustering
Saad et al. Data analytics-based anomaly detection in smart distribution network
CN111179108A (en) Method and device for predicting power consumption

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant