KR20190050682A - Pattern Tagging based Power Data Storing and Management System - Google Patents

Pattern Tagging based Power Data Storing and Management System Download PDF

Info

Publication number
KR20190050682A
KR20190050682A KR1020180012252A KR20180012252A KR20190050682A KR 20190050682 A KR20190050682 A KR 20190050682A KR 1020180012252 A KR1020180012252 A KR 1020180012252A KR 20180012252 A KR20180012252 A KR 20180012252A KR 20190050682 A KR20190050682 A KR 20190050682A
Authority
KR
South Korea
Prior art keywords
data
patterns
pattern
power
learning
Prior art date
Application number
KR1020180012252A
Other languages
Korean (ko)
Other versions
KR102072901B1 (en
Inventor
최준균
김나경
오현택
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of KR20190050682A publication Critical patent/KR20190050682A/en
Application granted granted Critical
Publication of KR102072901B1 publication Critical patent/KR102072901B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R22/00Arrangements for measuring time integral of electric power or current, e.g. electricity meters
    • G01R22/06Arrangements for measuring time integral of electric power or current, e.g. electricity meters by electronic methods
    • G01R22/061Details of electronic electricity meters
    • G01R22/063Details of electronic electricity meters related to remote communication
    • H04L67/16
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S20/00Management or operation of end-user stationary applications or the last stages of power distribution; Controlling, monitoring or operating thereof
    • Y04S20/30Smart metering, e.g. specially adapted for remote reading

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Power Engineering (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

Provided are a method and a system for storing and managing power data based on a pattern tagging technology. The method for storing and managing power data based on a pattern tagging technology comprises the following steps: selecting multiple types of data among entire data samples; extracting patterns through unsupervised learning of average point movement clustering using a correlation value for the multiple types of selected data; classifying the entire data samples into the most similar patterns after extracting the patterns; inserting and storing the classified patterns together with tags into the data; and visualizing power usage data and pattern data using the tags of the inserted data.

Description

패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템{Pattern Tagging based Power Data Storing and Management System} {Pattern Tagging based Power Data Storing and Management System}

본 발명은 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템에 관한 것이다. The present invention relates to a method and system for managing power data storage based on pattern tagging technology.

현재 IoT시장이 폭발적인 성장을 거듭하고 있다. 2015년까지 49억이 넘는 기기들이 설치되었으며, 2020년까지 208억개 정도의 기기가 설치 될 것으로 전망된다.Currently, the IoT market is exploding. By 2015, more than 4.9 billion devices have been installed, and by 2020 there will be around 20.8 billion devices installed.

전력 관련 AMI(Advanced Metering Infrastructure)는 IoT시장의 적지 않은 부분을 차지하고 있다. 2015년도에 미국 내에 배치된 전력 관련 양방향 미터링(advanced meter) 기기의 수가 약 6천 5백만개에 다다르고 있다. 이는 전력 스마트 미터링(smart metering) 기기가 총 배치된 IoT기기들 중 1.32%이상을 차지함을 의미한다. IoT시장에서 존재하는 기기들의 다양성과 미국 내에서 배치된 전력 스마트 미터링 기기의 수만을 포함한 것을 고려하였을 때, 1.32%는 전력 산업이 IoT에서 큰 부분을 차지하고 있음을 나타낸다. IoT기기에 개인 핸드폰, 컴퓨터, 등등이 포함됨을 고려하였을 때 100개의 IoT기기 중 1개가 전력 측정 기기이다.Power-related Advanced Metering Infrastructure (AMI) is a small part of the IoT market. Approximately 65 million power-related advanced meter devices are deployed in the United States in 2015. This means that smart metering devices account for more than 1.32% of the total deployed IoT devices. Considering the diversity of devices in the IoT market and the number of power smart metering devices deployed in the US, 1.32% indicates that the power industry is a large part of IoT. Considering that IoT devices include personal phones, computers, etc., one of the 100 IoT devices is a power measurement device.

IoT 데이터는 다수의 센서들로 이루어진 센서 네트워크로부터 빠르고 지속적으로 방대한 양의 데이터가 생성 및 수집된다. 새로운 종류의 데이터로써 그 특성이 기존의 데이터와는 다르다. 생성/수집되는 데이터의 양이 방대하고 비정형이며 스트리밍성이 강하다. 산업과 기기 종류에 따라 분석단계와 관리단계에서 각 데이터의 특성과 어플리케이션 별로 맞춤형 처리 방식이 현재에도 계속하여 사용되고 있다.IoT data is generated and collected quickly and continuously from sensor networks consisting of a large number of sensors. As a new kind of data, its characteristics are different from existing data. The amount of data generated / collected is vast, irregular, and streaming. Depending on the industry and device type, the characteristics of each data and the customized processing method for each application are still used in analysis and management stages.

기존 IoT 전력 데이터의 저장과 관리에 있어서, 데이터의 특성이 비IoT 데이터들과 다름에도 기존과 같은 방식으로 저장 및 관리되고 있다. 데이터 사용시에 각 산업, 분야, 목적에 따라 특성에 맞는 맞춤형 처리와 분석방법들이 계속하여 연구되어 사용되고 있으나, 데이터를 저장 및 관리 시 IoT 데이터 특성에 맞는 방법과 시스템이 미비하다. 전력 데이터의 경우 수집된 전력 사용량 저장과 관리 시 사용자와 날짜를 기준으로 데이터 값을 시간축으로 하나의 행으로 저장하는 경우가 대부분이다.In the storage and management of existing IoT power data, the characteristics of the data are stored and managed in the same way as the non-IoT data. Although the customized processing and analysis methods that are tailored to the characteristics of each industry, field, and purpose have been continuously studied and used in data use, methods and systems suited to the characteristics of IoT data are not available when storing and managing data. In the case of power data, the data values are stored in a single row on the time axis based on the user and date when storing and managing the collected power usage.

기존 데이터 저장 관리 방법에는 다음과 같은 문제점이 있다. 현재 많은 IoT데이터들의 저장 방식들은 데이터를 수집하고, 저장 시 분석 없이 저장 후 추후에 적용하며, 활용 시 분석을 통해 알맞게 사용한다. 비IoT들과는 다르게, 양이 많고 비정형인 스트리밍성이 강한 IoT 데이터들은 비 IoT 데이터와 같은 방식으로 저장하여, 관리 시 검색, 의미 파악, 사용이 어렵고 효율성이 떨어진다. 따라서 IoT에서는 데이터의 실시간 가치가 소멸되기 전에 분석이 수행되어야 하며 데이터가 저장되기 이전에 전처리를 통한 분석이 필요하다.The existing data storage management method has the following problems. Currently, many IoT data storage methods collect data, store it without analysis at the time of storage, apply it later, and use it appropriately through analysis when using it. Unlike the non-IoTs, the IoT data, which is high in quantity and irregular in streaming, is stored in the same manner as the non-IoT data, so that it is difficult to search for the management, to grasp the meaning and to use it. Therefore, in IoT, analysis should be performed before the real-time value of the data disappears, and analysis through preprocessing is required before data is stored.

본 발명이 이루고자 하는 기술적 과제는 IoT환경에서 계속하여 늘어가는 스마트 미터링 기기와 전력 데이터를 효율적으로 저장하고 관리하기 위한 기술로, 데이터 수집 및 저장 단계에서 전처리 분석을 통해 패턴 태그를 삽입하고, 데이터 사이의 상관 계수를 이용한 평균점 이동 클러스터링 비지도 학습을 통해 자동적으로 데이터의 패턴을 파악하고 데이터를 각 패턴으로 구분해 태그를 삽입하여 저장함으로써 데이터의 검색, 관리, 사용 등을 용이하게 하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템을 제공하는데 있다. SUMMARY OF THE INVENTION The present invention is directed to a technology for efficiently storing and managing smart metering devices and power data in an IoT environment. In the data gathering and storing step, pattern tags are inserted through preprocess analysis, We use pattern tagging technology which makes it easy to search, manage, and use data by inserting tag and inserting tag by dividing data into each pattern. Power data storage management method and system.

일 측면에 있어서, 본 발명에서 제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계, 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계 및 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계를 포함한다. According to an aspect of the present invention, there is provided a method for managing a power data storage based on a pattern tagging technique, comprising: selecting a plurality of data from among all data samples; Extracting the patterns, extracting the patterns and dividing the entire data samples into the most similar patterns, inserting and storing the divided patterns together with the tags in the data, and using the tags of the inserted data And visualizing power usage data and pattern data.

상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계는 사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다. The step of extracting patterns through learning of averaging point clustering non-affine mapping using the correlation value for the selected plurality of data includes a step of extracting a plurality of power use values used by the user each day as one vector having a plurality of features And calculate the correlation value by measuring the similarity of each vector, and apply the average moving clustering.

상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계는 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. The step of dividing all the data samples into the most similar patterns after extracting the patterns includes learning the distribution diagrams of the plurality of data, and moving the clusters using the correlation values. The vectors having high similarity among the patterns extracted through the learning of the non- .

상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.After forming the clusters and performing outlier handling, each cluster centroid is extracted using each of the final clusters as one pattern.

상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계는 상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다. The step of inserting and storing the divided patterns into the data together with the tags may include inserting the corresponding pattern tags by distinguishing patterns of existing data and newly generated data using the information of the patterns, To update an existing database or to construct a new database.

또 다른 일 측면에 있어서, 본 발명에서 제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 데이터 생성부, 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하고, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 데이터 분석부, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부에 저장하도록 하는 데이터 구조화부 및 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 시각화부를 포함한다. According to another aspect of the present invention, there is provided a method of managing a power data storage based on pattern tagging technology, comprising: a data generation unit for selecting a plurality of data among all data samples; A data analyzing unit for extracting patterns through learning of moving clustering non-affine mapping, extracting the patterns, and then dividing the entire data samples into the most similar patterns; storing the divided patterns in data together with the tags in the data storage unit; And a visualization unit for visualizing the power usage data and the pattern data using the data structure unit and the tag of the inserted data.

상기 데이터 분석부는 사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다. The data analysis unit defines a plurality of power usage values used by a user in one day as one vector having a plurality of features, calculates a correlation value by measuring similarity of each vector, and applies average mobile clustering.

상기 데이터 분석부는 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. The data analyzer learns a distribution diagram of a plurality of data and forms clusters among vectors having high similarity among the patterns extracted through the averaging shift clustering non-index learning using correlation values.

상기 데이터 분석부는 상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다. The data analyzer forms the clusters and extracts cluster centroids of each of the final clusters as one pattern after outlier handling.

상기 데이터 구조화부는 상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다. The data structure unit divides patterns of existing data and newly generated data by using the information of the patterns, inserts the corresponding pattern tags, and updates the existing database by issuing the tag-inserted data, Build the base.

본 발명의 실시예들에 따르면 데이터의 패턴 인식 및 추출은 데이터 분석의 기초 단계로써, 전력 데이터의 여러 적용응용분야에서 전반적으로 널리 사용될 수 있어 다양한 분야에서 활용이 기대된다. 사용량 예측, 전력 거래 모델링, 이상 감지 시스템, 사용자 분석, 에너지 관리 등이 있음. 패턴 태그를 활용한 전력 소비 맞춤 서비스 개발, 관리 개선 시스템 등 여러 서비스 모델이 가능하다. According to embodiments of the present invention, pattern recognition and extraction of data is a fundamental step of data analysis, and can be widely used in various application fields of power data, and is expected to be utilized in various fields. Usage forecasting, power trading modeling, anomaly detection systems, user analysis, and energy management. Various service models such as power consumption customized service development and management improvement system using pattern tag are possible.

도 1은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.
도 4 및 도 5는 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 과정을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 시스템의 구성을 나타내는 도면이다.
도 7은 본 발명의 일 실시예에 따른 시각화 과정을 설명하기 위한 도면이다.
FIG. 1 is a flowchart illustrating a method of managing a power data storage based on a pattern tagging technique according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining learning of a moving average clustering busy according to an exemplary embodiment of the present invention. Referring to FIG.
FIG. 3 is a diagram for explaining an averaging shift clustering beacon learning using a correlation value according to an embodiment of the present invention. Referring to FIG.
4 and 5 are diagrams for explaining a process of storing power data based on a pattern tagging technique according to an embodiment of the present invention.
6 is a diagram illustrating a configuration of a power data storage management system based on a pattern tagging technology according to an embodiment of the present invention.
7 is a view for explaining a visualization process according to an embodiment of the present invention.

연결되는 기기의 수가 늘어감에 따라 IoT 시장은 폭발적인 성장을 거듭하고 있으며, 그 중의 적지 않은 부분을 전력 관련 스마트 미터링이 차지하고 있는 추세이다. 에너지 관련 시장 또한 스마트 시티/IoT와 함께 부각되며 성장 중에 있다.As the number of connected devices increases, the IoT market continues to grow explosively, and electric power-related smart metering is a small part of it. The energy-related market is also growing with Smart City / IoT.

본 발명의 실시예에 따르면, 커져가는 IoT와 에너지 시장과 늘어가는 스마트 미터링 기기 수에 비례하여 전력 데이터가 기하학적으로 생성되는 환경에서 에너지 관련 IoT 데이터의 저장, 관리, 처리, 시각화 분야에서의 효율성 증진과 비용 감소의 효과 등을 기대할 수 있다.According to the embodiment of the present invention, efficiency in the storage, management, processing and visualization of energy-related IoT data is enhanced in an environment where power data is generated geometrically in proportion to the growing IoT, the energy market and the increasing number of smart metering devices And the cost reduction effect can be expected.

또한, 현재 IoT와 스마트 빌딩, 카, 시티 등이 각광받는 시점에서 추출된 패턴 활용에 따른 새로운 비즈니스 모델을 도출할 수 있으며 사업화 가능성이 높다.In addition, when IoT, smart buildings, cars, and cities are in the spotlight, new business models based on extracted patterns can be derived and commercialization is highly possible.

뿐만 아니라, 전력 데이터를 다루는 전력 관련 기업들과, 스마트 빌딩을 건축하는 건축 관련 기업들, 그리고 IoT 기기를 연구, 개발, 생산하는 IoT 관련 기업들 등 여러 다양한 분야의 기업들에서 적용이 가능하다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.In addition, it can be applied to various companies such as electric power companies that handle power data, building companies that build smart buildings, and IoT companies that research, develop and produce IoT devices. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법을 설명하기 위한 흐름도이다. FIG. 1 is a flowchart illustrating a method of managing a power data storage based on a pattern tagging technique according to an embodiment of the present invention.

제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계(110), 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계(120), 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계(130), 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계(140), 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계(150)를 포함한다. The proposed pattern tagging technology based power data storage management method includes a step 110 of selecting a plurality of data among all data samples, a step of calculating a pattern using a correlation point, Extracting the patterns and dividing the entire data samples into the most similar patterns 130, inserting and storing the separated patterns in the data together with the tags 140, And visualizing the power consumption data and the pattern data using the tag of the power consumption data.

단계(110)에서, 전체 데이터 샘플들 중에서 복수의 데이터들을 선발한다. At step 110, a plurality of data are selected from among the entire data samples.

단계(120)에서, 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출한다. In step 120, patterns are extracted through averaging shift clustering bitmap learning using a correlation value for the selected plurality of data.

사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다. A plurality of power usage values used by a user for a day are defined as one vector having a plurality of features, and average mobile clustering is applied by calculating a correlation value by measuring similarity of each vector.

도 2는 본 발명의 일 실시예에 따른 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.FIG. 2 is a diagram for explaining learning of a moving average clustering busy according to an exemplary embodiment of the present invention. Referring to FIG.

본 발명의 실시예에 따른 비지도 학습은 기계 학습의 일종으로 다양한 분야에서 사용되고 있다. 데이터의 분포도나 데이터의 실제 레이블 값을 알지 못할 때, 데이터의 숨어있는 특성과 구조를 파악하기 위해 사용되며, 파악된 중요 특징을 활용하여 데이터의 숨은 패턴들을 찾아 낼 수 있다. 여기서 말하는 패턴이란, 어떠한 공통된 속성을 가지는 데이터들의 그룹이며, 한 패턴 안의 데이터들은 동일할 필요는 없지만 어떠한 기준에서 서로 가장 비슷한 성질을 갖는 데이터들로 이루어진다. The non-background learning according to the embodiment of the present invention is a type of machine learning and is used in various fields. When the distribution of data or the actual label value of the data is unknown, it is used to grasp the hidden characteristics and structure of the data, and the hidden patterns of the data can be found by utilizing the identified important features. The pattern referred to here is a group of data having any common attribute, and the data in one pattern does not need to be the same, but consists of data having properties most similar to each other in some criterion.

본 발명의 실시예에 따른 평균점 이동(Mean-shift) 클러스터링 비지도 학습은, 각 한 점을 하나의 클러스터(다시 말해, 패턴)로 시작하여 데이터들의 밀도가 높은 곳으로 클러스터들을 이동하여 최종적인 패턴을 구분한다. Mean-shift clustering according to an exemplary embodiment of the present invention begins with a single cluster (i.e., a pattern), moves clusters to a place where data density is high, .

평균점 이동 클러스터링 비지도 학습을 위해 하기 식을 이용하여 가우시안 커널 밀도 추정(Gaussian kernel density estimate)을 계산할 수 있다. Gaussian kernel density estimate can be calculated using the following equation for learning the average moving clustering likelihood.

Figure pat00001
Figure pat00001

Figure pat00002
Figure pat00002

Figure pat00003
Figure pat00003

여기서,

Figure pat00004
는 총 N개의 데이터를 포함하는 데이터 셋 중 n번째 즉 하나의 데이터 포인트를 뜻하며,
Figure pat00005
는 전체 데이터 셋의 분포를 나타낸다. K(t)는 커널 함수를 뜻하며(가우시안의 경우
Figure pat00006
), 위의 식에서는 가우시안 커널이 사용되었다. σ는 자유 파라미터로써 데이터들의 이동시 이동 반경을 제한하는 파라미터이다. 최종적으로 데이터 셋의 분포 변동이 없어지는 지점(
Figure pat00007
)까지 계속하여 데이터 포인트 이동 함수의 식(
Figure pat00008
)을 통하여 각 데이터 포인트(
Figure pat00009
)들을 이동시켜준다.here,
Figure pat00004
Denotes an n-th data point, i.e., one data point, of a data set including a total of N data,
Figure pat00005
Represents the distribution of the entire dataset. K (t) is the kernel function (Gaussian case
Figure pat00006
), Gaussian kernel was used in the above equation. σ is a free parameter and is a parameter that limits the moving radius when moving data. Finally, at the point where the distribution variation of the dataset disappears (
Figure pat00007
) To the data point shift function (
Figure pat00008
) To each data point (
Figure pat00009
).

도 2를 참조하면 클러스터 1(211)은 밀도가 높은 곳으로 이동하여 패턴 1(212)로 구분되고, 클러스터 2(221)는 밀도가 높은 곳으로 이동하여 패턴 2(222)로 구분되고, 클러스터 3(231)은 밀도가 높은 곳으로 이동하여 패턴 3(232)으로 구분된다. Referring to FIG. 2, the cluster 1 211 moves to a higher density region and is divided into a pattern 1 212, a cluster 2 221 moves to a higher density region and is divided into a pattern 2 222, 3 (231) moves to a higher density region and is divided into a pattern 3 (232).

단계(130)에서, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분한다. 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다. In step 130, after extracting the patterns, all data samples are divided into the most similar patterns. Learning the distribution of a plurality of data and moving averaging points using correlation values. Clustering among the vectors with high similarity among the patterns extracted through the learning of the beacon is formed. Clusters are formed, and after each outlier handling, each cluster centroid is extracted using each of the final clusters as a pattern.

도 3은 본 발명의 일 실시예에 따른 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다. FIG. 3 is a diagram for explaining an averaging shift clustering beacon learning using a correlation value according to an embodiment of the present invention. Referring to FIG.

상관값, 다시 말해 상관 거리(Correlation distance)를 이용한 평균점 이동 클러스터링 비지도 학습은 한 사용자의 하루 n개의 전력 사용 값들을 n개의 피처(feature)를 갖는 하나의 벡터로 고려하여 이루어진다. The averaged point clustering based on the correlation value, that is, the correlation distance, is performed by considering n power use values of one user per day as one vector having n features.

도 3을 참조하면, 사용자 M의 하루 N개의 전력 사용 값들과, 각 사용자 L의 하루 K개의 전력 사용 값들과, 사용자 M의 하루 L개의 전력 사용 값들을 하나의 벡터(340)로 나타내었다. 그리고, 벡터의 유사도 측정(similarity measurement)으로 상관값들을 계산하여 평균점 이동 클러스터링을 적용하고, 데이터들의 분포도를 학습하여 유사도가 높은 벡터들끼리 클러스터를 형성한다. 아울리어 핸들링(Outlier handling) 후 최종적인 클러스터들 각각을 하나의 패턴으로 보고 각 클러스터 중심값(cluster centroid)을 패턴으로 추출한다. Referring to FIG. 3, N power usage values per day for user M, K power usage values per day for each user L, and L power usage values per day for user M are shown as one vector 340. Then, the correlation values are calculated by similarity measurement of the vector, and the average moving clustering is applied, and the distribution diagram of the data is learned to form a cluster of vectors having high similarity. After outlier handling, each of the final clusters is represented as a pattern, and each cluster centroid is extracted as a pattern.

상관 거리(Correlation distance)를 이용한 평균점 이동 클러스터링 비지도 학습을 위해 하기 식을 이용하여 상관계수(correlation coefficient) 및 거리 측정(distance measurement)을 계산할 수 있다. We can calculate the correlation coefficient and the distance measurement for the average point clustering non-geographic learning using the correlation distance using the following equation.

Figure pat00010
Figure pat00010

Figure pat00011
Figure pat00011

Figure pat00012
또는
Figure pat00013
는 d길이를 가지는 하나의 벡터 데이터 또는 d차원의 하나의 데이터 포인트로 해석될 수 있으며,
Figure pat00014
Figure pat00015
의 분산 그리고
Figure pat00016
는 두 데이터간의 공분산을 뜻한다. 피어슨 상관계수(
Figure pat00017
)에 기반한 두 데이터 포인트의 거리 함수(
Figure pat00018
)를 이용하여 비유사도를 측정한다.
Figure pat00012
or
Figure pat00013
Can be interpreted as one vector data having a length d or one data point having a dimension d,
Figure pat00014
The
Figure pat00015
And
Figure pat00016
Is the covariance between two data. Pearson correlation coefficient (
Figure pat00017
) Based on the distance function of two data points (
Figure pat00018
).

단계(140)에서, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장한다. 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다. In step 140, the divided patterns are inserted into the data together with the tags and stored. By using the information of the patterns, the existing pattern data is distinguished from the pattern of the newly generated data, the corresponding pattern tag is inserted, and the inserted data is issued to update the existing database or construct a new database.

도 4 및 도 5는 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 과정을 설명하기 위한 도면이다. 4 and 5 are diagrams for explaining a process of storing power data based on a pattern tagging technique according to an embodiment of the present invention.

본 발명의 실시예에 따른 평균점 이동 클러스터링 비지도 학습을 통해 전처리 단계에서 IoT 전력 데이터의 패턴을 자동적으로 파악하고, 데이터를 저장 시 구분된 패턴을 태그와 함께 삽입해 저장하여 추후의 데이터 처리와 관리를 용이하고 효율적이게 할 수 있다. In the preprocessing step, a pattern of IoT power data is automatically detected through learning of average moving clustering busy information according to an embodiment of the present invention, and a pattern is inserted and stored together with a tag when data is stored, Can be made easy and efficient.

도 4를 참조하면, 사용자1(User1)부터 사용자L(UserL)까지의 Day1에서 Day까지에 대하여, 한 사용자의 하루 전력 사용량 그래프(410)를 데이터 세트(400)로 나타내었다. 이러한 데이터 세트에 대하여 비지도 학습을 통한 패턴 구분을 이용하여 파악된 패턴들(420)(pattern1, pattern2, pattern3, pattern4, pattern5, pattern6, ..., patternN)을 나타내었다. Referring to FIG. 4, a daily power consumption graph 410 of one user is shown as a data set 400 from Day 1 to Day from the user 1 (User 1) to the user L (User L). Patterns 420 (pattern1, pattern2, pattern3, pattern4, pattern5, pattern6, ..., patternN) identified using the pattern classification through the non-background learning are shown for these data sets.

마지막으로, 이렇게 구분된 패턴들을 패턴 태그(430)와 함께 데이터에 삽입하여 저장하고, 기존의 데이터 베이스를 업데이트하거나 새로운 데이터(440)를 구축할 수 있다. Finally, the pattern thus classified can be inserted into the data together with the pattern tag 430 and stored, and the existing data base can be updated or the new data 440 can be constructed.

도 5를 참조하면, 전체 데이터 샘플(511)에서 일부분의 데이터를 무작위로 선발(510)하여 비지도 학습을 통해 패턴 추출(521)한다. 패턴 추출 후 전체 데이터 샘플을 알맞은(다시 말해, 유사도가 높은) 패턴으로 구분하고, 구분된 패턴을 태그와 함께 데이터에 삽입(530)하여 패턴 태그(540)를 저장한다. Referring to FIG. 5, a part of data is randomly selected (510) in the entire data sample 511 and pattern extraction 521 is performed through non-feature learning. After extracting the pattern, the entire data sample is divided into a suitable pattern (that is, the similarity is high), and the pattern tag 540 is stored by inserting the divided pattern into the data together with the tag (530).

단계(150)에서, 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화할 수 있다. 삽입된 데이터 태그를 활용하여 전력 사용량 데이터를 시각화하고, 삽입된 데이터 태그를 활용하여 패턴 데이터를 시각화할 수 있다. In step 150, the power usage data and the pattern data can be visualized using the tag of the inserted data. The power consumption data can be visualized using the inserted data tag, and the pattern data can be visualized using the inserted data tag.

도 6은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 시스템의 구성을 나타내는 도면이다. 6 is a diagram illustrating a configuration of a power data storage management system based on a pattern tagging technology according to an embodiment of the present invention.

제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 시스템은 데이터 생성부(610), 데이터 분석부(620) 및 데이터 구조화부(630)를 포함하는 데이터 관리부(600), 데이터 저장부(640) 및 시각화부(650)를 포함한다. The proposed pattern tagging technology based power data storage management system includes a data management unit 600 including a data generation unit 610, a data analysis unit 620 and a data structure unit 630, a data storage unit 640, (650).

데이터 생성부(610)는 전체 데이터 샘플들 중에서 복수의 데이터들을 선발한다. The data generation unit 610 selects a plurality of data from among all the data samples.

데이터 분석부(620)는 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하고, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분한다. The data analyzer 620 extracts patterns by learning an average moving clustering likelihood using a correlation value for a plurality of selected data, extracts the patterns, and divides all data samples into the most similar patterns.

사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다. A plurality of power usage values used by a user for a day are defined as one vector having a plurality of features, and average mobile clustering is applied by calculating a correlation value by measuring similarity of each vector.

그리고, 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다. Then, a distribution diagram of a plurality of data is learned, and vectors having high similarity among patterns extracted through the averaging shift clustering non-degree learning using a correlation value are formed into clusters. Clusters are formed, and after each outlier handling, each cluster centroid is extracted using each of the final clusters as a pattern.

데이터 분석부(620)는 패턴 인식기(621), 패턴 저장기(622) 및 패턴 발행기(623)를 포함한다. The data analyzer 620 includes a pattern recognizer 621, a pattern storage 622, and a pattern issuer 623.

패턴 인식기(621)는 데이터 저장부(640)에 저장된 데이터베이스 별로 정보를 받아 클러스터링 비지도 학습을 통한 패턴 인식 및 추출을 실행한다. The pattern recognizer 621 receives the information for each database stored in the data storage unit 640 and executes pattern recognition and extraction by learning clustering bitmap.

복수의 데이터들에선 무작위로 선발된 데이터를 선택하고, 선택한 데이터를 표준화하는 전처리 과정을 수행한다. 이후 평균 이동 클러스터링을 적용한다. In the plurality of data, randomly selected data is selected and a preprocessing process for standardizing the selected data is performed. Then, average mobile clustering is applied.

패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분한다. 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling)의 후처리를 수행하고, 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.After extracting the patterns, we divide the whole data samples into the most similar patterns. Learning the distribution of a plurality of data and moving averaging points using correlation values. Clustering among the vectors with high similarity among the patterns extracted through the learning of the beacon is formed. Clusters are formed to perform post-processing of outlier handling, and each cluster centroid is extracted using each of the final clusters as one pattern.

패턴 저장기(622)는 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값을 저장한다. 다시 말해, 인식 및 추출된 패턴을 각 데이터 베이스 별로 구분하여 저장한다. The pattern storage unit 622 stores each cluster center value in a pattern of each of the last clusters. In other words, the recognized and extracted patterns are stored separately for each database.

패턴 발행기(623)는 다른 모듈에게 패턴 정보를 제공하기 위해 저장된 패턴을 발행하여 전달한다. The pattern issuer 623 issues and transmits a stored pattern to provide pattern information to other modules.

데이터 구조화부(630)는 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부(640)에 저장하도록 한다. 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다. The data structure unit 630 inserts the divided patterns together with the tags into the data, and stores the inserted patterns in the data storage unit 640. By using the information of the patterns, the existing pattern data is distinguished from the pattern of the newly generated data, the corresponding pattern tag is inserted, and the inserted data is issued to update the existing database or construct a new database.

데이터 구조화부(630)는 데이터 태거(631) 및 태그된 데이터 발행기(632)를 포함한다. The data structure unit 630 includes a data tag 631 and a tagged data issuer 632.

데이터 태거(631)는 전체 데이터를 적절한 패턴으로 분류하여 원본 데이터에 패턴 태그를 삽입한다. 데이터 분석부(620)로부터 전달받은 패턴 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그 삽입한다. The data tagger 631 classifies the entire data into an appropriate pattern and inserts the pattern tag into the original data. Using the pattern information received from the data analysis unit 620, separates the existing data from the newly generated data pattern and inserts the corresponding pattern tag.

태그된 데이터 발행기(632)는 태그를 삽입한 데이터를 발행하고 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스 구축한다. The tagged data issuer 632 issues the tagged data and updates the existing database or builds a new database.

데이터 저장부(640)는 이렇게 생성된 패턴들을 태그와 함께 데이터에 삽입하여 저장한다. The data storage unit 640 inserts the generated patterns together with the tags and stores the inserted data.

시각화부(650)는 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화한다. The visualization unit 650 visualizes the power consumption data and the pattern data using the tag of the inserted data.

시각화부(650)는 데이터 시각화기(651) 및 패턴 시각화기(652)를 포함한다. 데이터 시각화기(651)는 삽입된 데이터 태그를 활용하여 전력 사용량 데이터를 시각화하고, 패턴 시각화기(652)는 삽입된 데이터 태그를 활용하여 패턴 데이터를 시각화할 수 있다. The visualization unit 650 includes a data visualizer 651 and a pattern visualizer 652. The data visualizer 651 visualizes the power consumption data using the inserted data tag, and the pattern visualizer 652 can visualize the pattern data using the inserted data tag.

도 7은 본 발명의 일 실시예에 따른 시각화 과정을 설명하기 위한 도면이다.7 is a view for explaining a visualization process according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 시각화부는 먼저 인식된 전력 사용량 패턴을 그래프로 표기(710)하고, 하나의 데이터 별로 삽입된 패턴을 표기(720)한다. 이후, 각 사용자 및 비즈니스 별로 패턴 분포율을 표기(730)하여 시각화할 수 있다. The visualization unit according to an embodiment of the present invention firstly displays the recognized power usage pattern as a graph 710 and displays the inserted pattern for each data 720. Then, the pattern distribution ratio for each user and business can be displayed (730) and visualized.

IoT 시장은 계속하여 커지고 있으며, 그 중에서도 전력 산업과 관련된 스마트 미터링 기기의 수가 늘어가고 그로 인한 금전적 절약이 예측되었다. 커져가는 IoT 시장과 늘어가는 스마트 미터링 기기의 수에 비례하여 전력 데이터가 기하학적으로 생성되는 환경에서, 에너지 관련 IoT 데이터의 저장, 관리, 처리, 시각화 시장 또한 함께 커지고 있다. 패턴 추출과 구분은 데이터 분석의 기초 단계로써, 관련 기술은 에너지 데이터의 다양한 분석 분야에서 활용이 기대된다. 예를 들면, 사용량 예측, 비정상 이벤트 예측 또는 감지, 누락 데이터 보간, 사용자 분석, 전력 거래, 에너지 관리 등이 있다. 따라서 추출된 패턴 활용에 따른 새로운 비즈니스 모델의 도출 또한 가능하다.The IoT market continues to grow, with a growing number of smart metering devices associated with the power industry and the resulting financial savings. The storage, management, processing, and visualization markets for energy-related IoT data are also growing in an environment where power data is geometrically generated in proportion to the growing IoT market and the growing number of smart metering devices. Pattern extraction and classification are the basic steps of data analysis, and related technologies are expected to be used in various fields of analysis of energy data. Examples include usage forecasting, abnormal event prediction or detection, missing data interpolation, user analysis, power trading, and energy management. Therefore, it is also possible to derive a new business model based on the extracted pattern utilization.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The apparatus described above may be implemented as a hardware component, a software component, and / or a combination of hardware components and software components. For example, the apparatus and components described in the embodiments may be implemented within a computer system, such as, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable array (FPA) A programmable logic unit (PLU), a microprocessor, or any other device capable of executing and responding to instructions. The processing device may execute an operating system (OS) and one or more software applications running on the operating system. The processing device may also access, store, manipulate, process, and generate data in response to execution of the software. For ease of understanding, the processing apparatus may be described as being used singly, but those skilled in the art will recognize that the processing apparatus may have a plurality of processing elements and / As shown in FIG. For example, the processing unit may comprise a plurality of processors or one processor and one controller. Other processing configurations are also possible, such as a parallel processor.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.The software may include a computer program, code, instructions, or a combination of one or more of the foregoing, and may be configured to configure the processing device to operate as desired or to process it collectively or collectively Device can be commanded. The software and / or data may be in the form of any type of machine, component, physical device, virtual equipment, computer storage media, or device As shown in FIG. The software may be distributed over a networked computer system and stored or executed in a distributed manner. The software and data may be stored on one or more computer readable recording media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.  The method according to an embodiment may be implemented in the form of a program command that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like, alone or in combination. The program instructions to be recorded on the medium may be those specially designed and configured for the embodiments or may be available to those skilled in the art of computer software. Examples of computer-readable media include magnetic media such as hard disks, floppy disks and magnetic tape; optical media such as CD-ROMs and DVDs; magnetic media such as floppy disks; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments. For example, it is to be understood that the techniques described may be performed in a different order than the described methods, and / or that components of the described systems, structures, devices, circuits, Lt; / RTI > or equivalents, even if it is replaced or replaced.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.Therefore, other implementations, other embodiments, and equivalents to the claims are also within the scope of the following claims.

Claims (12)

전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계;
상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계;
상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계; 및
상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계
를 포함하는 전력 데이터 저장 관리 방법.
Comprising: selecting a plurality of data from among all data samples;
Extracting patterns by learning an average moving clustering bitmap using a correlation value for the selected plurality of data;
Dividing all data samples into the most similar patterns after extracting the patterns; And
Inserting and storing the divided patterns together with the tags in the data
The power data storage management method comprising:
제1항에 있어서,
상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계는,
사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용하는
전력 데이터 저장 관리 방법.
The method according to claim 1,
The step of extracting patterns by learning the average point moving clustering likelihood using a correlation value for the selected plurality of data,
A plurality of power usage values that a user uses in one day are defined as one vector having a plurality of features, a correlation value is calculated by measuring similarity of each vector, and average mobile clustering is applied
Power data storage management method.
제1항에 있어서,
상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계는,
복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성하는
전력 데이터 저장 관리 방법.
The method according to claim 1,
Dividing the entire data samples into the most similar patterns after extracting the patterns,
Learning the distribution of a plurality of data and moving averaging points using correlation values, vectors having high similarity among the patterns extracted through the learning of non-mapping of clusters form clusters
Power data storage management method.
제3항에 있어서,
상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출하는
전력 데이터 저장 관리 방법.
The method of claim 3,
After forming the clusters and performing outlier handling, each cluster centroid is extracted using each of the final clusters as one pattern
Power data storage management method.
제1항에 있어서,
상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계는,
상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축하는
전력 데이터 저장 관리 방법.
The method according to claim 1,
The step of inserting and storing the divided patterns together with the tags into the data may include:
Using the information of the patterns, it is possible to distinguish patterns of existing data and newly generated data, inserting the corresponding pattern tag, and updating the existing database by issuing the tag-inserted data or building a new database
Power data storage management method.
제1항에 있어서,
삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계
를 더 포함하는 전력 데이터 저장 관리 방법.
The method according to claim 1,
Visualizing power usage data and pattern data using the tags of the inserted data
Further comprising the steps of:
전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 데이터 생성부;
선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하고, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 데이터 분석부; 및
상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부에 저장하도록 하는 데이터 구조화부
를 포함하는 전력 데이터 저장 관리 시스템.
A data generation unit for selecting a plurality of data from all the data samples;
A data analyzer for extracting patterns by learning averaging point clustering non-affinity learning using a correlation value for a plurality of selected data, dividing all data samples into the most similar patterns after extracting the patterns; And
A data structuring unit for inserting the divided patterns together with tags into data and storing the data in a data storage unit,
And the power data storage management system.
제7항에 있어서,
상기 데이터 분석부는,
사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용하는
전력 데이터 저장 관리 시스템.
8. The method of claim 7,
The data analysis unit may include:
A plurality of power usage values that a user uses in one day are defined as one vector having a plurality of features, a correlation value is calculated by measuring similarity of each vector, and average mobile clustering is applied
Power data storage management system.
제7항에 있어서,
상기 데이터 분석부는,
복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성하는
전력 데이터 저장 관리 시스템.
8. The method of claim 7,
The data analysis unit may include:
Learning the distribution of a plurality of data and moving averaging points using correlation values, vectors having high similarity among the patterns extracted through the learning of non-mapping of clusters form clusters
Power data storage management system.
제9항에 있어서,
상기 데이터 분석부는,
상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출하는
전력 데이터 저장 관리 시스템.
10. The method of claim 9,
The data analysis unit may include:
After forming the clusters and performing outlier handling, each cluster centroid is extracted using each of the final clusters as one pattern
Power data storage management system.
제7항에 있어서,
상기 데이터 구조화부는,
상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축하는
전력 데이터 저장 관리 시스템.
8. The method of claim 7,
The data structure unit may include:
Using the information of the patterns, it is possible to distinguish patterns of existing data and newly generated data, inserting the corresponding pattern tag, and updating the existing database by issuing the tag-inserted data or building a new database
Power data storage management system.
제7항에 있어서,
삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 시각화부
를 더 포함하는 전력 데이터 저장 관리 시스템.
8. The method of claim 7,
A visualization unit for visualizing power consumption data and pattern data using tags of the inserted data
The power data storage management system further comprising:
KR1020180012252A 2017-11-03 2018-01-31 Pattern Tagging based Power Data Storing and Management System KR102072901B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170145834 2017-11-03
KR20170145834 2017-11-03

Publications (2)

Publication Number Publication Date
KR20190050682A true KR20190050682A (en) 2019-05-13
KR102072901B1 KR102072901B1 (en) 2020-02-03

Family

ID=66582234

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180012252A KR102072901B1 (en) 2017-11-03 2018-01-31 Pattern Tagging based Power Data Storing and Management System

Country Status (1)

Country Link
KR (1) KR102072901B1 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021107422A1 (en) * 2019-11-28 2021-06-03 한국전자기술연구원 Nonintrusive load monitoring method using energy consumption data
CN113884734A (en) * 2021-10-27 2022-01-04 广东电网有限责任公司 Non-invasive electricity utilization abnormity diagnosis method and device
CN116434425A (en) * 2023-06-09 2023-07-14 国网浙江省电力有限公司营销服务中心 Electricity charge data acquisition method, acquisition equipment and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017156868A (en) 2016-02-29 2017-09-07 株式会社東芝 Behavioral pattern estimation device, behavioral pattern estimation method, and behavioral pattern estimation program

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017156868A (en) 2016-02-29 2017-09-07 株式会社東芝 Behavioral pattern estimation device, behavioral pattern estimation method, and behavioral pattern estimation program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Li Fei-Fei "Lecture 13: k-means and mean-shift clustering" Stanford Vision Lab (2013.10.27.) 1부.* *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021107422A1 (en) * 2019-11-28 2021-06-03 한국전자기술연구원 Nonintrusive load monitoring method using energy consumption data
KR20210066534A (en) * 2019-11-28 2021-06-07 한국전자기술연구원 Method for nonintrusive load monitoring of energy usage data
CN113884734A (en) * 2021-10-27 2022-01-04 广东电网有限责任公司 Non-invasive electricity utilization abnormity diagnosis method and device
CN113884734B (en) * 2021-10-27 2024-04-19 广东电网有限责任公司 Non-invasive electricity consumption abnormality diagnosis method and device
CN116434425A (en) * 2023-06-09 2023-07-14 国网浙江省电力有限公司营销服务中心 Electricity charge data acquisition method, acquisition equipment and storage medium
CN116434425B (en) * 2023-06-09 2023-08-18 国网浙江省电力有限公司营销服务中心 Electricity charge data acquisition method, acquisition equipment and storage medium

Also Published As

Publication number Publication date
KR102072901B1 (en) 2020-02-03

Similar Documents

Publication Publication Date Title
Li et al. Crowded scene analysis: A survey
US9633483B1 (en) System for filtering, segmenting and recognizing objects in unconstrained environments
Fan et al. Wafer defect patterns recognition based on OPTICS and multi-label classification
JP5647627B2 (en) Unusual pattern discovery
JP6888484B2 (en) A search program, a search method, and an information processing device on which the search program operates.
KR102150170B1 (en) Method and System for Power Load Forecasting based on Pattern Tagging
KR102072901B1 (en) Pattern Tagging based Power Data Storing and Management System
CN108959305A (en) A kind of event extraction method and system based on internet big data
CN113986674A (en) Method and device for detecting abnormity of time sequence data and electronic equipment
CN114120138A (en) Method, device, equipment and medium for detecting and identifying remote sensing image target
Richards et al. Clustering and unsupervised classification
CN114925938B (en) Electric energy meter running state prediction method and device based on self-adaptive SVM model
US20230095533A1 (en) Enriched and discriminative convolutional neural network features for pedestrian re-identification and trajectory modeling
CN111626311B (en) Heterogeneous graph data processing method and device
KR102433598B1 (en) A System and Method for Deriving Data Boundary
Belhadi et al. Comparative study on trajectory outlier detection algorithms
Shen et al. An automatic framework for pylon detection by a hierarchical coarse-to-fine segmentation of powerline corridors from UAV LiDAR point clouds
Arase et al. Rethinking task and metrics of instance segmentation on 3D point clouds
Xin et al. Accurate and complete line segment extraction for large-scale point clouds
Kumari et al. An interactive visual analytic tool for semantic classification of 3D urban LiDAR point cloud
Nguyen et al. A method for efficient clustering of spatial data in network space
De Oliveira et al. An optimization-based process mining approach for explainable classification of timed event logs
Manikandan et al. Outlier analysis and Detection using K-medoids with support vector machine
CN112115996B (en) Image data processing method, device, equipment and storage medium
Li et al. Non-rigid 3D shape retrieval based on multi-scale graphical image and joint Bayesian

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant