KR102072901B1

KR102072901B1 - 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템

Info

Publication number: KR102072901B1
Application number: KR1020180012252A
Authority: KR
Inventors: 최준균; 김나경; 오현택
Original assignee: 한국과학기술원
Priority date: 2017-11-03
Filing date: 2018-01-31
Publication date: 2020-02-03
Also published as: KR20190050682A

Abstract

패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템이 제시된다. 본 발명에서 제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계, 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계 및 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계를 포함한다.

Description

패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템{Pattern Tagging based Power Data Storing and Management System}

본 발명은 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템에 관한 것이다.

현재 IoT시장이 폭발적인 성장을 거듭하고 있다. 2015년까지 49억이 넘는 기기들이 설치되었으며, 2020년까지 208억개 정도의 기기가 설치 될 것으로 전망된다.

전력 관련 AMI(Advanced Metering Infrastructure)는 IoT시장의 적지 않은 부분을 차지하고 있다. 2015년도에 미국 내에 배치된 전력 관련 양방향 미터링(advanced meter) 기기의 수가 약 6천 5백만개에 다다르고 있다. 이는 전력 스마트 미터링(smart metering) 기기가 총 배치된 IoT기기들 중 1.32%이상을 차지함을 의미한다. IoT시장에서 존재하는 기기들의 다양성과 미국 내에서 배치된 전력 스마트 미터링 기기의 수만을 포함한 것을 고려하였을 때, 1.32%는 전력 산업이 IoT에서 큰 부분을 차지하고 있음을 나타낸다. IoT기기에 개인 핸드폰, 컴퓨터, 등등이 포함됨을 고려하였을 때 100개의 IoT기기 중 1개가 전력 측정 기기이다.

IoT 데이터는 다수의 센서들로 이루어진 센서 네트워크로부터 빠르고 지속적으로 방대한 양의 데이터가 생성 및 수집된다. 새로운 종류의 데이터로써 그 특성이 기존의 데이터와는 다르다. 생성/수집되는 데이터의 양이 방대하고 비정형이며 스트리밍성이 강하다. 산업과 기기 종류에 따라 분석단계와 관리단계에서 각 데이터의 특성과 어플리케이션 별로 맞춤형 처리 방식이 현재에도 계속하여 사용되고 있다.

기존 IoT 전력 데이터의 저장과 관리에 있어서, 데이터의 특성이 비IoT 데이터들과 다름에도 기존과 같은 방식으로 저장 및 관리되고 있다. 데이터 사용시에 각 산업, 분야, 목적에 따라 특성에 맞는 맞춤형 처리와 분석방법들이 계속하여 연구되어 사용되고 있으나, 데이터를 저장 및 관리 시 IoT 데이터 특성에 맞는 방법과 시스템이 미비하다. 전력 데이터의 경우 수집된 전력 사용량 저장과 관리 시 사용자와 날짜를 기준으로 데이터 값을 시간축으로 하나의 행으로 저장하는 경우가 대부분이다.

기존 데이터 저장 관리 방법에는 다음과 같은 문제점이 있다. 현재 많은 IoT데이터들의 저장 방식들은 데이터를 수집하고, 저장 시 분석 없이 저장 후 추후에 적용하며, 활용 시 분석을 통해 알맞게 사용한다. 비IoT들과는 다르게, 양이 많고 비정형인 스트리밍성이 강한 IoT 데이터들은 비 IoT 데이터와 같은 방식으로 저장하여, 관리 시 검색, 의미 파악, 사용이 어렵고 효율성이 떨어진다. 따라서 IoT에서는 데이터의 실시간 가치가 소멸되기 전에 분석이 수행되어야 하며 데이터가 저장되기 이전에 전처리를 통한 분석이 필요하다.

일본 공개특허공보 특개2017-156868호(2017.09.07.)

본 발명이 이루고자 하는 기술적 과제는 IoT환경에서 계속하여 늘어가는 스마트 미터링 기기와 전력 데이터를 효율적으로 저장하고 관리하기 위한 기술로, 데이터 수집 및 저장 단계에서 전처리 분석을 통해 패턴 태그를 삽입하고, 데이터 사이의 상관 계수를 이용한 평균점 이동 클러스터링 비지도 학습을 통해 자동적으로 데이터의 패턴을 파악하고 데이터를 각 패턴으로 구분해 태그를 삽입하여 저장함으로써 데이터의 검색, 관리, 사용 등을 용이하게 하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법 및 시스템을 제공하는데 있다.

일 측면에 있어서, 본 발명에서 제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계, 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계 및 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계를 포함한다.

상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계는 사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다.

상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계는 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다.

상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.

상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계는 상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다.

또 다른 일 측면에 있어서, 본 발명에서 제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 데이터 생성부, 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하고, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 데이터 분석부, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부에 저장하도록 하는 데이터 구조화부 및 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 시각화부를 포함한다.

상기 데이터 분석부는 사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다.

상기 데이터 분석부는 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다.

상기 데이터 분석부는 상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.

상기 데이터 구조화부는 상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다.

본 발명의 실시예들에 따르면 데이터의 패턴 인식 및 추출은 데이터 분석의 기초 단계로써, 전력 데이터의 여러 적용응용분야에서 전반적으로 널리 사용될 수 있어 다양한 분야에서 활용이 기대된다. 사용량 예측, 전력 거래 모델링, 이상 감지 시스템, 사용자 분석, 에너지 관리 등이 있음.　패턴 태그를 활용한 전력 소비 맞춤 서비스 개발, 관리 개선 시스템 등 여러 서비스 모델이 가능하다.

도 1은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법을 설명하기 위한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.
도 4 및 도 5는 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 과정을 설명하기 위한 도면이다.
도 6은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 시스템의 구성을 나타내는 도면이다.
도 7은 본 발명의 일 실시예에 따른 시각화 과정을 설명하기 위한 도면이다.

연결되는 기기의 수가 늘어감에 따라 IoT 시장은 폭발적인 성장을 거듭하고 있으며, 그 중의 적지 않은 부분을 전력 관련 스마트 미터링이 차지하고 있는 추세이다. 에너지 관련 시장 또한 스마트 시티/IoT와 함께 부각되며 성장 중에 있다.

본 발명의 실시예에 따르면, 커져가는 IoT와 에너지 시장과 늘어가는 스마트 미터링 기기 수에 비례하여 전력 데이터가 기하학적으로 생성되는 환경에서 에너지 관련 IoT 데이터의 저장, 관리, 처리, 시각화 분야에서의 효율성 증진과 비용 감소의 효과 등을 기대할 수 있다.

또한, 현재 IoT와 스마트 빌딩, 카, 시티 등이 각광받는 시점에서 추출된 패턴 활용에 따른 새로운 비즈니스 모델을 도출할 수 있으며 사업화 가능성이 높다.

뿐만 아니라, 전력 데이터를 다루는 전력 관련 기업들과, 스마트 빌딩을 건축하는 건축 관련 기업들, 그리고 IoT 기기를 연구, 개발, 생산하는 IoT 관련 기업들 등 여러 다양한 분야의 기업들에서 적용이 가능하다. 이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법을 설명하기 위한 흐름도이다.

제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 방법은 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계(110), 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계(120), 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계(130), 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장하는 단계(140), 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계(150)를 포함한다.

단계(110)에서, 전체 데이터 샘플들 중에서 복수의 데이터들을 선발한다.

단계(120)에서, 상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출한다.

사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용한다.

도 2는 본 발명의 일 실시예에 따른 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.

본 발명의 실시예에 따른 비지도 학습은 기계 학습의 일종으로 다양한 분야에서 사용되고 있다. 데이터의 분포도나 데이터의 실제 레이블 값을 알지 못할 때, 데이터의 숨어있는 특성과 구조를 파악하기 위해 사용되며, 파악된 중요 특징을 활용하여 데이터의 숨은 패턴들을 찾아 낼 수 있다. 여기서 말하는 패턴이란, 어떠한 공통된 속성을 가지는 데이터들의 그룹이며, 한 패턴 안의 데이터들은 동일할 필요는 없지만 어떠한 기준에서 서로 가장 비슷한 성질을 갖는 데이터들로 이루어진다.

본 발명의 실시예에 따른 평균점 이동(Mean-shift) 클러스터링 비지도 학습은, 각 한 점을 하나의 클러스터(다시 말해, 패턴)로 시작하여 데이터들의 밀도가 높은 곳으로 클러스터들을 이동하여 최종적인 패턴을 구분한다.

평균점 이동 클러스터링 비지도 학습을 위해 하기 식을 이용하여 가우시안 커널 밀도 추정(Gaussian kernel density estimate)을 계산할 수 있다.

여기서,

는 총 N개의 데이터를 포함하는 데이터 셋 중 n번째 즉 하나의 데이터 포인트를 뜻하며,

는 전체 데이터 셋의 분포를 나타낸다. K(t)는 커널 함수를 뜻하며(가우시안의 경우

), 위의 식에서는 가우시안 커널이 사용되었다. σ는 자유 파라미터로써 데이터들의 이동시 이동 반경을 제한하는 파라미터이다. 최종적으로 데이터 셋의 분포 변동이 없어지는 지점(

)까지 계속하여 데이터 포인트 이동 함수의 식(

)을 통하여 각 데이터 포인트(

)들을 이동시켜준다.

도 2를 참조하면 클러스터 1(211)은 밀도가 높은 곳으로 이동하여 패턴 1(212)로 구분되고, 클러스터 2(221)는 밀도가 높은 곳으로 이동하여 패턴 2(222)로 구분되고, 클러스터 3(231)은 밀도가 높은 곳으로 이동하여 패턴 3(232)으로 구분된다.

단계(130)에서, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분한다. 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.

도 3은 본 발명의 일 실시예에 따른 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 설명하기 위한 도면이다.

상관값, 다시 말해 상관 거리(Correlation distance)를 이용한 평균점 이동 클러스터링 비지도 학습은 한 사용자의 하루 n개의 전력 사용 값들을 n개의 피처(feature)를 갖는 하나의 벡터로 고려하여 이루어진다.

도 3을 참조하면, 사용자 M의 하루 N개의 전력 사용 값들과, 각 사용자 L의 하루 K개의 전력 사용 값들과, 사용자 M의 하루 L개의 전력 사용 값들을 하나의 벡터(340)로 나타내었다. 그리고, 벡터의 유사도 측정(similarity measurement)으로 상관값들을 계산하여 평균점 이동 클러스터링을 적용하고, 데이터들의 분포도를 학습하여 유사도가 높은 벡터들끼리 클러스터를 형성한다. 아울리어 핸들링(Outlier handling) 후 최종적인 클러스터들 각각을 하나의 패턴으로 보고 각 클러스터 중심값(cluster centroid)을 패턴으로 추출한다.

상관 거리(Correlation distance)를 이용한 평균점 이동 클러스터링 비지도 학습을 위해 하기 식을 이용하여 상관계수(correlation coefficient) 및 거리 측정(distance measurement)을 계산할 수 있다.

또는

는 d길이를 가지는 하나의 벡터 데이터 또는 d차원의 하나의 데이터 포인트로 해석될 수 있으며,

는

의 분산 그리고

는 두 데이터간의 공분산을 뜻한다. 피어슨 상관계수(

)에 기반한 두 데이터 포인트의 거리 함수(

)를 이용하여 비유사도를 측정한다.

단계(140)에서, 상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 저장한다. 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다.

도 4 및 도 5는 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 과정을 설명하기 위한 도면이다.

본 발명의 실시예에 따른 평균점 이동 클러스터링 비지도 학습을 통해 전처리 단계에서 IoT 전력 데이터의 패턴을 자동적으로 파악하고, 데이터를 저장 시 구분된 패턴을 태그와 함께 삽입해 저장하여 추후의 데이터 처리와 관리를 용이하고 효율적이게 할 수 있다.

도 4를 참조하면, 사용자1(User1)부터 사용자L(UserL)까지의 Day1에서 Day까지에 대하여, 한 사용자의 하루 전력 사용량 그래프(410)를 데이터 세트(400)로 나타내었다. 이러한 데이터 세트에 대하여 비지도 학습을 통한 패턴 구분을 이용하여 파악된 패턴들(420)(pattern1, pattern2, pattern3, pattern4, pattern5, pattern6, ..., patternN)을 나타내었다.

마지막으로, 이렇게 구분된 패턴들을 패턴 태그(430)와 함께 데이터에 삽입하여 저장하고, 기존의 데이터 베이스를 업데이트하거나 새로운 데이터(440)를 구축할 수 있다.

도 5를 참조하면, 전체 데이터 샘플(511)에서 일부분의 데이터를 무작위로 선발(510)하여 비지도 학습을 통해 패턴 추출(521)한다. 패턴 추출 후 전체 데이터 샘플을 알맞은(다시 말해, 유사도가 높은) 패턴으로 구분하고, 구분된 패턴을 태그와 함께 데이터에 삽입(530)하여 패턴 태그(540)를 저장한다.

단계(150)에서, 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화할 수 있다. 삽입된 데이터 태그를 활용하여 전력 사용량 데이터를 시각화하고, 삽입된 데이터 태그를 활용하여 패턴 데이터를 시각화할 수 있다.

도 6은 본 발명의 일 실시예에 따른 패턴 태깅 기술 기반 전력 데이터 저장 관리 시스템의 구성을 나타내는 도면이다.

제안하는 패턴 태깅 기술 기반 전력 데이터 저장 관리 시스템은 데이터 생성부(610), 데이터 분석부(620) 및 데이터 구조화부(630)를 포함하는 데이터 관리부(600), 데이터 저장부(640) 및 시각화부(650)를 포함한다.

데이터 생성부(610)는 전체 데이터 샘플들 중에서 복수의 데이터들을 선발한다.

데이터 분석부(620)는 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하고, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분한다.

그리고, 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.

데이터 분석부(620)는 패턴 인식기(621), 패턴 저장기(622) 및 패턴 발행기(623)를 포함한다.

패턴 인식기(621)는 데이터 저장부(640)에 저장된 데이터베이스 별로 정보를 받아 클러스터링 비지도 학습을 통한 패턴 인식 및 추출을 실행한다.

복수의 데이터들에선 무작위로 선발된 데이터를 선택하고, 선택한 데이터를 표준화하는 전처리 과정을 수행한다. 이후 평균 이동 클러스터링을 적용한다.

패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분한다. 복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 유사도가 높은 벡터들끼리 클러스터들을 형성한다. 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling)의 후처리를 수행하고, 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출한다.

패턴 저장기(622)는 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값을 저장한다. 다시 말해, 인식 및 추출된 패턴을 각 데이터 베이스 별로 구분하여 저장한다.

패턴 발행기(623)는 다른 모듈에게 패턴 정보를 제공하기 위해 저장된 패턴을 발행하여 전달한다.

데이터 구조화부(630)는 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부(640)에 저장하도록 한다. 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축한다.

데이터 구조화부(630)는 데이터 태거(631) 및 태그된 데이터 발행기(632)를 포함한다.

데이터 태거(631)는 전체 데이터를 적절한 패턴으로 분류하여 원본 데이터에 패턴 태그를 삽입한다. 데이터 분석부(620)로부터 전달받은 패턴 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그 삽입한다.

태그된 데이터 발행기(632)는 태그를 삽입한 데이터를 발행하고 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스 구축한다.

데이터 저장부(640)는 이렇게 생성된 패턴들을 태그와 함께 데이터에 삽입하여 저장한다.

시각화부(650)는 삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화한다.

시각화부(650)는 데이터 시각화기(651) 및 패턴 시각화기(652)를 포함한다. 데이터 시각화기(651)는 삽입된 데이터 태그를 활용하여 전력 사용량 데이터를 시각화하고, 패턴 시각화기(652)는 삽입된 데이터 태그를 활용하여 패턴 데이터를 시각화할 수 있다.

도 7은 본 발명의 일 실시예에 따른 시각화 과정을 설명하기 위한 도면이다.

본 발명의 일 실시예에 따른 시각화부는 먼저 인식된 전력 사용량 패턴을 그래프로 표기(710)하고, 하나의 데이터 별로 삽입된 패턴을 표기(720)한다. 이후, 각 사용자 및 비즈니스 별로 패턴 분포율을 표기(730)하여 시각화할 수 있다.

IoT 시장은 계속하여 커지고 있으며, 그 중에서도 전력 산업과 관련된 스마트 미터링 기기의 수가 늘어가고 그로 인한 금전적 절약이 예측되었다. 커져가는 IoT 시장과 늘어가는 스마트 미터링 기기의 수에 비례하여 전력 데이터가 기하학적으로 생성되는 환경에서, 에너지 관련 IoT 데이터의 저장, 관리, 처리, 시각화 시장 또한 함께 커지고 있다. 패턴 추출과 구분은 데이터 분석의 기초 단계로써, 관련 기술은 에너지 데이터의 다양한 분석 분야에서 활용이 기대된다. 예를 들면, 사용량 예측, 비정상 이벤트 예측 또는 감지, 누락 데이터 보간, 사용자 분석, 전력 거래, 에너지 관리 등이 있다. 따라서 추출된 패턴 활용에 따른 새로운 비즈니스 모델의 도출 또한 가능하다.

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.　 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.　 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.　 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.　 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.　 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치에 구체화(embody)될 수 있다.　 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.　 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.　 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.　 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.　 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.　

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.　 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.

그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims

데이터 생성부를 통해 전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 단계;
상기 선발된 복수의 데이터들에 대하여 데이터 분석부에서 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계;
상기 패턴들을 추출한 후 데이터 구조화부를 통해 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계; 및
상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부에 저장하는 단계
를 포함하고,
상기 선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하는 단계는,
사용자가 하루에 이용하는 복수의 데이터들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균점 이동 클러스터링을 적용하며,
평균점 이동 클러스터링 비지도 학습을 위해 가우시안 커널 밀도 추정(Gaussian kernel density estimate)을 계산하고,
데이터들의 평균점 이동 시, 복수의 데이터들을 포함하는 데이터 셋, 데이터 셋의 분포, 커널 함수 및 이동 반경을 제한하는 자유 파라미터를 이용하여 최종적으로 데이터 셋의 분포 변동이 없어지는 지점까지 계속하여 이동하도록 데이터들의 평균점 이동 함수의 식을 통해 각 데이터 평균점을 이동시키는
전력 데이터 저장 관리 방법.
삭제
제1항에 있어서,
상기 패턴들을 추출한 후 데이터 구조화부를 통해 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 단계는,
복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 상관계수에 기반하여 유사도를 측정하고, 측정된 유사도가 미리 정해진 기준 이상인 벡터들끼리 클러스터들을 형성하는
전력 데이터 저장 관리 방법.
제3항에 있어서,
상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출하는
전력 데이터 저장 관리 방법.
제1항에 있어서,
상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부에 저장하는 단계는,
상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축하는
전력 데이터 저장 관리 방법.
제1항에 있어서,
삽입된 데이터의 태그를 활용하여 시각화부를 통해 전력 사용량 데이터 및 패턴 데이터를 시각화하는 단계
를 더 포함하는 전력 데이터 저장 관리 방법.
전체 데이터 샘플들 중에서 복수의 데이터들을 선발하는 데이터 생성부;
선발된 복수의 데이터들에 대하여 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 패턴들을 추출하고, 상기 패턴들을 추출한 후 전체 데이터 샘플들을 가장 유사한 패턴으로 구분하는 데이터 분석부; 및
상기 구분된 패턴들을 태그와 함께 데이터에 삽입하여 데이터 저장부에 저장하도록 하는 데이터 구조화부
를 포함하고,
상기 데이터 분석부는,
사용자가 하루에 이용하는 복수의 전력 사용 값들을 복수의 피처(feature)를 갖는 하나의 벡터로 정의하고, 각 벡터의 유사도 측정으로 상관값을 계산하여 평균 이동 클러스터링을 적용하며,
평균점 이동 클러스터링 비지도 학습을 위해 가우시안 커널 밀도 추정(Gaussian kernel density estimate)을 계산하고,
데이터들의 평균점 이동 시, 복수의 데이터들을 포함하는 데이터 셋, 데이터 셋의 분포, 커널 함수 및 이동 반경을 제한하는 자유 파라미터를 이용하여 최종적으로 데이터 셋의 분포 변동이 없어지는 지점까지 계속하여 이동하도록 데이터들의 평균점 이동 함수의 식을 통해 각 데이터 평균점을 이동시키는
전력 데이터 저장 관리 시스템.
삭제
제7항에 있어서,
상기 데이터 분석부는,
복수의 데이터들의 분포도를 학습하고 상관값을 이용한 평균점 이동 클러스터링 비지도 학습을 통해 추출된 패턴들 중 상관계수에 기반하여 유사도를 측정하고, 측정된 유사도가 미리 정해진 기준 이상인 벡터들끼리 클러스터들을 형성하는
전력 데이터 저장 관리 시스템.
제9항에 있어서,
상기 데이터 분석부는,
상기 클러스터들을 형성하여 아웃리어 핸들링(Outlier handling) 후 최종 클러스터들 각각을 하나의 패턴으로 하여 각각의 클러스터 중심 값(cluster centroid)을 추출하는
전력 데이터 저장 관리 시스템.
제7항에 있어서,
상기 데이터 구조화부는,
상기 패턴들의 정보를 활용하여, 기존의 데이터들과 새로 생성되는 데이터의 패턴을 구분하여 해당 패턴 태그를 삽입하고, 태그를 삽입한 데이터를 발행하여 기존의 데이터 베이스를 업데이트하거나 새로운 데이터 베이스를 구축하는
전력 데이터 저장 관리 시스템.
제7항에 있어서,
삽입된 데이터의 태그를 활용하여 전력 사용량 데이터 및 패턴 데이터를 시각화하는 시각화부
를 더 포함하는 전력 데이터 저장 관리 시스템.