KR101070368B1 - Apparatus for customer clustering using automatic metering data and method thereof - Google Patents

Apparatus for customer clustering using automatic metering data and method thereof Download PDF

Info

Publication number
KR101070368B1
KR101070368B1 KR1020090080069A KR20090080069A KR101070368B1 KR 101070368 B1 KR101070368 B1 KR 101070368B1 KR 1020090080069 A KR1020090080069 A KR 1020090080069A KR 20090080069 A KR20090080069 A KR 20090080069A KR 101070368 B1 KR101070368 B1 KR 101070368B1
Authority
KR
South Korea
Prior art keywords
cluster
daily
clusters
clustering
customer
Prior art date
Application number
KR1020090080069A
Other languages
Korean (ko)
Other versions
KR20110022460A (en
Inventor
김영일
신진호
고종민
송재주
이봉재
Original Assignee
한국전력공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전력공사 filed Critical 한국전력공사
Priority to KR1020090080069A priority Critical patent/KR101070368B1/en
Publication of KR20110022460A publication Critical patent/KR20110022460A/en
Application granted granted Critical
Publication of KR101070368B1 publication Critical patent/KR101070368B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3404Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for parallel or distributed programming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3438Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment monitoring of user actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법에 관한 것으로, 각 고객별로 일정 시간 단위의 전력 사용량을 측정한 검침 데이터를 수집하는 검침 데이터 수집부, 각 고객별로 산출된 일정 시간 단위의 전력 사용량의 평균값으로부터 일일 평균 부하곡선을 생성하는 부하 계산부, 일일 평균 부하곡선을 정규화하는 전처리부, 및 K-means 처리기를 통해 전처리부에 의해 정규화된 일일 평균 부하곡선에 대한 군집화를 수행하여 하나 이상의 군집들을 생성하는 군집화부를 포함하고, 군집화부는 생성된 군집수가 최종 목표 군집수에 도달할 때까지 각 군집의 일일 평균 부하곡선과 각 군집의 일일 평균 부하곡선들로부터 계산된 일일 대표 부하패턴의 오차가 큰 군집을 소규모 군집들로 분할하여, 군집수가 최종 목표 군집수에 도달 시 최종 확정된 군집의 대표 부하 패턴을 생성한다.The present invention relates to a power customer clustering apparatus and method using automatic meter reading data, the meter reading data collection unit for collecting the meter reading data measuring the power consumption of a certain time unit for each customer, a predetermined time unit calculated for each customer The load calculation unit generates a daily average load curve from the average value of power consumption, the preprocessing unit normalizing the daily average load curve, and the clustering of the daily average load curve normalized by the preprocessor through the K-means processor. Clustering unit for generating the above clusters, the clustering unit error of the daily representative load pattern calculated from the daily average load curve of each cluster and the daily average load curve of each cluster until the generated cluster reaches the final target cluster number Divides the larger cluster into smaller clusters, so that cluster reaches the final target cluster To produce a representative load patterns of the last established communities.

Description

자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법{Apparatus for customer clustering using automatic metering data and method thereof}Apparatus for customer clustering using automatic metering data and method

본 발명은 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법에 관한 것으로서, 특히 자동검침 장비가 설치된 전력 고객의 일정 시간 단위의 전력사용량 검침 데이터를 이용하여 고객들을 군집화하고 각 군집에 속한 고객들의 전력사용량을 대표할 수 있는 대표 부하패턴을 생성하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법에 관한 것이다.The present invention relates to a power customer clustering device and a method using the automatic meter reading data, in particular to cluster the customers using the power consumption meter data of a certain time unit of the power customer with the automatic metering equipment is installed and the power of the customers belonging to each cluster The present invention relates to a power customer clustering device using automatic meter reading data that generates a representative load pattern that can represent the amount of usage, and a method thereof.

배전선로의 안정적인 운영을 위해 배전선로의 15분 단위의 부하분석은 중요한 기술중의 하나이다. 배전선로의 15분 단위의 부하분석을 위해서는 선로를 구성하는 회선이나 구간에 대한 15분 단위의 부하곡선이 필요하다.The 15 minute load analysis of distribution lines is one of the important technologies for stable operation of distribution lines. For 15 minute load analysis of the distribution line, a 15 minute load curve for the line or section constituting the line is required.

기존에는 변전소에서 공급하는 회선에 대한 15분 단위 부하를 측정하여 SOMAS(Substation Operatiing results MAnagement System)에 저장하고 회선에 대한 부하분석에 활용하였다. 최근에는 과부하의 위험이 있는 일부 설비에 자동검침 장비를 이용하여 특정 구간에 대한 부하를 분석하는 연구도 진행되고 있다. 그러나 모든 구간에 대한 부하분석을 하고자 하는 경우에는 모든 설비에 자동검침 장비를 설치해야 되므로 비용적인 측면에서 어려움을 갖게 된다. In the past, the 15 minute load on the circuit supplied by the substation was measured and stored in the SOMAS (Substation Operating Results MAnagement System) and used for load analysis on the circuit. Recently, studies have been conducted to analyze the load on a specific section using automatic metering equipment in some facilities that may be overloaded. However, if you want to analyze the load for all sections, you have to install automatic meter reading equipment in every facility, which makes it difficult in terms of cost.

따라서, 자동검침 장비가 설치된 고객의 15분 단위의 부하곡선을 이용하여 고객들을 군집화하고 각 군집별로 대표 부하곡선을 생성하여 자동검침 장비가 설치되지 않은 고객들을 부하형태가 가장 유사할 것으로 예상되는 군집의 대표 부하곡선을 선택하여 월 전기사용량을 대입하여 가상 부하곡선을 만드는 방법이 연구되고 있다. 자동검침 고객들의 실제 부하곡선과 미 검침 고객들의 가상 부하곡선을 이용하면 모든 구간에 대한 부하분석이 가능하게 된다.Therefore, clustering the customers using the load curve of the 15 minute unit of the customer who installed the automatic metering equipment and generating the representative load curve for each cluster, the group that the load type is expected to be the most similar to the customers who do not have the automatic metering equipment. A method of creating a virtual load curve by selecting a representative load curve of and substituting monthly electric consumption has been studied. By using the actual load curves of auto-reading customers and the virtual load curves of non-reading customers, load analysis of all sections is possible.

자동검침 고객의 부하곡선을 군집화하는 방법으로 종래에는 K-means 알고리즘을 이용한 군집화를 주로 사용하였다. K-means 알고리즘은 공간상에 존재하는 데이터를 서로 가까운 데이터들끼리 묶어서 몇 개의 군집으로 나누는 군집화 방법 중 하나로 데이터가 벡터공간을 이룬다고 가정하고, 각각의 묶음에 속하는 점들이 다른 묶음의 중심에서의 유클리디안 거리보다는 자신이 속한 묶음까지의 유클리디안 거리가 최소화 되도록 군집화하여 묶음의 분산도를 최소화하는 방식이다.Automatic metering As a method of clustering the load curve of the customer, the clustering using the K-means algorithm is mainly used. The K-means algorithm is one of the clustering methods in which data existing in space is grouped into adjacent clusters and divided into several clusters. The K-means algorithm assumes that the data form a vector space, and the points belonging to each bundle are determined by It is a method of minimizing the dispersion of bundles by grouping them to minimize the Euclidean distance to their bundle rather than the Euclidean distance.

고객 군집화를 위해 K-means 알고리즘을 이용할 경우, 데이터가 많이 편중된 지역이 중심이 되어 중심에서 먼 지역의 데이터들은 상대적으로 오류가 많이 발생하게 되는 지역편중 현상이 발생하게 된다. 본 발명은 지역편중 현상을 해결하기 위해 부하곡선을 소규모의 군집들로 나누고, 각각의 군집들 중에서 평균오차율이 가장 높은 군집을 선택하여 다시 소규모의 군집들로 나누는 과정을 반복적으로 수행하는 군집화 방법을 통해 지역편중 현상을 최소화하도록 하였다.When using the K-means algorithm for customer clustering, the region biased where the data is heavily centered and the data from the region far from the center are relatively error-prone. The present invention divides the load curve into small clusters in order to solve the regional bias phenomenon, and selects the cluster having the highest average error rate among the clusters and repeatedly divides the cluster into smaller clusters. This aims to minimize local bias.

상기한 목적을 달성하기 위한 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치는, 각 고객별로 일정 시간 단위의 전력 사용량을 측정한 검침 데이터를 수집하는 검침 데이터 수집부, 상기 각 고객별로 산출된 상기 일정 시간 단위의 전력 사용량의 평균값으로부터 일일 평균 부하곡선을 생성하는 부하 계산부, 상기 일일 평균 부하곡선을 정규화하는 전처리부, 및 K-means 처리기를 통해 상기 전처리부에 의해 정규화된 상기 일일 평균 부하곡선에 대한 군집화를 수행하여 하나 이상의 군집들을 생성하는 군집화부를 포함한다.
여기서, 상기 군집화부는 생성된 군집수가 최종 목표 군집수에 도달할 때까지 각 군집의 일일 평균 부하곡선과 상기 각 군집의 일일 평균 부하곡선들로부터 계산된 일일 대표 부하패턴의 오차가 큰 군집을 소규모 군집들로 분할하여, 상기 군집수가 상기 최종 목표 군집수에 도달 시 최종 확정된 군집의 대표 부하패턴을 생성하는 것을 특징으로 한다.
Power customer clustering device using the automatic metering data according to the present invention for achieving the above object, the metering data collection unit for collecting the metering data measuring the power consumption of a predetermined time unit for each customer, calculated for each customer A load calculation unit for generating a daily average load curve from the average value of the power consumption of the predetermined time unit, a preprocessor for normalizing the daily average load curve, and the daily average load normalized by the preprocessor through a K-means processor And a clustering unit for performing clustering on the curve to generate one or more clusters.
Here, the clustering unit may be a small cluster of large clusters having a large error of the daily representative load pattern calculated from the daily average load curve of each cluster and the daily average load curve of each cluster until the generated cluster reaches the final target population. By dividing into two, characterized in that for generating the representative load pattern of the finally confirmed cluster when the cluster number reaches the final target cluster number.

상기 군집화부는 상기 군집을 소규모 군집들로 분할하기 전에, 현재 군집수, 최종 목표 군집수, 소규모 군집들로 분할 시 몇 개의 소규모 군집들로 분할할 것인가를 나타내는 소군집 분할 개수, 및 군집 허용 최소 고객수 중 하나 이상의 정보를 상기 K-means 처리기에서 K-means 알고리즘의 초기값으로 입력하는 것을 특징으로 한다.The clustering unit divides the cluster into small clusters before the current cluster, the final target cluster, and the small clusters indicating how many small clusters to divide into the small clusters, and the minimum number of clusters allowed. One or more pieces of information may be input as an initial value of the K-means algorithm in the K-means processor.

상기 K-means 처리기는 상기 군집을 소규모 군집들로 분할하는 경우, 상기 군집을 상기 K-means 알고리즘의 초기값으로 입력된 상기 소군집 분할 개수만큼 분할하는 것을 특징으로 한다.When the K-means processor divides the cluster into small clusters, the cluster divides the cluster by the number of sub-group divisions input as an initial value of the K-means algorithm.

상기 K-means 처리기는 상기 각 군집에 속한 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 계산하여 일일 대표 부하패턴을 계산하고, 상기 각 군집에 속한 각 고객의 일일 평균 부하곡선과 상기 일일 대표 부하패턴과의 오차로부터 상기 일일 대표 부하패턴의 평균 오차를 계산하는 것을 특징으로 한다.The K-means processor calculates a daily representative load pattern by calculating an average value for the same time of the daily average load curves belonging to each cluster, and calculates the daily average load curve and the daily representative load pattern of each customer belonging to each cluster. The average error of the daily representative load pattern is calculated from an error of and.

상기 군집화부는 군집 허용 최소 고객수 보다 고객수가 많은 군집 중에서 상기 일일 대표 부하패턴의 평균 오차가 가장 큰 군집을 선택하여 소규모 군집들로 분할하는 것을 특징으로 한다.The clustering unit selects a cluster having the largest average error of the daily representative load pattern among clusters having a larger number of customers than the minimum allowable number of customers, and divides the cluster into small clusters.

상기 군집화부는 현재 분할된 군집수가 최종 목표 군집수에 도달하면, 상기 K-means 처리기에 의해 현재까지 분할된 군집을 최종 군집으로 확정하고, 상기 최종 군집의 일일 대표 부하패턴을 최종 대표 부하패턴으로 사용하는 것을 특징으로 한다.When the number of clusters currently divided reaches the final target cluster number, the clustering unit determines the cluster divided up to now by the K-means processor as the final cluster, and uses the daily representative load pattern of the final cluster as the final representative load pattern. Characterized in that.

상기 부하 계산부는 상기 검침 데이터에 근거하여 상기 각 고객에 대한 일정 시간 단위의 일일 부하곡선을 생성하고, 상기 일일 부하곡선에서 동일한 시각에 대한 상기 전력 사용량의 평균값을 계산하는 것을 특징으로 한다.The load calculation unit may generate a daily load curve of a predetermined time unit for each customer based on the meter reading data, and calculate an average value of the power consumption for the same time in the daily load curve.

상기 전처리부는 상기 일일 평균 부하곡선의 최대값이 1이 되도록 정규화하는 것을 특징으로 한다.The preprocessor normalizes the maximum value of the daily average load curve to be 1.

상기 군집을 소규모 군집들로 분할하는 상기 소규모 군집화 수행 정보 및 상기 일일 대표 부하패턴 관련 정보가 저장되는 저장부를 더 포함하는 것을 특징으로 한다.The apparatus may further include a storage unit configured to store the small clustering performance information and the daily representative load pattern related information for dividing the cluster into small clusters.

한편, 상기한 목적을 달성하기 위한 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 방법은, 각 고객별로 일정 시간 단위의 전력 사용량을 측정한 검침 데이터를 수집하여 일정 시간 단위의 전력 사용량의 평균값으로부터 일일 평균 부하곡선을 계산하는 단계, 상기 일일 평균 부하곡선을 정규화하는 단계, K-means 처리기를 통해 상기 정규화된 일일 평균 부하곡선에 대한 군집화를 수행하여 하나 이상의 군집들을 생성하는 단계, 상기 생성하는 단계에서 생성된 군집수가 최종 목표 군집수에 도달할 때까지 각 군집의 일일 평균 부하곡선과 상기 각 군집의 일일 평균 부하곡선들로부터 계산된 일일 대표 부하패턴의 오차가 큰 군집을 소규모 군집들로 분할하는 단계, 및 상기 군집수가 상기 최종 목표 군집수에 도달 시 최종 확정된 군집의 대표 부하 패턴을 생성하는 단계를 포함하는 것을 특징으로 한다.On the other hand, the power customer clustering method using the automatic meter reading data according to the present invention for achieving the above object, by collecting the meter reading data measuring the power consumption of a certain time unit for each customer from the average value of the power consumption of a certain time unit Calculating a daily average load curve, normalizing the daily average load curve, performing clustering on the normalized daily average load curve through a K-means processor, and generating one or more clusters; The clusters are divided into small clusters, each of which has a large difference in the daily average load curve calculated from the daily average load curves of the clusters and the daily average load curves of the clusters, until the clusters generated in the cluster reach the final target clusters. And the cluster of the finalized cluster when the cluster number reaches the final target cluster number. Characterized in that it comprises a step of generating a load pattern.

상기 소규모 군집들로 분할하는 단계 이전에, 현재 군집수, 최종 목표 군집수, 소규모 군집들로 분할 시 몇 개의 소규모 군집들로 분할할 것인가를 나타내는 소군집 분할 개수, 군집 허용 최소 고객수 중 하나 이상의 정보를 상기 K-means 처리기에서 K-means 알고리즘의 초기값으로 입력하는 단계를 더 포함하는 것을 특징으로 한다.Prior to the step of dividing into small clusters, one or more of the current number of clusters, the final target number of clusters, the number of small clusters indicating the number of small clusters to divide into small clusters, the minimum number of clusters allowed And inputting information as an initial value of a K-means algorithm in the K-means processor.

상기 소규모 군집들로 분할하는 단계는, 상기 군집을 상기 K-means 알고리즘의 초기값으로 입력된 상기 소군집 분할 개수만큼 분할하는 것을 특징으로 한다.The dividing into small clusters may be performed by dividing the cluster by the number of subgroup divisions input as an initial value of the K-means algorithm.

상기 소규모 군집들로 분할하는 단계는, 상기 각 군집에 속한 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 계산하여 상기 일일 대표 부하패턴을 계산하는 단계, 및 상기 각 군집에 속한 각 고객의 일일 평균 부하곡선과 상기 일일 대표 부하패턴과의 오차로부터 상기 일일 대표 부하패턴의 평균 오차를 계산하는 단계를 포함하는 것을 특징으로 한다.The dividing into small clusters may include calculating a daily representative load pattern by calculating an average value for the same time of the daily average load curves belonging to each cluster, and a daily average load of each customer belonging to each cluster. And calculating an average error of the daily representative load pattern from an error between the curve and the daily representative load pattern.

상기 소규모 군집들로 분할하는 단계 수행 시, 군집 허용 최소 고객수보다 고객수가 많은 군집 중에서 상기 일일 대표 부하패턴의 평균 오차가 가장 큰 군집을 선택하여 상기 K-means 처리기로 전달하는 단계를 더 포함하는 것을 특징으로 한다.When performing the dividing into small clusters, selecting a cluster having the largest average error of the daily representative load pattern among the clusters having more customers than the minimum number of customers allowed for the cluster, and transmitting the cluster to the K-means processor. It is characterized by.

상기 대표 부하패턴을 생성하는 단계는, 현재 분할된 군집수가 상기 최종 목표 군집수에 도달하면, 상기 K-means 처리기에 의해 현재까지 분할된 군집을 최종 군집으로 확정하고, 각 군집의 일일 대표 부하패턴을 최종 대표 부하패턴으로 확정하는 단계를 더 포함하는 것을 특징으로 한다.In the generating of the representative load pattern, when the number of clusters currently divided reaches the final target population, the cluster divided so far by the K-means processor is determined as the final cluster, and the daily representative load pattern of each cluster is determined. The method may further include determining a final representative load pattern.

상기 계산하는 단계에서, 상기 검침 데이터에 근거하여 상기 각 고객에 대한 일정 시간 단위의 일일 부하곡선을 생성하는 단계를 포함하는 것을 특징으로 한다.In the calculating step, generating a daily load curve of a predetermined time unit for each customer based on the meter reading data.

상기 정규화하는 단계는 상기 일일 평균 부하곡선의 최대값이 1이 되도록 정규화하는 것을 특징으로 한다.The normalizing may be performed such that the maximum value of the daily average load curve is 1.

본 발명은 종래의 K-means 알고리즘을 이용한 고객 군집화 기술에서 나타나는 지역편중 현상을 해결하기 위해 부하곡선을 소규모의 군집들로 나누고, 각각의 군집들 중에서 평균오차율이 가장 높은 군집을 선택하여 다시 소규모의 군집들로 나누는 과정을 반복적으로 수행하는 군집화 방법을 통해 지역편중 현상을 최소화하는 효과가 있다.The present invention divides the load curve into small clusters to solve the regional bias phenomenon in the customer clustering technique using the conventional K-means algorithm, selects the cluster with the highest mean error rate among each cluster, The clustering method that performs the process of dividing into clusters repeatedly has the effect of minimizing local bias.

또한, 본 발명은 고객 군집화의 지역편중 현상을 최소화함으로써, 일일 대표 부하패턴의 정확도를 높여 기존의 방법에 비해 부하예측을 통한 부하분석 단계의 정확도를 향상시키는 이점이 있다.In addition, the present invention has the advantage of improving the accuracy of the load analysis step through the load prediction compared to the conventional method by increasing the accuracy of the daily representative load pattern by minimizing the regional bias of the customer clustering.

또한, 본 발명은 고객의 일일 평균 부하곡선을 이용하여 고객에 대한 군집화를 수행하는 경우에 K-means 알고리즘만을 이용하여 군집화를 수행할 경우에 발생하는 지역편중 현상을 줄일 수 있도록 하나의 군집을 소규모의 군집으로 나누고, 평균 오차가 큰 군집을 선택하여 소규모 군집으로 나누는 작업을 반복적으로 수행하는 군집화 시스템 및 방법을 제안하고 있다. 본 발명을 활용할 경우 군집화를 통해 얻어지는 일일 대표 부하패턴의 분별력이 높아지게 되어 배전선로의 부하분석에 있어서 보다 정확한 분석 결과를 얻을 수 있는 이점이 있다.In addition, the present invention is a small cluster to reduce the local bias occurring when performing clustering using only the K-means algorithm when performing the clustering of the customer using the daily average load curve of the customer We propose a clustering system and method for selecting a cluster having a large average error and repeatedly dividing the cluster into small clusters. If the present invention is utilized, the discrimination power of the daily representative load pattern obtained through clustering is increased, and thus, there is an advantage that a more accurate analysis result can be obtained in load analysis of a distribution line.

이하, 첨부된 도면을 참조하여 본 발명의 실시예를 설명한다.Hereinafter, with reference to the accompanying drawings will be described an embodiment of the present invention.

본 발명에서는 자동검침 고객의 부하곡선을 군집화하는 방법으로, K-means 알고리즘을 이용한 군집화 방법의 지역편중 현상을 해결하고자 하나의 군집을 소규모의 군집들로 나누고, 각각의 군집들 중에서 평균 오차율이 가장 높은 군집을 다시 소규모의 군집으로 나누는 과정을 반복적으로 수행하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법을 제안한다.In the present invention, as a method for clustering the load curve of the automatic meter reading customer, in order to solve the regional bias phenomenon of the clustering method using the K-means algorithm, one cluster is divided into small clusters, and the average error rate is the most among the clusters. An apparatus and method for clustering electric power customers using automatic meter reading data which repeatedly performs a process of dividing a high cluster into smaller clusters are proposed.

도 1은 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치의 구성을 설명하는데 참조되는 도이다. 도 1에 도시된 바와 같이, 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치는, 검침 데이터 수집부(10), 부하 계산부(20), 전처리부(30), 메인 제어부(40), 군집화부(50), 및 저장부(60)를 포함 한다.1 is a diagram referred to explain the configuration of a power customer clustering apparatus using automatic meter reading data according to the present invention. As shown in FIG. 1, the power customer clustering apparatus using the automatic meter reading data according to the present invention includes a meter reading data collector 10, a load calculator 20, a preprocessor 30, a main controller 40, Clustering unit 50, and the storage unit 60.

검침 데이터 수집부(10)는 자동검침 장비가 설치된 고객들로부터 사용 전력을 수집한다. 이때, 검침 데이터 수집부(10)는 일정시간 단위로 사용전력을 수집하게 되는데, 15분 단위로 사용전력을 수집하는 것이 바람직하다. 따라서, 이하의 설명에서는 15분 단위로 사용전력을 수집한 예를 중점으로 하여 설명하나, 이에 한정되는 것은 아니다. The meter reading data collection unit 10 collects the power used from the customers with the automatic meter reading equipment installed. At this time, the meter reading data collection unit 10 collects the power used in a predetermined time unit, it is preferable to collect the power used in units of 15 minutes. Therefore, the following description focuses on an example in which power usage is collected every 15 minutes, but is not limited thereto.

검침 데이터 수집부(10)에 의해 수집된 검침 데이터는 저장부(60)에 저장된다.The meter reading data collected by the meter reading data collection unit 10 is stored in the storage unit 60.

부하 계산부(20)는 검침 데이터 수집부(10)에 의해 수집된 15분 단위별의 검침 데이터를 이용하여 각 고객에 대한 일일 부하곡선을 생성한다. 또한, 부하 계산부(20)는 하루 단위로 생성된 일일 부하곡선을 이용하여, 월 단위로 동일한 시각에 대한 일정시간 단위의 전력 사용량의 평균값을 계산한다. 이때, 부하 계산부(20)는 계산된 전력 사용량의 평균값을 이용하여 일일 평균 부하곡선을 생성한다.The load calculator 20 generates a daily load curve for each customer by using the meter data for each 15 minutes collected by the meter data collector 10. In addition, the load calculation unit 20 calculates an average value of power consumption of a predetermined time unit for the same time on a monthly basis by using a daily load curve generated in units of one day. In this case, the load calculator 20 generates a daily average load curve by using the average value of the calculated power usage.

부하 계산부(20)에 의해 생성된 일일 부하곡선, 일정시간 단위의 전력 사용량의 평균값, 일일 평균 부하곡선 등은 저장부(60)에 저장한다.The daily load curve generated by the load calculation unit 20, the average value of power consumption in a predetermined time unit, the daily average load curve, and the like are stored in the storage unit 60.

메인 제어부(40)는 각 부의 동작을 제어하며, 저장부(60)에 저장된 데이터를 관리한다.The main controller 40 controls the operation of each unit and manages data stored in the storage unit 60.

전처리부(30)는 군집화를 수행하기 전, 검침 데이터 수집부(10)에 의해 검침 데이터에 대한 전처리를 수행하는 수단이다. 이때, 전처리부(30)는 각 곡선의 전력 사용량에 따른 그래프의 변량을 최소화하기 위해, 부하 계산부(20)에 의해 계산된 각 고객의 일일 평균 부하곡선을 최대값이 일정 이하가 되도록 정규화한다. 여기서, 전처리부(30)는 일일 평균 부하곡선의 최대값이 '1' 이하가 되도록 정규화하는 것이 바람직하다.The preprocessing unit 30 is a means for performing preprocessing on the metering data by the metering data collection unit 10 before performing clustering. At this time, the preprocessor 30 normalizes the daily average load curve of each customer calculated by the load calculation unit 20 so that the maximum value is less than or equal to a certain value in order to minimize the variation of the graph according to the power consumption of each curve. . Here, it is preferable that the preprocessor 30 normalizes the maximum value of the daily average load curve to be '1' or less.

전처리부(30)에 의해 일일 평균 부하곡선의 전처리가 완료되면, 메인 제어부(40)는 군집화부(50)에 의해 군집화가 수행되도록 한다.When the preprocessing of the daily average load curve is completed by the preprocessing unit 30, the main control unit 40 allows the clustering unit 50 to perform clustering.

따라서, 군집화부(50)는 수집된 검침 데이터에 대한 군집화를 수행하기 전, 군집과 최종 목표 군집수, 소군집 분할 개수, 군집 허용 최소 고객수 등의 정보를 입력받는다.Therefore, the clustering unit 50 receives information such as the number of clusters and the final target clusters, the number of subgroup divisions, the number of cluster allowable minimum customers, and the like before performing clustering on the collected meter reading data.

여기서, 최종 목표 군집수는 입력받은 군집을 최종적으로 몇 개의 군집으로 만들 것인가를 나타내는 값이다. 또한, 소군집 분할 개수는 하나의 군집을 K-means 처리기(55)로 군집화할 때 몇 개의 소규모 군집으로 분할할 것인가를 나타내는 값이다. 또한, 군집 허용 최소 고객수는 하나의 군집을 소규모 군집으로 분할하고자 하는 경우, 해당 군집에 최소한으로 존재하는 고객의 수를 나타내는 값이다. Here, the final target cluster number is a value indicating how many clusters the input clusters will finally be made. In addition, the small group division number is a value indicating how many small clusters to divide when one cluster is clustered by the K-means processor 55. In addition, the minimum number of cluster allowable customers is a value indicating the number of minimum customers present in the cluster when a cluster is to be divided into small clusters.

이때, 고객의 수가 군집 허용 최소 고객수 보다 적은 경우에는 군집의 분할을 허용하지 않는다. In this case, if the number of customers is smaller than the minimum number of clusters allowed, the division of the cluster is not allowed.

군집과 최종 목표 군집수, 소군집 분할 개수, 군집 허용 최소 고객수 등의 정보는 사용자에 의해 수동으로 입력받을 수 있으나, 검침 데이터 수집부(10)에 의해 수집된 정보에 근거하여 획득할 수도 있다. 물론, 검침 데이터 수집부(10)가 검침 데이터를 수집하는 과정에서 별도의 정보를 수집할 수도 있다.Information such as the number of clusters, the final target population, the number of subgroup divisions, the minimum number of clusters allowed, and the like may be manually input by the user, but may be acquired based on the information collected by the meter reading data collection unit 10. . Of course, the meter reading data collection unit 10 may collect additional information in the process of collecting the meter data.

이와 같이, 군집과 최종 목표 군집수, 소군집 분할 개수, 군집 허용 최소 고객수 등의 정보를 입력받는 방법은 다양하게 적용 가능하다.As such, the method of receiving information such as the number of clusters and the final target clusters, the number of subgroup divisions, the minimum number of clusters allowed, and the like may be variously applied.

군집과 최종 목표 군집수, 소군집 분할 개수, 군집 허용 최소 고객수 등의 정보는 K-means 처리기(55)에서 K-means 알고리즘의 입력값이 된다. 물론, 최종 목표 군집수, 소군집 분할 개수, 군집 허용 최소 고객수 등의 정보는 군집화가 반복적으로 수행되는 동안 그 값이 변경될 수 있다.Information such as the number of clusters, the final target population, the number of subgroup divisions, the minimum number of clusters allowed, and the like are input values of the K-means algorithm in the K-means processor 55. Of course, the information such as the final target population, the number of subgroup divisions, the minimum number of clusters allowed, and the like may be changed while clustering is repeatedly performed.

이후, 군집화부(50)는 K-means 처리기(55)를 이용하여 하나의 군집에 속한 일일 평균 부하곡선들을 소규모의 군집으로 분할한다.Thereafter, the clustering unit 50 divides the daily average load curves belonging to one cluster into small clusters by using the K-means processor 55.

도 1에서 K-means 처리기(55)는 군집화부 내부에 구비된 것으로 도시하였으나, 이에 한정되는 것은 아니며, 군집화부(50)와 별도로 구비될 수도 있다.In FIG. 1, the K-means processor 55 is illustrated as being provided inside the clustering unit, but is not limited thereto and may be provided separately from the clustering unit 50.

K-means 처리기(55)는 K-means 알고리즘을 이용하여 소군집 분할 개수만큼 소규모 군집화를 수행하게 된다. K-means 처리기(55)는 각 군집에 속한 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 계산하고, 계산된 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 이용하여 15분 단위의 전력사용량을 대표할 수 있는 일일 대표 부하패턴을 계산한다.The K-means processor 55 performs a small clustering by the number of subgroup divisions using the K-means algorithm. The K-means processor 55 calculates an average value for the same time of the daily average load curves belonging to each cluster, and represents a power consumption of 15 minutes using the calculated average value for the same time of the daily average load curves. Compute the daily representative load pattern that can be calculated.

또한, K-means 처리기(55)는 군집에 속한 각 고객의 일일 평균 부하곡선과 일일 대표 부하패턴과의 15분 단위의 오차를 계산하여, 일일 대표 부하패턴의 평균 오차를 계산하게 된다.In addition, the K-means processor 55 calculates an error of 15 minutes between the daily average load curve and the daily representative load pattern of each customer in the cluster, and calculates the average error of the daily representative load pattern.

군집화부(50)는 반복적으로 군집화를 수행한다. 이때, 군집화부(50)는 현재 분할되어 있는 군집의 수가 최종 목표 군집의 수와 동일하게 될 때까지 K-means 처리기(55)를 이용하여 반복적으로 군집화를 수행한다. 군집화부(50)는 반복적인 군집화를 통해 현재 분할된 군집의 수가 최종 목표 군집수와 동일하게 되면 최종 목표 군집수 만큼의 일일 대표 부하패턴의 생성을 완료한다.The clustering unit 50 repeatedly performs clustering. At this time, the clustering unit 50 repeatedly clusters using the K-means processor 55 until the number of clusters currently divided becomes equal to the number of final target clusters. The clustering unit 50 completes generation of daily representative load patterns as many as the final target cluster when the number of currently divided clusters is equal to the final target cluster through repetitive clustering.

즉, 현재 분할된 군집의 수가 최종 목표 군집수와 동일하게 되면, 군집화부(50)는 현재까지 분할된 군집을 최종 군집으로 확정하고, 각 군집의 일일 대표 부하패턴을 최종 대표 패턴으로 사용한다.That is, when the number of clusters currently divided is equal to the final target cluster number, the clustering unit 50 determines the clusters thus far divided into final clusters and uses the daily representative load pattern of each cluster as the final representative pattern.

반면, 현재 분할되어 있는 군집의 수가 최종 목표 군집의 수보다 적은 경우, 군집화부(50)는 군집의 고객수가 군집의 분할 허용 최소 고객수 보다 많은 군집 중에서 일일 대표 부하패턴의 평균 오차가 가장 큰 군집을 선택하여 K-means 처리기(55)를 이용하여 소규모 군집화를 수행하게 된다.On the other hand, if the number of clusters that are currently divided is smaller than the final target cluster, the clustering unit 50 clusters having the largest average error of the daily representative load pattern among the clusters in which the number of customers in the cluster is larger than the minimum allowable number of clients in the cluster. By selecting the small-scale clustering using the K-means processor 55.

이와 같은 방법으로, K-means 알고리즘의 지역편중 현상을 해결하기 위해 일일 평균 부하곡선을 소규모의 군집들로 나누고, 각각의 군집들 중에서 대표 부하패턴과의 오차율이 높은 군집을 선택하여 다시 소규모의 군집들로 나누는 과정을 반복적으로 수행하는 군집화 방법을 통해 지역편중 현상을 줄이고, 보다 분별력이 높은 일일 대표 부하패턴을 구할 수 있게 된다.In this way, in order to solve the regional bias of the K-means algorithm, the daily average load curve is divided into small clusters, and among the clusters, a cluster having a high error rate with the representative load pattern is selected again. The clustering method, which performs the process of dividing the group into multiple groups, can reduce the regional bias and obtain a more discreet daily representative load pattern.

상기와 같이 구성되는 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치의 동작 절차를 설명하면 다음과 같다.The operation procedure of the power customer clustering device using the automatic meter reading data according to the present invention configured as described above is as follows.

도 2 는 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 방법에 대한 동작 흐름을 도시한 순서도이다.2 is a flow chart illustrating an operation flow for a power customer clustering method using automatic meter reading data according to the present invention.

도 2를 참조하면, 먼저 검침 데이터 수집부(10)는 15분 단위를 기준으로 하여, 자동으로 각 고객의 검침 데이터를 수집한다(S100).Referring to FIG. 2, first, the meter reading data collecting unit 10 automatically collects meter reading data of each customer based on a 15 minute unit (S100).

부하 계산부(20)는 'S100' 과정에서 수집된 검침 데이터를 이용하여 일일 부하곡선을 생성하고(S110), 월 단위로 동일한 시각에 대한 일정시간 단위의 전력 사용량의 평균값을 계산하여 일일 평균 부하곡선을 생성한다(S120).The load calculation unit 20 generates a daily load curve by using the metering data collected in the 'S100' process (S110), and calculates an average value of power consumption of a certain time unit for the same time on a monthly basis to calculate the daily average load. Generate a curve (S120).

전처리부(30)는 'S120' 과정에서 생성된 각 고객별 일일 평균 부하곡선을 최대값이 '1' 이하가 되도록 정규화한다(S130)The preprocessing unit 30 normalizes the daily average load curve for each customer generated in the 'S120' process so that the maximum value is '1' or less (S130).

이후, K-means 처리기(55)는 군집과 최종 목표 군집수, 소군집 분할 개수, 군집 허용 최소 고객수 등의 정보가 K-means 알고리즘의 초기값으로 입력되면(S140), 현재 분할된 군집수와 최종의 목표 군집수를 비교하여, 현재 분할된 군집수가 목표 군집수와 동일한지를 확인한다(S150).Then, the K-means processor 55, if information such as the number of clusters, the final target clusters, the number of subgroup divisions, the minimum number of cluster allowances is input as an initial value of the K-means algorithm (S140), the number of clusters currently divided The final target clusters are compared with the final target clusters to determine whether the currently divided clusters are the same as the target clusters (S150).

만일, 'S150' 과정에서, 현재 분할된 군집수가 목표 군집수 미만이면, 군집화부(50)는 군집의 고객수가 군집의 분할 허용 최소 고객수 보다 많은 군집 중에서 평균 오차가 가장 큰 군집을 선택하여 K-means 처리기(55)로 전달한다(S160, S170).If, in the process 'S150', the number of divided clusters is less than the target number of clusters, the clustering unit 50 selects a cluster having the largest mean error among clusters where the number of customers in the cluster is larger than the minimum number of allowable customers in the cluster. -means processor 55 passes (S160, S170).

이때, K-means 처리기(55)는 K-means 알고리즘을 이용하여 하나의 군집에 속한 일일 평균 부하곡선들을 소규모의 군집으로 분할한다(S180).At this time, the K-means processor 55 divides the daily average load curves belonging to one cluster into small clusters by using the K-means algorithm (S180).

이후, K-means 처리기(55)는 각 군집에 속한 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 계산하고, 계산된 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 이용하여 일일 대표 부하패턴을 계산한다(S190).Thereafter, the K-means processor 55 calculates an average value for the same time of the daily average load curves belonging to each cluster, and calculates a daily representative load pattern using the calculated average value for the same time of the daily average load curves. (S190).

또한, K-means 처리기(55)는 군집에 속한 각 고객의 일일 평균 부하곡선과 일일 대표 부하패턴과의 15분 단위의 오차를 계산하여, 일일 대표 부하패턴의 평균 오차를 계산하게 된다(S200).In addition, the K-means processor 55 calculates an error of 15 minutes between the daily average load curve and the daily representative load pattern of each customer belonging to the cluster, and calculates the average error of the daily representative load pattern (S200). .

여기서, 'S150' 내지 'S200' 과정은, 현재 분할된 군집수가 목표 군집수와 동일하게 될 때까지 반복하여 수행된다.Here, the process 'S150' to 'S200' is repeatedly performed until the currently divided cluster number becomes equal to the target cluster number.

한편, 'S150' 과정에서, 현재 분할된 군집수가 목표 군집수와 동일하게 되면, 군집화부(50)는 최종적으로 'S190' 과정의 일일 대표 부하패턴을 최종적인 일일 대표 부하패턴으로 확정함으로써, 최종 목표 군집수 만큼의 일일 대표 부하패턴을 생성을 완료하게 된다.On the other hand, in the 'S150' process, if the current divided cluster number equals the target cluster number, the clustering unit 50 finally finalizes the daily representative load pattern of the 'S190' process as the final daily representative load pattern, The daily representative load pattern as many as the target cluster is completed.

도 3 및 도 5는 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법의 동작 설명에 참조되는 실시예를 나타낸 것이다.3 and 5 illustrate an embodiment referred to in the description of the operation of the power customer clustering apparatus and method using automatic meter reading data according to the present invention.

먼저, 도 3은 군집화부에 의해서 하나의 군집이 소규모 군집으로 분할되는 예를 나타낸 것이다. 여기서, 소군집 분할 개수는 3, 최종 목표 군집수는 10인 것 을 예로 한다.First, FIG. 3 shows an example in which one cluster is divided into small clusters by the clustering unit. Here, it is assumed that the number of subgroup divisions is 3 and the final target group number is 10.

도 3을 참조하면, 군집화부(50)는 전처리부(30)에 의해 정규화된 일일 평균 부하곡선을 K-means 처리기(55)를 통해 세 개의 군집 A, B, C로 분할한다.Referring to FIG. 3, the clustering unit 50 divides the daily average load curve normalized by the preprocessor 30 into three clusters A, B, and C through the K-means processor 55.

군집화부(50)는 분할된 세 개의 군집 A, B, C 중에서 오차가 가장 큰 군집 A를 선택하여 K-means 처리기(55)를 통해 다시 세 개의 군집 Aa1, Aa2, Aa3으로 분할하여 총 다섯 개의 군집 Aa1, Aa2, Aa3, B, C를 형성한다. 이때, K-means 처리기(55)는 군집에 속한 각 고객의 일일 평균 부하곡선과 일일 대표 부하패턴과의 15분 단위의 오차를 계산하여 일일 대표 부하패턴의 평균 오차를 계산한다.The clustering unit 50 selects the cluster A having the largest error among the three clusters A, B, and C divided into three clusters Aa1, Aa2, and Aa3 through the K-means processor 55, and then divides the total five. The colonies Aa1, Aa2, Aa3, B, C. In this case, the K-means processor 55 calculates an error of 15 minutes between the daily average load curve and the daily representative load pattern of each customer in the cluster to calculate the average error of the daily representative load pattern.

현재 분할된 군집수는 총 다섯 개로 아직 최종 목표 군집수에는 도달하지 못하였으므로, 다시 일일 대표 부하패턴의 평균 오차가 가장 큰 군집 Aa3을 선택하여 K-means 처리기(55)를 통해 세 개의 군집 Aab1, Aab2, Aab3으로 분할한다. 따라서, 현재 총 일곱 개의 군집 Aa1, Aa2, Aab1, Aab2, Aab3, B, C를 형성하게 된다.Currently, the total number of divided clusters has not been reached yet, so the final target cluster has not been reached yet. Therefore, the cluster Aa3 having the largest average error of the daily representative load pattern is selected again, and the three clusters Aab1, Split into Aab2, Aab3. Thus, a total of seven clusters Aa1, Aa2, Aab1, Aab2, Aab3, B, and C are currently formed.

마찬가지로 아직 최종 목표 군집수에는 도달하지 못하였으므로, 군집화부(50)는 군집 Aa1, Aa2, Aab1, Aab2, Aab3, B, C 중 오차가 가장 큰 군집인 Aa1을 K-means 처리기(55)를 통해 세 개의 군집 Aac1, Aac2, Aac3으로 분할한다. 따라서, 현재 총 아홉 개의 군집 Aac1, Aac2, Aac3, Aa2, Aab1, Aab2, Aab3, B, C를 형성하게 된다.Similarly, since the final target population has not been reached yet, the clustering unit 50 uses the K-means processor 55 to select Aa1, which is the largest error among the clusters Aa1, Aa2, Aab1, Aab2, Aab3, B, and C. Divide into three clusters, Aac1, Aac2, and Aac3. Thus, a total of nine colonies Aac1, Aac2, Aac3, Aa2, Aab1, Aab2, Aab3, B, and C are currently formed.

또한, 군집화부(50)는 총 아홉 개의 군집 Aac1, Aac2, Aac3, Aa2, Aab1, Aab2, Aab3, B, C 중 오차가 가장 큰 군집인 C를 K-means 처리기(55)를 통해 두 개의 군집 Cd1, Cd2로 분할한다. 이때, 최종 목표 군집수는 총 10개이므로, 군집 C는 두 개의 군집으로 분할하도록 한다.In addition, the clustering unit (50) is a group of the nine largest clusters Aac1, Aac2, Aac3, Aa2, Aab1, Aab2, Aab3, B, C, the largest error of the two clusters through the K-means processor 55 It divides into Cd1 and Cd2. In this case, since the final target population is a total of 10, cluster C is divided into two clusters.

따라서, 열 개의 군집 Aac1, Aac2, Aac3, Aa2, Aab1, Aab2, Aab3, B, Cd1, Cd2가 최종 대표 부하패턴으로 확정되게 된다.Therefore, ten clusters Aac1, Aac2, Aac3, Aa2, Aab1, Aab2, Aab3, B, Cd1, and Cd2 are determined as final representative load patterns.

도 4 및 도 5는 최종 확정된 대표 부하패턴의 실시예를 나타낸 것으로, 도 4는 기존의 K-means 알고리즘만을 이용하여 군집화한 일일 대표 부하패턴을 나타낸 것이고, 도 5는 본 발명에 따른 군집화부에서 반복적으로 소규모 군집으로 분할함으로써 군집화한 일일 대표 부하패턴을 나타낸 것이다.4 and 5 show an embodiment of the final representative representative load pattern, Figure 4 shows a daily representative load pattern clustered using only the existing K-means algorithm, Figure 5 is a clustering unit according to the present invention Shows the daily representative load pattern clustered by repeatedly dividing into smaller clusters.

먼저, 도 4에는 총 10개의 그래프가 도시되어 있으며, 하나의 그래프는 하나의 군집을 나타낸다. 각 그래프에서 M은 군집에 속한 각 고객의 일일 평균 부하곡선을 나타내고, N은 군집의 일일 대표 부하패턴을 나타낸다.First, a total of 10 graphs are shown in FIG. 4, and one graph represents one cluster. In each graph, M represents the daily average load curve of each customer in the cluster, and N represents the daily representative load pattern of the cluster.

도 4를 참조하여 각 군집의 일일 대표 부하패턴을 살펴보면, 도 4에서 TLP(Typical Load Profile) 1 내지 TLP 10 중에서 TLP 2, TLP 5, TLP 6, TLP 9에서 지역편중 현상이 높아 일일 대표 부하패턴의 형태가 비교적 유사하여 군집 간의 분별력이 떨어짐을 확인할 수 있다.Looking at the daily representative load pattern of each cluster with reference to Figure 4, in the TLP (Typ 2) TLP 2, TLP 5, TLP 6, TLP 9 among the TLP (Typical Load Profile) 1 to TLP 10 in FIG. It can be seen that the shape of is relatively similar to the discrimination between clusters.

한편, 도 5는 소군집 분할 개수 3, 군집 허용 최소 고객수 100으로 하여 10개의 군집으로 군집화한 일일 대표 부하패턴을 나타낸 그래프이다. 도 5에서도 도 4의 그래프에 대응하는 10개의 그래프가 도시되어 있으며, 마찬가지로 하나의 그래프는 하나의 군집을 나타낸다. 각 그래프에서 M은 군집에 속한 각 고객의 일일 평 균 부하곡선을 나타내고, N은 군집의 일일 대표 부하패턴을 나타낸다.On the other hand, Figure 5 is a graph showing the daily representative load pattern clustered into 10 clusters by the number of subgroup division number 3, the minimum number of customers allowed to cluster 100. In FIG. 5, ten graphs corresponding to the graph of FIG. 4 are shown. Likewise, one graph represents one cluster. In each graph, M represents the daily average load curve of each customer in the cluster, and N represents the daily representative load pattern of the cluster.

도 5를 참조하여 각 군집의 일일 대표 부하패턴을 살펴보면, 도 4에서는 TLP 2, TLP 5, TLP 6, TLP 9에서 지역편중 현상이 높음을 확인할 수 있었던 반면, 도 5에서는 도 4와 비교하여 지역편중 현상이 많이 해소된 것을 확인할 수 있다.Looking at the daily representative load pattern of each cluster with reference to Figure 5, in Figure 4 it was confirmed that the regional bias phenomenon is high in TLP 2, TLP 5, TLP 6, TLP 9, while in FIG. It can be seen that much of the bias phenomenon has been eliminated.

따라서, 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법은 기존의 K-means 알고리즘을 이용하는 방법보다 분별력이 높은 일일 대표 부하패턴을 구할 수 있게 된다.Therefore, the electric power customer clustering apparatus using the automatic meter reading data and the method according to the present invention can obtain a daily representative load pattern with a higher discrimination ability than the conventional method using the K-means algorithm.

이상에서와 같이 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치 및 그 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.As described above, the power customer clustering apparatus and the method using the automatic meter reading data according to the present invention are not limited to the configuration and method of the embodiments described as described above, the embodiments can be variously modified All or part of each of the embodiments may be configured to be selectively combined so that.

도 1은 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치의 구성을 설명하는데 참조되는 블록 구성도이다.1 is a block diagram for reference in explaining the configuration of a power customer clustering apparatus using automatic meter reading data according to the present invention.

도 2는 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 방법에 대한 동작 흐름을 도시한 순서도이다.2 is a flowchart illustrating an operation flow of a power customer clustering method using automatic meter reading data according to the present invention.

도 3 은 본 발명의 실시 예에 따른 반복적인 소규모 군집화를 통한 군집화 절차를 도시한 예시도이다.3 is an exemplary diagram illustrating a clustering procedure through repetitive small clustering according to an embodiment of the present invention.

도 4 는 기존의 K-means 알고리즘만을 이용하여 군집화한 일일 대표 부하패턴을 나타낸 그래프이다.4 is a graph showing a daily representative load pattern clustered using the existing K-means algorithm only.

도 5 는 본 발명에 따른 자동 검침 데이터를 이용한 전력 고객 군집화 장치를 이용하여 반복적으로 소규모 군집화한 일일 대표 부하패턴을 나타낸 그래프이다.FIG. 5 is a graph illustrating a daily representative load pattern repeatedly clustered using a small scale power customer clustering device using automatic meter reading data according to the present invention.

Claims (17)

각 고객별로 일정 시간 단위의 전력 사용량을 측정한 검침 데이터를 수집하는 검침 데이터 수집부;Meter reading data collection unit for collecting the meter reading data measuring the power consumption of a certain time unit for each customer; 상기 각 고객별로 산출된 상기 일정 시간 단위의 전력 사용량의 평균값으로부터 일일 평균 부하곡선을 생성하는 부하 계산부;A load calculator configured to generate a daily average load curve from the average value of power consumption of the predetermined time unit calculated for each customer; 상기 일일 평균 부하곡선을 정규화하는 전처리부; 및A preprocessor normalizing the daily average load curve; And K-means 처리기를 통해 상기 전처리부에 의해 정규화된 상기 일일 평균 부하곡선에 대한 군집화를 수행하여 하나 이상의 군집들을 생성하는 군집화부;를 포함하고,And a clustering unit generating one or more clusters by performing clustering on the daily average load curve normalized by the preprocessor through a K-means processor. 상기 군집화부는, 생성된 군집수가 최종 목표 군집수에 도달할 때까지 각 군집의 일일 평균 부하곡선과 상기 각 군집의 일일 평균 부하곡선들로부터 계산된 일일 대표 부하패턴 사이의 오차가 큰 군집을 소규모 군집들로 분할하여, 상기 군집수가 상기 최종 목표 군집수에 도달 시 최종 확정된 군집의 대표 부하패턴을 생성하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.The clustering unit may include a small cluster in which a large error between the daily average load curve of each cluster and the daily representative load pattern calculated from the daily average load curves of each cluster until the generated cluster reaches the final target cluster number. And dividing the data into groups, and generating representative load patterns of the finalized cluster when the cluster number reaches the final target cluster number. 청구항 1에 있어서,The method according to claim 1, 상기 군집화부는,The clustering unit, 상기 군집을 소규모 군집들로 분할하기 전에, 현재 군집수, 최종 목표 군집수, 소규모 군집들로 분할 시 몇 개의 소규모 군집들로 분할할 것인가를 나타내는 소군집 분할 개수, 및 군집 허용 최소 고객수 중 하나 이상의 정보를 상기 K-means 처리기에서 K-means 알고리즘의 초기값으로 입력하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.Before dividing the cluster into small clusters, one of the current cluster, the final target cluster, the number of small clusters indicating how many small clusters to divide into small clusters, and the minimum number of customers allowed. The above-mentioned information is inputted by the K-means processor as an initial value of the K-means algorithm. 청구항 2에 있어서,The method according to claim 2, 상기 K-means 처리기는,The K-means processor, 상기 군집을 소규모 군집들로 분할하는 경우, 상기 군집을 상기 K-means 알고리즘의 초기값으로 입력된 상기 소군집 분할 개수만큼 분할하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.And dividing the cluster into small clusters, wherein the cluster is divided by the number of small cluster divisions input as an initial value of the K-means algorithm. 청구항 1에 있어서,The method according to claim 1, 상기 K-means 처리기는,The K-means processor, 상기 각 군집에 속한 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 계산하여 일일 대표 부하패턴을 계산하고, 상기 각 군집에 속한 각 고객의 일일 평균 부하곡선과 상기 일일 대표 부하패턴과의 오차로부터 상기 일일 대표 부하패턴의 평균 오차를 계산하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.The daily representative load pattern is calculated by calculating an average value at the same time of the daily average load curves belonging to each cluster, and the daily average load curve of each customer belonging to each cluster is determined from the error between the daily representative load pattern and the daily representative load pattern. Power customer clustering device using the automatic meter reading data, characterized in that for calculating the average error of the representative load pattern. 청구항 4에 있어서,The method according to claim 4, 상기 군집화부는,The clustering unit, 군집 허용 최소 고객수 보다 고객수가 많은 군집 중에서 상기 일일 대표 부하패턴의 평균 오차가 가장 큰 군집을 선택하여 소규모 군집들로 분할하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.An apparatus for clustering power customers using automatic meter reading data, characterized in that a cluster having the largest average error of the daily representative load pattern is selected among clusters having a larger number of customers than the minimum number of allowed customers. 청구항 1에 있어서,The method according to claim 1, 상기 군집화부는,The clustering unit, 현재 분할된 군집수가 최종 목표 군집수에 도달하면, 상기 K-means 처리기에 의해 현재까지 분할된 군집을 최종 군집으로 확정하고, 상기 최종 군집의 일일 대표 부하패턴을 최종 대표 부하패턴으로 사용하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.When the currently divided cluster reaches the final target cluster, the cluster divided so far is determined as the final cluster by the K-means processor, and the daily representative load pattern of the final cluster is used as the final representative load pattern. Electric power customer clustering device using automatic meter reading data. 청구항 1에 있어서,The method according to claim 1, 상기 부하 계산부는,The load calculation unit, 상기 검침 데이터에 근거하여 상기 각 고객에 대한 일정 시간 단위의 일일 부하곡선을 생성하고, 상기 일일 부하곡선에서 동일한 시각에 대한 상기 전력 사용량의 평균값을 계산하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.Based on the metering data, a daily load curve for each customer is generated, and an average value of the power usage for the same time is calculated in the daily load curve. Clustering device. 청구항 1에 있어서,The method according to claim 1, 상기 전처리부는,The preprocessing unit, 상기 일일 평균 부하곡선의 최대값이 1이 되도록 정규화하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.The power customer clustering device using the automatic meter reading data, characterized in that the normalization so that the maximum value of the daily average load curve is 1. 청구항 1에 있어서, The method according to claim 1, 상기 군집을 소규모 군집들로 분할하는 소규모 군집화 수행 정보 및 상기 일일 대표 부하패턴 관련 정보가 저장되는 저장부;를 더 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 장치.And a storage unit for storing the small clustering performance information for dividing the cluster into small clusters and the daily representative load pattern related information. 2. 각 고객별로 일정 시간 단위의 전력 사용량을 측정한 검침 데이터를 수집하여 일정 시간 단위의 전력 사용량의 평균값으로부터 일일 평균 부하곡선을 계산하는 단계;Calculating daily average load curves from average values of power consumption for a predetermined time by collecting meter reading data measuring power usage for a predetermined time for each customer; 상기 일일 평균 부하곡선을 정규화하는 단계;Normalizing the daily average load curve; K-means 처리기를 통해 상기 정규화된 일일 평균 부하곡선에 대한 군집화를 수행하여 하나 이상의 군집들을 생성하는 단계;Performing clustering on the normalized daily average load curve through a K-means processor to generate one or more clusters; 상기 생성하는 단계에서 생성된 군집수가 최종 목표 군집수에 도달할 때까지 각 군집의 일일 평균 부하곡선과 상기 각 군집의 일일 평균 부하곡선들로부터 계산된 일일 대표 부하패턴의 오차가 큰 군집을 소규모 군집들로 분할하는 단계; 및Small clusters are clusters having a large error of the daily representative load pattern calculated from the daily average load curve of each cluster and the daily average load curve of each cluster until the number of clusters generated in the generating step reaches the final target cluster number. Dividing into groups; And 상기 군집수가 상기 최종 목표 군집수에 도달 시 최종 확정된 군집의 대표 부하패턴을 생성하는 단계;를 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.And generating a representative load pattern of a finalized cluster when the cluster number reaches the final target cluster number. 청구항 10에 있어서,The method according to claim 10, 상기 소규모 군집들로 분할하는 단계 이전에,Prior to dividing into small clusters, 현재 군집수, 최종 목표 군집수, 소규모 군집들로 분할 시 몇 개의 소규모 군집들로 분할할 것인가를 나타내는 소군집 분할 개수, 및 군집 허용 최소 고객수 중 하나 이상의 정보를 상기 K-means 처리기에서 K-means 알고리즘의 초기값으로 입력하는 단계;를 더 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.In the K-means processor, the K-means processor provides one or more pieces of information on one or more of the current cluster number, the final target cluster number, the number of small clusters indicating how many small clusters to divide into small clusters, and the minimum number of clusters allowed. and inputting an initial value of the means algorithm. 청구항 11에 있어서,The method of claim 11, 상기 소규모 군집들로 분할하는 단계는,Splitting into small clusters, 상기 군집을 상기 K-means 알고리즘의 초기값으로 입력된 상기 소군집 분할 개수만큼 분할하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.And dividing the cluster by the number of subgroup divisions input as an initial value of the K-means algorithm. 청구항 10에 있어서,The method according to claim 10, 상기 소규모 군집들로 분할하는 단계는,Splitting into small clusters, 상기 각 군집에 속한 일일 평균 부하곡선들의 동일 시각에 대한 평균값을 계산하여 상기 일일 대표 부하패턴을 계산하는 단계; 및Calculating the daily representative load pattern by calculating an average value for the same time of the daily average load curves belonging to each cluster; And 상기 각 군집에 속한 각 고객의 일일 평균 부하곡선과 상기 일일 대표 부하패턴과의 오차로부터 상기 일일 대표 부하패턴의 평균 오차를 계산하는 단계;를 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.Computing the average error of the daily representative load pattern from the error between the daily average load curve of each customer belonging to each cluster and the daily representative load pattern; Power customer clustering using the automatic metering data comprising a Way. 청구항 13에 있어서,14. The method of claim 13, 상기 소규모 군집들로 분할하는 단계 수행 시, 군집 허용 최소 고객수보다 고객수가 많은 군집 중에서 상기 일일 대표 부하패턴의 평균 오차가 가장 큰 군집을 선택하여 상기 K-means 처리기로 전달하는 단계;를 더 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.When performing the dividing into small clusters, selecting a cluster having the largest average error of the daily representative load pattern among the clusters with more customers than the minimum number of customers allowed for the clusters, and delivering the clusters to the K-means processor. Power customer clustering method using the automatic meter reading data, characterized in that. 청구항 10에 있어서,The method according to claim 10, 상기 대표 부하패턴을 생성하는 단계는, Generating the representative load pattern, 현재 분할된 군집수가 상기 최종 목표 군집수에 도달하면, 상기 K-means 처리기에 의해 현재까지 분할된 군집을 최종 군집으로 확정하고, 상기 최종 군집의 일일 대표 부하패턴을 최종 대표 부하패턴으로 확정하는 단계;를 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.When the currently divided cluster reaches the final target cluster, determining the cluster divided so far by the K-means processor as the final cluster, and determining the daily representative load pattern of the final cluster as the final representative load pattern. Power customer clustering method using automatic meter reading data, characterized in that it comprises a. 청구항 10에 있어서,The method according to claim 10, 상기 계산하는 단계에서,In the calculating step, 상기 검침 데이터에 근거하여 상기 각 고객에 대한 일정 시간 단위의 일일 부하곡선을 생성하는 단계;를 포함하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.And generating a daily load curve for each customer based on the meter reading data. 청구항 10에 있어서,The method according to claim 10, 상기 정규화하는 단계는,The normalizing step is 상기 일일 평균 부하곡선의 최대값이 1이 되도록 정규화하는 것을 특징으로 하는 자동 검침 데이터를 이용한 전력 고객 군집화 방법.The power customer clustering method using automatic metering data, characterized in that the normalized so that the maximum value of the daily average load curve is 1.
KR1020090080069A 2009-08-27 2009-08-27 Apparatus for customer clustering using automatic metering data and method thereof KR101070368B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090080069A KR101070368B1 (en) 2009-08-27 2009-08-27 Apparatus for customer clustering using automatic metering data and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090080069A KR101070368B1 (en) 2009-08-27 2009-08-27 Apparatus for customer clustering using automatic metering data and method thereof

Publications (2)

Publication Number Publication Date
KR20110022460A KR20110022460A (en) 2011-03-07
KR101070368B1 true KR101070368B1 (en) 2011-10-05

Family

ID=43930872

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090080069A KR101070368B1 (en) 2009-08-27 2009-08-27 Apparatus for customer clustering using automatic metering data and method thereof

Country Status (1)

Country Link
KR (1) KR101070368B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503847A (en) * 2016-10-29 2017-03-15 国家电网公司 Classed load acquiring method based on distribute-electricity transformer district Source of Gateway Meter measured data
KR20220055737A (en) 2020-10-27 2022-05-04 고려대학교 산학협력단 Method of clustering and analyzing data of customer using electricity

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101354628B1 (en) * 2012-11-16 2014-01-27 한국전기연구원 Apparatus for estimating electricity customer's electric load profile curves and method thereof
CN111950620A (en) * 2020-08-07 2020-11-17 国网能源研究院有限公司 User screening method based on DBSCAN and K-means algorithm

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
김영일외 1인, 클러스터링 기법을 이용한 전력 고객의 대표 부하패턴 생성에 관한 연구, 한국정보처리학회 춘계학술발표논문집 제15권 제1호, 2008.05.*
김영일외 3인, "자동검침 고객의 부하패턴을 이용한 일일 대표 부하패턴 생성", 전기학회논문지 제57권 제9호, 2008.09.*
박진형외 3인, "GIS-AMR 시스템에서 시공간 데이터마이닝 기법을 이용한 전력 소비 패턴의 분석 및 예측", 정보처리학회 논문지 vol.16D, no.3 2009.06.
신진호외 4인, "검침데이터를 이용한 전력설비 시공간 부하분석 모델", 전기학회논문지 제57권 제11호, 2008.11.

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106503847A (en) * 2016-10-29 2017-03-15 国家电网公司 Classed load acquiring method based on distribute-electricity transformer district Source of Gateway Meter measured data
KR20220055737A (en) 2020-10-27 2022-05-04 고려대학교 산학협력단 Method of clustering and analyzing data of customer using electricity

Also Published As

Publication number Publication date
KR20110022460A (en) 2011-03-07

Similar Documents

Publication Publication Date Title
CN108022043B (en) Abnormal electricity consumption behavior identification method and device and central server
CN112699913A (en) Transformer area household variable relation abnormity diagnosis method and device
CN106096810B (en) Method and system for planning based on power distribution network operation data Yu geographical topology information
CN108595539A (en) A kind of recognition methods of trace analogical object and system based on big data
KR101070368B1 (en) Apparatus for customer clustering using automatic metering data and method thereof
Gerbec et al. Determination and allocation of typical load profiles to the eligible consumers
CN108171379A (en) A kind of electro-load forecast method
Simab et al. Using integrated model to assess the efficiency of electric distribution companies
CN110991527A (en) Similarity threshold determination method considering voltage curve average fluctuation rate
JP2006340552A (en) Electric power quality evaluation system and method, and program therefor
CN108932562B (en) Method for establishing comprehensive benefit evaluation model of comprehensive energy system
KR102447048B1 (en) Apparatus and method for generating energy simulation model
CN102945222A (en) Poor information measurement data gross error discrimination method based on Grey System Theory
KR20160074325A (en) Electricity Demand Index (EDI) Forecasting System with respect to Weather Condition Change
CN107274025B (en) System and method for realizing intelligent identification and management of power consumption mode
CN117391258B (en) Method, device, equipment and storage medium for predicting negative carbon emission
CN109389517B (en) Analysis method and device for quantifying line loss influence factors
CN109840536A (en) A kind of power grid power supply reliability horizontal clustering method and system
CN111680852B (en) Method and system for monitoring overall energy consumption of area
CN116579884B (en) Power user behavior analysis method and system
KR20220052200A (en) Machine learning based load prrdiction model cmparative verification system and mthod
CN112595918A (en) Low-voltage meter reading fault detection method and device
KR20220061713A (en) Method of replacing missing value in smart meter and control system of smart meter using the same
CN111080089A (en) Method and device for determining critical factors of line loss rate based on random matrix theory
Nasiakou et al. A three-stage scheme for consumers' partitioning using hierarchical clustering algorithm

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140915

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20150915

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20160920

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180831

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20190829

Year of fee payment: 9