KR20200056340A - 개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법 - Google Patents
개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법 Download PDFInfo
- Publication number
- KR20200056340A KR20200056340A KR1020190145998A KR20190145998A KR20200056340A KR 20200056340 A KR20200056340 A KR 20200056340A KR 1020190145998 A KR1020190145998 A KR 1020190145998A KR 20190145998 A KR20190145998 A KR 20190145998A KR 20200056340 A KR20200056340 A KR 20200056340A
- Authority
- KR
- South Korea
- Prior art keywords
- data
- energy
- theft
- value
- usage data
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01R—MEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
- G01R22/00—Arrangements for measuring time integral of electric power or current, e.g. electricity meters
- G01R22/06—Arrangements for measuring time integral of electric power or current, e.g. electricity meters by electronic methods
- G01R22/061—Details of electronic electricity meters
- G01R22/066—Arrangements for avoiding or indicating fraudulent use
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S20/00—Management or operation of end-user stationary applications or the last stages of power distribution; Controlling, monitoring or operating thereof
-
- Y04S20/18—
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S20/00—Management or operation of end-user stationary applications or the last stages of power distribution; Controlling, monitoring or operating thereof
- Y04S20/30—Smart metering, e.g. specially adapted for remote reading
-
- Y04S20/36—
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Medical Informatics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Power Engineering (AREA)
- Alarm Systems (AREA)
- Burglar Alarm Systems (AREA)
Abstract
본 발명은 에너지 사용을 측정하는 스마트 그리드에서 에너지 절도를 검출할 수 있는 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법을 제공한다.
일 예로서, GBTD 알고리즘을 이용하여 에너지 절도를 검출하기 위한 시스템에 있어서, 실제 에너지 사용자의 사용 데이터를 인가받고, 추가적인 복수개의 합성 데이터를 더 추가하는 전처리 모듈부; 및 GBTD 알고리즘에 사용 데이터 및 합성 데이터를 적용하여 에너지의 절도 여부를 판단하는 절도 판단부를 포함하되, 상기 합성 데이터는 사용 데이터의 표준편차, 평균값, 최소값 및 최대값을 포함하는 에너지 검출 시스템이 개시된다.
일 예로서, GBTD 알고리즘을 이용하여 에너지 절도를 검출하기 위한 시스템에 있어서, 실제 에너지 사용자의 사용 데이터를 인가받고, 추가적인 복수개의 합성 데이터를 더 추가하는 전처리 모듈부; 및 GBTD 알고리즘에 사용 데이터 및 합성 데이터를 적용하여 에너지의 절도 여부를 판단하는 절도 판단부를 포함하되, 상기 합성 데이터는 사용 데이터의 표준편차, 평균값, 최소값 및 최대값을 포함하는 에너지 검출 시스템이 개시된다.
Description
본 발명은 에너지 사용을 측정하는 스마트 그리드에서 에너지 절도를 검출할 수 있는 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법에 관한 것이다.
스마트 그리드 미터기를 통해, 사용자의 에너지 사용량을 측정하는 것이 가능하다. 그러나 일부 악의적인 사용자의 경우, 미터기의 조작 등으로 사용량을 조작함으로써, 에너지 사용량을 적게 표시하는 일이 발생하는 문제가 있다. 이러한 에너지 절도를 검출하기 위한 기존 알고리즘들이 존재하나, 검출 성능의 향상이나 검출에 소요되는 시간에서의 개선이 요구되고 있다.
본 발명은 에너지 사용을 측정하는 스마트 그리드에서 에너지 절도를 검출할 수 있는 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법을 제공한다.
본 발명의 실시예에 따른 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 시스템은 실제 에너지 사용자의 사용 데이터를 인가받고, 추가적인 복수개의 합성 데이터를 더 추가하는 전처리 모듈부; 및 GBTD 알고리즘에 사용 데이터 및 합성 데이터를 적용하여 에너지의 절도 여부를 판단하는 절도 판단부를 포함하되, 상기 합성 데이터는 사용 데이터의 표준편차, 평균값, 최소값 및 최대값을 포함할 수 있다.
여기서, 상기 사용 데이터는 하루를 일정 시간 간격으로 나누어, 실제 에너지 사용자의 사용 데이터를 샘플링한 것일 수 있다.
그리고 상기 전처리 모듈부는 상기 사용 데이터 및 합성 데이터에 대해 각 특징별 기여도에 다른 가중치 WFI(Weighted Feature Importance metric)값을 매겨서, 상기 절도 판단부에 전달할 수 있다.
또한, 상기 WFI값은 상기 합성 데이터에서의 값이 상기 사용 데이터에서의 값에 비해 높도록 설정될 수 있다.
또한, 상기 전처리 모듈은 실제의 사용 데이터에 대해 랜덤 수를 곱하여, 다수개의 에너지 절도 케이스의 데이터를 를 추가적으로 생성하고, 실제의 사용 데이터와 생성된 에너지 절도 케이스의 데이터를 통해 트레이닝을 수행할 수 있다.
더불어, 본 발명에 따른 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 방법은 전처리 모듈부가 실제 에너지 사용자의 사용 데이터를 인가받고, 추가적인 복수개의 합성 데이터를 더 추가하는 단계; 및 절도 판단부가 GBTD 알고리즘에 사용 데이터 및 합성 데이터를 적용하여 에너지의 절도 여부를 판단하는 단계를 포함하되, 상기 합성 데이터는 사용 데이터의 표준편차, 평균값, 최소값 및 최대값을 포함할 수 있다.
여기서, 상기 사용 데이터는 하루를 일정 시간 간격으로 나누어, 실제 에너지 사용자의 사용 데이터를 샘플링한 것일 수 있다.
그리고 상기 전처리 모듈부는 상기 사용 데이터 및 합성 데이터에 대해 각 특징별 기여도에 다른 가중치 WFI(Weighted Feature Importance metric)값을 매겨서, 상기 절도 판단부에 전달할 수 있다.
또한, 상기 WFI값은 상기 합성 데이터에서의 값이 상기 사용 데이터에서의 값에 비해 높도록 설정될 수 있다.
또한, 상기 전처리 모듈은 실제의 사용 데이터에 대해 랜덤 수를 곱하여, 다수개의 에너지 절도 케이스의 데이터를 를 추가적으로 생성하고, 실제의 사용 데이터와 생성된 에너지 절도 케이스의 데이터를 통해 트레이닝을 수행할 수 있다.
본 발명의 실시예에 따른 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법은 기존에 비해 검출 성능(검출률, 오탐률)의 향상은 물론 검출 시간을 줄일 수 있다.
도 1은 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 블록도이다.
도 2는 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 트레이닝 과정을 도시한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 테스팅 과정을 도시한 흐름도이다.
도 2는 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 트레이닝 과정을 도시한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 테스팅 과정을 도시한 흐름도이다.
본 발명이 속하는 기술분야에 있어서 통상의 지식을 가진 자가 용이하게 실시할 수 있을 정도로 본 발명의 바람직한 실시예를 도면을 참조하여 상세하게 설명하면 다음과 같다.
도 1은 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 블록도이다.
먼저, 도 1을 참조하면, 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템(10)은 전처리 모듈부(100), 데이터베이스(200), 절도 판단부(300)를 포함할 수 있다.
여기서, 전처리 모듈부(100)는 절도 판단에 필요한 특성들을 반영하기 위한 엔지니어링 기반의 전처리 모듈을 의미한다. 전처리 모듈부(100)는 스마트 그리드에서 사용자의 데이터세트로부터 불필요한 특성(노이즈)를 제거함에 의해 트레이닝 시간 복잡도를 상당히 줄일 수 있는 가중된 특성 중요도(Weighted Feature Importance)를 사용한 특성 추출 기능을 구비할 수도 있다. 이를 위해, 전처리 모듈부(100)는 두 번의 전처리를 위해, 합성 특징 생성부(110)와 주요 특징 추출부(120)를 포함할 수 있다.
합성 특징 생성부(110)는 전처리 과정 1을 통해 후술할 GBTD 알고리즘에 필요한 합성 특징 발생(synthetic feature)들을 생성할 수 있다.
전처리과정 1에서 합성 특징 생성부(110)는 입력 DB 데이터(스마트 미터[SM]를 이용하여 측정한 사용자[가구]별 전력사용량 빅데이터, 예를 들면, 420일 동안에 걸쳐 5000가구에 대해 측정한 DB 데이터 샘플로부터 통계적 합성 특징(stochastic synthetic feature)을 생성할 수 있다. 또한, 본 발명의 일 실시예에 따른 절도 검출 시스템(100)에서 사용하는 GB (gradient boosting) ML (Machine Learning) 기반 에너지 절도 검출 알고리즘, 일명 GBTD (gradient boosting theft detection) 알고리즘은 합성 특징 생성부(110)에서 생성한 합성 특징을 이용하여 검출성능을 개선시킬 수 있다.
또한, 합성 특징 생성부(110)에서 생성된 합성 특징 데이터는 사용자(가구) 별 에너지 사용 패턴(energy usage pattern)의 통계적 특성을 잘 나타내는 특성일 수 있으며, 구체적으로 표준편차, 평균, 최소값, 최대값을 포함할 수 있다.
특히, 이들 4개의 합성 특징은 정상 사용자(benign user)와 비정상사용자(malicious user 혹은 에너지 절도 사용자(energy theft)를 잘 구별하는 특징을 가질 수 있다. 따라서, 하루 24시간을 30분 간격으로 샘플링하여 취득한 기존 특성(original feature 48개)에 이들 4개의 합성 특성을 추가하여, 총 52개의 특성을 이용하는 경우, 기존 특성만을 이용했을 때에 비해 검출률 및 오탐률에서 검출성능이 월등히 개선됨을 확인할 수 있다.
또한, 절도 사용자는 에너지 사용 비용 절감을 위해 스마트 그리드 미터기 데이터 조작으로 사용 전기 사용량 (original energy usage)에 비해 적은 사용량으로 고지한다고 추정할 수 있어, 이 경우 표준편차, 평균값, 최소값, 최대값 등의 통계치가 정상사용자에 비해 상대적으로 줄어들게 되기 때문이다. 다시 설명하면, 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템에서 제안되는 개선된 GBTD 방식에서는 이들 합성 특성을 효과적으로 이용한 방식으로 검출성능을 개선시킬 수 있다.
주요 특징 추출부(120)는 전처리과정 2를 통해, 주요 특징을 추출(feature extraction) 또는 선별할 수 있다. 여기서, 주요 특징 추출부(200)에서 추출된 주요 특징들은 GBTD 분류기(XGBoost, CATBoost, LightGBM 등)에 추가되어, 잡음을 낮추어주어 성능을 개선함은 물론 처리시간을 줄이고 저장 장치도 절약시킬 수 있다.
주요 특징 추출부(120)는 특징 추출 과정의 진행을 통해 전 특징 데이터에 대해 각 특징별 기여도에 따른 가중치(Weighted Feature Importance metric: WFI)를 매기고 WFI값 기반의 특징 데이터 부집합을 발생한다. 이에 따라, 개선된 GBTD 알고리즘에는 결정 트리도 상에 각 특징별 WFI값을 부여하는 특성 중요도(feature importance) 모듈을 내장할 수 있다.
여기서 주목할 점은, 각 분류기에 따라 같은 특징이라도 WFI값이 달라질 수 있다는 것이다. 그 결과 특성 중요도 모듈로 측정하였을 때 주요 특징 추출부(120)의 합성 특징 생성부(110)를 통해 생성된 4가지 통계적 합성 특성(synthetic feature: 표준편차, 평균, 최소값, 최대값)은 기존 특성에 비해 상대적으로 높은 WFI값을 갖게 된다. 개선된 GBTD 알고리즘에서, 주요 특징 추출부(120)는 전처리과정 2을 통해 입력 데이터로부터 보다 효과적인 특징 추출을 위해 재귀적인 반복과정을 수행할 수 있다. 해당 반복과정에서 WFI 임계치의 조절(상/하)이 가능하며 이러한 과정을 통해 불필요한 잡음이 제거되어져 요구성능(검출률 및 오탐률) 기준 만족이 가능할 뿐 아니라 알고리즘 복잡도를 낮추어 주는 특징을 선정할 수 있다.
데이터베이스(200)는 앞서 언급한 전처리 모듈부(100)에서 생성된 주요 특징들을 저장할 수 있다. 또한 데이터베이스(200)는 합성 특징 모듈부(110)로부터 48개의 샘플링된 기존 특성, 4개의 합성 특성을 입력받고, 주요 특징 추출부(120)로부터 추출된 주요 특징들을 입력받아 저장할 수 있다.
절도 판단부(300)는 데이터베이스(200)에 저장된 특징들을 알고리즘에 적용하여, 정상 사용과 에너지 절도를 구분하여 판단할 수 있다.
이를 위해, 절도 판단부(300)은 개선된 GBTD(Gradient Boosting Theft Detector) 알고리즘을 사용할 수 있다. 여기서, 개선된 GBTD(Gradient Boosting Theft Detector) 알고리즘은 에너지 절도를 검출하기 위한 알고리즘으로, 점진적 부스팅 분류기들(Gradient Boosting Classifiers, GBCs)인 XGBoost(Extreme Gradient Boosting), CatBoost(Categorical Boosting) 및 LightGBM(light gradient boosting) 방법에 기반하고 있다.
개선된 GBTD(Gradient Boosting Theft Detector) 알고리즘은 머신 러닝(Machine Learning)에 기반하여 스마트 그리드(Smart Grid, SG) 미터의 전기 사용에서 비정상적인 활동을 감지한다. 이를 위해, 개선된 GBTD 알고리즘은 사용자의 에너지 소비 패턴에서 비정상을 확인함에 의해 절도를 검출할 수 있다.
또한, 앞서 설명한 전처리 모듈부(100)에서의 전처리를 통해 개선된 GBTD에서 절도 검출의 판단 기준이 되는 검출률(Detection rate, DR)과 오탐률(False Positive Rate, FPR)은 물론 시간복잡성(time-complexity)이 개선될 수 있다.
이하에서는 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템(10)을 이용한 절도 검출 방법 및 효과를 보다 상세하게 설명하도록 한다.
도 2는 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 트레이닝 과정을 도시한 흐름도이다.
먼저, 주어진 스마트 그리드에서, 사용자의 기록된 실제 사용 데이터를 쉽게 획득할 수 있으나, 이러한 데이터에서 절도 샘플들은 드물게 존재하거나 존재하지 않을 수 있다. 이에 따라, 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템에서는 수학적 방식에 기반하여 사용자의 실제 사용을 조작(manipulating)함으로써, 우리의 최초 데이터세트에서 절도 케이스들의 부족을 보상할 수 있다.
구체적으로, 개선된 GBTD 알고리즘의 분류기(classifier)의 수치적 평가를 위해, 먼저 실시간 악의적 행동 특성들을 생성하고 지도식 머신 러닝(Supervised Machine Learingn) 알고리즘의 사용을 위해 특성들을 분류한다. 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템에서는 기존 절도 케이스들을 개선한 6개의 절도 케이스들을 제안한다.
기존에서는 케이스 1, 2를 생성시 0.1에서 0.8 사이의 랜덤수를 곱하여 생성하였으나, 제안 알고리즘에서는 0.8을 0.9로 변경을 제안한다. 또한, 케이스 4, 5에서 곱하여지는 수가 0.1 내지 0.8에서 0.1 내지 1.0으로 변경할 것을 제안한다.
이러한 케이스들을 활용하여, 기존 아이리쉬 스마트 에너지 데이터세트(Irish smart energy dataset, "old"로 표기)와 본 발명의 일 실시예에 따라 생성된 6개의 절도 케이스들을 갖는 데이터세트("new"로 표기)에 대해, 각각 기존 CPBETD와 제안하는 GBTD 분류기를 통해 검출 성능을 확인한 결과, 검출률(DR)과 오탐률(FPR)에서 모두 검출 성능 향상이 있음을 수치적으로 확인할 수 있다.
한편, 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템에서 제안되는 개선된 GBTD 알고리즘의 분류기에서는 기존 GBCs, 즉 XGBoost, Catboost 및 LightGBM에 사용되는 합성 특성들 외에 표준편차, 평균, 최대값, 최소값의 4가지 특성을 추가로 제안한다.
이러한 케이스들을 활용하여, 기존 CPBETD와 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템에서 제안하는 GBTD 분류기를 통해 검출 성능을 확인한 결과, 특성을 추가하지 않은 경우("w/o synth"로 표기)에 비해, 추가한 경우("w/Mean", "w/Std", "w/Min", "w/Max", "w/All 4"로 표기)에서 모두 검출률(DR)과 오탐률(FPR)에서 모두 성능 향상이 있음을 수치적으로 확인할 수 있다.
그리고 이를 위해, 앞서 설명한 전처리 모듈(100)을 통해 전처리 과정 1 및 2를 수행할 수 있다. 전처리과정 1, 2를 포함한 제안한 GBTD 알고리즘은 높은 검출성능(DR 및 FPR)의 유지가 가능할 뿐 아니라, 저장공간의 절약과 함께 사용시간을 효과적으로 줄여준다. 결과적으로, 제안 알고리즘은 기존 알고리즘(기존의 GB방식, CBPTED, 시계열 추정 방식 외에 비해 성능(특히 오탐률)면에서 우수 할 뿐 아니라 상업적 이용 측면에서도 많은 이점이 갖는다.
제안한 개선된 GBTD 알고리즘은 크게 트레이닝(training) 단계 (단계 A)와 테스팅(testing) 단계 (단계 B)의 두 단계로 구분할 수 있으며, 도 2는 트레이닝 단계로서 제안 알고리즘의 전체 흐름도를 요약하여 보여준다. 제안한 알고리즘은 supervised ML 기법으로 에너지 절도에 대한 별도의 입력 DB를 확보하고 있지 않음을 가정하고 있다. 이에 따라 비정상 (절도) 사용자 샘플 발생을 위해 자료(논문)에서 제안한 6 가지의 에너지 절도 모델을 활용한다.
도 2를 참조하면, 트레이닝(training) 단계에서는 일반(정상) 사용자에 대한 최초 에너지 사용 데이터의 입력 데이터베이스("original DB" 혹은 "input DB")로부터 불필요한 데이터를 제거하는 클린과정(단, 데이터베이스 내에 NULL 데이터 혹은 Missing 데이터 등의 불필요한 데이터를 포함한 경우에만 사용하고 그렇지 않은 경우 스킵 가능)을 거치며, 이를 통해 각 사용자별 정상에너지 사용량 패턴(energy usage pattern [or sample vector])을 얻을 수 있다(S1).
이렇게 얻어진 각 사용자별 정상 에너지 사용량 패턴(샘플 벡터)에 대해 제안한 6개의 에너지 절도 모델의 적용으로 대응되는 비정상(절도) 사용자 에너지 사용량 패턴을 발생시킨다. 다시 말해 각 사용자의 하나의 정상 입력 패턴에 대해 절도 모델을 각기 적용한다고 볼 때 총 6개의 에너지 절도 패턴(샘플 벡터)이 얻어짐을 알 수 있다.
이러한 과정을 거쳐 얻은 절도 패턴이 저장된 악의적 DB(malicious DB)(비정상사용자 데이터 저장 DB; majority class)의 크기는 일반적으로 정상적 DB(benign DB, 정상사용자 데이터 저장; minority class)의 크기에 비해 상대적으로 매우 커지게 된다. 또한, ML(기계어 학습) 알고리즘의 원만한 적용을 위한 오버샘플링(oversampling)을 통한 데이터세트 밸런스(dataset balance)를 요구한다.
제안 시스템에서는 오버샘플링(oversampling)을 위해 SMOT(synthetic minority oversampling technique) 기법을 사용하며, 그 결과 정상적 DB에 있는 minority class 크기가 (factor ‘n’만큼 증가되어져) majority class와 균형이 이루어져 원만한 ML 트레이닝과정 수행이 가능하다.
다음은 합성 특징 발생부(110)에서 전처리과정 1의 합성 특징 발생 기능의 사용으로 input DB에 들어있는 각 정상 사용자 샘플로부터 평균, 표준편차, 최대값, 최소값의 통계적 특성을 얻고 이 합성 특성 데이터(4개)를 일반사용자의 특성 데이터(48개)에 연접(concatenate)하여 주어 특성 벡터(52개)를 생성한다(S2).
또한, 앞서 생성된 6개의 에너지 절도 모델을 적용한 악의적 사용에 대해서도 특성 벡터를 생성할 수 있다(S3).
이렇게 발생된 정상사용자의 에너지 사용 패턴 (혹은 정상 사용자 특징 샘플 벡터)과 비정상 사용자의 에너지 사용 패턴 (절도사용자 특징 샘플 벡터)를 구분하기 위해 일반사용자의 경우 '0'을 절도 사용자의 경우 '1'을 라벨한다(S4).
또한, 라벨 되어진 입력 패턴으로 구성된 데이터세트를 활용하여 개선된 GBTD 분류기를 트레이닝시키게 된다(S5).
이 때, 전처리과정 1에서 필요시 하이퍼 파라미터(overfitting 파라미터 등)의 조정 또한 가능하다(S6).
다음으로는 전처리과정 2의 주요 특징 추출 기능을 사용하며, 여기서는 classifier에 포함된 feature importance 모듈을 이용하여 전처리과정 1로부터 얻은 각 특징 데이터(모든 특징 샘플의 개수는 52개)에 대해 WFI (weighted feature importance metric 혹은 feature importance score)값을 부여한다. 52개 특징 데이터 샘플 중에서 허용 임계치 TH 이상인 f개 (대략 10 ~ 20개)의 특징 데이터를 추출(선별)하고 가장 큰 WFI 값을 갖는 순으로 정리(priority-based ordering) 한다. 이렇게 우선순위에 의해 선발된 f개 특징 데이터로 제안 GBTD 분류기를 재트레이닝(re-training)시킨다. 상기의 트레이닝 및 재트레이닝의 과정을 거쳐 얻은 (이는 곧 트레이닝 단계의 출력) 제안하는 개선된 GBTD 분류기 모델은 실제 입력 데이터에 대한 악의적 사용(절도) 유무 판정에 이용한다.
이하에서는 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템에서 테스팅 과정을 구체적으로 설명하도록 한다.
도 3은 본 발명의 일 실시예에 따른 에너지 절도 검출 시스템의 테스팅 과정을 도시한 흐름도이다.
도 3을 참조하면, 테스팅 단계에서는 앞의 트레이닝단계를 거쳐 얻은 제안 분류기를 활용하여 실제로 입력된 (에너지 사용량) 각 샘플에 대해 악의적 사용(절도) 유무를 검증할 수 있다.
먼저, 앞서 설명한 개선된 GBTD 분류기 모듈을 절도 검출 모델로서 준비할 수 있다(S10).
한편, 도 3의 테스팅 단계는 도 1의 트레이닝 단계와 유사하게 전처리과정 1 및 전처리과정 2를 함께 포함할 수 있으며, 단지 차이점은 입력 DB를 기초로 한 별도의 악의적 사용 DB(malicious DB) 발생과 이를 이용한 트레이닝 및 재트레이닝 과정이 본 테스팅 단계에서는 생략되어 있음을 알 수 있다.
구체적으로, 테스팅 단계에서는 획득한 입력 DB로부터 우선 불필요한 데이터를 제거하는 클린 과정(NULL 데이터 혹은 Missing 데이터 과정; 필요시 사용)을 거쳐 각 일반 사용자별 정상 에너지 사용 패턴 (energy usage pattern)을 얻는다(S11). 그리고 새로이 입력된 각 사용자 샘플에 대해, 평균, 표준편차, 최대값, 최소값의 통계적 특성 데이터를 얻고 이 합성 특성 데이터(4개)를 사용자의 특징 데이터(48개)에 연접(concatenate)한 특성 벡터(52개)를 얻는다(S12).
발생한 특성 벡터에 대해 특성별 WFI(weighted feature importance metric 혹은 feature importance score) 값을 할당한 후, WFI 값이 허용 임계치 TH를 넘는 f개 (대략 10 ~ 20개)의 특성 데이터를 추출(선발)하고 가장 높은 순으로 정리된(갱신된) 특성 벡터를 얻는다. 이렇게 얻어진(추출된) 특성 벡터에 대해 제안 GBTD 분류기(이는 곧, 앞의 트레이닝 단계를 통해 검증된 분류기임) 적용하여 악의적 사용(절도) 유무를 판정하고 이를 해당 입력 패턴에 표시(mark)할 수 있다(S13).
이상에서 설명한 것은 본 발명에 의한 개선된 GBTD 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법을 실시하기 위한 하나의 실시예에 불과한 것으로서, 본 발명은 상기 실시예에 한정되지 않고, 이하의 특허청구범위에서 청구하는 바와 같이 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 정신이 있다고 할 것이다.
Claims (10)
- GBTD 알고리즘을 이용하여 에너지 절도를 검출하기 위한 시스템에 있어서,
실제 에너지 사용자의 사용 데이터를 인가받고, 추가적인 복수개의 합성 데이터를 더 추가하는 전처리 모듈부; 및
GBTD 알고리즘에 사용 데이터 및 합성 데이터를 적용하여 에너지의 절도 여부를 판단하는 절도 판단부를 포함하되,
상기 합성 데이터는 사용 데이터의 표준편차, 평균값, 최소값 및 최대값을 포함하는 에너지 검출 시스템. - 제 1 항에 있어서,
상기 사용 데이터는 하루를 일정 시간 간격으로 나누어, 실제 에너지 사용자의 사용 데이터를 샘플링한 것인 에너지 검출 시스템. - 제 1 항에 있어서,
상기 전처리 모듈부는 상기 사용 데이터 및 합성 데이터에 대해 각 특징별 기여도에 다른 가중치 WFI(Weighted Feature Importance metric)값을 매겨서, 상기 절도 판단부에 전달하는 에너지 검출 시스템. - 제 3 항에 있어서,
상기 WFI값은 상기 합성 데이터에서의 값이 상기 사용 데이터에서의 값에 비해 높도록 설정된 에너지 검출 시스템. - 제 1 항에 있어서,
상기 전처리 모듈은 실제의 사용 데이터에 대해 랜덤 수를 곱하여, 다수개의 에너지 절도 케이스의 데이터를 를 추가적으로 생성하고, 실제의 사용 데이터와 생성된 에너지 절도 케이스의 데이터를 통해 트레이닝을 수행하는 에너지 검출 시스템. - GBTD 알고리즘을 이용하여 에너지 절도를 검출하기 위한 방법에 있어서,
전처리 모듈부가 실제 에너지 사용자의 사용 데이터를 인가받고, 추가적인 복수개의 합성 데이터를 더 추가하는 단계; 및
절도 판단부가 GBTD 알고리즘에 사용 데이터 및 합성 데이터를 적용하여 에너지의 절도 여부를 판단하는 단계를 포함하되,
상기 합성 데이터는 사용 데이터의 표준편차, 평균값, 최소값 및 최대값을 포함하는 에너지 검출 방법. - 제 6 항에 있어서,
상기 사용 데이터는 하루를 일정 시간 간격으로 나누어, 실제 에너지 사용자의 사용 데이터를 샘플링한 것인 에너지 검출 방법. - 제 6 항에 있어서,
상기 전처리 모듈부는 상기 사용 데이터 및 합성 데이터에 대해 각 특징별 기여도에 다른 가중치 WFI(Weighted Feature Importance metric)값을 매겨서, 상기 절도 판단부에 전달하는 에너지 검출 방법. - 제 8 항에 있어서,
상기 WFI값은 상기 합성 데이터에서의 값이 상기 사용 데이터에서의 값에 비해 높도록 설정된 에너지 검출 방법. - 제 6 항에 있어서,
상기 전처리 모듈은 실제의 사용 데이터에 대해 랜덤 수를 곱하여, 다수개의 에너지 절도 케이스의 데이터를 를 추가적으로 생성하고, 실제의 사용 데이터와 생성된 에너지 절도 케이스의 데이터를 통해 트레이닝을 수행하는 에너지 검출 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20180139810 | 2018-11-14 | ||
KR1020180139810 | 2018-11-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200056340A true KR20200056340A (ko) | 2020-05-22 |
KR102357475B1 KR102357475B1 (ko) | 2022-02-04 |
Family
ID=70914212
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020190145998A KR102357475B1 (ko) | 2018-11-14 | 2019-11-14 | 개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102357475B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112991093A (zh) * | 2021-02-22 | 2021-06-18 | 国网四川省电力公司营销服务中心 | 一种基于边缘计算的窃电检测方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101151050B1 (ko) * | 2010-09-03 | 2012-06-01 | 엘에스산전 주식회사 | 전기에너지 관리 시스템 |
JP2013105497A (ja) * | 2011-11-15 | 2013-05-30 | Fujitsu Ltd | エネルギー消費のプロファイリング |
JP2017126329A (ja) * | 2015-12-31 | 2017-07-20 | ダッソー システムズDassault Systemes | トレーニングセットの評価 |
JP2018036934A (ja) * | 2016-09-01 | 2018-03-08 | 九電テクノシステムズ株式会社 | 電力使用量または消費電流による居住者の生活状態・活動推定システムおよび方法 |
KR20180103632A (ko) * | 2017-03-10 | 2018-09-19 | 광주과학기술원 | 비정상 정보 검출 기술을 적용한 스마트 미터 시스템 및 검출 방법 |
-
2019
- 2019-11-14 KR KR1020190145998A patent/KR102357475B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101151050B1 (ko) * | 2010-09-03 | 2012-06-01 | 엘에스산전 주식회사 | 전기에너지 관리 시스템 |
JP2013105497A (ja) * | 2011-11-15 | 2013-05-30 | Fujitsu Ltd | エネルギー消費のプロファイリング |
JP2017126329A (ja) * | 2015-12-31 | 2017-07-20 | ダッソー システムズDassault Systemes | トレーニングセットの評価 |
JP2018036934A (ja) * | 2016-09-01 | 2018-03-08 | 九電テクノシステムズ株式会社 | 電力使用量または消費電流による居住者の生活状態・活動推定システムおよび方法 |
KR20180103632A (ko) * | 2017-03-10 | 2018-09-19 | 광주과학기술원 | 비정상 정보 검출 기술을 적용한 스마트 미터 시스템 및 검출 방법 |
Non-Patent Citations (1)
Title |
---|
Theft of Electricity Detection Based on Supervised Learning(2017.08.공개)* * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112991093A (zh) * | 2021-02-22 | 2021-06-18 | 国网四川省电力公司营销服务中心 | 一种基于边缘计算的窃电检测方法及系统 |
CN112991093B (zh) * | 2021-02-22 | 2024-02-02 | 国网四川省电力公司营销服务中心 | 一种基于边缘计算的窃电检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
KR102357475B1 (ko) | 2022-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104794192B (zh) | 基于指数平滑、集成学习模型的多级异常检测方法 | |
CN108629413B (zh) | 神经网络模型训练、交易行为风险识别方法及装置 | |
WO2019179403A1 (zh) | 基于序列宽深学习的欺诈交易检测方法 | |
EP3743859A1 (en) | Systems and methods for preparing data for use by machine learning algorithms | |
CN104536983A (zh) | 一种预测广告点击率的方法和装置 | |
CN108595667A (zh) | 一种网络异常数据的关联性分析方法 | |
US20170300580A1 (en) | System and method for identifying contacts of a target user in a social network | |
CN103258025B (zh) | 生成共现关键词的方法、提供关联搜索词的方法以及系统 | |
Jiang et al. | A feature selection method for malware detection | |
CN109977977B (zh) | 一种识别潜在用户的方法及对应装置 | |
CN112437053A (zh) | 入侵检测方法及装置 | |
CN110019779A (zh) | 一种文本分类方法、模型训练方法及装置 | |
CN112463848A (zh) | 检测用户异常行为的检测方法、系统、装置和存储介质 | |
CN111898637A (zh) | 一种基于ReliefF-DDC特征选择算法 | |
CN110097120B (zh) | 网络流量数据分类方法、设备及计算机存储介质 | |
KR20200056340A (ko) | 개선된 gbtd 알고리즘을 이용한 에너지 절도 검출 시스템 및 방법 | |
Trevizan et al. | Nontechnical losses detection: A discrete cosine transform and optimum-path forest based approach | |
Krishna et al. | Efficient genetic-wrapper algorithm based data mining for feature subset selection in a power quality pattern recognition applicationction in a power quality pattern recognition application. | |
CN106257449A (zh) | 一种信息确定方法和装置 | |
Bui et al. | A clustering-based shrink autoencoder for detecting anomalies in intrusion detection systems | |
WO2011114135A1 (en) | Detecting at least one community in a network | |
CN114168788A (zh) | 音频审核的处理方法、装置、设备及存储介质 | |
Ozkan-Okay et al. | A new feature selection approach and classification technique for current intrusion detection system | |
KR102356176B1 (ko) | 에너지 절도 검출 시스템 및 방법 | |
Cope et al. | Classifying plant leaves from their margins using dynamic time warping |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |