KR20220039325A - Apparatus for analyzing meter data of ami - Google Patents

Apparatus for analyzing meter data of ami Download PDF

Info

Publication number
KR20220039325A
KR20220039325A KR1020200122331A KR20200122331A KR20220039325A KR 20220039325 A KR20220039325 A KR 20220039325A KR 1020200122331 A KR1020200122331 A KR 1020200122331A KR 20200122331 A KR20200122331 A KR 20200122331A KR 20220039325 A KR20220039325 A KR 20220039325A
Authority
KR
South Korea
Prior art keywords
data
analysis
mdms
ami
web
Prior art date
Application number
KR1020200122331A
Other languages
Korean (ko)
Inventor
신진호
김영일
김예리
이승준
Original Assignee
한국전력공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전력공사 filed Critical 한국전력공사
Priority to KR1020200122331A priority Critical patent/KR20220039325A/en
Publication of KR20220039325A publication Critical patent/KR20220039325A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/06Electricity, gas or water supply
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2428Query predicate definition using graphical user interfaces, including menus and forms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/40Display of information, e.g. of data or controls
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S20/00Management or operation of end-user stationary applications or the last stages of power distribution; Controlling, monitoring or operating thereof
    • Y04S20/30Smart metering, e.g. specially adapted for remote reading

Abstract

Disclosed is an apparatus for analyzing the meter data of an AMI The apparatus comprises: an OLAP spark cluster for profiling, validating, and aggregating meter data from an MDMS system in a distributed parallel manner; an online query module connected to a user terminal based on the Web to extract, analyze, and visualize the meter data stored in the MDMS system; a professional client analysis module which accesses the MDMS system, provides a script to a developer terminal connected thereto based on the Web, and provides an API for advanced analysis of the meter data to support sending and receiving files; and a connection module connected to an operator terminal based on the Web to provide Hadoop data of the MDMS system to other systems and perform configurations. Therefore, users can analyze big meter data without additional coding.

Description

AMI 계량 데이터 분석 장치{APPARATUS FOR ANALYZING METER DATA OF AMI}AMI weighing data analysis device

본 발명은 AMI 계량 데이터 분석 장치에 관한 것으로서, 보다 상세하게는 지능형 전력계량 인프라를 통해 수집한 AMI 계량 데이터를 직접 분석할 수 있도록 WEB 환경의 온라인 질의형 분석도구와 전문가용 전용 분석환경 및 타 시스템과 연계하여 데이터를 제공할 수 있도록 하는 AMI 계량 데이터 분석 장치에 관한 것이다. The present invention relates to an AMI metering data analysis device, and more particularly, an online query type analysis tool in a WEB environment, an expert analysis environment, and other systems so that the AMI metering data collected through an intelligent power metering infrastructure can be directly analyzed. It relates to an AMI weighing data analysis device that can provide data in connection with the AMI.

최근 지능형 전력계량 인프라(Advanced Meter Infrastructure, AMI) 구축에 따라 수집되는 계량 데이터의 관리가 요구되고 있다. Recently, management of metering data collected according to the construction of an advanced metering infrastructure (AMI) is required.

계량 데이터는 전기요금 산정, 고객에게 실시간 사용량 및 요금 제공, 수요반응(Demand Response, DR) 분석 등 에너지신산업 창출을 위한 근간 데이터이므로, 계량 데이터의 관리에 있어서 높은 신뢰성이 요구된다. Since metering data is fundamental data for creating a new energy industry, such as calculating electricity rates, providing customers with real-time usage and rates, and analyzing Demand Response (DR), high reliability is required in the management of metering data.

현재 계량 데이터를 관리하기 위한 시스템으로 약 1천만호를 구축하여 본사 계량 데이터 관리시스템(MDMS : Metering Data Management System)에서 전국의 계량 빅데이터를 수집 및 처리하여 통합관리하고 있다. Currently, about 10 million units have been built as a system for managing metering data, and the head office metering data management system (MDMS: Metering Data Management System) collects, processes, and manages nationwide metering big data.

해외에서도 AMI 구축사업을 활발하게 추진하고 있으며, AMI 계량 데이터는 요금부과의 기준이 될 뿐만 아니라, 전기품질(전압, 전류) 관리, 위약/도전/손실 탐색, 지역별/구간별 전기부하 패턴분석 및 수요예측, 실시간 전기사용정보 고객제공, 전기소비 컨설팅 등 배전/영업/고객서비스 분야의 다양한 업무, 서비스를 위한 근간이 되는 중요한 데이터이다. We are actively promoting AMI construction overseas as well, and AMI measurement data is not only a standard for charging, but also electricity quality (voltage, current) management, violation/conduction/loss search, electric load pattern analysis by region/section, and demand It is important data that is the basis for various tasks and services in the distribution/sales/customer service fields such as forecasting, real-time electricity usage information customer provision, and electricity consumption consulting.

본 발명의 배경기술은 대한민국 공개특허공보 제10-2018-0033961호(2018.04.04. 공개, 계량데이터 관리 시스템 및 컴퓨터 판독가능 기록 매체)에 개시되어 있다. The background technology of the present invention is disclosed in Korean Patent Publication No. 10-2018-0033961 (published on April 4, 2018, a weighing data management system and a computer-readable recording medium).

최근에는 AMI 보급량 증가 및 빅데이터, 인공지능(AI) 등 4차 산업혁명 기술 화두에 따라 AMI 계량 데이터의 활용가치를 높이기 위한 MDMS의 빅데이터 분석 솔루션 및 서비스의 역할이 더욱 커지고 있다. In recent years, the role of MDMS big data analysis solutions and services to increase the utilization value of AMI measurement data is growing in line with the increase in the supply of AMI and the 4th industrial revolution technology such as big data and artificial intelligence (AI).

AMI 구축사업의 투자 효용성을 제고하고 해외수출 기술경쟁력을 강화하기 위해 AMI 데이터를 종합 분석하여 새로운 가치를 창출할 수 있는 데이터 분석 및 시각화 솔루션이 필요한 실정이다. A data analysis and visualization solution that can create new value by comprehensively analyzing AMI data is needed in order to enhance the investment effectiveness of the AMI construction project and to strengthen the technological competitiveness of overseas exports.

한전 MDMS는 빅데이터 기술을 적용하여 용도와 목적에 따라 Hadoop 파일시스템, NoSQL 데이터베이스, 관계형 데이터베이스(RDB)에 계량 데이터를 적재하여 처리하고 있다. KEPCO MDMS applies big data technology to load and process weighing data in Hadoop file system, NoSQL database, and relational database (RDB) depending on the purpose and purpose.

그러나, MDMS에서 수집되는 1천만 호 AMI 계기의 데이터양은 하루 약 6억건(450GByte) 이상으로 업무담당자 및 관리자, 데이터 과학자 및 알고리즘 개발자 등이 일반적인 방법으로 접근하여 데이터를 분석하기는 어려운 문제점이 있다. However, the amount of data of 10 million AMI instruments collected from MDMS is more than 600 million cases (450 GByte) per day, and it is difficult for business managers, managers, data scientists, and algorithm developers to access and analyze data in a general way.

본 발명은 상기와 같은 문제점들을 개선하기 위하여 안출된 것으로, 일 측면에 따른 본 발명의 목적은 지능형 전력계량 인프라를 통해 수집한 AMI 계량 데이터를 직접 분석할 수 있도록 WEB 환경의 온라인 질의형 분석도구와 전문가용 전용 분석환경 및 타 시스템과 연계하여 데이터를 제공할 수 있도록 하는 AMI 계량 데이터 분석 장치를 제공하는 것이다. The present invention has been devised to improve the above problems, and an object of the present invention according to one aspect is to directly analyze the AMI metering data collected through the intelligent power metering infrastructure. It is to provide an AMI measurement data analysis device that can provide data in connection with an expert analysis environment and other systems.

본 발명의 일 측면에 따른 AMI 계량 데이터 분석 장치는, MDMS 시스템으로부터 계량 데이터를 분산 병렬로 프로파일링, 검증 및 집계 처리하는 OLAP 스파크 클러스터; 웹기반으로 사용자 단말기와 접속되어 MDMS 시스템에 저장된 계량 데이터를 추출하여 분석하고 시각화하는 온라인 질의모듈; 웹기반으로 접속된 개발자 단말기에 대해 MDMS 시스템에 접근하여 스크립트를 제공하고, 계량 데이터의 고급분석을 위한 API를 제공하여 파일을 송수신할 수 있도록 지원하는 전문 클라이언트 분석모듈; 및 웹기반으로 운영자 단말기와 접속되어 MDMS 시스템의 하둡(Hadoop) 데이터를 타 시스템에 제공하고 설정하기 위한 연계모듈;을 포함하는 것을 특징으로 한다. AMI metering data analysis apparatus according to an aspect of the present invention, OLAP spark cluster for profiling, verifying, and aggregating metering data from an MDMS system in distributed parallel; an online query module that is connected to a web-based user terminal and extracts, analyzes, and visualizes weighing data stored in the MDMS system; A professional client analysis module that provides a script by accessing the MDMS system for a web-based connected developer terminal, and provides an API for advanced analysis of weighing data to support sending and receiving files; and a web-based connection module for providing and setting Hadoop data of the MDMS system to other systems by being connected to an operator terminal.

본 발명에서 온라인 질의모듈은, 분석대상 속성에 대한 속성정보에 대한 모델을 메타데이터 형태로 관리하는 소형 관계형 DB; 소형 관계 DB나 HDFS 소스의 분석 대상 속성에 대한 속성정보에 대한 모델을 소형 관계 DB를 통해 관리하는 데이터 모델 관리부; 데이터 모델 관리부에서 관리되는 데이터 모델 형식으로 계량 데이터를 조회하는 계량 데이터 조회부; 계량 데이터 조회부를 통해 조회된 계량 데이터를 OLAP(Online Analytical Processing) 스파크 클러스터를 통해 병렬로 분석하고 시각화하는 분석 시각화부; 및 사용자 단말기가 데이터 모델 관리부, 계량 데이터 조회부 및 분석 시각화부에 접속하기 위한 환경을 설정하는 환경 설정부;를 포함하는 것을 특징으로 한다. In the present invention, the online query module includes: a small relational DB for managing a model for attribute information on an analysis target attribute in the form of metadata; a data model management unit that manages a model for attribute information on a small relational DB or HDFS source's analysis target attribute through a small relational DB; a weighing data inquiry unit for inquiring weighing data in a data model format managed by the data model management unit; an analysis visualization unit that analyzes and visualizes the weighing data retrieved through the weighing data inquiry unit in parallel through an OLAP (Online Analytical Processing) spark cluster; and an environment setting unit for setting an environment for the user terminal to access the data model management unit, the measurement data inquiry unit, and the analysis visualization unit.

본 발명에서 계량 데이터 조회부는, 데이터 모델을 선택하고, 데이터 모델의 컬럼과 검색 시간범위를 저장하고, 검색 질의어를 통해 검색조건을 입력하는 것을 특징으로 한다. In the present invention, the metering data inquiry unit selects a data model, stores a column of the data model and a search time range, and inputs a search condition through a search query.

본 발명에서 검색 질의어는, where 조건절 및 연산자를 통해 데이터를 필터링하는 것을 특징으로 한다. In the present invention, the search query term is characterized in that data is filtered through a where conditional clause and an operator.

본 발명에서 계량 데이터 조회부는, 통계함수, 그룹함수 및 정렬함수 어느 하나 이상을 사용하여 검색하는 것을 특징으로 한다. In the present invention, the weighing data inquiry unit searches by using one or more of a statistical function, a group function, and an alignment function.

본 발명에서 분석 시각화부는, 검색 결과의 각 필드를 행, 열, 값 중 어느 하나 이상을 조합하여 피벗 분석 기능을 제공하는 것을 특징으로 한다. In the present invention, the analysis visualization unit provides a pivot analysis function by combining each field of the search result with any one or more of a row, a column, and a value.

본 발명에서 전문 클라이언트 분석모듈은, 웹기반으로 MDMS 시스템에 개발자 단말기를 접속하여 R 패키지를 관리하고 스크립트를 다운로드 받도록 스크립트 템플릿을 제공하는 스크립트 제공부; 개발자 단말기에서 MDMS 시스템의 HDFS 파일을 다운로드하거나 계량 데이터를 조회할 수 있도록 지원하는 프록시 서버; MDMS 시스템에 접속되는 개발자 단말기를 인증하는 인증서버; 및 R API를 인증하고 하둡파일에 접근하여 다운로드하고 메타데이터를 조회하며 계량 데이터를 질의하기 위한 API를 제공하는 API 제공부;를 포함하는 것을 특징으로 한다. In the present invention, the specialized client analysis module includes: a script providing unit that connects a developer terminal to a web-based MDMS system, manages R packages, and provides a script template to download scripts; A proxy server that supports downloading the HDFS file of the MDMS system or inquiring weighing data from the developer's terminal; an authentication server for authenticating a developer terminal connected to the MDMS system; and an API providing unit that authenticates the R API, accesses and downloads Hadoop files, inquires metadata, and provides APIs for querying metering data.

본 발명에서 프록시 서버는 MDMS 시스템의 NFS 게이트웨이와 접속되어 HDFS 파일을 다운로드하는 것을 특징으로 한다. In the present invention, the proxy server is connected to the NFS gateway of the MDMS system to download the HDFS file.

본 발명에서 연계모듈은 MDMS 시스템의 하둡 클러스터에서 계량 데이터 제공에 대한 목록, 이력조회 설정 중 어느 하나 이상을 관리하고 제공하는 것을 특징으로 한다. In the present invention, the link module is characterized in that it manages and provides any one or more of a list and history inquiry setting for metering data provision in the Hadoop cluster of the MDMS system.

본 발명의 일 측면에 따른 AMI 계량 데이터 분석 장치는 지능형 전력계량 인프라를 통해 수집한 AMI 계량 데이터를 직접 분석할 수 있도록 WEB 환경의 온라인 질의형 분석도구와 전문가용 전용 분석환경 및 타 시스템과 연계하여 데이터를 제공할 수 있어, 사용자는 MDMS 시스템에 저장된 장기 이력 데이터의 하둡 빅데이터를 Web 환경에서 접속 및 질의, 피벗 분석 및 다양한 시각화 방법을 제공하여 별도 코딩 없이도 계량 빅데이터를 분석 가능하고, 개발자등 분석가는 전용 분석환경 및 API 제공으로 손쉽게 계량 빅데이터 접근 및 분석할 수 있도록 한다. The AMI metering data analysis device according to an aspect of the present invention connects with the online query type analysis tool of the WEB environment, the expert analysis environment and other systems so that the AMI metering data collected through the intelligent power metering infrastructure can be directly analyzed. Data can be provided, so users can access and query Hadoop big data of long-term history data stored in the MDMS system in the web environment, and provide pivot analysis and various visualization methods to analyze quantitative big data without separate coding. Analysts can easily access and analyze quantitative big data by providing a dedicated analysis environment and API.

도 1은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치를 나타낸 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 온라인 질의모듈을 구체적으로 나타낸 블록 구성도이다.
도 3은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 온라인 질의모듈의 작동을 설명하기 위한 흐름도이다.
도 4는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 분석대상 적재를 위한 HDFS 디렉토리 구조를 나타낸 예시도이다.
도 5는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 계량 데이터의 검색 화면을 나타낸 예시도이다.
도 6은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 피벗 분석 화면을 나타낸 예시도이다.
도 7은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 차트 분석화면을 나타낸 예시도이다.
도 8은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈을 구체적으로 나타낸 블록 구성도이다.
도 9는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈의 실행 프로세스를 나타낸 구성도이다.
도 10은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈에서 제공하는 API 목록이다.
도 11은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈에서 HDFS 접근 및 파일 다운로드 과정을 설명하기 위한 도면이다.
1 is a block diagram showing an AMI measurement data analysis apparatus according to an embodiment of the present invention.
2 is a block diagram specifically illustrating an online query module of the AMI metering data analysis apparatus according to an embodiment of the present invention.
3 is a flowchart for explaining the operation of the online query module of the AMI metering data analysis apparatus according to an embodiment of the present invention.
4 is an exemplary diagram illustrating an HDFS directory structure for loading an analysis target in the AMI metering data analysis apparatus according to an embodiment of the present invention.
5 is an exemplary diagram illustrating a search screen for weighing data in the AMI weighing data analysis apparatus according to an embodiment of the present invention.
6 is an exemplary view showing a pivot analysis screen in the AMI measurement data analysis apparatus according to an embodiment of the present invention.
7 is an exemplary diagram illustrating a chart analysis screen in the AMI weighing data analysis apparatus according to an embodiment of the present invention.
8 is a block diagram specifically illustrating a specialized client analysis module of the AMI metering data analysis apparatus according to an embodiment of the present invention.
9 is a block diagram illustrating an execution process of a professional client analysis module of an AMI metering data analysis apparatus according to an embodiment of the present invention.
10 is a list of APIs provided by the specialized client analysis module of the AMI metering data analysis apparatus according to an embodiment of the present invention.
11 is a view for explaining the HDFS access and file download process in the professional client analysis module of the AMI metering data analysis apparatus according to an embodiment of the present invention.

이하, 첨부된 도면들을 참조하여 본 발명에 따른 AMI 계량 데이터 분석 장치를 설명한다. 이 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다. 또한, 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있다. 그러므로 이러한 용어들에 대한 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.Hereinafter, an AMI measurement data analysis apparatus according to the present invention will be described with reference to the accompanying drawings. In this process, the thickness of the lines or the size of the components shown in the drawings may be exaggerated for clarity and convenience of explanation. In addition, the terms to be described later are terms defined in consideration of functions in the present invention, which may vary according to the intention or custom of the user or operator. Therefore, definitions of these terms should be made based on the content throughout this specification.

도 1은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치를 나타낸 블록 구성도이고, 도 2는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 온라인 질의모듈을 구체적으로 나타낸 블록 구성도이며, 도 3은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 온라인 질의모듈의 작동을 설명하기 위한 흐름도이고, 도 4는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 분석대상 적재를 위한 HDFS 디렉토리 구조를 나타낸 예시도이며, 도 5는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 계량 데이터의 검색 화면을 나타낸 예시도이고, 도 6은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 피벗 분석 화면을 나타낸 예시도이며, 도 7은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치에서 차트 분석화면을 나타낸 예시도이고, 도 8은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈을 구체적으로 나타낸 블록 구성도이며, 도 9는 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈의 실행 프로세스를 나타낸 구성도이고, 도 10은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈에서 제공하는 API 목록이며, 도 11은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 전문 클라이언트 분석모듈에서 HDFS 접근 및 파일 다운로드 과정을 설명하기 위한 도면이다. 1 is a block diagram illustrating an AMI measurement data analysis apparatus according to an embodiment of the present invention, and FIG. 2 is a block diagram illustrating an online query module of the AMI measurement data analysis apparatus according to an embodiment of the present invention. 3 is a flowchart for explaining the operation of the online query module of the AMI measurement data analysis apparatus according to an embodiment of the present invention, and FIG. 4 is an analysis target in the AMI measurement data analysis apparatus according to an embodiment of the present invention. It is an exemplary view showing the HDFS directory structure for loading, and FIG. 5 is an exemplary view showing a weighing data search screen in the AMI weighing data analysis apparatus according to an embodiment of the present invention, and FIG. 6 is an embodiment of the present invention. It is an exemplary view showing a pivot analysis screen in the AMI metering data analysis apparatus according to the present invention, Figure 7 is an exemplary view showing a chart analysis screen in the AMI metering data analysis apparatus according to an embodiment of the present invention, Figure 8 is an embodiment of the present invention It is a block diagram specifically showing the professional client analysis module of the AMI metering data analysis apparatus according to an example, and FIG. 9 is a block diagram showing the execution process of the professional client analysis module of the AMI metering data analysis apparatus according to an embodiment of the present invention 10 is a list of APIs provided by the specialized client analysis module of the AMI measurement data analysis apparatus according to an embodiment of the present invention, and FIG. 11 is a professional client analysis of the AMI measurement data analysis apparatus according to an embodiment of the present invention. It is a diagram to explain the HDFS access and file download process in the module.

도 1에 도시된 바와 같이 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치(20)는 OLAP 스파크 클러스터(23), 온라인 질의모듈(21), 전문 클라이언트 분석모듈(25) 및 연계모듈(27)을 제공할 수 있다. As shown in FIG. 1 , the AMI metering data analysis device 20 according to an embodiment of the present invention includes an OLAP spark cluster 23 , an online query module 21 , an expert client analysis module 25 , and a link module 27 . ) can be provided.

본 실시예에서 MDMS 시스템(10)은, 계량 데이터를 각 지역본부의 Head-End System에서 수집하여 하둡 클러스터(Hadoop Cluster)에 원본 데이터를 저장하고, NoSQL 데이터베이스에 로딩하여 스파크 클러스터(Spark Cluster)를 통해 분산 병렬로 프로파일링(Profiling), 검증 및 집계 처리한 다음 관계형 데이터베이스(RDB)와 하둡 클러스터에 처리 결과를 저장한다. 그리고, 이력데이터 저장범위는 비용 효율성을 위해 하둡에 10년, NoSQL DB에 13개월, 관계형 DB에 4개월을 저장할 수 있다.In this embodiment, the MDMS system 10 collects weighing data from the Head-End System of each regional headquarters, stores the original data in a Hadoop Cluster, and loads the NoSQL database to create a Spark Cluster. Through distributed parallel profiling, verification, and aggregation processing, the processing results are stored in a relational database (RDB) and a Hadoop cluster. In addition, the history data storage range can be stored for 10 years in Hadoop, 13 months in NoSQL DB, and 4 months in relational DB for cost efficiency.

OLAP(Online Analytical Processing) 스파크 클러스터(23)는 MDMS 시스템(10)으로부터 계량 데이터를 분산 병렬로 프로파일링, 검증 및 집계 처리할 수 있다. The OLAP (Online Analytical Processing) spark cluster 23 may profile, verify, and aggregate measurement data from the MDMS system 10 in distributed parallel.

여기서 스파크 클럭스터(Spark Cluster)(23)는 독립 시스템 방식을 지원하며 Spark master, worker로 구성되며, 대량의 계량 데이터를 질의하기 위해서는 고성능의 Spark 서버들이 다수 필요하므로 병렬 데이터 처리를 통해 분석 성능을 향상시킬 수 있다. Here, the Spark Cluster 23 supports an independent system method and is composed of a Spark master and a worker. In order to query a large amount of weighing data, a large number of high-performance Spark servers are required, so analysis performance can be improved through parallel data processing. can be improved

온라인 질의모듈(21)은 웹기반으로 사용자 단말기와 접속되어 MDMS 시스템(10)에 저장된 계량 데이터를 추출하여 분석하고 시각화할 수 있다. The online query module 21 may be connected to a user terminal based on the web to extract, analyze, and visualize the weighing data stored in the MDMS system 10 .

즉, 온라인 질의모듈(21)을 통해 웹기반으로 접속한 사용자 단말기(30)에서 HDFS(Hardoop Distributed File System; 하둡 분산 파일 시스템) 또는 Oracle을 대상으로 검색하고자 하는 키워드 또는 검색 조건이 입력될 경우 원하는 데이터를 검색할 수 있도록 제공하고, 검색되어진 결과의 필드, 행, 열 등을 선택하여 원하는 분석 결과를 시각화하여 제공할 수 있다. That is, when a keyword or search condition to search for HDFS (Hardoop Distributed File System) or Oracle is input in the user terminal 30 accessed through the web-based online query module 21, the desired Data can be searched and provided, and desired analysis results can be visualized and provided by selecting fields, rows, and columns of the searched results.

전문 클라이언트 분석모듈(25)은 웹기반으로 접속된 개발자 단말기(40)에 대해 MDMS 시스템(100에 접근하여 계량 데이터의 고급분석을 위한 API를 제공하여 파일을 송수신할 수 있도록 지원할 수 있어, API를 통해 고급분석에 필요한 HDFS 파일을 R 클라이언트로 다운로드할 수 있어 쉽게 고급 분석 및 시각화를 수행할 수 있도록 한다. The professional client analysis module 25 can access the MDMS system 100 for the web-based developer terminal 40 and provide an API for advanced analysis of weighing data to support transmission and reception of files, HDFS files required for advanced analysis can be downloaded to the R client, allowing easy advanced analysis and visualization.

연계모듈(27)은 웹기반으로 운영자 단말기와 접속되어 MDMS 시스템(10)의 하둡(Hadoop) 데이터를 타 시스템에 제공하고 설정할 수 있어, HDFS에 적재된 계량 데이터를 타 시스템에 제공하기 위한 계량 데이터 설정기능과 추출 및 제공 현황 등을 관리할 수 있다. The linkage module 27 is connected to the operator terminal based on the web to provide and set Hadoop data of the MDMS system 10 to other systems, so weighing data for providing the weighing data loaded in HDFS to other systems You can manage the setting function, extraction and provision status, etc.

보다 구체적으로, 온라인 질의모듈(21)은 도 2에 도시된 바와 같이 소형 관계 DB(210), 데이터 모델 관리부(212), 계량 데이터 조회부(214), 분석 시각화부(216) 및 환경 설정부(218)를 포함할 수 있다. More specifically, as shown in FIG. 2 , the online query module 21 includes a small relation DB 210 , a data model management unit 212 , a weighing data inquiry unit 214 , an analysis visualization unit 216 , and an environment setting unit. (218).

소형 관계 DB(210)는 분석대상 속성에 대한 속성정보에 대한 모델을 메타데이터 형태로 관리할 수 있다. The small relation DB 210 may manage a model for attribute information on an analysis target attribute in the form of metadata.

여기서, 소형 관계 DB(210)는 소형으로 MariaDB에서는 데이터모델에 대한 Meta 데이터에 대한정보 및 사용자 정보 등 AMI 계량 데이터 분석 장치(21)에 필요한 데이터들을 관리하고, NoSQL DB로 사용하는 Mongo DB는 SON과 같은 동적인 스키마형 도큐먼트 데이터를 처리하고 관리할 수 있다. Here, the small relation DB 210 is small, and MariaDB manages the data necessary for the AMI metric data analysis device 21, such as information on meta data for the data model and user information, and the Mongo DB used as the NoSQL DB is SON. It can process and manage dynamic schema-type document data such as

데이터 모델 관리부(212)는 소형 관계 DB(210)나 HDFS 소스의 분석 대상 속성에 대한 속성정보에 대한 모델을 관리할 수 있다. The data model management unit 212 may manage the model for attribute information on the analysis target attribute of the small relation DB 210 or the HDFS source.

계량 데이터 조회부(214)는 데이터 모델 관리부(212)에서 관리되는 데이터 모델 형식으로 계량 데이터를 조회하고 특정 키워드를 검색하거나 통계 분석을 하기 위한 검색을 지원할 수 있다. The measurement data inquiry unit 214 may search for measurement data in a data model format managed by the data model management unit 212 and support a search for specific keywords or statistical analysis.

분석 시각화부(216)는 계량 데이터 조회부(214)를 통해 조회된 계량 데이터를 OLAP 스파크 클러스터(23)를 통해 병렬로 분석하고 시각화할 수 있다. The analysis visualization unit 216 may analyze and visualize the measurement data inquired through the measurement data inquiry unit 214 in parallel through the OLAP spark cluster 23 .

여기서, 분석 시각화부(216)는 피벗(Pivot) 기능을 제공하고, 분석하고자 하는 데이터를 분석 유형 및 차트를 통해 시각화할 수 있다. Here, the analysis visualization unit 216 may provide a pivot function and visualize data to be analyzed through an analysis type and a chart.

환경 설정부(218)는 사용자 단말기(30)가 데이터 모델 관리부(212), 계량 데이터 조회부(214) 및 분석 시각화부(216)에 접속하기 위한 환경을 설정할 수 있다. The environment setting unit 218 may set an environment for the user terminal 30 to access the data model management unit 212 , the measurement data inquiry unit 214 , and the analysis visualization unit 216 .

도 3은 본 발명의 일 실시예에 따른 AMI 계량 데이터 분석 장치의 온라인 질의모듈의 작동을 설명하기 위한 흐름도이다. 3 is a flowchart for explaining the operation of the online query module of the AMI metering data analysis apparatus according to an embodiment of the present invention.

도 3에 도시된 바와 같이 온라인 질의모듈(21)은 계량 데이터로부터 특정 키워드 검색을 하거나 통계 분석할 수 있는 환경을 제공할 수 있다. As shown in FIG. 3 , the online query module 21 may provide an environment in which a specific keyword can be searched or statistical analysis can be performed from measurement data.

먼저, 온라인 질의모듈(21)은 MDMS 시스템(10)의 RDB 또는 HDFS의 연결정보를 생성하여 분석대상 데이터를 소형 관계 DB(210)에 적재하고, 분석대상 테이블이나 파일, 또는 폴더를 선택하여 동시에 여러 파일들을 선택하여 데이터 모델을 생성할 수 있다. First, the online query module 21 creates the connection information of the RDB or HDFS of the MDMS system 10, loads the analysis target data into the small relational DB 210, selects the analysis target table, file, or folder at the same time You can select multiple files to create a data model.

여기서 분석대상 데이터는 MDMS 시스템(10)의 NoSQL 클러스터(MongoDB)에 적재된 계량 데이터를 본 실시예에 의한 AMI 계량 데이터 분석 장치(20)에서 활용할 수 있도록 MongoDB export utility를 이용해서 CSV 파일 형태로 데이터를 내보낼 수 있다. 그 다음 Apache Nifi를 이용해서 계량 데이터 파일을 HDFS로 적재할 수 있다. Here, the analysis target data is data in CSV file format using the MongoDB export utility so that the weighing data loaded in the NoSQL cluster (MongoDB) of the MDMS system 10 can be utilized in the AMI weighing data analysis device 20 according to this embodiment. can be exported. You can then load the metering data file into HDFS using Apache Nifi.

또한, 계량 데이터 제공기능을 위해서 Hive Meta Data데이터를 만들고 HDFS에 적재된 파일을 JDBC(Java Database Connectivity) 형태로 접속해서 질의할 수 있는 환경을 제공할 수 있다. In addition, for the metering data provision function, it is possible to create Hive Meta Data data and provide an environment for querying by connecting the files loaded in HDFS in the form of JDBC (Java Database Connectivity).

여기서 계량 데이터 하둡 클러스터 HDFS 디렉토리 구조는 지역본부, 검침코드, Meter_key(2자리), 년도, 월, 일자, 계량 데이터 파일로 도 4에 도시된 바와 같이 데이터를 보관할 수 있다. Here, the metering data Hadoop cluster HDFS directory structure can store data as shown in FIG. 4 as regional headquarters, meter reading code, Meter_key (2 digits), year, month, date, and metering data file.

이후 온라인 질의모듈(21)은 계량 데이터의 검색을 위해 기존 저장된 데이터 모델을 선택할 수 있으며, 검색범위를 축소하기 위해 데이터 모델의 컬럼을 선택하고, 검색 시간범위를 지정할 수 있고, 검색 질의어를 통해 검색 조건을 입력하여 검색할 수 있다. Afterwards, the online query module 21 may select an existing stored data model to search for weighing data, select a column of the data model to reduce the search range, designate a search time range, and search through a search query You can search by entering conditions.

여기서 데이터 모델은 도 4와 같이 적재된 분석대상 HDFS 파일이나 RDBMS에 저장된 데이터를 연결하여 만들 수 있으며, 기존 생성한 데이터 모델은 저장 관리하여 도 5에 도시된 계량 데이터 검색 화면에서 리스트로 나타낼 수 있다. Here, the data model can be created by linking the data stored in the loaded analysis target HDFS file or RDBMS as shown in FIG. 4, and the previously created data model can be stored and managed and displayed as a list on the weighing data search screen shown in FIG. .

새로운 데이터 모델을 생성하기 위해서는 먼저 검색하고자 하는 데이터 모델과 검색 기간을 설정하고, 검색조건에서 검색어는 직접 입력하거나 추천 기능의 도움을 받아 입력할 수 있다. To create a new data model, first set the data model to be searched for and a search period, and search terms can be entered directly or with the help of a recommendation function in the search conditions.

온라인 질의모듈(21)은 검색어 입력란에 검색어가 입력되면 이에 맞추어 검색어 추천창을 표시하여 입력한 내용에 따라 이전 검색 이력을 보여주고, 명령어가 입력되었다면 그 명령어의 간략한 설명과 문법, 예시 등을 보여줄 수 있다. When a search word is input in the search word input field, the online query module 21 displays a search word recommendation window according to the inputted content, and shows the previous search history according to the entered content. can

이때 검색어 문법이나 명령어를 작성하는 방법의 편의성을 위해 Command Syntax 도움말을 제공할 수 있다. 이전 검색 이력은 키보드 위, 아래 키나 마우스 클릭으로 선택할 수 있으며, 선택하면 바로 입력란에 이전 검색 내용이 입력되고, 검색어 추천 창이 자동으로 나타나는 것을 원하지 않는다면 검색어 추천 버튼을 클릭하여 off 상태로 설정할 수 있다. In this case, Command Syntax help may be provided for the convenience of writing keyword grammar or commands. Previous search history can be selected by using the up or down keys on the keyboard or by clicking the mouse. When selected, the previous search information is immediately entered into the input box.

여기서 검색 질의어는 SQL(Structured Query Language)과 같이 where 조건절 및 연산자를 통해 데이터 필터링이 가능하고 통계함수, 그룹함수, 정렬함수 등을 사용할 수 있다. Here, as in Structured Query Language (SQL), data filtering is possible through where conditional clauses and operators, and statistical functions, group functions, sort functions, etc. can be used.

검색결과는 도 5에 도시된 바와 같이 검색 조건에 따라 이벤트, 통계, 시각화 등 3개의 탭으로 구분되며, 이벤트 탭은 모든 검색 시 이벤트 리스트가 기본적으로 출력되는 탭이며, 통계 탭과 시각화 탭은 검색 바에 stats, pivot 등 통계 결과를 얻는 명령어를 사용하여 검색할 경우에만 표시될 수 있다. As shown in FIG. 5, the search results are divided into three tabs such as event, statistics, and visualization according to the search conditions. The event tab is a tab where an event list is basically output during all searches, and the statistics tab and visualization tab are search results. It can be displayed only when searching using commands that obtain statistical results such as stats and pivot in the bar.

좌측의 데이터 모델 컬럼에서 기본적으로 선택한 데이터 모델의 필드 정보를 표시할 수 있고, 검색 화면에서는 결과 이벤트 그리드의 열을 제어하는 역할과 검색 결과에 대한 필드의 통계성 정보를 추가로 제공할 수 있다. In the data model column on the left, field information of the data model selected by default can be displayed, and in the search screen, the role of controlling the columns of the result event grid and statistical information of the fields for the search results can be additionally provided.

또한, 필드 목록에서 각 필드 항목에 있는 체크박스를 이용하여 이벤트 탭의 검색 결과 그리드의 동일한 이름의 열을 표기하거나 숨길 수 있고, 데이터 개수 버튼이 on 상태일 경우, 검색 수행 시 모든 필드에 대해 distinct count 정보를 불러올 수 있다. In addition, by using the checkbox in each field item in the field list, you can display or hide columns with the same name in the search result grid in the Event tab. Count information can be called.

또한, 특정 필드를 선택했을 경우에는 필드 통계 정보 창이 팝업되면서 검색 결과 내에서 해당 어떤 종류의 값이 어떤 분포를 나타내고 있는지 상위 10개 값에 대한 상세한 정보를 서버로부터 불러와 표시할 수 있다. In addition, when a specific field is selected, the field statistics information window pops up and detailed information about the top 10 values can be retrieved from the server and displayed to indicate which type of value represents what distribution within the search result.

데이터 탭에서는 기본적인 검색 결과에 대한 정보를 표시하고, 타임라인 그래프에서는 각 시간대별로 몇 건의 데이터가 있는지 막대 그래프로 나타내며, 검색결과 그리드에서는 데이터의 일부분을 그리드 뷰 형태로 출력할 수 있다. In the data tab, information about basic search results is displayed, in the timeline graph, how many pieces of data are in each time period in a bar graph, and in the search result grid, a part of the data can be output in the form of a grid view.

통계 탭에서는 stats, pivot 등의 명령어 결과를 그리드 뷰로 보여주며, 시각화 탭에서는 이 결과를 차트로 표현할 수 있고, 차트 유형을 변경하여 같은 데이터를 꺾은선형, 막대형, 원형 등의 다른 차트로 살펴보거나, 옵션 다이얼로그를 통해 x/y 축 레이블, 데이터 값 표시 여부 등 차트의 스타일을 변경할 수 있으며, 타임라인 차트를 통해 시간이 지남에 따라 발생되는 이벤트의 변화를 확인할 수 있다. In the Statistics tab, the results of commands such as stats and pivot are displayed in a grid view, and in the Visualization tab, the results can be expressed as a chart. , you can change the style of the chart, such as x/y axis labels and whether to display data values, through the option dialog, and you can check the changes in events that occur over time through the timeline chart.

특히, 이벤트의 수가 급격하게 증가하거나 감소하게 하는 비정상적인 상황을 쉽게 인지할 수 있어, 이러한 비정상 상황에 대하여 상세 분석이 필요한 경우, 특정 막대를 클릭하거나 영역을 드래그로 지정한 후, 지정한 시간 범위를 기준으로 검색을 다시 수행할 수 있다. In particular, it is easy to recognize abnormal situations that cause the number of events to rapidly increase or decrease, so if detailed analysis of these abnormal situations is required, click a specific bar or specify an area by dragging, and then based on the specified time range You can perform the search again.

또한, 온라인 질의모듈(21)은 사용자 단말기(30)를 통해 분석가가 검색 결과의 각 필드를 행, 열, 값 등으로 적절히 조합함으로써, 원하는 분석 결과를 쉽고 빠르게 도출하기 위한 피벗분석 기능을 도 6에 도시된 바와 같은 피벗 분석 화면을 통해 제공할 수 있다. In addition, the online query module 21 provides a pivot analysis function for easily and quickly deriving a desired analysis result by appropriately combining each field of a search result by an analyst through the user terminal 30 into a row, column, value, etc. It can be provided through the pivot analysis screen as shown in .

여기서 온라인 질의모듈(21)은 피벗분석을 위해 데이터 모델을 선택하고 필터를 추가하여 피벗 실행의 대상이 되는 범위를 설정할 수 있다. 즉, 사용자는 특정 필드의 값의 범위를 설정함으로써, 피벗 실행의 대상이 되는 데이터를 제한할 수 있다. Here, the online query module 21 selects a data model for pivot analysis and adds a filter to set a target range for pivot execution. That is, the user can limit the data to be pivoted by setting the range of values of a specific field.

도 6에 도시된 바와 같이 피벗 설정의 상단에서 필터 설정을 이용하여 특정 필드의 데이터를 제한적으로 분석할 수 있으며, 필드의 속성이 문자형이나 숫자형에 따라 적용 가능한 연산자를 사용할 수 있다. As shown in FIG. 6 , data of a specific field can be limitedly analyzed by using the filter setting at the top of the pivot setting, and operators applicable according to the character type or numeric type of the field property can be used.

예를 들어, 계량 데이터 중에서 LP(Load Profile)의 구간 검침값이 1kW 이상인 값으로 설정하거나, 정전데이터에서 복전시간이 수신되지 않은 데이터만 필터를 설정할 수 있다. For example, in the weighing data, the meter reading value of the LP (Load Profile) section may be set to a value of 1 kW or more, or a filter may be set only for data for which the power recovery time is not received in the power outage data.

또한, 온라인 질의모듈(21)은 시각화를 위해 사용자 단말기에서 웹기반으로 사용자가 분석 유형을 선택하고, 데이터 모델을 선택하며, 분석 컬럼을 지정하여 실행함으로써, 검색 결과의 각 필드, 행, 열 등을 GUI 화면상으로 원하는 분석 결과를 쉽고 빠르게 도출하기 위하여 피벗과는 달리 시각화에 중점을 두어 차트에 최적화된 직관적인 사용자 인터페이스를 도 7에 도시된 바와 같이 제공할 수 있다. In addition, the online query module 21 allows a user to select an analysis type, select a data model, and designate and execute an analysis column based on the web in the user terminal for visualization, so that each field, row, column, etc. of the search result is executed. In order to quickly and easily derive desired analysis results on the GUI screen, unlike pivot, an intuitive user interface optimized for charts can be provided as shown in FIG. 7 by focusing on visualization.

즉, Line Plot, Scatter Plot, Bar Chart, Pie Chart, Histogram, Sankey Chart, Heatmap 등 다양한 차트 설정 및 시각화 옵션을 제공할 수 있다. That is, various chart settings and visualization options such as Line Plot, Scatter Plot, Bar Chart, Pie Chart, Histogram, Sankey Chart, and Heatmap can be provided.

전문 클라이언트 분석모듈(25)은 도 8에 도시된 바와 같이 스크립트 제공부(250), 프록시 서버(252), 인증서버(254) 및 API 제공부(256)를 포함할 수 있다. The professional client analysis module 25 may include a script providing unit 250 , a proxy server 252 , an authentication server 254 , and an API providing unit 256 as shown in FIG. 8 .

스크립트 제공부(250)는 웹기반으로 MDMS 시스템(10)에 개발자 단말기(40)를 접속하여 R 패키지를 관리하고 스크립트를 다운로드 받도록 스크립트 템플릿을 제공할 수 있다. The script providing unit 250 may connect the developer terminal 40 to the MDMS system 10 based on the web to provide a script template to manage the R package and download the script.

개발자 단말기(40)의 클라이언트 PC 환경에서 고급 분석 및 시각화하는 프로세스는 도 9에 도시된 바와 같이 MDMS 시스템(10)에 웹기반으로 접속하여 공유되는 R 클라이언트, R 패키지를 다운로드 받아 설치하고, R 스튜디오를 실행하여 R 샘플 스크립트를 Load한 다음 분석하고자 하는 목적에 따라 R 스크립트를 수정하여 R 스크립트를 실행함으로써 시각화 및 분석이 가능하도록 한다. In the process of advanced analysis and visualization in the client PC environment of the developer terminal 40, as shown in FIG. 9, the R client and R package shared by web-based access to the MDMS system 10 are downloaded and installed, and the R studio to load the R sample script, then modify the R script according to the purpose of analysis and execute the R script to enable visualization and analysis.

프록시(Proxy) 서버(252)는 MDMS 시스템(10)의 NFS 게이트웨이와 접속되어 HDFS에 적재된 파일을 네트워크 파일시스템(NFS) 프로토콜로 서버 호스트에 파일공유 서비스를 제공하여 개발자 단말기에서 MDMS 시스템(10)의 HDFS 파일을 다운로드하거나 계량 데이터를 조회할 수 있도록 지원할 수 있다. The proxy server 252 is connected to the NFS gateway of the MDMS system 10 and provides a file sharing service to the server host using the network file system (NFS) protocol for the files loaded in HDFS, and from the developer terminal to the MDMS system 10 ) to download the HDFS file or to inquire weighing data.

인증서버(254)는 Keycloak로 구성되어 MDMS 시스템(10)과 SSO(Single Sign-On)를 처리하여 개발자 단말기(40)의 접속을 인증할 수 있다. The authentication server 254 may be configured as a keycloak to process single sign-on (SSO) with the MDMS system 10 to authenticate the connection of the developer terminal 40 .

API 제공부(256)는 R API를 인증하여 하둡파일에 접근하여 다운로드하고 메타데이터를 조회하며 계량 데이터를 질의하는 API를 제공할 수 있다. The API providing unit 256 may provide an API for authenticating the R API, accessing and downloading the Hadoop file, inquiring metadata, and querying measurement data.

전문가 분석을 위한 API 목록은 도 10에 예시된 바와 같이 로그인, 인증처리, 계량 데이터 다운로드, 계량 데이터 제공 Meta정보, 계량 데이터 질의, 시계열 데이터 분석을 위한 LP 데이터 로딩, 전처리코드, 탐색적 분석코드, 이상치 및 결측 보정, 분석 코드 등의 API를 제공할 수 있다. As illustrated in FIG. 10, the API list for expert analysis includes login, authentication processing, weighing data download, weighing data provision meta information, weighing data query, LP data loading for time series data analysis, preprocessing code, exploratory analysis code, APIs such as outlier and missing corrections and analysis codes can be provided.

따라서 개발자 단말기(40)를 통해 API를 이용하여 MDMS 시스템(10)의 HDFS에 인증보안이 적용된 방식으로 손쉽게 접근하여 분석을 수행할 수 있다. Therefore, it is possible to easily access and analyze the HDFS of the MDMS system 10 by using an API through the developer terminal 40 in a manner in which authentication security is applied.

예를 들어, API 중에서 Hadoop Access 및 HDFS 파일 다운로드 API에 대해 보다 구체적으로 설명하면 도 11에 도시된 바와 같이 Web API 및 Keycloadk 인증서버(254)를 통해 인증을 수행한 다음 프록시 서버(252)와 NFS Gateway를 통해 서비스를 제공할 수 있다. For example, if we describe in more detail about Hadoop Access and HDFS file download API among APIs, as shown in Fig. 11, authentication is performed through Web API and Keycloadk authentication server 254, and then, proxy server 252 and NFS Services can be provided through the Gateway.

여기서, NFS Gateway는 MDMS 시스템(10)의 Hadoop Cluster에 위치하며 HDFS 파일 시스템을 리눅스 서버 파일시스템으로 탑재(mount)하고, MDA.loadData API는 내부적으로 MDMS SSO처리를 하여 인증토큰을 체크할 수 있다. Here, the NFS Gateway is located in the Hadoop Cluster of the MDMS system 10 and mounts the HDFS file system as a Linux server file system, and the MDA.loadData API internally performs MDMS SSO processing to check the authentication token. .

또한, 대량의 데이터를 한 번에 조회하는 것을 제한하기 위해 계량 데이터 테이블로 제한 기간을 관리하며, 해당 기간을 초과해서 다운로드 요청하면 에러 메시지를 출력할 수 있다. In addition, in order to limit the inquiry of a large amount of data at once, a limited period is managed with the weighing data table, and an error message can be output if a download request is made beyond the relevant period.

프록시(Proxy) 서버(252)는 NFS Gateway를 통해 MDMS 시스템(10)에 접속되고, HDFS 파일시스템을 다운로드 할 때는 NFS Gateway의 sftp 기능을 활용해서 다운로드 처리할 수 있다. The proxy server 252 is connected to the MDMS system 10 through the NFS Gateway, and when downloading the HDFS file system, the download can be processed using the sftp function of the NFS Gateway.

또한, 사용자별 다운로드 정보는 Web API를 통해서 MDMS 시스템(10)의 RDB에 로그를 기록하고, 다운로드된 CSV 형태의 HDFS 파일은 별도 뷰어를 통해서 파일을 확인할 수 있으며, R 클라이언트 CSV API를 사용해서 PC 메모리에 로딩한 후에 분석 및 시각화를 진행할 수 있다. In addition, the download information for each user is recorded in the RDB of the MDMS system 10 through the Web API, the downloaded CSV format HDFS file can be checked through a separate viewer, and the PC using the R client CSV API After loading into memory, analysis and visualization can proceed.

개발자 단말기(40)는 이와 같이 다운로드된 계량 데이터에 대해 분석 스크립트를 이용해서 이상치 및 결측치를 보정할 수 있다. The developer terminal 40 may correct outliers and missing values by using an analysis script for the downloaded weighing data in this way.

연계모듈(27)은 MDMS 시스템(10)의 하둡 클러스터에서 계량 데이터 제공에 대한 목록, 이력조회 설정 중 어느 하나 이상을 웹기반으로 운영자 단말기(50)에서 관리하고 제공할 수 있다. The link module 27 may manage and provide any one or more of a list for providing metering data and a history inquiry setting in the Hadoop cluster of the MDMS system 10 on a web-based basis in the operator terminal 50 .

MDMS 시스템(10)에 저장되어 있는 대규모/대용량의 AMI 계량 데이터를 필요로 하는 Legacy 시스템에 데이터 항목과 연계 시스템 정보를 설정하여 자동 연계하거나 클라이언트 PC로 다운로드기능을 제공할 수 있다. It is possible to automatically link data items and link system information to a legacy system that requires large/large-capacity AMI measurement data stored in the MDMS system 10 to automatically link or provide a download function to a client PC.

여기서 계량 데이터 제공에 대한 목록, 이력조회, 설정 등 관리하는 기능을 이용하여 스파크 클러스터에서 배치(Batch) 작업을 통해 설정내용을 로드하여 하둡 클러스터의 Hive에 접속하여 계량 데이터 조회 Query를 생성하여 실행하면 계량 데이터를 선택할 수 있다. 스파크 클러스터에서 Query 조건에 따라 추출된 계량 데이터 Dataset을 Legacy 시스템에 전달하고, 하둡 클러스터에도 저장한 다음 제공결과를 저장하여 제공이력을 관리할 수 있다. Here, by using the function to manage the list, history inquiry, setting, etc. of the weighing data provision, load the setting contents through a batch operation in the spark cluster, connect to Hive of the Hadoop cluster, create and execute the weighing data inquiry query Weighing data can be selected. The provision history can be managed by transferring the data set extracted from the spark cluster according to the query condition to the legacy system and storing it in the Hadoop cluster as well.

상술한 바와 같이, 본 발명의 실시예에 의한 AMI 계량 데이터 분석 장치에 따르면, 지능형 전력계량 인프라를 통해 수집한 AMI 계량 데이터를 직접 분석할 수 있도록 WEB 환경의 온라인 질의형 분석도구와 전문가용 전용 분석환경 및 타 시스템과 연계하여 데이터를 제공할 수 있어, 사용자는 MDMS 시스템에 저장된 장기 이력 데이터의 하둡 빅데이터를 Web 환경에서 접속 및 질의, 피벗 분석 및 다양한 시각화 방법을 제공하여 별도 코딩 없이도 계량 빅데이터를 분석 가능하고, 개발자등 분석가는 전용 분석환경 및 API 제공으로 손쉽게 계량 빅데이터 접근 및 분석할 수 있도록 한다. As described above, according to the AMI metering data analysis device according to the embodiment of the present invention, an online query type analysis tool of the WEB environment and dedicated analysis for experts so that the AMI metering data collected through the intelligent power metering infrastructure can be directly analyzed Data can be provided in connection with the environment and other systems, so users can access and query Hadoop big data of long-term history data stored in the MDMS system in the web environment, and provide pivot analysis and various visualization methods to measure big data without separate coding. can be analyzed, and analysts such as developers can easily access and analyze quantitative big data by providing a dedicated analysis environment and API.

본 명세서에서 설명된 구현은, 예컨대, 방법 또는 프로세스, 장치, 소프트웨어 프로그램, 데이터 스트림 또는 신호로 구현될 수 있다. 단일 형태의 구현의 맥락에서만 논의(예컨대, 방법으로서만 논의)되었더라도, 논의된 특징의 구현은 또한 다른 형태(예컨대, 장치 또는 프로그램)로도 구현될 수 있다. 장치는 적절한 하드웨어, 소프트웨어 및 펌웨어 등으로 구현될 수 있다. 방법은, 예컨대, 컴퓨터, 마이크로프로세서, 집적 회로 또는 프로그래밍 가능한 로직 디바이스 등을 포함하는 프로세싱 디바이스를 일반적으로 지칭하는 프로세서 등과 같은 장치에서 구현될 수 있다. 프로세서는 또한 최종-사용자 사이에 정보의 통신을 용이하게 하는 컴퓨터, 셀 폰, 휴대용/개인용 정보 단말기(personal digital assistant: "PDA") 및 다른 디바이스 등과 같은 통신 디바이스를 포함한다.Implementations described herein may be implemented in, for example, a method or process, an apparatus, a software program, a data stream, or a signal. Although discussed only in the context of a single form of implementation (eg, discussed only as a method), implementations of the discussed features may also be implemented in other forms (eg, as an apparatus or program). The apparatus may be implemented in suitable hardware, software and firmware, and the like. A method may be implemented in an apparatus such as, for example, a processor, which generally refers to a computer, a microprocessor, a processing device, including an integrated circuit or programmable logic device, or the like. Processors also include communication devices such as computers, cell phones, portable/personal digital assistants (“PDA”) and other devices that facilitate communication of information between end-users.

본 발명은 도면에 도시된 실시예를 참고로 하여 설명되었으나, 이는 예시적인 것에 불과하며, 당해 기술이 속하는 분야에서 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. Although the present invention has been described with reference to the embodiment shown in the drawings, this is merely an example, and those skilled in the art to which various modifications and equivalent other embodiments are possible. will understand

따라서 본 발명의 진정한 기술적 보호범위는 아래의 청구범위에 의해서 정하여져야 할 것이다.Therefore, the true technical protection scope of the present invention should be defined by the following claims.

10 : MDMS 시스템 20 : AMI 계량 데이터 분석 장치
21 : 온라인 질의모듈 23 : OLAP 스파크 클러스터
25 : 전문 클라이언트 분석모듈 27 : 연계모듈
30 : 사용자 단말기 40 : 개발자 단말기
50 : 운영자 단말기 210 : 소형 관계 DB
212 : 데이터 모델 관리부 214 : 계량 데이터 조회부
216 : 분석 시각화부 218 : 환경 설정부
250 : 스크립트 제공부 252 : 프록시 서버
254 : 인증서버 256 : API 제공부
10: MDMS system 20: AMI weighing data analysis device
21: Online Query Module 23: OLAP Spark Cluster
25: specialized client analysis module 27: linkage module
30: user terminal 40: developer terminal
50: operator terminal 210: small relation DB
212: data model management unit 214: weighing data inquiry unit
216: analysis visualization unit 218: environment setting unit
250: script providing unit 252: proxy server
254: authentication server 256: API provider

Claims (9)

MDMS 시스템으로부터 계량 데이터를 분산 병렬로 프로파일링, 검증 및 집계 처리하는 OLAP 스파크 클러스터;
웹기반으로 사용자 단말기와 접속되어 상기 MDMS 시스템에 저장된 상기 계량 데이터를 추출하여 분석하고 시각화하는 온라인 질의모듈;
웹기반으로 접속된 개발자 단말기에 대해 상기 MDMS 시스템에 접근하여 스크립트를 제공하고, 상기 계량 데이터의 고급분석을 위한 API를 제공하여 파일을 송수신할 수 있도록 지원하는 전문 클라이언트 분석모듈; 및
웹기반으로 운영자 단말기와 접속되어 상기 MDMS 시스템의 하둡(Hadoop) 데이터를 타 시스템에 제공하고 설정하기 위한 연계모듈;을 포함하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
OLAP Spark cluster for distributing and parallel profiling, validation, and aggregation of weighing data from MDMS systems;
an online query module for extracting, analyzing, and visualizing the measurement data stored in the MDMS system connected to a web-based user terminal;
a professional client analysis module that accesses the MDMS system for a web-based connected developer terminal to provide a script, and provides an API for advanced analysis of the metering data to support sending and receiving files; and
AMI metering data analysis device comprising a; a web-based connection module for connecting to an operator terminal to provide and set Hadoop data of the MDMS system to other systems.
제 1항에 있어서, 상기 온라인 질의모듈은,
분석대상 속성에 대한 속성정보에 대한 모델을 메타데이터 형태로 관리하는 소형 관계형 DB;
상기 소형 관계 DB나 HDFS 소스의 분석 대상 속성에 대한 속성정보에 대한 모델을 상기 소형 관계 DB를 통해 관리하는 데이터 모델 관리부;
상기 데이터 모델 관리부에서 관리되는 데이터 모델 형식으로 계량 데이터를 조회하는 계량 데이터 조회부;
상기 계량 데이터 조회부를 통해 조회된 상기 계량 데이터를 상기 OLAP(Online Analytical Processing) 스파크 클러스터를 통해 병렬로 분석하고 시각화하는 분석 시각화부; 및
상기 사용자 단말기가 상기 데이터 모델 관리부, 상기 계량 데이터 조회부 및 상기 분석 시각화부에 접속하기 위한 환경을 설정하는 환경 설정부;를 포함하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The method of claim 1, wherein the online query module comprises:
A small relational DB that manages the model for the attribute information on the analysis target attribute in the form of metadata;
a data model management unit for managing a model for attribute information on the analysis target attribute of the small relation DB or the HDFS source through the small relation DB;
a weighing data inquiry unit that inquires about measurement data in a data model format managed by the data model management unit;
an analysis visualization unit that analyzes and visualizes the measurement data retrieved through the measurement data inquiry unit in parallel through the OLAP (Online Analytical Processing) spark cluster; and
and an environment setting unit for setting an environment for the user terminal to access the data model management unit, the measurement data inquiry unit, and the analysis visualization unit.
제 2항에 있어서, 상기 계량 데이터 조회부는, 데이터 모델을 선택하고, 데이터 모델의 컬럼과 검색 시간범위를 저장하고, 검색 질의어를 통해 검색조건을 입력하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The apparatus of claim 2, wherein the metering data inquiry unit selects a data model, stores a column of the data model and a search time range, and inputs a search condition through a search query.
제 3항에 있어서, 상기 검색 질의어는, where 조건절 및 연산자를 통해 데이터를 필터링하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The apparatus of claim 3, wherein the search query word filters data through a where conditional clause and an operator.
제 2항에 있어서, 상기 계량 데이터 조회부는, 통계함수, 그룹함수 및 정렬함수 어느 하나 이상을 사용하여 검색하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The apparatus according to claim 2, wherein the weighing data inquiry unit searches using one or more of a statistical function, a group function, and an alignment function.
제 2항에 있어서, 상기 분석 시각화부는, 검색 결과의 각 필드를 행, 열, 값 중 어느 하나 이상을 조합하여 피벗 분석 기능을 제공하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The apparatus of claim 2, wherein the analysis visualization unit provides a pivot analysis function by combining each field of a search result with any one or more of a row, a column, and a value.
제 1항에 있어서, 상기 전문 클라이언트 분석모듈은,
웹기반으로 상기 MDMS 시스템에 개발자 단말기를 접속하여 R 패키지를 관리하고 스크립트를 다운로드 받도록 스크립트 템플릿을 제공하는 스크립트 제공부;
상기 개발자 단말기에서 상기 MDMS 시스템의 HDFS 파일을 다운로드하거나 상기 계량 데이터를 조회할 수 있도록 지원하는 프록시 서버;
상기 MDMS 시스템에 접속되는 상기 개발자 단말기를 인증하는 인증서버; 및
R API를 인증하고 하둡파일에 접근하여 다운로드하고 메타데이터를 조회하며 계량 데이터를 질의하기 위한 API를 제공하는 API 제공부;를 포함하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
According to claim 1, wherein the professional client analysis module,
a script providing unit that connects a developer terminal to the MDMS system based on a web, manages the R package, and provides a script template to download the script;
a proxy server supporting the developer terminal to download the HDFS file of the MDMS system or to inquire the metering data;
an authentication server for authenticating the developer terminal connected to the MDMS system; and
AMI metering data analysis device comprising: an API providing API for authenticating R API, accessing and downloading Hadoop files, inquiring metadata, and querying metering data.
제 7항에 있어서, 상기 프록시 서버는 상기 MDMS 시스템의 NFS 게이트웨이와 접속되어 HDFS 파일을 다운로드하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The apparatus of claim 7, wherein the proxy server is connected to an NFS gateway of the MDMS system to download an HDFS file.
제 1항에 있어서, 상기 연계모듈은 상기 MDMS 시스템의 하둡 클러스터에서 계량 데이터 제공에 대한 목록, 이력조회 설정 중 어느 하나 이상을 관리하고 제공하는 것을 특징으로 하는 AMI 계량 데이터 분석 장치.
The apparatus of claim 1, wherein the link module manages and provides any one or more of a list for metering data provision and a history inquiry setting in the Hadoop cluster of the MDMS system.
KR1020200122331A 2020-09-22 2020-09-22 Apparatus for analyzing meter data of ami KR20220039325A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200122331A KR20220039325A (en) 2020-09-22 2020-09-22 Apparatus for analyzing meter data of ami

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200122331A KR20220039325A (en) 2020-09-22 2020-09-22 Apparatus for analyzing meter data of ami

Publications (1)

Publication Number Publication Date
KR20220039325A true KR20220039325A (en) 2022-03-29

Family

ID=80995842

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200122331A KR20220039325A (en) 2020-09-22 2020-09-22 Apparatus for analyzing meter data of ami

Country Status (1)

Country Link
KR (1) KR20220039325A (en)

Similar Documents

Publication Publication Date Title
US10521404B2 (en) Data transformations with metadata
US11620400B2 (en) Querying in big data storage formats
US11636105B2 (en) Generating a subquery for an external data system using a configuration file
US11023463B2 (en) Converting and modifying a subquery for an external data system
US20220335338A1 (en) Feature processing tradeoff management
US11269859B1 (en) Correlating different types of data of a distributed ledger system
US10853124B2 (en) Managing user data in a multitenant deployment
US11755560B2 (en) Converting a language type of a query
US20200125530A1 (en) Data management platform using metadata repository
US10366053B1 (en) Consistent randomized record-level splitting of machine learning data
US9916358B2 (en) Sample data extraction
US9992269B1 (en) Distributed complex event processing
US11055352B1 (en) Engine independent query plan optimization
US10360394B2 (en) System and method for creating, tracking, and maintaining big data use cases
US10909114B1 (en) Predicting partitions of a database table for processing a database query
EP2849097A2 (en) A method for operating storage resources in an in-memory warehouse system
US20170139674A1 (en) Systems and methods for tracking sensitive data in a big data environment
US10878493B2 (en) Sample data extraction
Caldarola et al. Big data: A survey-the new paradigms, methodologies and tools
US20210294814A1 (en) Systems and methods for generating, deploying, and managing data infrastructure stacks
US10671631B2 (en) Method, apparatus, and computer-readable medium for non-structured data profiling
KR20220039325A (en) Apparatus for analyzing meter data of ami
Sigman et al. Splunk: Enterprise Operational Intelligence Delivered
CN109828983A (en) PG data base processing method, device, electronic equipment and storage medium
US20240086495A1 (en) Auto-Triage Failures In A/B Testing

Legal Events

Date Code Title Description
A201 Request for examination