CN107330008A - 一种基于Hadoop平台的电力系统谐波监测方法 - Google Patents

一种基于Hadoop平台的电力系统谐波监测方法 Download PDF

Info

Publication number
CN107330008A
CN107330008A CN201710446703.0A CN201710446703A CN107330008A CN 107330008 A CN107330008 A CN 107330008A CN 201710446703 A CN201710446703 A CN 201710446703A CN 107330008 A CN107330008 A CN 107330008A
Authority
CN
China
Prior art keywords
hadoop
data
distributed file
key
back end
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710446703.0A
Other languages
English (en)
Inventor
陈文娟
于胜洋
白德宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Foshan Power Supply Bureau of Guangdong Power Grid Corp
Original Assignee
Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Power Supply Bureau of Guangdong Power Grid Corp filed Critical Foshan Power Supply Bureau of Guangdong Power Grid Corp
Priority to CN201710446703.0A priority Critical patent/CN107330008A/zh
Publication of CN107330008A publication Critical patent/CN107330008A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01RMEASURING ELECTRIC VARIABLES; MEASURING MAGNETIC VARIABLES
    • G01R23/00Arrangements for measuring frequencies; Arrangements for analysing frequency spectra
    • G01R23/16Spectrum analysis; Fourier analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/182Distributed file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Supply And Distribution Of Alternating Current (AREA)

Abstract

本发明提供一种基于Hadoop平台的电力系统谐波监测方法,该方法通过构建Hadoop分布式文件系统和设计MapReduce并行化编程模型,实现了对区域电网中谐波监测采样数据的高效并行化处理。该方法采用Hadoop分布式文件系统和MapReduce并行化编程模型,可以充分利用Hadoop分布式文件系统和并行化编程模型所提供的强大的数据存储能力和计算能力对区域电网电能质量监测的基础数据进行存储和并行化计算。

Description

一种基于Hadoop平台的电力系统谐波监测方法
技术领域
本发明涉及电力系统谐波监测方法领域,更具体地,涉及一种基于Hadoop平台的电力系统谐波监测方法。
背景技术
智能电网的提出和发展相应的带来了电力系统区域电网中电能质量监测终端的大量投入,采样频率与监测时间的增长加速了电力系统电能质量监测平台采样数据的爆炸式增长。在传统电能质量监测平台下,对监测终端所上传的数据多采用集中式处理方式。随着智能电网建设的不断推进,对电能质量监测指标的计算速度和精度提出了更高的要求。在传统电能质量监测平台下,所使用服务器的存储能力和计算能力很难满足日益提升的运算要求,购置更高配置的服务器虽然可以暂时满足计算需求,但在没有运行任务时,会带来较大的资源浪费。如何在减少硬件开销和资源浪费的前提下实现电力系统对采样数据的高效处理具有一定的研究价值。
发明内容
本发明提供一种基于Hadoop平台的电力系统谐波监测方法,该方法可对区域电网谐波采样的基础数据进行存储和高效并行化计算。
为了达到上述技术效果,本发明的技术方案如下:
一种基于Hadoop的电力系统谐波监测方法,具体包括以下步骤:
步骤1:搭建Hadoop分布式文件系统(HDFS)。Hadoop大数据处理平台为用户提供了系统底层透明的分布式基础架构。分布式文件系统的基础架构包括Hadoop客户端和Hadoop集群。Hadoop集群包括名称节点(Namenode)、备用名称节点(SecondaryNamenode)和用于管理存储数据的数据节点(Datanodes)。Hadoop分布式文件系统中,客户端通过名称节点获取数据节点和文件块的映射关系,通过名称节点记录的映射关系到相应的位置访问文件块。名称节点对文件、目录进行创建、删除和重命名等操作,管理数据节点和文件块的映射关系。数据节点的数据保存在本地Linux文件系统中,每个数据节点会周期性地向名称节点发送“心跳”信号,报告自己的状态。
步骤2:定制MapReduce并行化编程模型,对各个变电站按照时间序列采集的采样数据进行处理。MapReduce是一种并行化编程模型,用于大规模数据的并行计算。与HDFS的主从节点结构相对应,MapReduce框架也包括一个Master和若干个Slave,对应于HDFS的名称节点和数据节点。Master上运行JobTracker,Slave上运行TaskTracker。用户提交的每个计算作业,都会被划分成若干个任务。JobTracker负责作业和任务的调度,监控他们的执行,并重新调度已经失败的任务。TaskTracker负责执行JobTracker指派的任务。
步骤2.1:InputSplit——对待处理文件进行逻辑切分。将系统采集数据并生成的以文本文件类型为扩展名的本地文件通过InputFormat模块来做Map前的预处理。在验证了文件的输入格式是否符合输入定义后,待处理文件就会在逻辑上被分成若干个InputSplit,这种逻辑切分并不是进行了实际的文件切割,而是记录了要处理的数据的位置和长度。本发明根据数据应用的具体情况,数据的位置信息即为采样的变电站ID和采样时间,选取的待分析采样序列长度统一设定为2048;
步骤2.2:Record Reader:——将待分析数据解析成记录,并转换成键值对的形式,传递给Map任务。这里我们使用Record Reader的默认解析功能,产生的键是数据在文件中的位置,值是组成这条记录的数据块。
步骤2.3:Map——定制Map,对Record Reader传入的记录进行谐波分析。谐波分析流程如图5所示。本发明为更好的符合区域电网谐波监测的需求,定制Map任务,计算谐波参数。Map处理后的中间结果会传递给Partition。根据需求,定制Map输出的中间结果是以采样序列的变电站ID和采样时间组成的组合键,输出的中间结果的值是采样时间和采样序列。Map任务中的谐波分析算法会根据采样数据分析得出该条记录的基波和谐波参数(幅值、相位、频率)。
步骤2.4:Partition——定制Partition和WritableComparator对Map任务的输出结果以组合键第一个字段(也即变电站ID)为单位,按照第二字段(也即采样时刻)进行排序。
步骤2.5:Shuffle——通过Shuffle过程将所有的Partition输出的键值对拉取到Reduce任务本地机上,按照这些数据的键进行排序并写入一个较大的List中。
步骤2.6:Reduce——以Shuffle过程输出的<key,value-list>形式的中间结果作为输入,在迭代器中,计算得出各个变电站、各个采样时刻的基波参数和谐波畸变率并进行输出。
步骤2.7:OutputFormat——获取Reduce端输出的最终键值对,首先验证输出目录是否已经存在,以及输出结果的类型是否符合配置文件中的设置,如果均满足,就输出Reduce结果到分布式文件系统进行保存。
与现有技术相比,本发明具有以下优点:
(1)采用Hadoop分布式文件系统,数据可以形成多个副本,数据读取速度快,数据丢失或错误能够及时回复,记录文件可靠高效;
(2)采用Hadoop分布式文件系统,数据存储可根据采样数据的大小动态增加Datanode;
(3)采用Hadoop分布式文件系统,可以根据实际需求,在不同的Datanode记录不同采样数据的数据类型;
(4)采用MapReduce并行化编程模型,以移动计算的方式来取代之前传统的移动数据的做法,大大降低在处理较大规模分布式数据文件时,数据在节点之间的传递会引起相当的网络开销;
(5)采用MapReduce并行化编程模型,可以根据不同的分析需求,定制不同的并行化处理模式,根据需求的不同定制所需的谐波分析方式;
(6)采用MapReduce并行化编程模型,只需要关注如何实现Map和Reduce函数,而不需要处理并行编程中的其他各种复杂问题,如分布式存储、工作调度、负载均衡、容错处理、网络通信等,MapReduce框架会负责解决这些问题。
(7)采用Hadoop分布式文件系统和MapReduce并行化编程模型,可以充分利用Hadoop分布式文件系统和并行化编程模型所提供的强大的数据存储能力和计算能力对区域电网电能质量监测的基础数据进行存储和并行化计算。
附图说明
图1是基于Hadoop的电能质量在线监测平台架构设计;
图2是Hadoop分布式文件系统的体系结构;
图3是Hadoop运行MapReduce作业的工作原理图;
图4是Hadoop运行MapReduce作业工作流程的各个执行阶段;
图5是谐波分析流程。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示是基于Hadoop的电能质量在线监测平台架构图,在该平台上实现区域电网的谐波监测。具体如下:
(1)搭建Hadoop分布式文件系统。
HDFS用于存储超大文件,包括多个计算机节点,配置一个Namenode(名称节点)、一个备用名称节点(SecondaryNamenode)和若干个Datanode(数据节点)。具体节点的配置信息如表1所示:
表1节点配置信息
相应的硬件和软件配置信息如表2所示:
表2硬件与软件配置信息
(2)安装和配置Hadoop。
Hadoop的基本安装配置步骤概括如下:创建Hadoop用户、安装Java、设置SSH登陆权限、安装Hadoop和分布式安装配置。具体操作如下:
创建Hadoop用户:“sudo useradd-m hadoop-s/bin/bash”并设置密码更新apt;
安装Java:“sudo apt-get install openjdk-7-jre openjdk-7-jdk”配置JAVA_HOME环境变量;
设置SSH登录权限:“sudo apt-get install openssh-server;ssh localhost”退出ssh,在终端窗口中利用ssh-keygen生成密钥,并将密钥加入到授权中;
安装Hadoop:“cat~/下载/hadoop-2.6.0.tar.gz.mds|grep‘MD5’;md5sum~/下载/hadoop-2.6.0.tar.gz|tr“a-z”“A-Z””将Hadoop安装至/usr/local/中;
分布式安装配置:修改位于/usr/local/hadoop/etc/hadoop/中的配置文件core-site.xml、hdfs-site.xml和mapredsite.xml,执行“./bin/hdfs namenode-format”格式化Namenode后即可开启Namenode和Datanode守护进程。
(3)定制MapReduce并行化编程模型。
根据谐波分析的需求,需要对MapReduce并行化编程模型中的Map、Partition、Reduce环节进行定制,通过继承相应的类来实现所需的功能。
通过继承Map类来对读入的数据进行谐波分析,谐波分析的流程如图5所示。在Partition环节,对本发明中设定的组合键分区需要自定义一个分区处理器来取代HadoopMapReduce框架下,默认提供的分区器功能。因此需要通过继承Partition类来定制按照组合键中的第一个字段(变电站ID)进行分区的分区函数。分区操作完成之后,调用自定义的排序器(通过继承WritableComparator类来实现)对组合键中的第二个字段(采样时刻)进行排序。经过Shuffle过程处理后,数据传送到Reduce端,记录在Reduce端通过迭代器来处理存储在数据列表中的每一条记录,并进行输出。
(4)分析结果写入分布式文件系统。
获取Reduce端输出的最终键值对,首先验证输出目录是否已经存在,以及输出结果的类型是否符合配置文件中的设置,如果均满足,就输出Reduce结果到分布式文件系统进行保存。
表3给出Hadoop分布式文件系统数据输入的基本信息示例。
表3 Hadoop分布式文件系统数据输入的基本信息
经过MapReduce并行化编程模型处理后的输出如表4所示。
表4 MapReduce作业输出结果截取
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (2)

1.一种基于Hadoop平台的电力系统谐波监测方法,其特征在于,包括以下步骤:
S1:搭建Hadoop分布式文件系统,该文件系统的基础架构包括构Hadoop客户端和Hadoop集群,Hadoop集群包括名称节点Namenode、备用名称节点SecondaryNamenode和用于管理存储数据的数据节点Datanodes;该文件系统中,客户端通过名称节点获取数据节点和文件块的映射关系,通过名称节点记录的映射关系到相应的位置访问文件块。名称节点对文件、目录进行创建、删除和重命名等操作,管理数据节点和文件块的映射关系。数据节点的数据保存在本地Linux文件系统中,每个数据节点会周期性地向名称节点发送“心跳”信号,报告自己的状态;
S2:定制MapReduce并行化编程模型,对各个变电站按照时间序列采集的采样数据进行并行化处理;与搭建的Hadoop分布式文件系统的主从节点结构相对应,MapReduce框架也包括一个Master和若干个Slave,对应于Hadoop分布式文件系统的名称节点和数据节点,Master上运行JobTracker,Slave上运行TaskTracker,用户提交的每个计算作业,都会被划分成若干个任务,JobTracker负责作业和任务的调度,监控他们的执行,并重新调度已经失败的任务,TaskTracker负责执行JobTracker指派的任务。
2.根据权利要求1所述的基于Hadoop平台的电力系统谐波监测方法,其特征在于,所述步骤S2的具体过程如下:
S21:对待处理文件进行逻辑切分,该逻辑切分并不是进行了实际的文件切割,而是记录了要处理的数据的位置和长度,其中,数据的位置信息即为采样的变电站ID和采样时间,选取的待分析采样序列长度统一设定为2048;
S22:将待分析数据解析成记录,并转换成键值对的形式,传递给Map任务,使用RecordReader的默认解析功能,产生的键是数据在文件中的位置,值是组成这条记录的数据块;
S23:定制Map,对Record Reader传入的记录进行谐波分析,根据需求,定制Map输出的中间结果是以采样序列的变电站ID和采样时间组成的组合键,输出的中间结果的值是采样时间和采样序列,Map任务中的谐波分析算法会根据采样数据分析得出该条记录的基波和谐波参数,其中谐波参数包括幅值、相位、频率;
S24:定制Partition和WritableComparator对Map任务的输出结果以组合键第一个字段即变电站ID为单位,按照第二字段即采样时刻进行排序;
S25:通过Shuffle过程将所有的Partition输出的键值对拉取到Reduce任务本地机上,按照这些数据的键进行排序并写入一个较大的List中;
S26:以Shuffle过程输出的<key,value-list>形式的中间结果作为输入,在迭代器中,计算得出各个变电站、各个采样时刻的基波参数和谐波畸变率并进行输出;
S27:获取Reduce端输出的最终键值对,首先验证输出目录是否已经存在,以及输出结果的类型是否符合配置文件中的设置,如果均满足,就输出Reduce结果到分布式文件系统进行保存。
CN201710446703.0A 2017-06-13 2017-06-13 一种基于Hadoop平台的电力系统谐波监测方法 Pending CN107330008A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710446703.0A CN107330008A (zh) 2017-06-13 2017-06-13 一种基于Hadoop平台的电力系统谐波监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710446703.0A CN107330008A (zh) 2017-06-13 2017-06-13 一种基于Hadoop平台的电力系统谐波监测方法

Publications (1)

Publication Number Publication Date
CN107330008A true CN107330008A (zh) 2017-11-07

Family

ID=60194627

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710446703.0A Pending CN107330008A (zh) 2017-06-13 2017-06-13 一种基于Hadoop平台的电力系统谐波监测方法

Country Status (1)

Country Link
CN (1) CN107330008A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533320A (zh) * 2019-08-28 2019-12-03 广东电网有限责任公司 一种基于Hadoop平台的电力设备停电计划编制方法
CN116155906A (zh) * 2022-12-25 2023-05-23 浙江省新型互联网交换中心有限责任公司 算力网络中面向低时延任务的MapReduce混合编码方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5587917A (en) * 1994-10-17 1996-12-24 Eaton Corporation Data collection and processing for digital AC power system monitor/analyzer
CN101701982A (zh) * 2009-11-16 2010-05-05 浙江大学 基于加窗插值fft的电力系统谐波检测方法
CN103412942A (zh) * 2013-08-22 2013-11-27 华北电力大学 一种基于云计算技术的电压暂降数据分析方法
CN104897961A (zh) * 2015-06-17 2015-09-09 中南民族大学 基于互乘法窗函数的三谱线插值fft谐波分析方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5587917A (en) * 1994-10-17 1996-12-24 Eaton Corporation Data collection and processing for digital AC power system monitor/analyzer
CN101701982A (zh) * 2009-11-16 2010-05-05 浙江大学 基于加窗插值fft的电力系统谐波检测方法
CN103412942A (zh) * 2013-08-22 2013-11-27 华北电力大学 一种基于云计算技术的电压暂降数据分析方法
CN104897961A (zh) * 2015-06-17 2015-09-09 中南民族大学 基于互乘法窗函数的三谱线插值fft谐波分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王淑祥: "基于Hadoop的海量电能质量数据云计算平台研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110533320A (zh) * 2019-08-28 2019-12-03 广东电网有限责任公司 一种基于Hadoop平台的电力设备停电计划编制方法
CN110533320B (zh) * 2019-08-28 2023-05-02 广东电网有限责任公司 一种基于Hadoop平台的电力设备停电计划编制方法
CN116155906A (zh) * 2022-12-25 2023-05-23 浙江省新型互联网交换中心有限责任公司 算力网络中面向低时延任务的MapReduce混合编码方法
CN116155906B (zh) * 2022-12-25 2024-03-12 浙江省新型互联网交换中心有限责任公司 算力网络中面向低时延任务的MapReduce混合编码方法

Similar Documents

Publication Publication Date Title
Xie et al. Real-time prediction of docker container resource load based on a hybrid model of ARIMA and triple exponential smoothing
US9336288B2 (en) Workflow controller compatibility
Le-Phuoc et al. Elastic and scalable processing of linked stream data in the cloud
Rusitschka et al. Smart grid data cloud: A model for utilizing cloud computing in the smart grid domain
US20140129746A1 (en) Real-time data management for a power grid
CN105843182A (zh) 一种基于oms的电力调度事故预案系统及方法
US20200213315A1 (en) Method for Controlled Sharing of Wind Farms and Wind Turbines Data, Data Analysis Algorithms, and Results of Data Analysis
CN112597218A (zh) 一种数据处理方法、装置以及数据湖架构
Zeydan et al. Recent advances in data engineering for networking
Di Stefano et al. Prometheus and aiops for the orchestration of cloud-native applications in ananke
CN107330008A (zh) 一种基于Hadoop平台的电力系统谐波监测方法
CN110533320B (zh) 一种基于Hadoop平台的电力设备停电计划编制方法
Malik et al. A common data architecture for energy data analytics
Theeten et al. Towards the optimization of a parallel streaming engine for telco applications
Luo et al. Configuration optimization method of Hadoop system performance based on genetic simulated annealing algorithm
Xiao et al. RETRACTED ARTICLE: Cloud platform wireless sensor network detection system based on data sharing
CN103729809A (zh) 基于实时数据库的电力通信管理系统的监管机制
Man et al. The study of cross networks alarm correlation based on big data technology
Chen et al. The Data Domain Construction of Digital Twin Network
Hassan et al. Real-time big data analytics for data stream challenges: an overview
Higashino Complex event processing as a service in multi-cloud environments
CN113973121A (zh) 物联网数据处理方法、装置、电子设备及存储介质
CN114064617A (zh) 数据获取方法、装置、设备及计算机存储介质
Liu et al. Graph database and graph computing for cyber-physical power systems
Yan et al. Research on implementation methods of edge computing in intelligent hydrology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20171107