CN104657497A - 一种基于分布式计算的海量用电信息并行计算系统及方法 - Google Patents

一种基于分布式计算的海量用电信息并行计算系统及方法 Download PDF

Info

Publication number
CN104657497A
CN104657497A CN201510103681.9A CN201510103681A CN104657497A CN 104657497 A CN104657497 A CN 104657497A CN 201510103681 A CN201510103681 A CN 201510103681A CN 104657497 A CN104657497 A CN 104657497A
Authority
CN
China
Prior art keywords
power information
module
node
task
distributed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510103681.9A
Other languages
English (en)
Inventor
王相伟
梁波
史玉良
荣以平
李贵民
朱伟义
袁伟玉
吕梁
陈凯平
尹明立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DAREWAY SOFTWARE Co Ltd
State Grid Corp of China SGCC
Shandong University
State Grid Shandong Electric Power Co Ltd
Original Assignee
DAREWAY SOFTWARE Co Ltd
State Grid Corp of China SGCC
Shandong University
State Grid Shandong Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DAREWAY SOFTWARE Co Ltd, State Grid Corp of China SGCC, Shandong University, State Grid Shandong Electric Power Co Ltd filed Critical DAREWAY SOFTWARE Co Ltd
Priority to CN201510103681.9A priority Critical patent/CN104657497A/zh
Publication of CN104657497A publication Critical patent/CN104657497A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于分布式计算的海量用电信息并行计算系统及方法,包括:用电信息分布式存储模块,主从结构,包括用电信息分布式存储模块主节点和若干用电信息分布式存储模块从节点,用电信息计算处理引擎,主从结构,包括用电信息计算处理引擎主节点和用电信息计算处理引擎从节点,用电信息计算处理引擎与用电信息分布式存储模块相互通信;实现应用分布式计算框架快速运算和计算结果回写在内的各项功能。在对要计算的海量用电信息实现非结构化映射的基础上,对要计算的数据分组后实现并行计算,将最终的结果合并后返回,提升数据综合计算能力,实现服务器计算能力的横向扩展,解决用电大数据时代海量数据实时、高效处理的问题。

Description

一种基于分布式计算的海量用电信息并行计算系统及方法
技术领域
本发明属于分布式计算领域,特别涉及一种基于分布式计算的海量用电信息并行计算系统及方法。
背景技术
随着电力领域对信息化数据要求的提升,电力领域的信息化系统逐渐呈现出覆盖规模庞大、海量数据、数据项复杂、数据处理逻辑复杂、数据存储周期长、业务种类多、计算频度高等特点。
目前,用电信息采集系统“全覆盖、全采集”目标正在逐步实现,系统会面临海量数据资源存储及处理的需求,包括终端采集的原始数据、解析并计算后得到的业务数据,这些数据的操作方式、操作频度要求各不相同,接入终端数量的增多,采集数据量呈指数级增长,系统的数据量也越来越大,面临着海量数据存储慢、重点数据分析时效性差、系统整体性能下降、业务分析计算困难等难题,有效提升电力领域的信息化系统海量数据的计算和处理能力已经迫在眉睫。
为了充分发挥电力领域信息化系统基础支撑作用,满足用电数据深化应用工作和对数据存储、查询、统计、分析及对数据价值深入挖掘的需求,通过领先的数据融合、数据清洗、数据治理以及大数据挖掘等相关技术手段提升用电数据应用价值已势在必行。这也决定了电力领域信息化系统对数据的需求更广、分析挖掘需求更深、在线统计计算时效性要求更高。如每天批量计算的线损计算服务,地市级的考核单元往往达数万、供入供出计量点往往达百万,而这些数据要求在一个小时左右的时间内计算完成,而相对单台服务器的计算能力是有限的。
因此,随着业务的开展,数据计算需要处理的数据越来越多,数据计算服务的计算时间也会越来越长,必须要通过分布式计算的手段提升其计算时效性,才能为电力业务的发展提供数据保障。
发明内容
本发明的目的就是为了解决上述问题,提供一种基于分布式计算的海量用电信息并行计算系统及方法,它具有有效的提升数据综合计算能力,实现服务器计算能力的横向扩展,解决用电大数据时代海量数据实时、高效处理的问题的优点。
为了实现上述目的,本发明采用如下技术方案:
一种基于分布式计算的海量用电信息并行计算系统,用主节点和从节点的框架体系,主节点负责数据的分发和任务的分发,在集群中起领导者的作用,主节点至少具备主、备各一台;从节点主要负责数据的存储和任务的执行,在集群中属于工作者,从节点有多台。
一种基于分布式计算的海量用电信息并行计算系统,包括:
用电信息分布式存储模块,是主从结构的,包括用电信息分布式存储模块主节点和若干用电信息分布式存储模块从节点,
用电信息计算处理引擎,是主从结构的,包括用电信息计算处理引擎主节点和用电信息计算处理引擎从节点,所述用电信息计算处理引擎与用电信息分布式存储模块相互通信;
分布式管理模块,用来解决分布式应用中遇到的数据管理问题;
用电信息元数据存储模块,用于存储用电信息数据管理模块所管理数据表的元数据信息;
用电信息数据管理模块,用于将存储在用电信息分布式存储模块中的结构化的数据文件映射为一张数据库表,并提供类SQL的查询语言,将查询语句自动转换为计算任务提交到用电信息计算处理引擎中运行,数据文件与数据表的映射关系存储在应用关系数据库中。
访问代理模块,提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机;当业务应用发起计算请求时,访问代理能够将业务应用不同协议方式的请求转换为统一的任务请求格式提交用电信息数据管理模块,并实现负载均衡。
所述用电信息分布式存储模块主节点包括主用单元和备用单元,主用单元和备用单元均存储命名节点,负责数据的分发;
所述用电信息分布式存储模块从节点包含数据节点,负责数据的存储。
所述用电信息计算处理引擎主节点包括计算任务分配模块,负责计算任务的分发,包括主用计算任务分配模块和备用计算任务分配模块;
所述用电信息计算处理引擎从节点包括计算任务执行模块,负责计算任务的执行。
所述用电信息分布式存储模块主节点上只运行一个命名节点,而在每一个用电信息分布式存储模块从节点上运行一个数据节点。
所述命名节点在映像文件中存储所有关于文件系统名称空间的信息,即文件系统中每个文件所处的命名空间,管理着整个用电信息分布式存储,以及对文件系统的操作;所述对文件系统的操作包括建立、删除文件和文件夹。
映像文件和包含所有事务的记录文件将存储在命名节点所在的本地文件系统上。
映像文件和记录文件也需要复制副本,以防文件损坏或命名节点所在文件系统丢失。
所述数据节点响应读写请求,还响应创建、删除和复制来自命名节点的块的命令。
所述数据节点支持一次写入,多次读取;不支持已写入数据的更新操作,但允许在文件尾部添加新的数据。
所述数据节点上的数据文件以分块形式存储,块大小默认为64MB,出于容错考虑,对块进行复制,默认副本数为3。
所述计算任务分配模块将接受到的任务分割为多个小的子任务,将分割后的任务分发给用电信息计算处理引擎从节点上的计算任务执行模块执行。
所述计算任务执行模块会定期向任务分配模块发送心跳,任务分配模块根据接收到心跳判断计算任务执行模块的健康状况。
所述计算任务执行模块在接收到任务分配模块发来的任务,将任务执行需要的应用请求从用电信息分布式存储模块保存到本地系统;为任务新建一个本地的工作目录,将应用请求的内容执行。
所述数据管理问题包括:统一命名服务、状态同步服务、集群管理、分布式应用配置项管理等,例如实现自动故障监测和转移。
一种基于分布式计算的海量用电信息并行计算系统的方法,包括如下步骤:
步骤(1):计算需要的原始数据以关系表的形式存放在应用关系数据库中,用电信息数据管理模块将关系表从应用关系数据库中取出,利用元数据储存模块的元数据,生成结构化文件,然后以结构化文件的形式存入用电信息分布式存储模块中,再将文件从用电信息分布式存储模块中载入用电信息数据管理模块;用电信息分布式存储模块的命名节点决定是否将文件映射到用电信息数据节点的复制块上,如果需要映射,则将文件映射到复制块,主用节点写入编辑日志,备用节点重做日志;
步骤(2):业务应用模块通过访问代理以JDBC的方式与用电信息数据管理模块建立连接,并提交类SQL语句实现服务的业务逻辑;用电信息数据管理模块负责将应用提交的类SQL语句转化为计算任务提交给用电信息计算处理引擎,由用电信息计算处理引擎负责分布式计算;计算过程中的临时表和最终结果都存储在用电信息数据管理模块中;
步骤(3):用电信息处理引擎的计算任务分配模块接收到要计算的作业后,对作业进行初始化,将作业加入调度队列,并由创建任务调度器进行调度;任务调度器首先从用电信息分布式存储模块中获取已计算好的输入分块信息,然后为每个划分创建一个计算任务;计算任务执行模块定期给计算任务分配模块发送心跳,计算任务分配模块根据收到的信息,判断是否可以分配给计算任务执行模块任务,如果是,任务调度器会对任务进行分配;计算任务执行模块被分配任务后,将任务执行需要的应用执行文件从用电信息分布式存储拷贝到本地系统,为任务新建一个本地的工作目录,将文件的内容解压,并新建一个任务执行器实例来运行任务;任务执行器将启动一个新的虚拟机用于执行任务;
步骤(4):主用计算任务分配模块会在本地存储计算任务作业状态,一旦主用计算任务分配模块宕掉,部署在主用计算任务分配模块上的分布式计算任务管理插件会监测到,并断开与分布式管理模块连接;备用计算任务分配模块上的计算任务监控模块试图成为新的主用计算任务分配模块,一旦成功,将重启原有活跃节点宕机时正在运行的计算任务作业。
所述步骤(1)中:
当用电信息数据管理模块发送请求要求创建文件时,命名节点会以块标识和该块的第一个副本的数据节点IP地址作为响应。命名节点还会通知其他将要接收该块的副本的数据节点。命名节点依赖来自每个数据节点的定期心跳消息。每条消息都包含一个块报告,命名节点可以根据报告验证块映射和其他文件系统元数据。如果数据节点不能发送心跳消息,命名节点将采取修复措施,重新复制在该节点上丢失的块。
数据节点同时向主用的命名节点和备用的命名节点发送心跳和文件块位置,因此即使主用的命名节点故障,备用的命名节点也能够知晓数据节点及文件块信息。
命名节点知晓自身的状态为主用的还是备用的。主用的命名节点将编辑日志写入日志节点,备用的命名节点从日志节点读取编辑日志,并重做,一旦转换为主用的命名节点,为保证正确性,它先从日志节点读取了所有的更新。日志节点保证只有1个命名节点向其写入编辑日志,并且编辑日志写入到一半以上日志节点才算成功。
所述分布式管理模块用于实现故障自动转移,在所有命名节点上引入分布式存储管理插件,分布式存储管理插件时刻监听自己所在节点上的命名节点健康状况,并作为分布式管理模块客户端连接分布式管理模块集群。主用命名节点上的分布式存储管理插件会在分布式管理模块上持有一个节点状态锁,一旦发现本地的命名节点出现故障,就释放锁,断开与分布式管理模块连接;其它备用的命名节点上的分布式存储管理插件发现节点状态锁没被持有,就试图获得锁,一旦成功,它所在节点上的命名节点就是新的主用的命名节点。
命名节点和计算任务分配模块可以部署在同一物理节点,也可以部署在不同物理节点,视具体情况而定。
一份文件存储内容存在3个或3个以上复制块时,一般第一个复制块存储在同一机架的不同节点上,最后一个复制块存储在不同机架的某个节点上,其他复制块可以根据情况进行灵活安排。一个并行计算系统中包含一个命名节点和大量数据节点。数据节点通常以机架的形式组织,机架通过一个交换机将系统中所有节点连接起来。
本发明的有益效果:
1,针对海量用电信息计算规模庞大、数据项复杂、计算频度高等特点,本发明的用电信息计算处理引擎通过对任务分解后进行并行计算,能够大幅度提升计算性能,缩短单一任务的计算时间。同时,用电信息计算处理引擎和用电信息分布式存储具备很强的伸缩性,能够通过增加物理节点的方式水平扩展,进一步提升其处理性能。
2面对目前电力领域信息化系统传统的建设模式中串行计算和关系型数据库较多的现实问题,本发明的计算引擎中针对传统的并行计算的引擎进行了大幅度的简化,它让那些没有多少并行计算经验的开发人员也可以开发并行应用,利用用电信息元数据存储模块和用电信息数据管理模块通过元数据的存储和转换,让开发人员的学习成本更低,能够通过类SQL语句快速实现简单的计算任务。
3为解决各类用电信息数据项复杂、业务种类多的问题,以满足各类电力领域信息化系统对数据的更为广泛的需求,本发明的访问代理模块提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,能够支持数以万计的并发连接,并且它的运行模式使得它可以很简单安全的整合进不同的业务应用架构中。
4由于要处理的用电信息具有数据项复杂、数据处理逻辑复杂、数据存储周期长等特点,因此在存储和计算周期内,保障数据和计算安全是一个需要重视的问题。本发明利用分布式管理模块保障分布式计算和分布式存储安全,使之具备很强的容错性。当分布式存储某一个块由于错误出现故障时,其他块能够安全的保存该块上的数据,重新复制在该节点上丢失的块;当分布式计算引擎任务分配模块宕机时,分布式管理模块会监测到,并指导其他模块接替宕机的模块重启计算任务。
附图说明
图1为本发明提出的一种基于分布式计算的海量用电信息并行计算系统。
图2为本发明的方法流程图。
其中,1、用电信息分布式存储模块,2、用电信息计算处理引擎,3、分布式管理模块,4、用电信息元数据存储模块,5、用电信息数据管理模块,6、访问代理模块,
101、主用单元,102、备用单元,103、主用单元命名节点,104、备用单元命名节点,105、第1用电信息分布式存储模块从节点,106、第n用电信息分布式存储模块从节点,107、第1数据节点,108、第n个数据节点;
201、用电信息计算处理引擎主用单元,202、用电信息计算处理引擎备用单元,203、主用计算任务分配模块,204、备用计算任务分配模块,205、第1用电信息计算处理引擎从节点,206、第n用电信息计算处理引擎从节点,207、第1计算任务执行模块,208、第n计算任务执行模块。
具体实施方式
下面结合附图与实施例对本发明作进一步说明。
图1,是基于本发明实现的一种基于分布式计算的海量用电信息并行计算系统,包括用电信息分布式存储模块1、用电信息计算处理引擎2、分布式管理模块3、用电信息元数据存储模块4、用电信息数据管理模块5、访问代理模块6。
所述用电信息分布式存储模块1是主从结构的,包括用电信息分布式存储模块主节点和用电信息分布式存储模块从节点。用电信息分布式存储模块主节点至少具备主用单元101、备用单元102各一台,主用单元包含主用单元命名节点103,备用单元包含备用单元命名节点104,负责数据的分发;从节点可以有多台,第1个用电信息分布式存储模块从节点105,依次类推,第n个用电信息分布式存储模块从节点106,第1用电信息分布式存储模块从节点包括第1数据节点107,依次类推,第n个用电信息分布式存储模块从节点包括第n个数据节点108,负责数据的存储。
所述用电信息计算处理引擎2是主从结构的,包括用电信息计算处理引擎主节点和用电信息计算处理引擎从节点。用电信息计算处理引擎主节点至少具备用电信息计算处理引擎主用单元201、用电信息计算处理引擎备用单元202各一台,用电信息计算处理引擎主用单元包括主用计算任务分配模块203,用电信息计算处理引擎备用单元包括备用计算任务分配模块204,计算任务分配模块主要负责任务的分发;从节点包括第1用电信息计算处理引擎从节点205,依次类推,第n用电信息计算处理引擎从节点206,其中,第1用电信息计算处理引擎从节点包括第1计算任务执行模块207,第n用电信息计算处理引擎从节点包括第n计算任务执行模块208;负责计算任务的执行。
主用计算任务分配模块203、备用计算任务分配模块204将接受到的任务分割为多个小的子任务,将分割后的任务分发给从节点上的第1计算任务执行模块207……第n计算任务执行模块208执行。计算任务执行模块在接收到任务分配模块发来的任务,将任务执行需要的应用请求从用电信息分布式存储模块保存到本地系统,将应用请求的内容执行。
分布式管理模块3主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等,例如实现自动故障监测和转移。
用电信息元数据存储模块4存储负责存储用电信息数据管理模块所管理数据表的元数据信息。
用电信息数据管理模块5将存储在用电信息分布式存储中的结构化的数据文件映射为一张数据库表,并提供类SQL的查询语言,能将查询语句自动转换为计算任务提交到引擎中运行,文件与表的映射关系存储在数据库中。
访问代理模块6提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案。
如图2所示,本发明工作过程如下:
计算需要的原始数据以关系表的形式存放在应用关系数据库中,用电信息数据管理模块将数据表从应用关系数据库中取出,基于元数据,以结构化文件的形式存入用电信息分布式存储模块中,再将文件从用电信息分布式存储模块中载入用电信息数据管理模块。
用电信息分布式存储模块的用电信息命名节点决定是否将文件映射到用电信息数据节点上的复制块上。对于最常见的3个复制块,第一个复制块存储在同一机架的不同节点上,最后一个复制块存储在不同机架的某个节点上。一个系统中包含一个命名节点和大量数据节点。数据节点通常以机架的形式组织,机架通过一个交换机将所有系统连接起来。
当用电信息数据管理模块发送请求要求创建文件时,命名节点会以块标识和该块的第一个副本的数据节点IP地址作为响应。命名节点还会通知其他将要接收该块的副本的数据节点。命名节点依赖来自每个数据节点的定期心跳消息。每条消息都包含一个块报告,命名节点可以根据这个报告验证块映射和其他文件系统元数据。如果数据节点不能发送心跳消息,命名节点将采取修复措施,重新复制在该节点上丢失的块。
数据节点同时向主用的命名节点和备用的命名节点发送心跳和文件块位置,因此即使主用的命名节点故障,备用的命名节点也能够知晓数据节点及文件块信息。
命名节点知晓自身的状态为主用的还是备用的。主用的命名节点将编辑日志写入日志节点,备用的命名节点从日志节点读取编辑日志,并重做,一旦转换为主用的命名节点,为保证正确性,它先从日志节点读取了所有的更新。日志节点保证只有1个命名节点向其写入编辑日志,并且编辑日志写入到一半以上日志节点才算成功。
为实现故障自动转移,引入了分布式管理模块。在所有命名节点上引入分布式存储管理插件,分布式存储管理插件时刻监听自己所在节点上的命名节点健康状况,并作为分布式管理模块客户端连接分布式管理模块集群。主用的命名节点上的分布式存储管理插件会在分布式管理模块上持有一个节点状态锁,一旦发现本地的命名节点出现故障,就释放锁,断开与分布式管理模块连接;其它备用的命名节点上的分布式存储管理插件发现节点状态锁没被持有,就试图获得锁,一旦成功,它所在节点上的命名节点就是新的主用的命名节点。
应用通过访问代理以JDBC的方式与用电信息数据管理模块建立连接,并提交类SQL语句实现服务的业务逻辑。用电信息数据管理模块负责将应用提交的类SQL语句转化为计算任务提交给用电信息计算处理引擎,由用电信息计算处理引擎负责分布式计算。计算过程中的临时表和最终结果都存储在用电信息数据管理模块中。
任务分配模块接收到要计算的作业后,对作业进行初始化,将作业加入调度队列,并由创建任务调度器进行调度。任务调度器首先从用电信息分布式存储模块中获取已计算好的输入分块信息,然后为每个划分创建一个计算任务。任务执行模块定期给任务分配模块发送心跳,任务分配模块根据收到的信息,判断是否可以分配给任务执行模块任务,如果是,任务调度器会对任务进行分配。任务执行模块被分配任务后,将任务执行需要的应用执行文件从用电信息分布式存储拷贝到本地系统,为任务新建一个本地的工作目录,将文件的内容解压,并新建一个任务执行器实例来运行任务。任务执行器将启动一个新的虚拟机用于执行任务。
主用的任务分配模块会在本地存储计算任务作业状态,一旦主用的任务分配模块宕掉,本地的分布式计算任务管理插件会监测到,并断开与分布式管理模块连接;备用的任务分配模块上的计算任务监控模块试图成为新的主用的任务分配模块,一旦成功,将重启原有活跃节点宕机时正在运行的计算任务作业。
命名节点和任务分配模块可以部署在同一物理节点,也可以部署在不同物理节点,视具体情况而定。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种基于分布式计算的海量用电信息并行计算系统,其特征是,包括:
用电信息分布式存储模块,是主从结构的,包括用电信息分布式存储模块主节点和若干用电信息分布式存储模块从节点,
用电信息计算处理引擎,是主从结构的,包括用电信息计算处理引擎主节点和用电信息计算处理引擎从节点,所述用电信息计算处理引擎与用电信息分布式存储模块相互通信;
分布式管理模块,用来解决分布式应用中遇到的数据管理问题;
用电信息元数据存储模块,用于存储用电信息数据管理模块所管理数据表的元数据信息;
用电信息数据管理模块,用于将存储在用电信息分布式存储模块中的结构化的数据文件映射为一张数据库表,并提供类SQL的查询语言,将查询语句自动转换为计算任务提交到用电信息计算处理引擎中运行,数据文件与数据表的映射关系存储在应用关系数据库中;
访问代理模块,提供高可用性、负载均衡以及基于TCP和HTTP应用的代理,支持虚拟主机;当业务应用发起计算请求时,访问代理能够将业务应用不同协议方式的请求转换为统一的任务请求格式提交用电信息数据管理模块,并实现负载均衡。
2.如权利要求1所述的一种基于分布式计算的海量用电信息并行计算系统,其特征是,
所述用电信息分布式存储模块主节点包括主用单元和备用单元,主用单元和备用单元均存储命名节点,负责数据的分发;
所述用电信息分布式存储模块从节点包含数据节点,负责数据的存储。
3.如权利要求1所述的一种基于分布式计算的海量用电信息并行计算系统,其特征是,
所述用电信息计算处理引擎主节点包括计算任务分配模块,负责计算任务的分发,包括主用计算任务分配模块和备用计算任务分配模块;
所述用电信息计算处理引擎从节点包括计算任务执行模块,负责计算任务的执行。
4.如权利要求2所述的一种基于分布式计算的海量用电信息并行计算系统,其特征是,
所述用电信息分布式存储模块主节点上只运行一个命名节点,而在每一个用电信息分布式存储模块从节点上运行一个数据节点;
所述命名节点在映像文件中存储所有关于文件系统名称空间的信息,即文件系统中每个文件所处的命名空间,管理着整个用电信息分布式存储,以及对文件系统的操作;所述对文件系统的操作包括建立、删除文件和文件夹;
映像文件和包含所有事务的记录文件将存储在命名节点所在的本地文件系统上;
映像文件和记录文件也需要复制副本,以防文件损坏或命名节点所在文件系统丢失。
5.如权利要求2所述的一种基于分布式计算的海量用电信息并行计算系统,其特征是,
所述数据节点响应读写请求,还响应创建、删除和复制来自命名节点的块的命令;
所述数据节点支持一次写入,多次读取;不支持已写入数据的更新操作,但允许在文件尾部添加新的数据;
所述数据节点上的数据文件以分块形式存储,块大小默认为64MB,出于容错考虑,对块进行复制。
6.如权利要求3所述的一种基于分布式计算的海量用电信息并行计算系统,其特征是,
所述计算任务分配模块将接受到的任务分割为多个小的子任务,将分割后的任务分发给用电信息计算处理引擎从节点上的计算任务执行模块执行;
所述计算任务执行模块会定期向任务分配模块发送心跳,任务分配模块根据接收到心跳判断计算任务执行模块的健康状况;
所述计算任务执行模块在接收到任务分配模块发来的任务,将任务执行需要的应用请求从用电信息分布式存储模块保存到本地系统;为任务新建一个本地的工作目录,将应用请求的内容执行。
7.如权利要求1所述的一种基于分布式计算的海量用电信息并行计算系统,其特征是,
所述数据管理问题包括:统一命名服务、状态同步服务、集群管理、分布式应用配置项管理等,例如实现自动故障监测和转移。
8.一种基于分布式计算的海量用电信息并行计算系统的方法,其特征是,包括如下步骤:
步骤(1):计算需要的原始数据以关系表的形式存放在应用关系数据库中,用电信息数据管理模块将关系表从应用关系数据库中取出,利用元数据储存模块的元数据,生成结构化文件,然后以结构化文件的形式存入用电信息分布式存储模块中,再将文件从用电信息分布式存储模块中载入用电信息数据管理模块;用电信息分布式存储模块的命名节点决定是否将文件映射到用电信息数据节点的复制块上,如果需要映射,则将文件映射到复制块,主用节点写入编辑日志,备用节点重做日志;
步骤(2):业务应用模块通过访问代理以JDBC的方式与用电信息数据管理模块建立连接,并提交类SQL语句实现服务的业务逻辑;用电信息数据管理模块负责将应用提交的类SQL语句转化为计算任务提交给用电信息计算处理引擎,由用电信息计算处理引擎负责分布式计算;计算过程中的临时表和最终结果都存储在用电信息数据管理模块中;
步骤(3):用电信息处理引擎的计算任务分配模块接收到要计算的作业后,对作业进行初始化,将作业加入调度队列,并由创建任务调度器进行调度;任务调度器首先从用电信息分布式存储模块中获取已计算好的输入分块信息,然后为每个划分创建一个计算任务;计算任务执行模块定期给计算任务分配模块发送心跳,计算任务分配模块根据收到的信息,判断是否可以分配给计算任务执行模块任务,如果是,任务调度器会对任务进行分配;计算任务执行模块被分配任务后,将任务执行需要的应用执行文件从用电信息分布式存储拷贝到本地系统,为任务新建一个本地的工作目录,将文件的内容解压,并新建一个任务执行器实例来运行任务;任务执行器将启动一个新的虚拟机用于执行任务;
步骤(4):主用计算任务分配模块会在本地存储计算任务作业状态,一旦主用计算任务分配模块宕掉,部署在主用计算任务分配模块上的分布式计算任务管理插件会监测到,并断开与分布式管理模块连接;备用计算任务分配模块上的计算任务监控模块试图成为新的主用计算任务分配模块,一旦成功,将重启原有活跃节点宕机时正在运行的计算任务作业。
9.如权利要求8所述的一种基于分布式计算的海量用电信息并行计算系统的方法,其特征是,所述步骤(1)中:
当用电信息数据管理模块发送请求要求创建文件时,命名节点会以块标识和该块的第一个副本的数据节点IP地址作为响应;命名节点还会通知其他将要接收该块的副本的数据节点;命名节点依赖来自每个数据节点的定期心跳消息;每条消息都包含一个块报告,命名节点可以根据报告验证块映射和其他文件系统元数据;如果数据节点不能发送心跳消息,命名节点将采取修复措施,重新复制在该节点上丢失的块;
数据节点同时向主用的命名节点和备用的命名节点发送心跳和文件块位置,因此即使主用的命名节点故障,备用的命名节点也能够知晓数据节点及文件块信息;
命名节点知晓自身的状态为主用的还是备用的;主用的命名节点将编辑日志写入日志节点,备用的命名节点从日志节点读取编辑日志,并重做,一旦转换为主用的命名节点,为保证正确性,它先从日志节点读取了所有的更新;日志节点保证只有1个命名节点向其写入编辑日志,并且编辑日志写入到一半以上日志节点才算成功。
10.如权利要求8所述的一种基于分布式计算的海量用电信息并行计算系统的方法,其特征是,
所述分布式管理模块用于实现故障自动转移,在所有命名节点上引入分布式存储管理插件,分布式存储管理插件时刻监听自己所在节点上的命名节点健康状况,并作为分布式管理模块客户端连接分布式管理模块集群;主用命名节点上的分布式存储管理插件会在分布式管理模块上持有一个节点状态锁,一旦发现本地的命名节点出现故障,就释放锁,断开与分布式管理模块连接;其它备用的命名节点上的分布式存储管理插件发现节点状态锁没被持有,就试图获得锁,一旦成功,它所在节点上的命名节点就是新的主用的命名节点。
CN201510103681.9A 2015-03-09 2015-03-09 一种基于分布式计算的海量用电信息并行计算系统及方法 Pending CN104657497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510103681.9A CN104657497A (zh) 2015-03-09 2015-03-09 一种基于分布式计算的海量用电信息并行计算系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510103681.9A CN104657497A (zh) 2015-03-09 2015-03-09 一种基于分布式计算的海量用电信息并行计算系统及方法

Publications (1)

Publication Number Publication Date
CN104657497A true CN104657497A (zh) 2015-05-27

Family

ID=53248624

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510103681.9A Pending CN104657497A (zh) 2015-03-09 2015-03-09 一种基于分布式计算的海量用电信息并行计算系统及方法

Country Status (1)

Country Link
CN (1) CN104657497A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106341467A (zh) * 2016-08-30 2017-01-18 国网江苏省电力公司电力科学研究院 基于大数据并行计算的用电信息采集设备状态分析方法
CN106951185A (zh) * 2017-03-01 2017-07-14 武汉爱宁智慧科技有限公司 一种基于区块链技术的健康检测数据管理系统及方法
CN107329982A (zh) * 2017-06-01 2017-11-07 华南理工大学 一种基于分布式列式存储的大数据并行计算方法及系统
CN107632891A (zh) * 2017-08-23 2018-01-26 国家电网公司 一种集中式应用服务资源管理系统及方法
CN108040045A (zh) * 2017-12-07 2018-05-15 百度在线网络技术(北京)有限公司 访问流量文件的生成方法、装置、服务器及存储介质
CN108696559A (zh) * 2017-04-11 2018-10-23 华为技术有限公司 流处理方法及装置
CN108874323A (zh) * 2018-07-04 2018-11-23 江苏农牧科技职业学院 一种宠物监测数据处理方法和系统
CN109407977A (zh) * 2018-09-25 2019-03-01 佛山科学技术学院 一种大数据分布式存储管理方法及系统
CN109672616A (zh) * 2018-12-27 2019-04-23 北京奇安信科技有限公司 数据传输方法、装置、设备及介质
CN110213378A (zh) * 2019-06-06 2019-09-06 北京科东电力控制系统有限责任公司 一种实时数据采集任务分配与管理方法及系统
CN110865880A (zh) * 2019-11-22 2020-03-06 山东万高电子科技有限公司 一种电子屏幕发布审计系统及其审计方法
CN111897845A (zh) * 2020-07-29 2020-11-06 徐州金蝶软件有限公司 一种基于流程实现海量信用信息处理方法及系统
CN112637067A (zh) * 2020-12-28 2021-04-09 北京明略软件系统有限公司 基于模拟网络广播的图并行计算系统和方法
CN112860393A (zh) * 2021-01-20 2021-05-28 北京科技大学 一种分布式任务调度方法及系统
CN117909693A (zh) * 2024-03-18 2024-04-19 江苏高昕建筑系统有限公司 一种电数字数据分析处理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150039735A1 (en) * 2012-02-07 2015-02-05 Cloudera, Inc. Centralized configuration of a distributed computing cluster
CN104391903A (zh) * 2014-11-14 2015-03-04 广州科腾信息技术有限公司 一种基于分布存储和并行计算的电网数据质量检测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150039735A1 (en) * 2012-02-07 2015-02-05 Cloudera, Inc. Centralized configuration of a distributed computing cluster
CN104391903A (zh) * 2014-11-14 2015-03-04 广州科腾信息技术有限公司 一种基于分布存储和并行计算的电网数据质量检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
肖凯: "基于Hive架构的电力设备状态信息数据仓库的研究", 《中国优秀硕士学位论文全文数据库信息科技辑(月刊 )》 *

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106341467A (zh) * 2016-08-30 2017-01-18 国网江苏省电力公司电力科学研究院 基于大数据并行计算的用电信息采集设备状态分析方法
CN106341467B (zh) * 2016-08-30 2019-11-29 国网江苏省电力公司电力科学研究院 基于大数据并行计算的用电信息采集设备状态分析方法
CN106951185A (zh) * 2017-03-01 2017-07-14 武汉爱宁智慧科技有限公司 一种基于区块链技术的健康检测数据管理系统及方法
CN106951185B (zh) * 2017-03-01 2019-12-06 武汉爱宁智慧科技有限公司 一种基于区块链技术的健康检测数据管理系统及方法
CN108696559A (zh) * 2017-04-11 2018-10-23 华为技术有限公司 流处理方法及装置
CN107329982A (zh) * 2017-06-01 2017-11-07 华南理工大学 一种基于分布式列式存储的大数据并行计算方法及系统
CN107632891A (zh) * 2017-08-23 2018-01-26 国家电网公司 一种集中式应用服务资源管理系统及方法
CN108040045A (zh) * 2017-12-07 2018-05-15 百度在线网络技术(北京)有限公司 访问流量文件的生成方法、装置、服务器及存储介质
CN108040045B (zh) * 2017-12-07 2021-05-07 百度在线网络技术(北京)有限公司 访问流量文件的生成方法、装置、服务器及存储介质
CN108874323B (zh) * 2018-07-04 2019-09-27 江苏农牧科技职业学院 一种宠物监测数据处理方法和系统
CN108874323A (zh) * 2018-07-04 2018-11-23 江苏农牧科技职业学院 一种宠物监测数据处理方法和系统
CN109407977A (zh) * 2018-09-25 2019-03-01 佛山科学技术学院 一种大数据分布式存储管理方法及系统
CN109407977B (zh) * 2018-09-25 2021-08-31 佛山科学技术学院 一种大数据分布式存储管理方法及系统
CN109672616A (zh) * 2018-12-27 2019-04-23 北京奇安信科技有限公司 数据传输方法、装置、设备及介质
CN110213378A (zh) * 2019-06-06 2019-09-06 北京科东电力控制系统有限责任公司 一种实时数据采集任务分配与管理方法及系统
CN110865880A (zh) * 2019-11-22 2020-03-06 山东万高电子科技有限公司 一种电子屏幕发布审计系统及其审计方法
CN110865880B (zh) * 2019-11-22 2023-05-26 山东万高电子科技有限公司 一种电子屏幕发布审计系统及其审计方法
CN111897845A (zh) * 2020-07-29 2020-11-06 徐州金蝶软件有限公司 一种基于流程实现海量信用信息处理方法及系统
CN111897845B (zh) * 2020-07-29 2023-10-31 江苏新蝶数字科技有限公司 一种基于流程实现海量信用信息处理方法及系统
CN112637067A (zh) * 2020-12-28 2021-04-09 北京明略软件系统有限公司 基于模拟网络广播的图并行计算系统和方法
CN112860393A (zh) * 2021-01-20 2021-05-28 北京科技大学 一种分布式任务调度方法及系统
CN112860393B (zh) * 2021-01-20 2024-03-15 北京科技大学 一种分布式任务调度方法及系统
CN117909693A (zh) * 2024-03-18 2024-04-19 江苏高昕建筑系统有限公司 一种电数字数据分析处理装置

Similar Documents

Publication Publication Date Title
CN104657497A (zh) 一种基于分布式计算的海量用电信息并行计算系统及方法
CN111339073A (zh) 实时数据处理方法、装置、电子设备及可读存储介质
CN103399894A (zh) 一种基于共享存储池的分布式事务处理方法
US10432703B2 (en) On-demand session upgrade in a coordination service
CN103533058A (zh) 面向HDFS/Hadoop存储集群的资源监控系统及方法
CN108228755A (zh) 基于日志解析技术的MySQL数据库到Hadoop平台的数据同步复制方法
US20120278429A1 (en) Cluster system, synchronization controlling method, server, and synchronization controlling program
CN115374102A (zh) 数据处理方法及系统
CN104281980B (zh) 基于分布式计算的火力发电机组远程诊断方法及系统
CN108228756A (zh) 基于日志解析技术的PG数据库到Hadoop平台的数据同步复制方法
CN112685499A (zh) 一种工作业务流的流程数据同步方法、装置及设备
CN117149909A (zh) 数据同步方法、装置、存储介质及处理器
EP3709173B1 (en) Distributed information memory system, method, and program
CN115757642A (zh) 一种基于归档日志文件的数据同步方法及装置
CN116010169A (zh) 一种基于云原生技术的云平台rds数据库迁移容灾方法
CN105760215A (zh) 基于映射规约模型分布式文件系统作业的运行方法
CN114661693A (zh) 数据审计的实现方法、存储介质、电子设备及系统
CN107330089B (zh) 跨网络结构化数据收集系统
JP6680897B2 (ja) 計算機システム及び分析ソースデータ管理方法
CN116055450B (zh) 通讯录数据的处理方法、装置和存储介质及电子设备
CN104462581A (zh) 基于微通道内存映射和Smart-Slice的极速文件指纹提取系统及方法
CN117349384B (zh) 一种数据库同步的方法、系统及设备
Tavares et al. An efficient and reliable scientific workflow system
CN115150466A (zh) 一种数据分发的实现方法、装置、电子设备及存储介质
CN115965481A (zh) 数据处理方法、装置、计算机可读存储介质和计算机设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20150527