CN105139130A - 一种适用于电力系统分布式任务的管理方法 - Google Patents

一种适用于电力系统分布式任务的管理方法 Download PDF

Info

Publication number
CN105139130A
CN105139130A CN201510533368.9A CN201510533368A CN105139130A CN 105139130 A CN105139130 A CN 105139130A CN 201510533368 A CN201510533368 A CN 201510533368A CN 105139130 A CN105139130 A CN 105139130A
Authority
CN
China
Prior art keywords
task
node
distributed
main
hot standby
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510533368.9A
Other languages
English (en)
Inventor
顾文杰
高原
沙一川
任升
方华建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Original Assignee
Nari Technology Co Ltd
NARI Nanjing Control System Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nari Technology Co Ltd, NARI Nanjing Control System Co Ltd filed Critical Nari Technology Co Ltd
Priority to CN201510533368.9A priority Critical patent/CN105139130A/zh
Publication of CN105139130A publication Critical patent/CN105139130A/zh
Pending legal-status Critical Current

Links

Abstract

本发明公开了一种适用于电力系统分布式任务的管理方法,其特征是,包括以下步骤:1)分布式任务的初始化:将待处理的数据集分成大小均衡的数据块,将数据块和任务部署到活跃节点上;2)分布式任务的运行管理:提供故障冗余、负载均衡、手动任务停止和任务切换功能;3)计算节点的状态管理:离线后,任务会自动迁移到其它节点运行;恢复后,高负载节点的任务自动迁移到该节点上;4)分布式任务的结果汇总:支持单节点、全系统、区域汇总三种方式。本发明所达到的有益效果:1、处理能力高,电力应用的任务完全分布式并发运行;2、可靠性高,任意任务实例或者计算节点故障都不影响任务的完成;3、资源使用率高,各个节点都为任务完成提供计算能力。

Description

一种适用于电力系统分布式任务的管理方法
技术领域
本发明涉及一种适用于电力系统的分布式任务管理方法,属于分布式处理技术领域。
背景技术
现有的电力调度自动化系统中,电力应用一般采用各个服务器单独运行全部处理任务,互为备份,仅应用主机对外提供服务的模式。资源利用率不高,且系统处理能力受到单机硬件能力的限制。
发明内容
为解决现有技术的不足,本发明的目的在于提供一种自动化程度高、可靠性高、处理能力强、资源利用率高、可移植性好的适用于电力系统的分布式任务管理方法。
为了实现上述目标,本发明采用如下的技术方案:
一种适用于电力系统分布式任务的管理方法,其特征是,包括以下步骤:
1)分布式任务的初始化:管理程序根据系统中活跃的处理节点的数量,将待处理数据划分成大小均衡的若干数据集合,并将任务进程分发到所有活跃的节点上;接着将每个数据集合分发到对应的计算节点上去,并启动计算任务,;
2)运行管理:包括故障冗余、负载均衡、状态切换以及启停管理;
3)计算节点的状态管理:通过心跳机制发现节点离线后,立刻将此节点上的任务迁移到其它低负载节点上;发现节点恢复后,通过负载均衡原则将高负载节点上的任务迁移到该节点上;
4)分布式任务的结果汇总:采用单节点汇总、全系统汇总和区域汇总,并将结果最终写入电力系统内存实时数据库;
前述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤2)中分布式任务的故障冗余为系统中所有正在运行的主任务启动一个热备任务,且热备任务与主任务不在同一个节点上;热备任务得到主任务同样的数据输入,并且运行同样的处理逻辑;如果主任务运行失败,或者中途故障退出,热备任务会立刻升级成主任务,计算完成后此任务实例的结果将参与汇总;同时除主任务故障的节点和热备任务升主任务的节点之外的另一个节点会再启动一个此任务的热备任务。
前述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤2)中分布式任务的负载均衡以每个节点的任务数量来衡量负载,包括主任务层面和热备任务层面;一旦任意两个节点间主任务的数量之差超过一个阈值,负载均衡会自动将高负载节点的部分主任务迁移到低负载节点上;其中,所述阈值根据经验值设定。同样,一旦两个节点间备任务的数量之差超过所述阈值,负载均衡会自动将高负载节点的部分备任务迁移到低负载节点上。
前述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤2)中状态切换采用手动切换主任务和热备任务的状态;启停管理采用手动停止任务,无论停止的是主任务还是热备任务,相对应的另一个任务也会停止。
前述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤3)中,节点一旦离线,管理程序通过心跳机制立刻发现后,将这个节点运行的主任务和热备任务在其它低负载节点上重新启动;节点一旦恢复,心跳机制会立刻发现该节点;管理程序将该节点上的任务先全部置为热备状态,根据主、备任务的负载均衡原则调整任务的分布情况,直到整个系统的主任务和热备任务都处于负载均衡状态。
前述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤4)中,当采用单节点汇总方式时,只有一个服务节点对上层电力应用提供服务时,电力应用指定该节点作为汇总节点,其他节点使用TCP协议向其发送最终的计算结果;当采用全系统汇总方式时,每个节点都对外提供服务时,每个计算节点使用组播发送自己的计算结果,实现全系统汇总,汇总结果最终写入电力系统内存实时数据库;当采用区域汇总方式时,电力应用采用区域计算和服务模式时,部分计算节点指定一个节点作为汇总节点,剩余节点指定另一个点作为汇总节点,使用汇总节点的节点号通过算法形成组播端口,通过组播协议发送计算结果。
本发明所达到的有益效果:1、处理能力高,电力应用的任务完全分布式并发运行;2、自动化程度高,从数据划分到结果汇总整个系统运行过程不需要人工干预;3、可靠性高,任意任务实例或者计算节点故障都不影响任务的最终完成;4、资源使用率高,任务负载被平均的分摊到了各个计算节点,各个节点都为任务完成提供了计算能力;5、可管理性高,在系统运行过程中允许增删计算节点,且不需要人工干预;6、可移植性好,所有功能完全是有计算机程序实现,可运行在各种UNIX和Linux、Windows操作系统上,不需要借助任何操作系统自带的软件;7、部署简单,只需部署一个管理程序、一个动态库、一个配置文件即可运行。
附图说明
图1是本发明中分布式系统的任务初始化流程图;
图2是本发明中任务故障处理流程图;
图3是本发明中恢复处理流程图;
图4是本发明中负载均衡的处理流程图;
图5是负载均衡实现的具体实例;
图6是节点离线的处理流程图;
图7是节点恢复的处理流程图;
图8是节点离线、恢复的具体实例示意图;
图9是向单一节点汇总的示意图;
图10是全系统汇总的示意图;
图11是分区域汇总的示意图。
具体实施方式
下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
图1是本发明中分布式系统的任务初始化流程图。
图中电力应用提交给管理程序的子任务数是12,表明应用希望共有12个任务分布式地运行在系统的所有服务器上。管理程序随之将待处理数据的全集均衡地划分成12个数据子集。然后将任务进程分发到4个应用服务器,并在每台服务器上启动3个进程实例,使得任务进程数与数据子集总数一致,并且每台应用服务器的处理任务是负载均衡的。管理程序使用数据子集的编号通过一定的数学算法计算出一个唯一的通道号,使用电力系统的消息总线将待处理的数据子集发送给对应的处理进程实例。
图2和图3分别是本发明中任务故障和恢复处理流程图。
本方法讨论的任务故障处理包括主任务故障处理和备任务故障处理。如果故障任务是主任务,则将系统中的备任务切换为主任务,同时在备任务数最少的节点上启动一个备任务。如果故障任务是备任务,则直接在其它备任务数最少的节点上启动一个备任务。如果备任务启动失败,则在备任务次少的节点上启动备任务。
当任务恢复时,该任务自动变成备任务。如果该备任务已经存在2个,则在备任务数较多的节点上删除该备任务。
图4是本发明中负载均衡的处理流程图,图5是负载均衡实现的具体实例。
本方法中的负载均衡分为主任务负载均衡和备任务负载均衡。主任务负载均衡时,首先判断主任务是否已经负载均衡,即最大主任务个数和最小主任务个数是否在阈值内。如果未达到主任务负载均衡,则查看主任务数最大的节点n和主任务数最小的节点m,如果节点n的某个主任务是节点m的备任务,则直接将节点m的备任务切换为主任务,同时节点n的主任务自动切换为备任务;如果节点n上不存在和节点m的备任务相同的主任务,则在节点n上选择一个主任务T,在节点m上启动主任务T,待启动结束后,将T从节点n上删除。然后进入下一轮主任务负载均衡流程。
如果主任务已经达到负载均衡,则继续备任务负载均衡。首先判断备任务是否已经负载均衡,即最大备任务个数和最小备任务个数是否在阈值内。如果未达到负载均衡,则查看备任务数最大的节点n和备任务数最小的节点m,如果节点n的某个备任务也是节点m的备任务,则直接将节点n上的备任务删除;否则,选择节点n上的备任务t,在节点m上启动备任务t,待启动结束后,将t从节点n上删除。然后进入下一轮备任务负载均衡流程。如果备任务已经达到负载均衡,则负载均衡流程结束。
图5中讨论了负载均衡的实施流程,这里假定负载均衡阈值是1,即如果两个节点任务数之差超过1,则认为负载不均衡。sca4的主任务数是0,负载不均衡。sca4依次将备任务9、10、11切换成主任务,相应的sca3、sca1、sca2依次将主任务9、10、11切换成备任务。此时各个节点的主任务数目都是3,已经达到负载均衡。sca4的备任务数是0,负载不均衡。sca4依次启动备任务4、1、2,相应的sca1、sca2、sca3依次将备任务4、1、2删除。此时各个节点的备任务数目都是3,已经达到负载均衡,负载均衡流程结束。
图6是节点离线的处理流程图,图7是节点恢复的处理流程图,图8是节点离线、恢复的具体实例。
节点离线处理流程首先将离线节点的状态设置为离线,然后离线节点上的主任务依次在其它节点从备任务切换成主任务,最后将离线节点上的备任务依次在系统中备任务数最少的节点上启动。
节点恢复处理流程首先将所有任务切换成备任务,然后依次为每个任务更新实时库数据。当数据准备完成后,将节点状态变成在线,在删除多余任务后,进入负载均衡处理流程。
图8中当sca4离线,sca4的节点状态设置为离线状态。sca4上的主任务10、11、12分别在sca1、sca2、sca3上从备任务切换为主任务,接着备任务3、6、9分别在sca2、sca3、sca1上启动为备任务。
当sca4恢复时,首先将sca4上的任务3、6、9、10、11、12设置为备任务,当每个任务的实时库数据更新结束后,节点状态变成在线。在进行删除多余任务时,将sca4上的备任务3、6、9,sca2上的备任务10,sca3上的备任务11,sca1上的备任务12删除。最后进行图3所示的负载均衡流程处理。
图9-11是本发明中的计算结果汇总的示意图。
图9是向单一节点汇总的示意图。图中sca2、sca3、sca4节点的计算结果都向sca1节点汇总。sca1节点在一轮计算完成后有1-12号全部数据集的计算结果,结果写入sca1节点的内存实时数据库。sca1作为SCADA的对外服务器对上层应用提供服务。
图10是全系统汇总的示意图。图中sca1、sca2、sca3、sca4节点的计算结果都互相汇总。在一轮计算完成每个节点都有全系统数据的计算结果,结果写入每个节点的内存实时数据库。每个节点都可对上层应用提供服务。此种模式汇总的数据量大,节点的实时库同时需要写入和读出,因此汇总过程相对较慢。
图11是分区域汇总的示意图。图中sca1、sca3节点的计算结果向sca2汇总。sca2节点在一轮计算完成后有1-9号数据集的计算结果,结果写入sca2节点的内存实时数据库。图中sca4、sca6节点的计算结果向sca5汇总。sca5节点在一轮计算完成后有10-18号数据集的计算结果,结果写入sca5节点的内存实时数据库。此方法用以支持应用的区域计算和服务模式,比如sca1、sca2、sca3节点处理华东电网的数据,而sca4、sca5、sca6节点处理华北电网的数据,两个区域分别有一个对外服务节点。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

Claims (6)

1.一种适用于电力系统分布式任务的管理方法,其特征是,包括以下步骤:
1)分布式任务的初始化:管理程序根据系统中活跃的处理节点的数量,将待处理数据划分成大小均衡的若干数据集合,并将任务进程分发到所有活跃的节点上;接着将每个数据集合分发到对应的计算节点上去,并启动计算任务,;
2)运行管理:包括故障冗余、负载均衡、状态切换以及启停管理;
3)计算节点的状态管理:通过心跳机制发现节点离线后,立刻将此节点上的任务迁移到其它低负载节点上;发现节点恢复后,通过负载均衡原则将高负载节点上的任务迁移到该节点上;
4)分布式任务的结果汇总:采用单节点汇总、全系统汇总和区域汇总,并将结果最终写入电力系统内存实时数据库。
2.根据权利要求1所述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤2)中分布式任务的故障冗余为系统中所有正在运行的主任务启动一个热备任务,且热备任务与主任务不在同一个节点上;热备任务得到主任务同样的数据输入,并且运行同样的处理逻辑;如果主任务运行失败,或者中途故障退出,热备任务会立刻升级成主任务,计算完成后此任务实例的结果将参与汇总;同时除主任务故障的节点和热备任务升主任务的节点之外的另一个节点会再启动一个此任务的热备任务。
3.根据权利要求1所述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤2)中分布式任务的负载均衡以每个节点的任务数量来衡量负载,包括主任务层面和热备任务层面;一旦任意两个节点间主任务的数量之差超过一个阈值,负载均衡会自动将高负载节点的部分主任务迁移到低负载节点上;其中,所述阈值根据经验值设定;同样,一旦两个节点间备任务的数量之差超过所述阈值,负载均衡会自动将高负载节点的部分备任务迁移到低负载节点上。
4.根据权利要求1所述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤2)中状态切换采用手动切换主任务和热备任务的状态;启停管理采用手动停止任务,无论停止的是主任务还是热备任务,相对应的另一个任务也会停止。
5.根据权利要求1所述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤3)中,节点一旦离线,管理程序通过心跳机制立刻发现后,将这个节点运行的主任务和热备任务在其它低负载节点上重新启动;节点一旦恢复,心跳机制会立刻发现该节点;管理程序将该节点上的任务先全部置为热备状态,根据主、备任务的负载均衡原则调整任务的分布情况,直到整个系统的主任务和热备任务都处于负载均衡状态。
6.根据权利要求1所述的一种适用于电力系统分布式任务的管理方法,其特征是,所述步骤4)中,当采用单节点汇总方式时,只有一个服务节点对上层电力应用提供服务时,电力应用指定该节点作为汇总节点,其他节点使用TCP协议向其发送最终的计算结果;当采用全系统汇总方式时,每个节点都对外提供服务时,每个计算节点使用组播发送自己的计算结果,实现全系统汇总,汇总结果最终写入电力系统内存实时数据库;当采用区域汇总方式时,电力应用采用区域计算和服务模式时,部分计算节点指定一个节点作为汇总节点,剩余节点指定另一个点作为汇总节点,使用汇总节点的节点号通过算法形成组播端口,通过组播协议发送计算结果。
CN201510533368.9A 2015-08-27 2015-08-27 一种适用于电力系统分布式任务的管理方法 Pending CN105139130A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510533368.9A CN105139130A (zh) 2015-08-27 2015-08-27 一种适用于电力系统分布式任务的管理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510533368.9A CN105139130A (zh) 2015-08-27 2015-08-27 一种适用于电力系统分布式任务的管理方法

Publications (1)

Publication Number Publication Date
CN105139130A true CN105139130A (zh) 2015-12-09

Family

ID=54724469

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510533368.9A Pending CN105139130A (zh) 2015-08-27 2015-08-27 一种适用于电力系统分布式任务的管理方法

Country Status (1)

Country Link
CN (1) CN105139130A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295110A (zh) * 2017-08-16 2017-10-24 网宿科技股份有限公司 计算任务的处理方法、边缘节点、业务服务器及系统
CN108616503A (zh) * 2018-03-12 2018-10-02 北京邮电大学 基于udp的数据传输方法及系统
CN110784779A (zh) * 2019-10-28 2020-02-11 国网上海市电力公司 一种用电信息采集系统的数据采集方法
CN111092915A (zh) * 2018-10-23 2020-05-01 亿度慧达教育科技(北京)有限公司 服务器系统
CN116743752A (zh) * 2023-08-11 2023-09-12 山东恒宇电子有限公司 一种分布式网络通讯实现数据处理负载均衡系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102394807A (zh) * 2011-08-23 2012-03-28 北京京北方信息技术有限公司 一种分散调度自治的流程引擎负载均衡集群系统及方法
US20120110584A1 (en) * 2010-10-29 2012-05-03 Google Inc. System and method of active risk management to reduce job de-scheduling probability in computer clusters
CN103560907A (zh) * 2013-10-23 2014-02-05 曙光信息产业(北京)有限公司 双机负载均衡设备的管理方法和装置
CN104077181A (zh) * 2014-06-26 2014-10-01 国电南瑞科技股份有限公司 一种适用于分布式任务管理系统的状态一致性维护方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120110584A1 (en) * 2010-10-29 2012-05-03 Google Inc. System and method of active risk management to reduce job de-scheduling probability in computer clusters
CN102394807A (zh) * 2011-08-23 2012-03-28 北京京北方信息技术有限公司 一种分散调度自治的流程引擎负载均衡集群系统及方法
CN103560907A (zh) * 2013-10-23 2014-02-05 曙光信息产业(北京)有限公司 双机负载均衡设备的管理方法和装置
CN104077181A (zh) * 2014-06-26 2014-10-01 国电南瑞科技股份有限公司 一种适用于分布式任务管理系统的状态一致性维护方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
吴德州,武君胜: "面向电力系统的分布式实时数据库设计", 《科学技术与工程》 *
国家电力调度控制中心 编: "《大电网在线分析理论及应用》", 31 May 2014, 北京:中国电力出版社 *
李代平等编著: "《软件工程分析案例》", 31 May 2008, 北京:清华大学出版社 *
陈波,张曦煌: "基于分层与容错机制的云计算负载均衡策略", 《计算机应用》 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107295110A (zh) * 2017-08-16 2017-10-24 网宿科技股份有限公司 计算任务的处理方法、边缘节点、业务服务器及系统
CN107295110B (zh) * 2017-08-16 2020-08-04 网宿科技股份有限公司 计算任务的处理方法、边缘节点、业务服务器及系统
CN108616503A (zh) * 2018-03-12 2018-10-02 北京邮电大学 基于udp的数据传输方法及系统
CN111092915A (zh) * 2018-10-23 2020-05-01 亿度慧达教育科技(北京)有限公司 服务器系统
CN110784779A (zh) * 2019-10-28 2020-02-11 国网上海市电力公司 一种用电信息采集系统的数据采集方法
CN110784779B (zh) * 2019-10-28 2021-08-24 国网上海市电力公司 一种用电信息采集系统的数据采集方法
CN116743752A (zh) * 2023-08-11 2023-09-12 山东恒宇电子有限公司 一种分布式网络通讯实现数据处理负载均衡系统

Similar Documents

Publication Publication Date Title
CN105139130A (zh) 一种适用于电力系统分布式任务的管理方法
CN106844510B (zh) 一种分布式数据库集群的数据迁移方法和装置
US20170048123A1 (en) System for controlling switch devices, and device and method for controlling system configuration
CN105159798A (zh) 一种虚拟机的双机热备方法、双机热备管理服务器和系统
CN103200036B (zh) 一种电力系统云计算平台的自动化配置方法
CN110134518B (zh) 一种提高大数据集群多节点应用高可用性的方法及系统
WO2016058307A1 (zh) 资源的故障处理方法及装置
CN108810115B (zh) 一种适用于分布式数据库的负载均衡方法、装置及服务器
CN103117874A (zh) 一种刀片服务器管理网络快速配置方法
US8352757B2 (en) Oversubscribing branch circuits while lowering power distribution costs
WO2011088767A1 (zh) 内容分发的方法、系统及调度服务器
CN104702691B (zh) 分布式负载均衡方法和装置
CN109358490A (zh) 一种冗余设备及其测试方法、系统和存储介质
CN104202255A (zh) 一种高效多链路数据传输实现方法
CN105162623A (zh) 一种云处理方法及云服务器
CN104123183A (zh) 集群作业调度方法和装置
CN104917827A (zh) 一种实现oracle负载均衡集群的方法
CN104052799B (zh) 一种利用资源环实现高可用存储的方法
Ammar et al. Dynamic SDN controllers-switches mapping for load balancing and controller failure handling
CN107493333B (zh) 一种基于SDN的云计算环境下web系统资源管理方法及系统
CN103888310A (zh) 监控处理方法及系统
CN104468674B (zh) 数据迁移方法及装置
CN111367711A (zh) 一种基于超融合数据安全容灾方法
CN104572402A (zh) 一种服务器及实现服务器功耗管理的方法
CN105049475A (zh) 大规模社区的数据高效存储优化方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20151209