CN109117320A - 基于云平台的配电自动化主站故障容灾处理系统及方法 - Google Patents

基于云平台的配电自动化主站故障容灾处理系统及方法 Download PDF

Info

Publication number
CN109117320A
CN109117320A CN201810730769.7A CN201810730769A CN109117320A CN 109117320 A CN109117320 A CN 109117320A CN 201810730769 A CN201810730769 A CN 201810730769A CN 109117320 A CN109117320 A CN 109117320A
Authority
CN
China
Prior art keywords
node
power distribution
distribution automation
main station
automation main
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810730769.7A
Other languages
English (en)
Inventor
杨乔
谭志荣
李翔
刘国庆
方莺辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Xuji Group Co Ltd
State Grid Zhejiang Electric Power Co Ltd
Zhuhai Xujizhi Power System Automation Co Ltd
Original Assignee
State Grid Corp of China SGCC
Xuji Group Co Ltd
State Grid Zhejiang Electric Power Co Ltd
Zhuhai Xujizhi Power System Automation Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Xuji Group Co Ltd, State Grid Zhejiang Electric Power Co Ltd, Zhuhai Xujizhi Power System Automation Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN201810730769.7A priority Critical patent/CN109117320A/zh
Publication of CN109117320A publication Critical patent/CN109117320A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了基于云平台的配电自动化主站故障容灾处理系统及方法,所述系统包括配电自动化主站,所述配电自动化主站包括若干个处理节点,每一个处理节点均包括主节点和备用节点;配电自动化主站节点管理模块,用于针对配电自动化主站的每个处理节点向云中心发送对关闭故障处理节点和启动冷备处理节点的命令,并用于将配电自动化主站的每个处理节点分别运行在所述本地云中心和同城云中心上。本系统提高了系统的容灾能力,使冷备处理节点启动时间从10分钟缩短到5分钟,使处理节点因系统故障单节点运行时间从30分钟到数天的检修时间缩短到5分钟。

Description

基于云平台的配电自动化主站故障容灾处理系统及方法
技术领域
本发明涉及配电自动化技术领域,具体涉及一种基于云平台的配电自动化主站故障的容灾处理系统及方法。
背景技术
现有配电自动化主站系统构建于操作系统之上的软件平台上,通过主备机的机制提高系统的容灾能力。云计算是近年来新兴发展的技术方向和商业模式,能够以较为低廉的价格获取各种计算资源和服务,并能按需申请或分配计算资源。
配电自动化主站系统是基于传统服务器架构上的系统方案,通过系统平台层的主备处理机制提高系统的容灾能力。系统平台层支持配电自动化主站系统在软件层面和硬件层面发生故障时的容灾处理。当软件系统发生故障时能在20秒内完成热备切换,系统主要功能恢复正常。当硬件系统发生故障时能在5分钟内完成冷备切换,系统主要功能恢复正常。
现有技术实现的热备和冷备切换的时间过长,使得配电网无监管运行的时间过长,而且维修和更换系统硬件也会使系统长时间处于单机运行状态,时间一般长达数小时到十几天。
发明内容
基于现有技术的不足,本发明的目的在于在提供一种基于云平台的配电自动化主站故障的容灾处理系统及方法,对配电自动化主站系统改造,适配云计算平台上运行,并保证系统处理的实时性,以此实现配电自动化主站系统虚拟化,能够在保持系统不停止服务的状态下动态增加、维护系统硬件安全,并结合云计算平台的技术优势和配电自动化主站的数据处理技术,全新设计配电自动化系统在2个云计算平台上的部署方式、数据同步方案以及容灾设计,提高配电自动化主站系统的整体容灾能力。
为实现上述目的,本发明的技术方案为:
基于云平台的配电自动化主站故障容灾处理系统,其特征在于:包括
配电自动化主站,所述配电自动化主站包括若干个处理节点,每一个处理节点均包括主节点和备用节点;
配电自动化主站节点管理模块,用于针对配电自动化主站的每个处理节点向云中心发送对关闭故障处理节点和启动冷备处理节点的命令,并用于将配电自动化主站的每个处理节点分别运行在所述本地云中心和同城云中心上。
进一步的,位于同城云中心上的配电自动化主站处理节点的备用节点上包括用于检测主节点故障的心跳侦测模块。
进一步的,每一个所述配电自动化主站的处理节点均包括用于在主、备节点之间切换的主备处理逻辑切换模块。
基于云平台的配电自动化主站故障容灾处理方法,所述方法包括,
S1:同城云中心上的配电自动化主站处理节点的备用节点通过心跳侦测,识别其主节点故障后,通过配电自动化主站处理节点的主备处理逻辑模块热切换为主节点,同时上报给配电自动化主站节点管理模块节点进行状态切换;
S2:配电自动化主站节点管理模块侦测到本地云中心的故障后,向本地云中心发送关闭故障处理节点和启动冷备处理节点的命令;
S3:冷备处理节点启动完毕后,配电自动化主站处理节点自识别为备节点,并与对应主节点建立热备关系。
进一步的,所述方法还包括,
当本地云中心上所有配电自动化处理节点均发生故障时,在执行步骤S3后继续执行步骤S4的操作:
S4:配电自动化节点管理模块侦测到本地云中心重新上线,向同城云中心发送关闭热备处理节点的命令,再向本地云中心管理平台发送启动冷备处理节点的命令,冷备处理节点启动完毕后,配电自动化主站处理节点自识别为备节点,并再次与对应主节点建立热备关系,进而配电自动化主站系统恢复到分别运行在同城云中心和本地云中心上的同一个配电自动化主站处理节点的主、备节点上。
本发明的有益效果为:在云计算平台的支撑下,配电自动化主站处理节点采用虚拟化技术,减少了计算机硬件设备自检的时间,处理节点不再与物理服务器绑定,可以在云计算平台上直接启动,提高了系统的容灾能力,使冷备处理节点启动时间从10分钟缩短到5分钟,使处理节点因系统故障单节点运行时间从30分钟到数天的检修时间缩短到5分钟。
附图说明
图1为本发明具体实施例的单节点故障系统容灾处理流程图;
图2为本发明具体实施例的云中心整体故障容灾处理流程图。
具体实施方式
以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整地描述,以充分地理解本发明的目的、特征和效果。显然,所描述的实施例只是本发明的一部分实施例,而不是全部实施例,本领域的技术人员在不付出创造性劳动的前提下所获得的其他实施例,均属于本发明保护的范围。
基于云平台的配电自动化主站故障容灾处理系统,包括
配电自动化主站,所述配电自动化主站包括若干个处理节点,每一个处理节点均包括主节点和备用节点;
配电自动化主站节点管理模块,用于针对配电自动化主站的每个处理节点向云中心发送对关闭故障处理节点和启动冷备处理节点的命令,并用于将配电自动化主站的每个处理节点分别运行在所述本地云中心和同城云中心上。
位于同城云中心上的配电自动化主站处理节点的备用节点上包括用于检测主节点故障的心跳侦测模块。
每一个所述配电自动化主站的处理节点均包括用于在主、备节点之间切换的主备处理逻辑切换模块。
如图1所示,单节点故障时,同城云中心上配电自动化主站处理节点的备用节点通过心跳侦测,识别其主节点故障,通过配电自动化主站处理节点的主备处理逻辑热切换为主节点,切换时间小于20秒。同时上报配电自动化主站节点管理模块节点状态切换。
节点管理模块向本地云中心管理平台发送关闭故障处理节点和启动冷备处理节点的命令。
冷备处理节点启动完毕,配电自动化主站处理节点自识别为备节点,并与对应主节点建立热备关系。冷备处理节点启动到建立热备关系时间小于5分钟。
如图2所示,本地云中心发生整体故障时,同城云中心上配电自动化主站处理节点的备用节点通过心跳侦测,识别其主节点故障,通过配电自动化主站处理节点的主备处理逻辑热切换为主节点,切换时间小于20秒。同时上报配电自动化主站节点管理模块节点状态切换。
配电自动化主站节点管理模块侦测到本地云中心的故障,节点管理模块向同城云中心管理平台发送关闭故障处理节点和启动冷备处理节点的命令。
冷备处理节点启动完毕,配电自动化主站处理节点自识别为备节点,并与对应主节点建立热备关系。
冷备处理节点启动到建立热备关系时间小于5分钟。
配电自动化主站节点管理模块侦测到本地云中心重新上线,向同城云中心管理平台发送关闭热备处理节点的命令,再向本地云中心管理平台发送启动冷备处理节点的命令。
冷备处理节点启动完毕,配电自动化主站处理节点自识别为备节点,并再次与对应主节点建立热备关系。系统恢复到同一个配电自动化主站处理节点的主、备节点分别运行在同城云中心和本地云中心上。
在云计算平台的支撑下,配电自动化主站处理节点采用虚拟化技术,因此减少了计算机硬件设备自检的时间,处理节点不再与物理服务器绑定,可以在云计算平台上直接启动。因此可获得以下2项收益,提高系统的容灾能力:
1.冷备处理节点启动时间从10分钟缩短到5分钟
2.处理节点因系统故障单节点运行时间从30分钟到数天的检修时间缩短到5分钟。
配电自动化主站云平台高可用系统架构与传统架构容灾对比:
需要说明的是,以上所述只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

Claims (5)

1.基于云平台的配电自动化主站故障容灾处理系统,其特征在于:包括
配电自动化主站,所述配电自动化主站包括若干个处理节点,每一个处理节点均包括主节点和备用节点;
配电自动化主站节点管理模块,用于针对配电自动化主站的每个处理节点向云中心发送对关闭故障处理节点和启动冷备处理节点的命令,并用于将配电自动化主站的每个处理节点分别运行在所述本地云中心和同城云中心上。
2.如权利要求1所述的配电自动化主站故障容灾处理系统,其特征在于:位于同城云中心上的配电自动化主站处理节点的备用节点上包括用于检测主节点故障的心跳侦测模块。
3.如权利要求1或2所述的配电自动化主站故障容灾处理系统,其特征在于:每一个所述配电自动化主站的处理节点均包括用于在主、备节点之间切换的主备处理逻辑切换模块。
4.基于云平台的配电自动化主站故障容灾处理方法,其特征在于,所述方法包括,
S1:同城云中心上的配电自动化主站处理节点的备用节点通过心跳侦测,识别其主节点故障后,通过配电自动化主站处理节点的主备处理逻辑模块热切换为主节点,同时上报给配电自动化主站节点管理模块节点进行状态切换;
S2:配电自动化主站节点管理模块侦测到本地云中心的故障后,向本地云中心发送关闭故障处理节点和启动冷备处理节点的命令;
S3:冷备处理节点启动完毕后,配电自动化主站处理节点自识别为备节点,并与对应主节点建立热备关系。
5.如权利要求4所述的基于云平台的配电自动化主站故障容灾处理方法,其特征在于所述方法还包括,
当本地云中心上所有配电自动化处理节点均发生故障时,在执行步骤S3后继续执行步骤S4的操作:
S4:配电自动化节点管理模块侦测到本地云中心重新上线,向同城云中心发送关闭热备处理节点的命令,再向本地云中心管理平台发送启动冷备处理节点的命令,冷备处理节点启动完毕后,配电自动化主站处理节点自识别为备节点,并再次与对应主节点建立热备关系,进而配电自动化主站系统恢复到分别运行在同城云中心和本地云中心上的同一个配电自动化主站处理节点的主、备节点上。
CN201810730769.7A 2018-07-05 2018-07-05 基于云平台的配电自动化主站故障容灾处理系统及方法 Pending CN109117320A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810730769.7A CN109117320A (zh) 2018-07-05 2018-07-05 基于云平台的配电自动化主站故障容灾处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810730769.7A CN109117320A (zh) 2018-07-05 2018-07-05 基于云平台的配电自动化主站故障容灾处理系统及方法

Publications (1)

Publication Number Publication Date
CN109117320A true CN109117320A (zh) 2019-01-01

Family

ID=64823012

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810730769.7A Pending CN109117320A (zh) 2018-07-05 2018-07-05 基于云平台的配电自动化主站故障容灾处理系统及方法

Country Status (1)

Country Link
CN (1) CN109117320A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124682A (zh) * 2019-12-24 2020-05-08 珠海大横琴科技发展有限公司 一种弹性资源分配方法、装置、电子设备和存储介质
CN114584459A (zh) * 2022-03-07 2022-06-03 浪潮云信息技术股份公司 一种实现容器云平台主备高可用的方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030110409A1 (en) * 2001-12-07 2003-06-12 Alan Gale Method and apparatus for network fault correction via adaptive fault router
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
CN101588295A (zh) * 2009-04-22 2009-11-25 北京四方继保自动化股份有限公司 电力自动化前置系统通道级的分层动态路由方法
CN105553701A (zh) * 2015-12-11 2016-05-04 国网青海省电力公司 一种配网调控系统及其控制方法
CN106886469A (zh) * 2017-04-10 2017-06-23 深圳第线通信有限公司 一种云计算容灾管理方法
CN106936213A (zh) * 2016-12-23 2017-07-07 国网山东省电力公司滨州供电公司 基于云平台的智能配电房综合监控管理系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030110409A1 (en) * 2001-12-07 2003-06-12 Alan Gale Method and apparatus for network fault correction via adaptive fault router
CN101179432A (zh) * 2007-12-13 2008-05-14 浪潮电子信息产业股份有限公司 一种多机环境中实现系统高可用的方法
CN101588295A (zh) * 2009-04-22 2009-11-25 北京四方继保自动化股份有限公司 电力自动化前置系统通道级的分层动态路由方法
CN105553701A (zh) * 2015-12-11 2016-05-04 国网青海省电力公司 一种配网调控系统及其控制方法
CN106936213A (zh) * 2016-12-23 2017-07-07 国网山东省电力公司滨州供电公司 基于云平台的智能配电房综合监控管理系统
CN106886469A (zh) * 2017-04-10 2017-06-23 深圳第线通信有限公司 一种云计算容灾管理方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
张璠等: "《物联网技术基础》", 31 May 2018 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111124682A (zh) * 2019-12-24 2020-05-08 珠海大横琴科技发展有限公司 一种弹性资源分配方法、装置、电子设备和存储介质
CN114584459A (zh) * 2022-03-07 2022-06-03 浪潮云信息技术股份公司 一种实现容器云平台主备高可用的方法

Similar Documents

Publication Publication Date Title
CN106383754A (zh) 一种基于区块链技术的数据库备份、恢复方法和系统
CN103778031B (zh) 一种云环境下的分布式系统多级故障容错方法
CN102394774B (zh) 一种云计算操作系统的控制器服务状态监控和故障恢复方法
CN110807064B (zh) Rac分布式数据库集群系统中的数据恢复装置
CN103226493B (zh) 多操作系统业务的部署方法和系统
CN100426751C (zh) 保证集群系统中配置信息一致的方法
CN103441863B (zh) 一种空管自动化系统中的双服务器热备系统及控制方法
CN104408071A (zh) 一种基于集群管理器的分布式数据库高可用方法及系统
CN109245926B (zh) 智能网卡、智能网卡系统及控制方法
CN107832164A (zh) 一种基于Ceph的故障硬盘处理的方法及装置
CN112948063B (zh) 云平台的创建方法、装置、云平台以及云平台实现系统
CN103595572B (zh) 一种云计算集群中节点自修复的方法
CN111371599A (zh) 一种基于etcd的集群容灾管理系统
CN108469996A (zh) 一种基于自动快照的系统高可用方法
CN112732311B (zh) 一种大型储能系统bms程序热更新方法、系统及介质
CN112650742A (zh) 跨链数据验证方法、装置、设备和存储介质
CN105812161B (zh) 一种控制器故障备份方法和系统
CN109117320A (zh) 基于云平台的配电自动化主站故障容灾处理系统及方法
CN107291821A (zh) 一种同城双活架构快速切换的方法
CN110286852A (zh) 双控构架分布式存储系统、数据读取方法、装置和存储介质
CN109361777A (zh) 分布式集群节点状态的同步方法、同步系统及相关装置
CN102111303A (zh) 无人值守系统自动监护方法及装置
CN102508745A (zh) 一种基于两级松散同步的三模冗余系统及其实现方法
CN106790349A (zh) 一种基于ieee1394接口实现双机热备的方法
CN112367186B (zh) 一种基于0penStack裸机的故障保护方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190101