CN109839041A - 一种基于去中心化集群计算架构的免维护测控方法 - Google Patents

一种基于去中心化集群计算架构的免维护测控方法 Download PDF

Info

Publication number
CN109839041A
CN109839041A CN201811618819.9A CN201811618819A CN109839041A CN 109839041 A CN109839041 A CN 109839041A CN 201811618819 A CN201811618819 A CN 201811618819A CN 109839041 A CN109839041 A CN 109839041A
Authority
CN
China
Prior art keywords
node
scheduling
scheduling node
maintaining
decentralization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811618819.9A
Other languages
English (en)
Other versions
CN109839041B (zh
Inventor
解梦迪
唐大林
毛鹏飞
李经伟
李洁
陈韬
薛娜
宗丽娜
徐宫健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Aerospace Measurement and Control Technology Co Ltd
Original Assignee
Beijing Aerospace Measurement and Control Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Aerospace Measurement and Control Technology Co Ltd filed Critical Beijing Aerospace Measurement and Control Technology Co Ltd
Priority to CN201811618819.9A priority Critical patent/CN109839041B/zh
Publication of CN109839041A publication Critical patent/CN109839041A/zh
Application granted granted Critical
Publication of CN109839041B publication Critical patent/CN109839041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种基于去中心化集群计算架构的免维护测控方法,过程如下:智能节点组成分布式结构的测控系统,节点间采用无线通讯互连,系统有常备暖备节点供激活使用;当判断出系统中出现故障节点时,系统其余在线工作节点识别出故障节点,并断开与故障节点的连接,故障节点承担的采集通道负载将通过负载均衡模块转移到其他节点中;当系统节点数量或者计算能力不足以满足系统需求时,唤醒暖备节点,通过负载均衡模块将周边节点采集通道均衡一部分到被激活的暖备节点上。该方法保证了系统的高可靠性,从而实现免维护和智能化设计的目标。

Description

一种基于去中心化集群计算架构的免维护测控方法
技术领域
本发明属于冗余控制、分布式计算技术领域,特别涉及一种基于去中心化集群计算架构的免维护测控方法。
背景技术
随着对某型号导弹地面测试设备的小型化、简约化、免维护和智能化设计需求,采用去中心分布式系统的数据处理算法有效的弥补了单点处理能力有限的问题,智能节点的灵活的出网和入网机制满足了长期加电、免维护的需求,系统负载均衡处理实现了节点负载动态调整,并且集群存储机制保证了故障节点的出网和暖备节点入网前后系统数据的完整性,该方法适用于对测控系统有维护条件限制、系统数据智能备份以及系统功耗有限制的特殊测控场合。目前用于某型号导弹的测试设备采用有缆连接、双机热备的架构保证系统的可靠性以及无人值守,当主机设备故障或者双机故障时,不可避免需要对故障设备进行维修等操作,满足不了需要长时间无人值守、需要维持系统高可靠性的测控场合。
发明内容
有鉴于此,本发明提供一种基于去中心化集群计算架构的免维护测控方法,该方法保证了系统的高可靠性,从而实现免维护和智能化设计的目标。
实现本发明的技术方案如下:
一种基于去中心化集群计算架构的免维护测控方法,具体过程如下:
智能节点组成分布式结构的测控系统,节点间采用无线通讯互连,系统有常备暖备节点供激活使用;
当判断出系统中出现故障节点时,系统其余在线工作节点识别出故障节点,并断开与故障节点的连接,故障节点承担的采集通道负载将通过负载均衡模块转移到其他节点中;
当系统节点数量或者计算能力不足以满足系统需求时,唤醒暖备节点,通过负载均衡模块将周边节点采集通道均衡一部分到被激活的暖备节点上。
进一步地,本发明组成测控系统的节点分为调度节点、备用调度节点及普通节点;故障节点识别的过程为:
普通节点和备用节点以单播的方式向调度节点周期性发送心跳,调度节点对普通节点进行心跳检测,连续三个周期未成功发送心跳则会被调度节点判为故障节点,调度节点向故障节点的多节点冗余控制模块发送退网控制指令;
调度节点将自己的心跳发送给备用调度节点,当连续三个周期接收不到调度节点的心跳,向故障调度节点多节点冗余控制模块发送退网控制指令。
进一步地,本发明所述测控系统有调度节点;
当系统检测到负载不均衡时,节点计算自身的负载信息,并将负载信息同步至调度节点;
调度节点负载均衡模块从存储区中获取系统中各节点同步的负载信息,调度节点综合判断给出系统节点负载调整信息表,并将调整结果分别同步至各节点负载均衡存储区;
各节点扫描负载均衡存储区获取调度节点同步的负载调整结果,负载均衡模块执行调整结果。
进一步地,本发明所述负载信息包括当前节点任务数量、当前节点健康状态、当前节点的节点连接数量以及当前节点采集通道数量信息。
进一步地,本发明所述调度节点采用如下过程进行选举,具体为:
系统初始化过程中,临时选举一个节点作为临时调度节点,然后以临时调度节点为基础选出调度节点和备用调度节点;
在系统运行过程中出现调度节点故障或者调度节点的权值下降,需要进行调度节点身份转移,将其转移到备用调度节点上,以保证系统的正常运行。
进一步地,本发明方法还进一步包括:
智能节点采集不同通道数据,采用模糊层次综合评价算法对采集的通道参数进行状态分析,给出每个通道参数的状态值,并将单个智能节点所分析的结果上传至调度节点;
调度节点收集系统在线节点的所有通道状态结果,并将参数通道进行分类处理,再次使用模糊层次综合评价算法,给出系统健康状态评估值。
有益效果
本发明采用去中心化集群结构的方法能够从实现系统长期工作免维护,以及系统节点智能的出网与入网、负载的均衡等保证了系统的高可靠性,从而实现免维护和智能化设计的目标。
本发明测控方法实现对故障检测率大于95%,具备40s内对弹体状态评估能力。
附图说明
图1为本发明去中心化集群计算架构的免维护测控结构示意图。
图2为本发明集群节点心跳结构示意图。
图3为本发明调度节点选举逻辑示意图。
图4为本发明分通道分布式数据分析逻辑示意图。
具体实施方式
下面结合附图和具体实例对本发明进行详细说明。
图1是本发明去中心化集群计算架构的免维护测控结构示意图。如图所示由通讯与同步子系统、任务调度与容错子系统以及分布式集群健康状态评估系统组成,各节点间通过通讯与同步系统进行节点、系统信息交互。任务调度与容错子系统完成节点故障信息分析与检测、系统冗余功能以及系统负载均衡保证系统运行平稳。分布式集群健康状态评估系统对当前系统健康状态进行综合评估,并根据评估结果进行动态调整。
基于上述系统的一种基于去中心化集群计算架构的免维护测控方法,具体过程为:
智能节点组成分布式结构的测控系统,节点间采用无线通讯互连,系统有常备暖备节点供激活使用;当判断出系统中出现故障节点时,系统其余在线工作节点识别出故障节点,并断开与故障节点的连接,故障节点承担的采集通道负载将通过负载均衡模块转移到其他节点中;当系统节点数量或者计算能力不足以满足系统需求时,唤醒暖备节点,通过负载均衡模块将周边节点采集通道均衡一部分到被激活的暖备节点上。
本发明在出现故障节点时,通过负载均衡将其负载转移到其他节点上,在出现系统计算能力不足时,激活暖备节点来分担一些负载,从而保证了系统的可靠性。
图2是本发明集群节点心跳结构示意图。如图所示节点间维护多冗余机制,测控系统包括普通节点、调度节点以及备用调度节点,其中普通节点以单播的方式向调度节点以一秒为一个周期发送心跳,调度节点对普通节点进行心跳检测,连续三个周期未成功发送心跳则会被调度节点判为故障节点,调度节点向故障节点的多节点冗余控制模块发送退网控制指令;调度节点的心跳模块用来接收向它发送心跳指令节点的心跳状态,并将自己的心跳发送给备用调度节点。备用调度节点除了将正常心跳发送给调度节点,接受调度节点的心跳检测外,还将接收到调度节点的心跳,对调度节点心跳进行检测,当连续三个周期接收不到调度节点的心跳,向故障调度节点多节点冗余控制模块发送退网控制指令。
本发明当系统检测到负载不均衡时,节点计算自身的负载信息,并将负载信息同步至调度节点;调度节点负载均衡模块从存储区中获取系统中各节点同步的负载信息,调度节点综合判断给出系统节点负载调整信息表,并将调整结果分别同步至各节点负载均衡存储区;各节点扫描负载均衡存储区获取调度节点同步的负载调整结果,负载均衡模块执行调整结果。本发明实施例负载信息包括当前节点任务数量、当前节点健康状态、当前节点的节点连接数量以及当前节点采集通道数量信息。当前节点的健康状态有节点CPU利用率、内存使用率、网络速率等决定。
图3为本发明调度节点选举逻辑示意图。如图所示系统在运行过程中调度节点会出现多种不同形态的动态改变,系统需要动态维护调度节点的状态。主要分为系统初始化以及调度节点身份移交两个状态,系统初始化过程中,系统中不存在调度节点,需要首先选举一个临时调度节点,然后以临时调度节点为基础选出调度节点和备用调度节点。系统初始化后,选出调度节点,在运行过程中出现如调度节点故障或者调度节点的权值下降等问题,系统需要进行调度节点的身份转移以保证系统的正常运行,将权值最大的节点作为调度节点,全局次大的节点作为备用调度节点。
本实施例考虑调度节点的信誉度、节点位置、剩余能量比3种因素计算权值,其中参数说明见表所示,并对节点权值进行排序,选择权值最大的节点为调度节点而选择次大的节点作为备选调用节点。3种因素分别用Ti、Pi、Ej表示,节点计算的权值计算公如下:
其中,
图4为本发明分通道分布式数据分析逻辑示意图。根据系统采集通道以及模糊算法的特点采用通道分布式方式进行数据分析,各节点采用模糊层次综合评估算法完成对采集通道参数的健康状态分级处理,各节点将通道的分级结果上传至调度节点。调度节点分析系统所有采集通道健康状态分级,并对采集通道进行归类处理,分为组件1、组件2、组件3……组件n等,最后依据模糊层次综合评估方法给出系统的健康状态等级(一类故障、二类故障、三类故障、四类故障和健康)。
本发明采用去中心分布式系统的数据处理算法,提出了多节点冗余机制;动态调度节点选举;动态负载均衡;基于分布式架构的状态评估方法有效的弥补了单点处理能力有限的问题,智能节点的灵活的出网和入网机制满足了长期加电、免维护的需求,系统负载均衡处理实现了节点负载动态调整,并且集群存储机制保证了故障节点的出网和暖备节点入网前后系统数据的完整性,该方法适用于对测控系统有维护条件限制、系统数据智能备份以及系统功耗有限制的特殊测控场合。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于去中心化集群计算架构的免维护测控方法,其特征在于,具体过程如下:
智能节点组成分布式结构的测控系统,节点间采用无线通讯互连,系统有常备暖备节点供激活使用;
当判断出系统中出现故障节点时,系统其余在线工作节点识别出故障节点,并断开与故障节点的连接,故障节点承担的采集通道负载将通过负载均衡模块转移到其他节点中;
当系统节点数量或者计算能力不足以满足系统需求时,唤醒暖备节点,通过负载均衡模块将周边节点采集通道均衡一部分到被激活的暖备节点上。
2.根据权利要求1所述基于去中心化集群计算架构的免维护测控方法,其特征在于,组成测控系统的节点分为调度节点、备用调度节点及普通节点;故障节点识别的过程为:
普通节点和备用节点以单播的方式向调度节点周期性发送心跳,调度节点对普通节点进行心跳检测,连续三个周期未成功发送心跳则会被调度节点判为故障节点,调度节点向故障节点的多节点冗余控制模块发送退网控制指令;
调度节点将自己的心跳发送给备用调度节点,当连续三个周期接收不到调度节点的心跳,向故障调度节点多节点冗余控制模块发送退网控制指令。
3.根据权利要求1所述基于去中心化集群计算架构的免维护测控方法,其特征在于,所述测控系统有调度节点;
当系统检测到负载不均衡时,节点计算自身的负载信息,并将负载信息同步至调度节点;
调度节点负载均衡模块从存储区中获取系统中各节点同步的负载信息,调度节点综合判断给出系统节点负载调整信息表,并将调整结果分别同步至各节点负载均衡存储区;
各节点扫描负载均衡存储区获取调度节点同步的负载调整结果,负载均衡模块执行调整结果。
4.根据权利要求3所述基于去中心化集群计算架构的免维护测控方法,其特征在于,所述负载信息包括当前节点任务数量、当前节点健康状态、当前节点的节点连接数量以及当前节点采集通道数量信息。
5.根据权利要求1所述基于去中心化集群计算架构的免维护测控方法,其特征在于,所述调度节点采用如下过程进行选举,具体为:
系统初始化过程中,临时选举一个节点作为临时调度节点,然后以临时调度节点为基础选出调度节点和备用调度节点;
在系统运行过程中出现调度节点故障或者调度节点的权值下降,需要进行调度节点身份转移,将其转移到备用调度节点上,以保证系统的正常运行。
6.根据权利要求1所述基于去中心化集群计算架构的免维护测控方法,其特征在于,该方法还进一步包括:
智能节点采集不同通道数据,采用模糊层次综合评价算法对采集的通道参数进行状态分析,给出每个通道参数的状态值,并将单个智能节点所分析的结果上传至调度节点;
调度节点收集系统在线节点的所有通道状态结果,并将参数通道进行分类处理,再次使用模糊层次综合评价算法,给出系统健康状态评估值。
7.根据权利要求5所述基于去中心化集群计算架构的免维护测控方法,其特征在于,所述权值采用如下公式计算,
其中,Ti、Pi、Ei分别表示调度节点的信誉度、节点位置、剩余能量比, 表示设定的权重,
CN201811618819.9A 2018-12-28 2018-12-28 一种基于去中心化集群计算架构的免维护测控方法 Active CN109839041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811618819.9A CN109839041B (zh) 2018-12-28 2018-12-28 一种基于去中心化集群计算架构的免维护测控方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811618819.9A CN109839041B (zh) 2018-12-28 2018-12-28 一种基于去中心化集群计算架构的免维护测控方法

Publications (2)

Publication Number Publication Date
CN109839041A true CN109839041A (zh) 2019-06-04
CN109839041B CN109839041B (zh) 2021-05-28

Family

ID=66883527

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811618819.9A Active CN109839041B (zh) 2018-12-28 2018-12-28 一种基于去中心化集群计算架构的免维护测控方法

Country Status (1)

Country Link
CN (1) CN109839041B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117311136A (zh) * 2023-11-28 2023-12-29 中国船舶集团有限公司第七一九研究所 基于互联心跳监测机制的双机运行方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640688A (zh) * 2009-08-20 2010-02-03 中兴通讯股份有限公司 基于cdn的节点主备用控制器切换方法及cdn网络
CN102055779A (zh) * 2009-10-30 2011-05-11 国际商业机器公司 生成高可用性组的方法、设备及系统
CN104901881A (zh) * 2015-04-30 2015-09-09 华为技术有限公司 路由设备、负载均衡设备、消息分发方法及系统
CN107147697A (zh) * 2017-04-07 2017-09-08 深信服科技股份有限公司 应用组切换方法及装置
WO2018074587A1 (ja) * 2016-10-20 2018-04-26 日本電気株式会社 サーバ装置、クラスタシステム、クラスタ制御方法およびプログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101640688A (zh) * 2009-08-20 2010-02-03 中兴通讯股份有限公司 基于cdn的节点主备用控制器切换方法及cdn网络
CN102055779A (zh) * 2009-10-30 2011-05-11 国际商业机器公司 生成高可用性组的方法、设备及系统
CN104901881A (zh) * 2015-04-30 2015-09-09 华为技术有限公司 路由设备、负载均衡设备、消息分发方法及系统
WO2018074587A1 (ja) * 2016-10-20 2018-04-26 日本電気株式会社 サーバ装置、クラスタシステム、クラスタ制御方法およびプログラム
CN107147697A (zh) * 2017-04-07 2017-09-08 深信服科技股份有限公司 应用组切换方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117311136A (zh) * 2023-11-28 2023-12-29 中国船舶集团有限公司第七一九研究所 基于互联心跳监测机制的双机运行方法及装置
CN117311136B (zh) * 2023-11-28 2024-03-01 中国船舶集团有限公司第七一九研究所 基于互联心跳监测机制的双机运行方法及装置

Also Published As

Publication number Publication date
CN109839041B (zh) 2021-05-28

Similar Documents

Publication Publication Date Title
US20150115711A1 (en) Multi-level data center consolidated power control
US11190025B2 (en) Control apparatus, control method, and power storage control apparatus
CN102395955B (zh) 数据中心控制
CN102685237B (zh) 一种集群环境下请求会话保持与调度的方法
CN106941276A (zh) 分散式的基于模块的dc数据中心
CN107145393A (zh) 一种负载调整方法、设备及计算机可读存储介质
Asim et al. A fault management architecture for wireless sensor network
Gelenbe et al. Central or distributed energy storage for processors with energy harvesting
CN108830451B (zh) 一种用户侧分布式储能的汇聚潜力评估方法及系统
CN111488049A (zh) 一种服务器机柜供电系统及控制方法
CN106330558A (zh) 应用于软件定义网络的控制器负载预测系统及方法
CN105975047A (zh) 云数据中心功耗调节方法和系统
Hezaveh et al. A fault-tolerant and energy-aware mechanism for cluster-based routing algorithm of WSNs
Nazemi et al. A mixed-integer distributionally robust chance-constrained model for optimal topology control in power grids with uncertain renewables
WO2024027192A1 (zh) 多支路电池系统的控制系统和方法
CN109839041A (zh) 一种基于去中心化集群计算架构的免维护测控方法
CN116404655A (zh) 配网负荷柔性调控方法及系统
CN100492297C (zh) 一种实现分布式设备的控制方法
CN116932271B (zh) 一种实现自组织的Chiplet的方法和芯片
CN108319501B (zh) 一种基于微服务网关的弹性资源供给方法及系统
CN103888310B (zh) 监控处理方法及系统
CN104683186A (zh) 网络资源调度方法及装置
Zhang et al. Multi-objective optimization of barrier coverage with wireless sensors
Elgamal et al. An adaptive multiagent control system for autonomous economic operation and resilience assurance in a hybrid-energy islanded microgrid
CN109257804A (zh) 用于5g通信的集中化中心机房节能控制方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant