CN109101372A - 机箱管理板的冗余切换方法、存储介质及机箱管理板 - Google Patents

机箱管理板的冗余切换方法、存储介质及机箱管理板 Download PDF

Info

Publication number
CN109101372A
CN109101372A CN201810883302.6A CN201810883302A CN109101372A CN 109101372 A CN109101372 A CN 109101372A CN 201810883302 A CN201810883302 A CN 201810883302A CN 109101372 A CN109101372 A CN 109101372A
Authority
CN
China
Prior art keywords
signal
opposite end
management board
place
end management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810883302.6A
Other languages
English (en)
Inventor
郭强
饶晓东
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
GHT CO Ltd
Original Assignee
GHT CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by GHT CO Ltd filed Critical GHT CO Ltd
Priority to CN201810883302.6A priority Critical patent/CN109101372A/zh
Publication of CN109101372A publication Critical patent/CN109101372A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2023Failover techniques
    • G06F11/2028Failover techniques eliminating a faulty processor or activating a spare

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明公开了一种机箱管理板的冗余切换方法、存储介质及机箱管理板,由本端管理板执行,所述方法包括:定时向对端管理板发送心跳信号;判断是否为强制备用;若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;定时检测对端管理板发送的心跳信号、告知信号和在位信号;判断是否为主用;当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;当所述对端管理板的工作状态改变时,切换状态为备用。实现软件强制切换管理板为备用状态,并且当管理板发生异常时主备用状态的切换。

Description

机箱管理板的冗余切换方法、存储介质及机箱管理板
技术领域
本发明属于机箱管理板冗余切换领域,具体涉及一种机箱管理板的冗余切换方法、存储介质及机箱管理板。
背景技术
冗余技术是计算机系统可靠性设计中一种常用的技术手段,为维持系统长期稳定可靠地运行,常使用双管理板冗余系统。在系统运行时,将其中某一管理板设为主用,另一管理板设为备用。若主用管理板出现故障不能正常工作时,切换备用管理板作为主用继续工作,从而保障整个系统的正常运行。但是现有的冗余管理机制具有以下缺陷:现有的机箱管理板冗余管理技术一般为检测到管理板的硬件异常后进行切换,当软件发生异常时,无法通过有效手段主动切换冗余系统中的管理板主备用状态。
发明内容
本发明,提供一种机箱管理板的冗余切换方法、存储介质及机箱管理板,实现软件强制切换管理板为备用状态,并且当管理板发生异常时主备用状态的切换。
在第一方面,本发明实施例提供一种机箱管理板的冗余切换方法,由本端管理板执行,所述方法包括:
定时向对端管理板发送心跳信号;
判断是否为强制备用;
若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;
定时检测对端管理板发送的心跳信号、告知信号和在位信号;
判断是否为主用;
当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;
当所述对端管理板的工作状态改变时,切换状态为备用。
进一步地,所述切换状态为备用,具体包括:
更新状态信息为备用,并发送对应的告知信号至所述对端管理板,所述告知信号包括管理板的主备用状态信息;
进一步地,所述根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变,具体包括:
从存储器中提取所述对端管理板的历史心跳信号、历史告知信号和历史在位信号;
根据所述历史心跳信号判断所述对端管理板的心跳信号是否异常;当所述心跳信号异常时,判断所述对端管理板的工作状态改变;
根据所述历史告知信号判断所述对端管理板的告知信号是否改变;当所述告知信号发生改变时,判断所述对端管理板的工作状态改变;
根据所述历史在位信号判断所述对端管理板的在位信号是否改变;当所述在位信号发生改变时,判断所述对端管理板的工作状态改变。
进一步地,在判断所述对端管理板的工作状态是否改变之后,还包括:
根据所述对端管理板发送的心跳信号、告知信号和在位信号,更新存储器中对应的历史心跳信号、历史告知信号和历史在位信号。
进一步地,所述当所述对端管理板的工作状态改变时,切换状态为备用,具体包括:
根据所述在位信号判断所述对端管理板是否在位;
当所述对端管理板不在位时,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
进一步地,所述当所述对端管理板的工作状态改变时,切换状态为备用,具体包括:
当所述对端管理板在位时,获取所述对端管理板的优先等级;
判断所述对端管理板的优先等级是否为最高等级;
当所述对端管理板的优先等级不为最高等级时,根据所述告知信息判断所述对端管理板的主备用状态;
当所述对端管理板为主用时,若所述对端管理板的心跳信号异常,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
进一步地,所述当所述对端管理板的工作状态改变时,切换状态为备用,具体包括:
当所述对端管理板的优先等级为最高等级时,若所述对端管理板的心跳信号正常,则根据所述告知信号判断所述对端管理板的主备用状态;
当所述对端管理板为备用时,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
在第二方面,本发明实施例还提供一种机箱管理板,所述机箱管理板包括:
心跳信号发送模块,用于定时向对端管理板发送心跳信号;
第一判断模块,用于判断是否为强制备用;
强制备用模块,用于若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;
检测模块,用于定时检测对端管理板发送的心跳信号、告知信号和在位信号;
第二判断模块,用于判断是否为主用;
对端状态判断模块,用于当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;
状态切换模块,用于当所述对端管理板的工作状态改变时,切换状态为备用。
在第三方面,本发明还提供一种机箱管理板,所述机箱管理板包括地址获取端,心跳信号接收和发送端,告知信号接收和发送端,在位信号接收和发送端;
所述地址获取端用于与管理平台连接获取地址信息;
所述心跳信号接收端用于接收对端管理板发送的心跳信号,所述心跳信号发送端用于向对端管理板发送心跳信号;
所述告知接收端用于接收对端管理板发送的告知信号,所述心跳信号发送端用于向对端管理板发送告知信号;
所述在位信号接收端用于接收对端管理板发送的在位信号,所述在位信号发送端用于向对端管理板发送在位信号。
在第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在的设备执行第一方面提供的机箱管理板的冗余切换方法。
实施本发明实施例,具有如下有益效果:
本发明提供的一种机箱管理板的冗余切换方法、存储介质及机箱管理板,通过定时向对端管理板发送心跳信号;判断是否为强制备用;若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;定时检测对端管理板发送的心跳信号、告知信号和在位信号;判断是否为主用;当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;当所述对端管理板的工作状态改变时,切换状态为备用。通过当接收到管理平台发送的强制备用指令时判断本端管理板为强制备用,从而强制切换本端管理板为备用状态,使得管理平台能够灵活的设置本端管理板的主备用状态,当本端管理板上的软件发生异常时,通过接收到管理平台发送的强制备用指令,判断本端管理板为强制备用从而主动切换状态为备用,实现软件强制切换管理板为备用状态。并且通过实时检测对端管理板心跳信号、告知信号和在位信号,判断对端管理板的硬件工作状态是否异常,当本端管理板为备用且对端管理板硬件工作状态异常时切换本端管理板为主用,实现管理板之间的状态监控和主用管理板发生异常时的主备用切换。
附图说明
图1是本发明实施例提供的一种机箱管理板的冗余切换方法的流程示意图;
图2是本发明实施例提供的一种机箱管理板的结构示意图;
图3是本发明实施例提供的一种机箱管理板的硬件结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参见图1,是本发明实施例提供的一种机箱管理板的冗余切换方法的流程示意图。
在第一方面,本发明实施例提供的一种机箱管理板的冗余切换方法,由本端管理板执行,且下文均以本端管理板作为执行主体进行说明。所述方法包括:
S1、定时向对端管理板发送心跳信号;
S2、判断是否为强制备用;
S3、若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;
S4、定时检测对端管理板发送的心跳信号、告知信号和在位信号;
S5、判断是否为主用;
S6、当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;
S7、当所述对端管理板的工作状态改变时,切换状态为备用。
进一步地,所述切换状态为备用,具体包括:
更新状态信息为备用,并发送对应的告知信号至所述对端管理板,所述告知信号包括管理板的主备用状态信息;
需要说明的是,本发明实施例提供的一种机箱管理板的冗余切换方法,适用于ATCA机箱基于两块机箱管理板实现机箱管理功能的冗余备份,使得ATCA平台在安装两块机箱管理板时实现冗余切换功能。本端管理板定时执行步骤S1至步骤S7,本端管理板定时向对端管理板发送心跳信号,其中所述心跳信号为正弦波信号,当管理板正常时该管理板发送的所述心跳信号不变,当管理板异常时该管理板发送的所述心跳信号变化。本端管理板定时发送心跳信号给对端管理板使得对端管理板通过检测接收到的心跳信号判断对端管理板是否正常。本端管理板判断是否为强制备用,若本端管理板接收到管理平台发送的强制备用指令时,判断为强制备用,本端管理板切换自身状态为备用,即本端管理板更新自身的状态信息记录变量为备用,并发送对应的低电平的告知信号LocActSig至所述对端管理板;其中,所述本端管理板的告知信号发送端与对端管理板的告知信号接收端连接,告知信号的高低电平切换代表管理板的主备用状态切换,当本端管理板发送给对端管理板的告知信号为高电平信号时用于告知所述对端管理板本端管理板的状态为主用;当本端管理板发送给对端管理板的告知信号为低电平信号时用于告知所述对端管理板本端管理板的状态为备用。
定时检测对端管理板发送的心跳信号、告知信号RemActSig和在位信号RemExistPS,本端管理板从存储器中提取对端管理板的历史心跳信号、历史告知信号和历史在位信号,通过将当前对端管理板的心跳信号、告知信号和在位信号与历史心跳信号、历史告知信号和历史在位信号作比较判断是否一致,当任一信号与对应的历史信号不一致时,更新本端管理板中的变量State_NoChg,标记所述对端管理板的变化,在当前对端管理板的心跳信号、告知信号和在位信号与历史心跳信号、历史告知信号和历史在位信号比较判断是否一致后,对应更新所述对端管理板的历史心跳信号、历史告知信号和历史在位信号。本端管理板判断是否为主用即根据自身的状态信息记录变量判断自身的主备用状态,当判断为备用时,判断所述对端管理板的工作状态是否改变,即判断当前对端管理板的心跳信号、告知信号和在位信号与历史心跳信号、历史告知信号和历史在位信号是否一致,当任一信号与对应的历史信号不一致时,判断对端管理板工作状态改变,本端管理板切换状态为主用。使得管理平台能够灵活的设置本端管理板的主备用状态,当本端管理板上的软件发生异常时,通过接收到管理平台发送的强制备用指令,判断本端管理板为强制备用从而主动切换状态为备用,实现软件强制切换管理板为备用状态。并且通过实时检测对端管理板心跳信号、告知信号和在位信号,判断对端管理板的硬件工作状态是否异常,当本端管理板为备用且对端管理板硬件工作状态异常时切换本端管理板为主用,实现管理板之间的状态监控和主用管理板发生异常时的主备用切换。
进一步地,上述步骤S6的具体实施过程可以为:
从存储器中提取所述对端管理板的历史心跳信号、历史告知信号和历史在位信号;
根据所述历史心跳信号判断所述对端管理板的心跳信号是否异常;当所述心跳信号异常时,判断所述对端管理板的工作状态改变;
根据所述历史告知信号判断所述对端管理板的告知信号是否改变;当所述告知信号发生改变时,判断所述对端管理板的工作状态改变;
根据所述历史在位信号判断所述对端管理板的在位信号是否改变;当所述在位信号发生改变时,判断所述对端管理板的工作状态改变。
需要说明的是,本发明实施例提供的一种机箱管理板的冗余切换方法,本端管理板的在位信号接收端对应接收对端管理板发送的在位信号;其中,在位信号的高低电平切换代表管理板的在位状态,当本端管理板接收到高电平的在位信号时代表对端管理板不在位,当本端管理板接收到低电平的在位信号时代表对端管理板在位。本端管理板根据所述历史心跳信号判断所述对端管理板的心跳信号是否异常;由于管理板正常工作时心跳信号不变,当判断所述对端管理板当前的心跳信号与历史心跳信号不一致,并且对比于正常的心跳信号发生变化时或当判断所述对端管理板当前的心跳信号与历史心跳信号一致,但对比于正常的心跳信号发生变化时,判断所述对端管理板的心跳信号异常;当所述心跳信号异常时,判断所述对端管理板的工作状态改变。本端管理板根据所述历史告知信号判断所述对端管理板的告知信号是否改变;当所述告知信号与所述历史告知信号不一致时,所述告知信号发生改变即所述对端管理板的主备用状态发生变化,从而判断所述对端管理板的工作状态改变;本端管理板还根据所述历史在位信号判断所述对端管理板的在位信号是否改变;当所述在位信号与所述历史在位信号不一致时,所述在位信号发生改变即所述对端管理板的在位状态发生变化,从而判断所述对端管理板的工作状态改变。实现对端管理板的工作状态的定时监控检测。
进一步地,在判断所述对端管理板的工作状态是否改变之后,还包括:
根据所述对端管理板发送的心跳信号、告知信号和在位信号,更新存储器中对应的历史心跳信号、历史告知信号和历史在位信号。
进一步地,上述步骤S7的具体实施过程可以为:
根据所述在位信号判断所述对端管理板是否在位;
当所述对端管理板不在位时,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
需要说明的是,本发明实施例提供的一种机箱管理板的冗余切换方法,本端管理板根据对端管理板的具体工作状态变化进行主备用的切换。本端管理板根据所述对端管理板当前的在位信号RemExistPS判断所述对端管理板是否在位,当所述在位信号为高电平信号时判断所述对端管理板不在位,此时本端管理板切换自身状态为主用,即本端管理板更新自身的状态信息记录变量为主用,并发送对应的高电平的告知信号LocActSig至所述对端管理板。
进一步地,上述步骤S7的具体实施过程可以为:
当所述对端管理板在位时,获取所述对端管理板的优先等级;
判断所述对端管理板的优先等级是否为最高等级;
当所述对端管理板的优先等级不为最高等级时,根据所述告知信息判断所述对端管理板的主备用状态;
当所述对端管理板为主用时,若所述对端管理板的心跳信号异常,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
需要说明的是,本发明实施例提供的一种机箱管理板的冗余切换方法,本端管理板根据所述对端管理板当前的在位信号判断所述对端管理板是否在位,当所述在位信号RemExistPS为低电平信号时判断所述对端管理板在位,此时根据本端管理板的物理地址获得所述对端管理板的优先等级,并判断所述对端管理板的优先等级是否为最高等级;其中,所述物理地址为管理板所在ATCA平台的硬件槽位,两个管理板的硬件槽位的物理地址分别为10和11,地址为10的管理板的优先等级高于地址为11的管理板的优先等级。当所述对端管理板的优先等级不为最高等级时,即所述对端管理板的地址为11,所述本端管理板的地址为10,所述本端管理板根据接收到的所述对端管理板当前的告知信号RemActSig判断所述对端管理板的主备用状态,当判断所述对端管理板为主用时即所述告知信号RemActSig为高电平信号,若接收到的所述对端管理板的当前心跳信号异常,则本端管理板切换自身状态为主用,即本端管理板更新自身的状态信息记录变量为主用,并发送对应的高电平的告知信号LocActSig至所述对端管理板。
进一步地,上述步骤S7的具体实施过程可以为:
当所述对端管理板的优先等级为最高等级时,若所述对端管理板的心跳信号正常,则根据所述告知信号判断所述对端管理板的主备用状态;
当所述对端管理板为备用时,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
需要说明的是,本发明实施例提供的一种机箱管理板的冗余切换方法,根据本端管理板的物理地址获得所述对端管理板的优先等级,并判断所述对端管理板的优先等级是否为最高等级;当所述对端管理板的优先等级为最高等级时,即所述对端管理板的地址为10,所述本端管理板的地址为11,若判断所述对端管理板当前的心跳信号为正常信号,所述本端管理板根据接收到的所述对端管理板当前的告知信号RemActSig判断所述对端管理板的主备用状态,当判断所述对端管理板为备用时即所述告知信号RemActSig为低电平信号,本端管理板切换自身状态为主用,即本端管理板更新自身的状态信息记录变量为主用,并发送对应的高电平的告知信号LocActSig至所述对端管理板。
需要说明的是,本实施例提供的一种机箱管理板的冗余切换方法,管理板在启动时需驱动装载进行初始化状态,管理板读取自身的物理地址信息即所在ATCA平台的槽位ID信息获得优先等级,对自身的状态信息记录变量初始化为备用状态;并将状态记录变量初始化为非正常值。当机箱管理板的主备用状态发生变化时,由于机箱管理板的应用程序实时检测管理板自身的主备用状态,当机箱管理板从主用切换为备用时,将当前数据发送至对端管理板使得对端管理板能够进行数据恢复,之后更新自身的状态信息记录变量为备用,并发送对应的低电平的告知信号LocActSig至所述对端管理板。
本实施例提供的一种机箱管理板的冗余切换方法,通过定时向对端管理板发送心跳信号;判断是否为强制备用;若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;定时检测对端管理板发送的心跳信号、告知信号和在位信号;判断是否为主用;当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;当所述对端管理板的工作状态改变时,切换状态为备用。通过当接收到管理平台发送的强制备用指令时判断本端管理板为强制备用,从而强制切换本端管理板为备用状态,使得管理平台能够灵活的设置本端管理板的主备用状态,当本端管理板上的软件发生异常时,通过接收到管理平台发送的强制备用指令,判断本端管理板为强制备用从而主动切换状态为备用,实现软件强制切换管理板为备用状态。并且通过实时检测对端管理板心跳信号、告知信号和在位信号,判断对端管理板的硬件工作状态是否异常,当本端管理板为备用且对端管理板硬件工作状态异常时切换本端管理板为主用,实现管理板之间的状态监控和主用管理板发生异常时的主备用切换。
如图2所示,是本发明实施例提供的一种机箱管理板的结构示意图。
在第二方面,本发明实施例还提供一种机箱管理板,所述机箱管理板包括:
心跳信号发送模块301,用于定时向对端管理板发送心跳信号;
第一判断模块302,用于判断是否为强制备用;
强制备用模块303,用于若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;
检测模块304,用于定时检测对端管理板发送的心跳信号、告知信号和在位信号;
第二判断模块305,用于判断是否为主用;
对端状态判断模块306,用于当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;
状态切换模块307,用于当所述对端管理板的工作状态改变时,切换状态为备用。
需要说明的是,本发明实施例提供的一种机箱管理板,心跳信号发送模块301定时向对端管理板发送心跳信号;第一判断模块302,判断是否为强制备用;若接收到管理平台发送的强制备用指令,强制备用模块303判断为强制备用,切换状态为备用;检测模块304定时检测对端管理板发送的心跳信号、告知信号和在位信号;第二判断模块305判断是否为主用;当为备用时,对端状态判断模块306根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;当所述对端管理板的工作状态改变时,状态切换模块307切换状态为备用。通过当接收到管理平台发送的强制备用指令时判断本端管理板为强制备用,从而强制切换本端管理板为备用状态,使得管理平台能够灵活的设置本端管理板的主备用状态,当本端管理板上的软件发生异常时,通过接收到管理平台发送的强制备用指令,判断本端管理板为强制备用从而主动切换状态为备用,实现软件强制切换管理板为备用状态。并且通过实时检测对端管理板心跳信号、告知信号和在位信号,判断对端管理板的硬件工作状态是否异常,当本端管理板为备用且对端管理板硬件工作状态异常时切换本端管理板为主用,实现管理板之间的状态监控和主用管理板发生异常时的主备用切换。
如图3所示,是本发明实施例提供的一种机箱管理板的硬件结构示意图。
在第三方面,本发明还提供一种机箱管理板,所述机箱管理板包括地址获取端,心跳信号接收和发送端,告知信号接收和发送端,在位信号接收和发送端;
所述地址获取端用于与管理平台连接获取地址信息;
所述心跳信号接收端用于接收对端管理板发送的心跳信号,所述心跳信号发送端用于向对端管理板发送心跳信号;
所述告知接收端用于接收对端管理板发送的告知信号,所述心跳信号发送端用于向对端管理板发送告知信号;
所述在位信号接收端用于接收对端管理板发送的在位信号,所述在位信号发送端用于向对端管理板发送在位信号。
需要说明的是,本发明实施例提供的一种机箱管理板,所述机箱管理板的地址获取端,心跳信号接收和发送端,告知信号接收和发送端,在位信号接收和发送端均为GPIO接口。传统的双机冗余备份实现,一般是通过网络来检测对方状态。该方法会占用网络带宽,且实时性交差。实时性的好坏和带宽占用率成正比,即较好的实时性就会占用交大带宽去检测。而本机箱管理板的冗余切换方法是硬件独立的,通过如图3所示,通过本端管理板与对端管理板的硬件连接检测心跳。有较高的实时性,并且不占用多少硬件资源。所以在管理板发生主备切换时,能够迅速完成切换,保证业务的安全性。机箱管理板包括硬件层冗余接口和软件冗余接口,软件冗余接口SRI接口使用以太网实现,硬件层冗余接口HRI接口使用GPIO实现。基于IMX6核心卡模块,由于以太网接口和GPIO接口都是比较通用的接口,使得本发明基于ATCA平台机箱管理板冗余设计的成本低。在硬件层的状态更新及切换都是在基于IMX6平台上,在内核驱动中完成第一方面的机箱管理板的冗余切换逻辑。基于现有的机箱管理软件构架,机箱管理板的冗余模块运行于该模块之下。从而能够快捷的提取和备份机箱管理相关数据,并很好的复用现有的运行环境。整个第一方面的机箱管理板的冗余切换流程在内核实现,并且该流程独立于应用。即该流程保证的是硬件级别的正常。机箱管理板上的应用都可以获取到该硬件的状态,来决定自己工作于那个硬件。并且可以根据自身状态来主动更改主备状态。
在第四方面,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在的设备执行第一方面提供的机箱管理板的冗余切换方法。
综上所述,本发明实施例提供的机箱管理板的冗余切换方法、存储介质及机箱管理板,通过定时向对端管理板发送心跳信号;判断是否为强制备用;若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;定时检测对端管理板发送的心跳信号、告知信号和在位信号;判断是否为主用;当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;当所述对端管理板的工作状态改变时,切换状态为备用。通过当接收到管理平台发送的强制备用指令时判断本端管理板为强制备用,从而强制切换本端管理板为备用状态,使得管理平台能够灵活的设置本端管理板的主备用状态,当本端管理板上的软件发生异常时,通过接收到管理平台发送的强制备用指令,判断本端管理板为强制备用从而主动切换状态为备用,实现软件强制切换管理板为备用状态。并且通过实时检测对端管理板心跳信号、告知信号和在位信号,判断对端管理板的硬件工作状态是否异常,当本端管理板为备用且对端管理板硬件工作状态异常时切换本端管理板为主用,实现管理板之间的状态监控和主用管理板发生异常时的主备用切换。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。

Claims (10)

1.一种机箱管理板的冗余切换方法,其特征在于,由本端管理板执行,包括:
定时向对端管理板发送心跳信号;
判断是否为强制备用;
若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;
定时检测对端管理板发送的心跳信号、告知信号和在位信号;
判断是否为主用;
当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;
当所述对端管理板的工作状态改变时,切换状态为备用。
2.如权利要求1所述的机箱管理板的冗余切换方法,其特征在于,所述切换状态为备用,具体包括:
更新状态信息为备用,并发送对应的告知信号至所述对端管理板,所述告知信号包括管理板的主备用状态信息。
3.如权利要求2所述的机箱管理板的冗余切换方法,其特征在于,所述根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变,具体包括:
从存储器中提取所述对端管理板的历史心跳信号、历史告知信号和历史在位信号;
根据所述历史心跳信号判断所述对端管理板的心跳信号是否异常;当所述心跳信号异常时,判断所述对端管理板的工作状态改变;
根据所述历史告知信号判断所述对端管理板的告知信号是否改变;当所述告知信号发生改变时,判断所述对端管理板的工作状态改变;
根据所述历史在位信号判断所述对端管理板的在位信号是否改变;当所述在位信号发生改变时,判断所述对端管理板的工作状态改变。
4.如权利要求3所述的机箱管理板的冗余切换方法,其特征在于,在判断所述对端管理板的工作状态是否改变之后,还包括:
根据所述对端管理板发送的心跳信号、告知信号和在位信号,更新存储器中对应的历史心跳信号、历史告知信号和历史在位信号。
5.如权利要求4所述的机箱管理板的冗余切换方法,其特征在于,所述当所述对端管理板的工作状态改变时,切换状态为备用,具体包括:
根据所述在位信号判断所述对端管理板是否在位;
当所述对端管理板不在位时,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
6.如权利要求5所述的机箱管理板的冗余切换方法,其特征在于,所述当所述对端管理板的工作状态改变时,切换状态为备用,具体包括:
当所述对端管理板在位时,获取所述对端管理板的优先等级;
判断所述对端管理板的优先等级是否为最高等级;
当所述对端管理板的优先等级不为最高等级时,根据所述告知信息判断所述对端管理板的主备用状态;
当所述对端管理板为主用时,若所述对端管理板的心跳信号异常,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
7.如权利要求6所述的机箱管理板的冗余切换方法,其特征在于,所述当所述对端管理板的工作状态改变时,切换状态为备用,具体包括:
当所述对端管理板的优先等级为最高等级时,若所述对端管理板的心跳信号正常,则根据所述告知信号判断所述对端管理板的主备用状态;
当所述对端管理板为备用时,更新状态信息为主用,并发送对应的告知信号至所述对端管理板。
8.一种机箱管理板,其特征在于,包括:
心跳信号发送模块,用于定时向对端管理板发送心跳信号;
第一判断模块,用于判断是否为强制备用;
强制备用模块,用于若接收到管理平台发送的强制备用指令,则判断为强制备用,切换状态为备用;
检测模块,用于定时检测对端管理板发送的心跳信号、告知信号和在位信号;
第二判断模块,用于判断是否为主用;
对端状态判断模块,用于当为备用时,根据检测到的所述心跳信号、告知信号和在位信号,判断所述对端管理板的工作状态是否改变;
状态切换模块,用于当所述对端管理板的工作状态改变时,切换状态为备用。
9.一种机箱管理板,其特征在于,所述机箱管理板包括地址获取端,心跳信号接收和发送端,告知信号接收和发送端,在位信号接收和发送端;
所述地址获取端用于与管理平台连接获取地址信息;
所述心跳信号接收端用于接收对端管理板发送的心跳信号,所述心跳信号发送端用于向对端管理板发送心跳信号;
所述告知接收端用于接收对端管理板发送的告知信号,所述心跳信号发送端用于向对端管理板发送告知信号;
所述在位信号接收端用于接收对端管理板发送的在位信号,所述在位信号发送端用于向对端管理板发送在位信号。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在的设备执行权利要求1至7任一项所述的机箱管理板的冗余切换方法。
CN201810883302.6A 2018-08-03 2018-08-03 机箱管理板的冗余切换方法、存储介质及机箱管理板 Pending CN109101372A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810883302.6A CN109101372A (zh) 2018-08-03 2018-08-03 机箱管理板的冗余切换方法、存储介质及机箱管理板

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810883302.6A CN109101372A (zh) 2018-08-03 2018-08-03 机箱管理板的冗余切换方法、存储介质及机箱管理板

Publications (1)

Publication Number Publication Date
CN109101372A true CN109101372A (zh) 2018-12-28

Family

ID=64848751

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810883302.6A Pending CN109101372A (zh) 2018-08-03 2018-08-03 机箱管理板的冗余切换方法、存储介质及机箱管理板

Country Status (1)

Country Link
CN (1) CN109101372A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336701A (zh) * 2019-07-11 2019-10-15 山东超越数控电子股份有限公司 一种高密度双路服务器管理方法及系统
CN113064664A (zh) * 2021-03-02 2021-07-02 凌华科技(中国)有限公司 一种控制方法、装置、复杂可编程逻辑器件及服务器

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321004A (zh) * 2000-04-25 2001-11-07 华为技术有限公司 交换机的主备倒换方法及其实现装置
CN101252372A (zh) * 2008-04-10 2008-08-27 烽火通信科技股份有限公司 一种双星型系统中主备主控盘倒换方法
US20120102580A1 (en) * 2010-10-22 2012-04-26 International Business Machines Corporation Out Of Band Vital Product Data Collection
CN102820973A (zh) * 2012-07-20 2012-12-12 福建星网锐捷网络有限公司 一种管理板、双管理板的模块化设备以及主控板选举方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1321004A (zh) * 2000-04-25 2001-11-07 华为技术有限公司 交换机的主备倒换方法及其实现装置
CN101252372A (zh) * 2008-04-10 2008-08-27 烽火通信科技股份有限公司 一种双星型系统中主备主控盘倒换方法
US20120102580A1 (en) * 2010-10-22 2012-04-26 International Business Machines Corporation Out Of Band Vital Product Data Collection
CN102820973A (zh) * 2012-07-20 2012-12-12 福建星网锐捷网络有限公司 一种管理板、双管理板的模块化设备以及主控板选举方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110336701A (zh) * 2019-07-11 2019-10-15 山东超越数控电子股份有限公司 一种高密度双路服务器管理方法及系统
CN110336701B (zh) * 2019-07-11 2022-03-01 超越科技股份有限公司 一种高密度双路服务器管理方法及系统
CN113064664A (zh) * 2021-03-02 2021-07-02 凌华科技(中国)有限公司 一种控制方法、装置、复杂可编程逻辑器件及服务器

Similar Documents

Publication Publication Date Title
CN101150430B (zh) 一种通过心跳机制实现网络接口板倒换的方法
CN103532753B (zh) 一种基于内存换页同步的双机热备方法
CN106331098A (zh) 一种服务器集群系统
CN106533736B (zh) 一种网络设备重启方法和装置
CN102916825A (zh) 一种双机热备系统的管理设备、管理方法及双机热备系统
CN103384212A (zh) 一种通信应用系统双机高可用方案及其实现
CN102137017A (zh) 用于虚拟网络单元的工作方法及装置
CN111385107A (zh) 一种服务器的主备切换处理方法及装置
CN105068763B (zh) 一种针对存储故障的虚拟机容错系统和方法
CN114500554B (zh) 一种物联网系统管理方法
CN112218321B (zh) 主备链路切换方法、装置、通信设备和存储介质
CN105634848B (zh) 一种虚拟路由器监控方法及装置
CN101388567B (zh) 电力设备监控方法及系统
CN109101372A (zh) 机箱管理板的冗余切换方法、存储介质及机箱管理板
CN103441987A (zh) 双机防火墙系统的管理方法和装置
CN102487332B (zh) 故障处理方法、装置和系统
CN117666970B (zh) 数据存储方法以及数据存储装置
CN101854263B (zh) 网络拓扑的分析处理方法、系统和管理服务器
CN103281720A (zh) 无线控制器热备切换方法及装置、无线控制器、接入系统
CN109088830B (zh) 一种端口状态同步方法及装置
CN103095766A (zh) 通信前置机的端口级冗余管理方法
CN107872822B (zh) 一种业务的承载方法及承载装置
CN111181764A (zh) 一种基于ovs的主备切换方法及其系统
CN109428821B (zh) 服务器、管理互备设备路由的方法和存储介质
CN110399254A (zh) 一种服务器cmc双机热活方法、系统、终端及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20181228

RJ01 Rejection of invention patent application after publication