CN109358490A - 一种冗余设备及其测试方法、系统和存储介质 - Google Patents

一种冗余设备及其测试方法、系统和存储介质 Download PDF

Info

Publication number
CN109358490A
CN109358490A CN201811221904.1A CN201811221904A CN109358490A CN 109358490 A CN109358490 A CN 109358490A CN 201811221904 A CN201811221904 A CN 201811221904A CN 109358490 A CN109358490 A CN 109358490A
Authority
CN
China
Prior art keywords
target
equipment
redundance unit
controller
delay machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811221904.1A
Other languages
English (en)
Inventor
王麒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811221904.1A priority Critical patent/CN109358490A/zh
Publication of CN109358490A publication Critical patent/CN109358490A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B9/00Safety arrangements
    • G05B9/02Safety arrangements electric
    • G05B9/03Safety arrangements electric with multiple-channel loop, i.e. redundant control systems

Abstract

本申请公开了一种冗余设备及其测试方法、系统和计算机可读存储介质,该冗余设备包括互为冗余的多个设备,每个所述设备均设置有控制器;所述控制器,用于接收到主控制器的控制命令时,控制所述设备宕机。本申请提供的冗余设备,只需要一个控制总线接口即可完成特定冗余设备或部件宕机及宕机后的整机各个部件的运行状态信息。减少人工机械操作的人工成本,降低了由于人为操作失误导致的测试不良,极大的提高测试效率和准确率。另外,通过主控制器可以实现同时对每组内的单冗余设备进行宕机操作,弥补了人工机械操作无法同时对多个设备做到同时机械拆卸的不足,有利于批量测试。

Description

一种冗余设备及其测试方法、系统和存储介质
技术领域
本申请涉及计算机技术领域,更具体地说,涉及一种冗余设备及其测试方法、系统和一种计算机可读存储介质。
背景技术
高可靠性设备的关键部件会采用双冗余设计,即关键部件例如控制器或者电源采用双冗余控制器或者双冗余电源,正常工作时两个功能相同的关键部件互为备份或一个为主一个备,所起的作用就是当其中一个关键部件失效时,另一个互为备份的关键部件能够继续进行当前业务,不至于使当前业务因为唯一的关键部件失效而中断。
互为备份的双冗余设计极大的提高了系统的可靠性,但是在系统设计组装时对双冗余功能最简单直接验证方法无非为直接对其中一个关键部件拆除掉,例如可直接拆卸的控制器或者电源可以直接人力从机箱抽出。但是此方法不仅耗费体力,一旦整机数量庞大和互为冗余的关键部件变多时此工作量将耗时费力,而且通过直接人工机械的对关键部件进行拆卸会带来整机机械损耗和人为操作的不可靠性等问题。更有甚者,有些互为冗余的关键部件在组装完整机后通过人工拆卸的方式会极不方便。
因此,如何提高冗余设备测试的准确性是本领域技术人员需要解决的问题。
发明内容
本申请的目的在于提供一种冗余设备及其测试方法、系统和一种计算机可读存储介质,提高了冗余设备测试的准确性。
为实现上述目的,本申请提供了一种冗余设备,包括互为冗余的多个设备,每个所述设备均设置有控制器;
所述控制器,用于接收到主控制器的控制命令时,控制所述设备宕机。
其中,所述主控制器通过通信总线与每个所述设备相连;
所述通信总线包括串口或I2C总线。
其中,所述主控制器包括BMC。
为实现上述目的,本申请提供了一种冗余设备测试方法,应用于如上述主控制器,包括:
当接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器控制所述目标设备宕机;
获取所有控制器发送的每个设备的状态信息,以便根据所述状态信息得到所述冗余设备的测试结果。
其中,所述目标控制器控制所述目标设备宕机,包括:
所述目标控制器通过断电控制所述目标设备宕机。
其中,所述目标控制器控制所述目标设备宕机,包括:
所述目标控制器通过向所述目标设备发送关机指令控制所述目标设备宕机。
为实现上述目的,本申请提供了一种冗余设备测试系统,应用于如上述主控制器,包括:
发送模块,用于当接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器控制所述目标设备宕机;
获取模块,用于获取所有控制器发送的每个设备的状态信息,以便根据所述状态信息得到所述冗余设备的测试结果。
其中,所述发送模块具体为接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器通过断电控制所述目标设备宕机的模块。
其中,所述发送模块具体为接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器通过向所述目标设备发送关机指令控制所述目标设备宕机的模块。
通过以上方案可知,本申请提供的一种冗余设备,包括互为冗余的多个设备,每个所述设备均设置有控制器;所述控制器,用于接收到主控制器的控制命令时,控制所述设备宕机。
本申请提供的冗余设备,只需要一个控制总线接口即可完成特定冗余设备或部件宕机及宕机后的整机各个部件的运行状态信息。减少人工机械操作的人工成本,降低了由于人为操作失误导致的测试不良,极大的提高测试效率和准确率。另外,通过主控制器可以实现同时对每组内的单冗余设备进行宕机操作,弥补了人工机械操作无法同时对多个设备做到同时机械拆卸的不足,有利于批量测试。本申请还公开了一种冗余设备测试方法、系统和一种计算机可读存储介质,同样能实现上述技术效果。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例公开的一种冗余设备的结构图;
图2为本申请实施例公开的一种冗余设备测试方法的流程图;
图3为本申请实施例公开的另一种冗余设备测试方法的流程图;
图4为本申请实施例公开的一种冗余设备测试系统的结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请实施例公开了一种冗余设备,提高了冗余设备测试的准确性。
参见图1,本申请实施例公开的一种冗余设备的结构图,如图1所示,包括互为冗余的多个设备100,每个所述设备100均设置有控制器101;
在具体实施中,在所有做冗余设计的设备或者部件上嵌入一颗控制器(MCU,微控制单元,Microcontroller Unit),该MCU能够控制本设备或部件宕机,即使本设备或部件处于失效状态,具体操作可以包括但不限于使冗余设备或部件断电的方式实现。需要说明的是,此处不限定冗余设备中互为冗余的设备的具体数量,可以为两个或更多。此处的提及的设备不限于基本设备或具体部件,可以为互为冗余的一个集群中的一个整机。
所述控制器101,用于接收到主控制器200的控制命令时,控制所述设备宕机。
在具体实施中,每个设备上的控制器均通过通信总线与主控制器连接,此处的通信总线包括但不限于串口或I2C总线,主控制器不仅限于为一个MCU,可以为整机控制系统的一部分,只需要把各个冗余设备或部件的控制接口接到可以与各个MCU通信的硬件接口即可,例如服务器的BMC(基板管理控制器,Baseboard Management Controller)。主控制器通过测试人员接口接受测试人员发送的测试命令,通过该通信总线向给各冗余设备或部件上的控制器发送控制指令和获取各冗余设备或部件上的控制器的状态信息,并向测试人员返回各状态信息。
需要测试互为冗余设备或部件的冗余特性时,通过主控制器的向冗余设备中的其中一个设备发送控制命令使其宕机,并通过主控制器的测试人员控制接口观测另一个设备的工作状态和整系统的工作状态即可完成互为冗余设备的冗余特性,从而省去了人工机械拆卸冗余设备或部件的操作。
本申请实施例提供的冗余设备,只需要一个控制总线接口即可完成特定冗余设备或部件宕机及宕机后的整机各个部件的运行状态信息。减少人工机械操作的人工成本,降低了由于人为操作失误导致的测试不良,极大的提高测试效率和准确率。另外,通过主控制器可以实现同时对每组内的单冗余设备进行宕机操作,弥补了人工机械操作无法同时对多个设备做到同时机械拆卸的不足,有利于批量测试。
本申请实施例公开了一种冗余设备测试方法,提高了冗余设备测试的准确性。
参见图2,本申请实施例公开的一种冗余设备测试方法的流程图,如图2所示,包括:
S101:当接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器控制所述目标设备宕机;
本实施例的执行主体为与上一实施例提供的冗余设备相连的主控制器,当主控制器接收到冗余设备的测试命令时,向待测试的冗余设备发送控制信息,以便控制相应的设备处于宕机状态。此处的测试命令至少包括待测试冗余设备的唯一标识信息等。
需要说明的是,本实施例不对控制器控制设备宕机的具体方式进行限定,本领域技术人员可以灵活选择。作为一种优选实施方式,目标控制器可以通过断电控制目标设备宕机,目标控制器也可以通过向目标设备发送关机指令控制目标设备宕机。
S102:获取所有控制器发送的每个设备的状态信息,以便根据所述状态信息得到所述冗余设备的测试结果。
可以理解的是,以该冗余设备中存在互为冗余的两个设备为例,在冗余设备中的其中一个设备处于宕机状态时,可以通过采集整个冗余设备的状态信息,判断另一个设备是否运行正常,即得到测试结果。对于特殊的测试要求,也可以同时控制两个设备均处于宕机状态。
本申请实施例提供的冗余设备测试方法,只需要一个控制总线接口即可完成特定冗余设备或部件宕机及宕机后的整机各个部件的运行状态信息。减少人工机械操作的人工成本,降低了由于人为操作失误导致的测试不良,极大的提高测试效率和准确率。另外,通过主控制器可以实现同时对每组内的单冗余设备进行宕机操作,弥补了人工机械操作无法同时对多个设备做到同时机械拆卸的不足,有利于批量测试。
下面以冗余设备中存在互为冗余的两个设备为例介绍本申请提供的冗余设备测试方法。具体的:
参见图3,本申请实施例公开的另一种冗余设备测试方法的流程图,如图3所示,包括:
S201:当接收到所述冗余设备的测试命令时,向第一设备中的第一控制器发送控制命令,以便所述第一控制器控制所述第一设备宕机;
S202:获取所述第一设备的状态信息和第二设备的状态信息;
S203:向所述第二设备中的第二控制器发送控制命令,以便所述第二控制器控制所述第二设备宕机;
S204:获取所述第一设备的状态信息和第二设备的状态信息,并根据获取的所有状态信息得到所述冗余设备的测试结果。
下面对本申请实施例提供的一种冗余设备测试系统进行介绍,下文描述的一种冗余设备测试系统与上文描述的一种冗余设备测试方法可以相互参照。
参见图4,本申请实施例提供的一种冗余设备测试系统的结构图,如图4所示,包括:
发送模块401,用于当接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器控制所述目标设备宕机;
获取模块402,用于获取所有控制器发送的每个设备的状态信息,以便根据所述状态信息得到所述冗余设备的测试结果。
本申请实施例提供的冗余设备测试系统,只需要一个控制总线接口即可完成特定冗余设备或部件宕机及宕机后的整机各个部件的运行状态信息。减少人工机械操作的人工成本,降低了由于人为操作失误导致的测试不良,极大的提高测试效率和准确率。另外,通过主控制器可以实现同时对每组内的单冗余设备进行宕机操作,弥补了人工机械操作无法同时对多个设备做到同时机械拆卸的不足,有利于批量测试。
在上述实施例的基础上,作为一种优选实施方式,所述发送模块401具体为接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器通过断电控制所述目标设备宕机的模块。
在上述实施例的基础上,作为一种优选实施方式,所述发送模块401具体为接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器通过向所述目标设备发送关机指令控制所述目标设备宕机的模块。
本申请还提供了一种计算机可读存储介质,该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。该存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一实施例提供的冗余设备测试方法的步骤。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种冗余设备,其特征在于,包括互为冗余的多个设备,每个所述设备均设置有控制器;
所述控制器,用于接收到主控制器的控制命令时,控制所述设备宕机。
2.根据权利要求1所述冗余设备,其特征在于,所述主控制器通过通信总线与每个所述设备相连;
所述通信总线包括串口或I2C总线。
3.根据权利要求1所述冗余设备,其特征在于,所述主控制器包括BMC。
4.一种冗余设备测试方法,其特征在于,应用于如权利要求1-3任一项中所述主控制器,包括:
当接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器控制所述目标设备宕机;
获取所有控制器发送的每个设备的状态信息,以便根据所述状态信息得到所述冗余设备的测试结果。
5.根据权利要求4所述冗余设备测试方法,其特征在于,所述目标控制器控制所述目标设备宕机,包括:
所述目标控制器通过断电控制所述目标设备宕机。
6.根据权利要求4所述冗余设备测试方法,其特征在于,所述目标控制器控制所述目标设备宕机,包括:
所述目标控制器通过向所述目标设备发送关机指令控制所述目标设备宕机。
7.一种冗余设备测试系统,其特征在于,应用于如权利要求1-3任一项中所述主控制器,包括:
发送模块,用于当接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器控制所述目标设备宕机;
获取模块,用于获取所有控制器发送的每个设备的状态信息,以便根据所述状态信息得到所述冗余设备的测试结果。
8.根据权利要求7所述冗余设备测试系统,其特征在于,所述发送模块具体为接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器通过断电控制所述目标设备宕机的模块。
9.根据权利要求7所述冗余设备测试系统,其特征在于,所述发送模块具体为接收到所述冗余设备的测试命令时,向目标设备中的目标控制器发送控制命令,以便所述目标控制器通过向所述目标设备发送关机指令控制所述目标设备宕机的模块。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求4至6任一项所述冗余设备测试方法的步骤。
CN201811221904.1A 2018-10-19 2018-10-19 一种冗余设备及其测试方法、系统和存储介质 Pending CN109358490A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811221904.1A CN109358490A (zh) 2018-10-19 2018-10-19 一种冗余设备及其测试方法、系统和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811221904.1A CN109358490A (zh) 2018-10-19 2018-10-19 一种冗余设备及其测试方法、系统和存储介质

Publications (1)

Publication Number Publication Date
CN109358490A true CN109358490A (zh) 2019-02-19

Family

ID=65345875

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811221904.1A Pending CN109358490A (zh) 2018-10-19 2018-10-19 一种冗余设备及其测试方法、系统和存储介质

Country Status (1)

Country Link
CN (1) CN109358490A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111025178A (zh) * 2019-12-29 2020-04-17 苏州浪潮智能科技有限公司 一种电源模块主备切换的稳定性测试方法及相关组件
CN111188782A (zh) * 2019-12-31 2020-05-22 苏州浪潮智能科技有限公司 一种风扇冗余测试方法、装置和计算机可读存储介质
CN112555183A (zh) * 2020-11-19 2021-03-26 浪潮电子信息产业股份有限公司 一种服务器风扇冗余测试的方法和系统
CN113014451A (zh) * 2021-02-25 2021-06-22 国网河南省电力公司电力科学研究院 一种双核心局域网冗余可靠性测试系统和方法
WO2021253856A1 (zh) * 2020-06-19 2021-12-23 浪潮电子信息产业股份有限公司 一种测试方法、装置、设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189806A (zh) * 2010-11-09 2013-07-03 霍尼韦尔国际公司 用于测试冗余控制配置中的辅助伺服控制电路的系统和方法
KR101594453B1 (ko) * 2015-09-21 2016-02-26 국방과학연구소 채널 고장 진단 장치 및 그 진단 방법
CN106155943A (zh) * 2015-04-01 2016-11-23 浙江大华技术股份有限公司 一种双控存储设备的掉电保护的方法及装置
CN107271854A (zh) * 2017-07-28 2017-10-20 北京航天光华电子技术有限公司 一种双冗余等电位电缆网混线测试装置及测试方法
CN107390513A (zh) * 2017-07-27 2017-11-24 湖南中车时代通信信号有限公司 一种冗余系统接入单路总线的方法和系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189806A (zh) * 2010-11-09 2013-07-03 霍尼韦尔国际公司 用于测试冗余控制配置中的辅助伺服控制电路的系统和方法
CN106155943A (zh) * 2015-04-01 2016-11-23 浙江大华技术股份有限公司 一种双控存储设备的掉电保护的方法及装置
KR101594453B1 (ko) * 2015-09-21 2016-02-26 국방과학연구소 채널 고장 진단 장치 및 그 진단 방법
CN107390513A (zh) * 2017-07-27 2017-11-24 湖南中车时代通信信号有限公司 一种冗余系统接入单路总线的方法和系统
CN107271854A (zh) * 2017-07-28 2017-10-20 北京航天光华电子技术有限公司 一种双冗余等电位电缆网混线测试装置及测试方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111025178A (zh) * 2019-12-29 2020-04-17 苏州浪潮智能科技有限公司 一种电源模块主备切换的稳定性测试方法及相关组件
CN111188782A (zh) * 2019-12-31 2020-05-22 苏州浪潮智能科技有限公司 一种风扇冗余测试方法、装置和计算机可读存储介质
WO2021253856A1 (zh) * 2020-06-19 2021-12-23 浪潮电子信息产业股份有限公司 一种测试方法、装置、设备及存储介质
CN112555183A (zh) * 2020-11-19 2021-03-26 浪潮电子信息产业股份有限公司 一种服务器风扇冗余测试的方法和系统
CN113014451A (zh) * 2021-02-25 2021-06-22 国网河南省电力公司电力科学研究院 一种双核心局域网冗余可靠性测试系统和方法
CN113014451B (zh) * 2021-02-25 2022-07-26 国网河南省电力公司电力科学研究院 一种双核心局域网冗余可靠性测试系统和方法

Similar Documents

Publication Publication Date Title
CN109358490A (zh) 一种冗余设备及其测试方法、系统和存储介质
US8495413B2 (en) System and method for providing a computer standby node
US9600370B2 (en) Server system
CN108153622B (zh) 一种故障处理的方法、装置和设备
US10725519B1 (en) Power control based on power controller configuration records
US20150169313A1 (en) Integrated system and firmware update method
US20090187668A1 (en) Protocol Independent Server Replacement and Replication in a Storage Area Network
CN104424048A (zh) 用于数据存储的方法和装置
CN107832164A (zh) 一种基于Ceph的故障硬盘处理的方法及装置
US20140136866A1 (en) Rack and power control method thereof
CN103744743A (zh) 一种基于数据库rac模式心跳信号的冗余配置的方法
CN108388490B (zh) 一种测试高端服务器内存的方法及系统
US9710051B2 (en) Methods of power supply unit rotating in an information handling system
CN104407680A (zh) 一种基于整机柜节点的管理系统
CN104506362A (zh) 一种cc-numa多节点服务器上系统状态切换和监控的方法
CN109614376A (zh) Nas节点配置文件的更新方法及nas配置节点控制器
CN102880527A (zh) 一种基板管理控制器的数据恢复方法
CN104468217A (zh) 一种1394网络管理者故障下的网络重建方法
CN106886441A (zh) 一种服务器系统及flash配置方法
CN104182300A (zh) 一种集群中虚拟机的备份方法及系统
CN105139130A (zh) 一种适用于电力系统分布式任务的管理方法
CN104503947A (zh) 多路服务器及其信号处理方法
WO2020014952A1 (en) Limiting computing rack input power due to power supply unit failure
CN103095739A (zh) 机柜服务器系统及其节点通信方法
CN104486127A (zh) 一种基于可信管理单元的冗余可信服务器管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190219

RJ01 Rejection of invention patent application after publication