CN109766110B - 一种控制方法、基板管理控制器及控制系统 - Google Patents

一种控制方法、基板管理控制器及控制系统 Download PDF

Info

Publication number
CN109766110B
CN109766110B CN201811611694.7A CN201811611694A CN109766110B CN 109766110 B CN109766110 B CN 109766110B CN 201811611694 A CN201811611694 A CN 201811611694A CN 109766110 B CN109766110 B CN 109766110B
Authority
CN
China
Prior art keywords
management controller
local
baseboard management
bmc
remote
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811611694.7A
Other languages
English (en)
Other versions
CN109766110A (zh
Inventor
王军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201811611694.7A priority Critical patent/CN109766110B/zh
Publication of CN109766110A publication Critical patent/CN109766110A/zh
Application granted granted Critical
Publication of CN109766110B publication Critical patent/CN109766110B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请公开一种控制方法、基板管理控制器及控制系统,通过本地基板管理控制器和远程基板管理控制器其中之一监控另一台基板管理控制器的工作状态,如果被监控方处于异常工作状态,通过监控方向被监控方发送控制指令,以控制改善被监控方的异常问题,由此实现通过一个基板管理控制器对另一个基板管理控制器的自动监控和异常问题的自动改善。并且如果作为被监控方的基板管理控制器为本地基板管理控制器,可以及时对本地基板管理控制器的异常问题进行改善,使得本地基板管理控制器的稳定性提高,而本地基板管理控制器的稳定性越高说明本地基板管理控制器的运行更加稳定,从而降低因本地基板管理控制器异常导致的无法控制管理多台设备的情况的发生。

Description

一种控制方法、基板管理控制器及控制系统
技术领域
本申请属于设备监控技术领域,更具体地说,尤其涉及一种控制方法、基板管理控制器及控制系统。
背景技术
BMC(Baseboard Management Controller,基板管理控制器)作为执行伺服器远端管理控制器,可以控制多台设备,并且在多台设备中任一设备处于关机状态中,BMC都可以对设备进行监控,例如对设备进行固件升级和查看设备中的数据等操作,正是因为BMC能够对多台设备进行多方面监控,使得BMC的功能越来越强大,导致BMC的稳定性也越来越差,例如导致BMC无法运行或者反应缓慢。
发明内容
有鉴于此,本申请的目的在于公开一种控制方法、基板管理控制器及控制系统,用于改善基板管理控制器的异常问题。技术方案如下:
本申请公开一种控制方法,所述方法包括:
通过本地基板管理控制器和远程基板管理控制器其中之一监控另一台基板管理控制器的工作状态,所述本地基板管理控制器控制管理多台设备;
如果作为被监控方的基板管理控制器处于异常工作状态,通过作为监控方的基板管理控制器向所述作为被监控方的基板管理控制器发送控制指令,以控制改善所述作为被监控方的基板管理控制器的异常问题。
优选的,所述通过作为监控方的基板管理控制器向所述作为被监控方的基板管理控制器发送控制指令,以控制改善所述作为被监控方的基板管理控制器的异常问题包括:
通过所述作为监控方的基板管理控制器向所述作为被监控方的基板管理控制器发送协助指令,以通过所述作为监控方的基板管理控制器协助所述作为被监控方的基板管理控制器解决所述异常问题。
优选的,所述通过所述作为监控方的基板管理控制器协助所述作为被监控方的基板管理控制器解决所述异常问题包括:通过所述作为监控方的基板管理控制器代替所述作为被监控方的基板管理控制器来运行第一功能,所述第一功能是使得所述作为被监控方的基板管理控制器存在异常问题的功能。
优选的,所述本地基板管理控制器和所述远程基板管理控制器均实现硬件层面数据管理至应用层面数据管理。
优选的,所述本地基板管理控制器用于实现硬件层面数据管理,所述远程基板管理控制器用于实现应用层面数据管理。
优选的,所述本地基板管理控制器用于实现硬件层面数据管理至应用层面数据管理,所述远程基板管理控制器用于对所述本地基板管理控制器的工作状态进行监控。
优选的,所述通过作为监控方的基板管理控制器向所述作为被监控方的基板管理控制器发送控制指令,以控制改善所述作为被监控方的基板管理控制器的异常问题包括:
通过所述作为监控方的基板管理控制器向所述作为被监控方的基板管理控制器发送重启指令,以控制所述作为被监控方的基板管理控制器重启。
优选的,所述控制所述作为被监控方的基板管理控制器重启包括:控制所述作为被监控方的基板管理控制器中的特定类型模块重启。
优选的,所述通过本地基板管理控制器和远程基板管理控制器其中之一监控另一台基板管理控制器的工作状态包括:
通过作为监控方的基板管理控制器向作为被监控方的基板管理控制器发送操作指令;
通过所述作为监控方的基板管理控制器获得所述作为被监控方的基板管理控制器反馈的操作结果,所述操作结果为所述作为被监控方的基板管理控制器控制与所述操作指令对应的模块响应所述操作指令的结果;
如果所述操作结果表明操作异常,则指示所述作为被监控方的基板管理控制器处于异常工作状态。
优选的,所述通过本地基板管理控制器和远程基板管理控制器其中之一监控另一台基板管理控制器的工作状态包括:通过所述本地基板管理控制器监控所述远程基板管理控制器的工作状态,通过所述远程基板管理控制器监控所述本地基板管理控制器的工作状态,以使得所述本地基板管理控制器和所述远程基板管理控制器互为监控。
本申请还公开一种基板管理控制器,所述基板管理控制器作为监控方,包括:处理器和存储器;
所述处理器,用于监控作为被监控方的基板管理控制器的工作状态,如果所述作为被监控方的基本管理控制器处于异常工作状态,向所述作为被监控方的基板管理控制器发送控制指令,以控制改善所述作为被监控方的基板管理控制器的异常问题;如果所述监控方和所述被监控方其中之一为本地基板管理控制器,所述本地基板管理控制器控制管理多台设备;
所述存储器,用于存储所述控制指令。
优选的,所述处理器,具体用于向所述作为被监控方的基板管理控制器发送协助指令,以通过所述作为监控方的基板管理控制器协助所述作为被监控方的基板管理控制器解决所述异常问题。
优选的,所述处理器,具体用于代替所述作为被监控方的基板管理控制器来运行第一功能,所述第一功能是使得所述作为被监控方的基板管理控制器存在异常问题的功能。
优选的,所述作为监控方的基板管理控制器和所述作为被监控方的基板管理控制器均实现硬件层面数据管理至应用层面数据管理。
优选的,所述作为监控方的基板管理控制器用于实现硬件层面数据管理,所述作为被监控方的基板管理控制器用于实现应用层面数据管理。
优选的,所述作为被监控方的基板管理控制器用于实现硬件层面数据管理至应用层面数据管理,所述作为监控方的基板管理控制器用于对所述本地基板管理控制器的工作状态进行监控。
优选的,所述处理器,具体用于向所述作为被监控方的基板管理控制器发送重启指令,以控制所述作为被监控方的基板管理控制器重启。
优选的,所述处理器,具体用于控制所述作为被监控方的基板管理控制器中的特定类型模块重启。
优选的,所述处理器,具体用向作为被监控方的基板管理控制器发送操作指令,获得所述作为被监控方的基板管理控制器反馈的操作结果,如果所述操作结果表明操作异常,则指示所述作为被监控方的基板管理控制器处于异常工作状态,所述操作结果为所述作为被监控方的基板管理控制器控制与所述操作指令对应的模块响应所述操作指令的结果。
本申请还公开一种控制系统,所述系统包括:本地基板管理控制器和远程基板管理控制器,所述本地基板管理控制器和远程基板管理控制器其中之一作为监控方,另一个作为被监控方,所述本地基板管理控制器控制管理多台设备;
作为监控方的基板管理控制器,用于监控作为被监控方的基板管理控制器的工作状态,如果作为被监控方的基板管理控制器处于异常工作状态,通过作为监控方的基板管理控制器向所述作为被监控方的基板管理控制器发送控制指令,以控制改善所述作为被监控方的基板管理控制器的异常问题。
从上述技术方案可知,通过本地基板管理控制器和远程基板管理控制器其中之一监控另一台基板管理控制器的工作状态,如果作为被监控方的基板管理控制器处于异常工作状态,通过作为监控方的基板管理控制器向作为被监控方的基板管理控制器发送控制指令,以控制改善作为被监控方的基板管理控制器的异常问题,由此实现通过一个基板管理控制器对另一个基板管理控制器的自动监控和异常问题的自动改善。并且如果作为被监控方的基板管理控制器为本地基板管理控制器,如果本地基板管理控制器处于异常工作状态,可以及时对本地基板管理控制器的异常问题进行改善,使得本地基板管理控制器的稳定性提高,而本地基板管理控制器的稳定性越高说明本地基板管理控制器的运行更加稳定,从而降低因本地基板管理控制器异常导致的无法控制管理多台设备的情况的发生。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例公开的控制方法对应的控制系统的架构图;
图2是本申请实施例公开的控制方法的流程图;
图3是本申请实施例公开的一种改善异常问题的示意图;
图4是本申请实施例公开的另一种改善异常问题的示意图;
图5是本申请实施例公开的基板管理控制器的结构示意图;
图6是本申请实施例公开的控制系统的架构图。
具体实施方式
目前BMC能够通过内置看门狗技术方式对BMC进行监控,其中看门狗技术是通过不断监测BMC中程序的运行时间,如果监测到程序的运行时间超过预设时间,确定BMC处于死循环中,此时强迫控制程序返回预设出错接口,但是此种方式仍会使得BMC无法运行或者反应缓慢。
为此本申请实施例提供一种用于解决这一问题的控制系统,该控制系统的架构图如图1所示,可以包括:至少一个本地BMC10和至少一个远程BMC20,其中至少一个本地BMC10中的每个本地BMC10控制管理多台设备,该多台设备可以是相同类型设备也可以是不同类型设备,且对于每个本地BMC来说,各自控制管理的多台设备之间可以存在重叠,即一台设备由多个本地BMC控制,在此情况下需要从控制一台设备的多个本地BMC中选取一个作为主控制器,其他作为备用控制器。
一个本地BMC10来说,能够与至少一个远程BMC20通信,以使得该本地BMC10能够由至少一个远程BMC20监控。同样的,对于一个远程BMC20来说,能够与至少一个本地BMC10通信,以使得该远程BMC20能够由至少一个本地BMC10监控。
针对图1所示控制系统中的本地BMC10和远程BMC20,本实施例提供一种控制方法能够通过一方对另一方进行监控,以使得被监控方异常时使得其异常得到改善。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参阅图2,其示出了本申请实施例公开的一种控制方法的流程图,用于实现对BMC的自动监控和异常问题的自动改善,可以包括以下步骤:
201:通过本地BMC和远程BMC其中之一监控另一台BMC的工作状态,其中本地BMC控制管理多台设备。
可以理解的是:本地BMC是处于用户直接控制下的BMC,而远程BMC则是相对于本地BMC来说,不处于该本地BMC的用户的直接控制下但能够与本地BMC通信的BMC。例如本地BMC和远程BMC之间能够通过网络连接方式通信,或者本地BMC和远程BMC之间能够通过电连接方式通信,对此本实施例不限定本地BMC和远程BMC之间的通信方式。对于本地BMC和多台设备之间,本地BMC能够通过与多台设备之间的网络连接控制管理多台设备,或者多台设备中如果有设备没有安装操作系统或者没有启动操作系统的情况下,即CPU未启动,此时本地BMC能够通过与设备之间的电连接进行控制管理,或者即使多台设备中有设备的操作系统处于启动状态,本地BMC也能够通过电连接或其他连接进行控制管理。
而通过本地BMC和远程BMC其中之一监控另一台BMC的工作状态可以包括:由本地BMC和远程BMC其中之一作为监控方,本地BMC和远程BMC其中另一个作为被监控方,由监控方监控被监控方的工作状态,例如能够通过本地BMC监控远程BMC的工作状态,也能够通过远程BMC监控本地BMC的工作状态,实现本地BMC和远程BMC之间的相互监控,即使得本地BMC和远程BMC互为监控,所谓互为监控表明本地BMC和远程BMC中的一方是另一方的监控方,同时也是另一方的被监控方,例如对于本地BMC来说,其可以是远程BMC的监控方也可以是远程BMC的被监控方。
当然上述通过本地BMC和远程BMC其中之一所监控的另一台BMC也可以是除本地BMC和远程BMC之外的BMC,也就是说能够作为本次监控的被监控方的可以是除本地BMC和远程BMC之外的BMC,以实现对本地BMC和远程BMC所在控制系统之外的BMC的监控。
在本实施例中,监控另一台BMC的工作状态的一种可行方式是:通过作为监控方的BMC向作为被监控方的BMC发送操作指令;通过作为监控方的BMC获得作为被监控方的BMC反馈的操作结果,如果操作结果表明操作异常,则指示作为被监控方的BMC处于异常工作状态,其中操作结果为作为被监控方的BMC控制与操作指令对应的模块响应操作指令的结果,由此通过对作为被监控方的BMC中模块的响应来监测BMC的工作状态。
其中作为监控方的BMC可以通过模拟HTTP(HyperText Transfer Protocol,超文本传输协议)命令、HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer或Hypertext Transfer Protocol Secure,超文本传输安全协议)命令、SSH(Secure Shell,安全外壳协议)命令和IPMI(Intelligent Platform Management Interface,智能平台管理接口)命令等中的任意一种方式向作为被监控方的BMC发送操作指令,并且作为监控方的BMC可以在预定时间或者周期性地向作为被监控方的BMC发送操作指令,以定期或周期性的监控BMC,在本实施例中预定时间和周期性发送操作指令时的时间间隔,本实施例不进行限定。
202:如果作为被监控方的BMC处于异常工作状态,通过作为监控放的BMC向作为被监控方的BMC发送控制指令,以控制改善作为被监控方的BMC的异常问题,从而使得作为被监控方的BMC的异常工作状态得到改善。
在本实施例中,控制改善作为被监控方的BMC的异常问题的一种可行方式是:通过作为监控方的BMC向作为被监控方的BMC发送协助指令,以通过作为监控方的BMC协助作为被监控方的BMC解决异常问题。其中协助解决异常问题的方式有但不限于如下方式:
一种方式是:由作为监控方的BMC和作为被监控方的BMC共同解决该异常问题,例如异常问题由作为被监控方的BMC的第一功能导致,在本实施例中可以将第一功能划分成至少两部分功能,其中一部分功能由作为监控方的BMC运行,另一部分功能在作为被监控方的BMC中寻找与该部分功能类似的功能,由作为被监控方的BMC中与该部分功能类似的功能来替换该部分功能。
另一种方式是:由作为监控方的BMC接管/代替作为被监控方的BMC,例如通过作为监控方的BMC代替作为被监控方的BMC来运行第一功能,以使作为监控方的BMC来承担该第一功能,其中第一功能是使得作为被监控方的BMC存在异常问题的功能。
例如如果作为被监控方的BMC接收到协助指令,作为被监控方的BMC不再执行导致自身存在异常问题的第一功能,而是将第一功能的一些信息,如第一功能的标识信息(以表示该第一功能)上传给作为监控方的BMC,作为监控方的BMC接收到第一功能的标识信息之后,触发作为监控方的BMC来运行第一功能,使得作为监控方的BMC能够协助作为被监控方的BMC来改善异常问题,如图3所示。由于导致作为被监控方的BMC存在异常问题的第一功能由作为监控方的BMC来承担运行,那么就意味着作为被监控方的BMC不再运行BMC,使得作为被监控方的BMC和作为监控方的BMC共同来实现作为监控方的BMC的全部功能。
在本实施例中,控制改善作为被监控方的BMC的异常问题的另一种可行方式是:通过作为监控方的BMC向作为被监控方的BMC发送重启指令,以控制作为被监控方的BMC重启,例如重启指令用于指示作为被监控方的BMC重启操作系统,使得作为被监控方的BMC中的全部模型得到重启,那么在重启过程中异常问题自动得到解决,并且使得作为被监控方的BMC处于正常工作状态。
此外除了重启作为被监控方的BMC的操作系统之外,本实施例中还可以控制作为被监控方的BMC中的特定类型模块重启,其中特定类型模块是作为被监控方的BMC的异常问题涉及到的模块,例如异常问题涉及到作为被监控方的BMC中的风扇,则可以控制风扇重启,这样通过重启特定类型模块的方式也能够使得作为被监控方的BMC处于正常工作状态。如图4所示,在监测到特定类型模块——风扇存在异常,则发送重启指令来重启风扇。在实际应用中还可以通过一个重启指令重启多个模块,如重启特定类型模块之外还重启一个预设模块,该预设模块可以每接收到重启指令进行一次重启,或者间隔几个重启指令进行一次重启,例如预设模块可以是CPU(Central Processing Unit,中央处理器)以通过重启对CPU运行的程序进行自动关闭,降低CPU的资源消耗。
针对上述几种可行方式,本实施例中本地BMC和远程BMC的架构如表1所示,并且在表1所示的系统架构中给出不同系统架构的优点和缺点。
表1本地BMC和远程BMC的架构
Figure BDA0001924910530000081
Figure BDA0001924910530000091
在第一种架构中:本地BMC和远程BMC中的功能完成相同,使得本地BMC和远程BMC能够互为监控,互为备份,但是在第一种架构中由于本地BMC中具有完整功能,使得本地BMC涉及到的模块增加,从而导致本地BMC的稳定性差,为此需要通过远程BMC来监控本地BMC的工作状态,并且如果本地BMC处于异常工作状态能够通过远程BMC改善本地BMC的异常问题,例如通过发送协助指令方式来协助改善,或者通过发送重启指令方式来重启,使得本地BMC处于正常工作状态。
在第二种架构中:本地BMC仅具备最基本的硬件方面的功能,在此架构中仅能通过远程BMC监控本地BMC,并且在此架构中由于本地BMC的硬件方面的功能不能由远程BMC代替,所以在此架构中如果本地BMC处于异常工作状态能够通过发送重启指令的方式来使本地BMC的异常问题改善,如通过重启指令重启本地BMC的方式或者重启本地BMC中存在异常问题涉及的模块的方式,使得本地BMC处于正常工作状态。
在第三种架构中:仅能通过远程BMC监控本地BMC,并且在此架构中远程BMC仅具有工作状态监控的功能,所以在此架构中如果本地BMC处于异常工作状态能够通过发送重启指令的方式来使本地BMC的异常问题改善,如通过重启指令重启本地BMC的方式或者重启本地BMC中存在异常问题涉及的模块的方式,使得本地BMC处于正常工作状态。
对于上述三种架构中,硬件层面数据管理至应用层面数据管理是指包括:硬件层面数据管理、驱动层面数据管理、数据层面数据管理和应用层面数据管理,其中驱动层面数据管理和数据层面数据管理用于数据传输,应用层面数据管理则是用于对传输到应用层面的数据的应用管理,如对传输到应用层面的数据进行日志管理、数据划分和服务管理等,如应用层面数据管理包括但不限于:log,redfish等管理,使得应用层面数据管理实现BMC的高级功能。
硬件层面数据管理用于对该层面涉及到的硬件进行数据采集以及对采集到的数据进行控制,例如硬件层面涉及到的硬件有散热器和传感器等,则采集到的数据有:散热器的温度、传感器采集到的各种类型数据等,对采集到的数据进行控制包括:基于散热器的温度决定对散热器的控制,如是否控制散热器启动和关闭等;对于传感器来说可以控制传感器何时采集数据等,使得硬件层面数据管理实现BMC的基本功能。
从上述技术方案可知,通过本地BMC和远程BMC其中之一监控另一台BMC的工作状态,如果作为被监控方的BMC处于异常工作状态,通过作为监控方的BMC向作为被监控方的BMC发送控制指令,以控制改善作为被监控方的BMC的异常问题,由此实现通过一个BMC对另一个BMC的自动监控和异常问题的自动改善。并且如果作为被监控方的BMC为本地BMC,如果本地BMC处于异常工作状态,可以及时对本地BMC的异常问题进行改善,使得本地BMC的稳定性提高,而本地BMC的稳定性越高说明本地BMC的运行更加稳定,从而降低因本地BMC异常导致的无法控制管理多台设备的情况的发生。
此外,在本实施例中,远程BMC能够通过构建虚拟机的方式实现,或者将本实施例提供的控制方法通过一个集中管理程序来实现,也就是说由运行在设备中的集中管理程序来代替远程BMC,以通过一个集中管理程序实现对多个本地BMC的监控,这种通过集中管理程序监控多个本地BMC能够节省资源,但是相对于通过一个远程BMC和一个本地BMC互为监控的方式来说,如果集中管理程序出现问题,则会导致该集中管理程序监控的所有本地BMC都失去监控。
与上述方法实施例相对应,本申请实施例还公开一种BMC,BMC作为监控方使用,该BMC的结构如图5所示,可以包括:处理器11和存储器12。
处理器11,用于监控作为被监控方的BMC的工作状态,如果作为被监控方的基本管理控制器处于异常工作状态,向作为被监控方的BMC发送控制指令,以控制改善作为被监控方的BMC的异常问题。如果监控方和被监控方其中之一为本地BMC,本地BMC控制管理多台设备。
存储器12,用于存储控制指令。
其中处理器11监控作为被监控方的BMC的工作状态的方式可以是:处理器11向作为被监控方的BMC发送操作指令,获得作为被监控方的BMC反馈的操作结果,如果操作结果表明操作异常,则指示作为被监控方的BMC处于异常工作状态,操作结果为作为被监控方的BMC控制与操作指令对应的模块响应操作指令的结果,具体说明请参阅方法实施例中的相关说明。
在本实施例中,控制改善作为被监控方的BMC的异常问题的一种方式是:处理器11向作为被监控方的BMC发送协助指令,以通过作为监控方的BMC协助作为被监控方的BMC解决异常问题,例如通过处理器11代替作为被监控方的BMC来运行第一功能,第一功能是使得作为被监控方的BMC存在异常问题的功能,在此方式中,作为监控方的BMC和作为被监控方的BMC的架构是:为监控方的BMC和作为被监控方的BMC均实现硬件层面数据管理至应用层面数据管理。
在本实施例中,处理器11控制改善作为被监控方的BMC的异常问题的另一种方式是:处理器11向作为被监控方的BMC发送重启指令,以控制作为被监控方的BMC重启,例如处理器11控制作为被监控方的BMC中的特定类型模块重启。在此方式中,作为监控方的BMC和作为被监控方的BMC的架构是:作为监控方的BMC用于实现硬件层面数据管理,作为被监控方的BMC用于实现应用层面数据管理;或者作为被监控方的BMC用于实现硬件层面数据管理至应用层面数据管理,作为监控方的BMC用于对本地BMC的工作状态进行监控。
对于上述两种方式以及架构的说明请参阅方法实施例,此处不再详述。
从上述技术方案可知,通过作为监控方的BMC中的处理器监控作为被监控方的BMC的工作状态,如果作为被监控方的BMC处于异常工作状态,通过处理器向作为被监控方的BMC发送控制指令,以控制改善作为被监控方的BMC的异常问题,由此实现通过对一个BMC的自动监控和异常问题的自动改善。并且如果作为被监控方的BMC为本地BMC,如果本地BMC处于异常工作状态,可以及时对本地BMC的异常问题进行改善,使得本地BMC的稳定性提高,而本地BMC的稳定性越高说明本地BMC的运行更加稳定,从而降低因本地BMC异常导致的无法控制管理多台设备的情况的发生。
此外,本申请实施例还公开一种控制系统,该控制系统的架构图如图6所示,可以包括:本地BMC10和远程BMC20,其中本地BMC10和远程BMC20其中之一作为监控方,另一个作为被监控方,本地BMC10控制管理多台设备。
作为监控方的BMC,用于监控作为被监控方的BMC的工作状态,如果作为被监控方的BMC处于异常工作状态,通过作为监控方的BMC向作为被监控方的BMC发送控制指令,以控制改善作为被监控方的BMC的异常问题。
在此说明一点:图6所示控制系统是以一个本地BMC和一个远程BMC为例进行说明,在实际应用中一个控制系统可以包括多个BMC,如上述图1所示,在一个控制系统中包括多个本地BMC和多个远程BMC,且一个本地BMC能够监控多个远程BMC,且一个本地BMC也能够被多个远程BMC监控,如果一个被监控方被多个监控方监控,可以从这多个监控方中选取一个作为主监控方,其他作为备用监控方,如果主监控方存在异常,则可以将备用监控方中的一个作为主监控方进行监控。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (5)

1.一种控制方法,所述方法包括:
通过远程基板管理控制器监控本地基板管理控制器的工作状态,所述本地基板管理控制器控制管理多台设备,所述远程基板管理控制器和所述本地基板管理控制器的架构是本地基板管理控制器实现硬件层面数据管理,远程基板管理控制器实现应用层面数据管理,或者本地基板管理控制器实现硬件层面数据管理至应用层面数据管理,远程基板管理控制器监控本地基板管理控制器时仅具有工作状态监控的功能;
如果本地基板管理控制器处于异常工作状态,通过远程基板管理控制器向所述本地基板管理控制器发送控制指令,以使所述本地基板管理控制器基于所述控制指令改善异常问题,其中所述控制指令用于指示所述本地基板管理控制器通过重启方式改善异常问题。
2.根据权利要求1所述的方法,所述通过远程基板管理控制器向所述本地基板管理控制器发送控制指令,以使所述本地基板管理控制器基于所述控制指令改善异常问题包括:
通过所述远程基板管理控制器向所述本地基板管理控制器发送重启指令,以控制所述本地基板管理控制器重启。
3.根据权利要求2所述的方法,所述控制所述本地基板管理控制器重启包括:控制所述本地基板管理控制器中的特定类型模块重启。
4.一种远程基板管理控制器,所述远程基板管理控制器作为监控方,包括:处理器和存储器;
所述处理器,用于监控作为被监控方的本地基板管理控制器的工作状态,如果所述本地基本管理控制器处于异常工作状态,向所述本地基板管理控制器发送控制指令,以使所述本地基板管理控制器基于所述控制指令改善异常问题,其中所述控制指令用于指示所述本地基板管理控制器通过重启方式改善异常问题;所述本地基板管理控制器控制管理多台设备,所述远程基板管理控制器和所述本地基板管理控制器的架构是本地基板管理控制器实现硬件层面数据管理,远程基板管理控制器实现应用层面数据管理,或者本地基板管理控制器实现硬件层面数据管理至应用层面数据管理,远程基板管理控制器监控本地基板管理控制器时仅具有工作状态监控的功能;
所述存储器,用于存储所述控制指令。
5.一种控制系统,所述系统包括:本地基板管理控制器和远程基板管理控制器,所述本地基板管理控制器和远程基板管理控制器的架构是本地基板管理控制器实现硬件层面数据管理,远程基板管理控制器实现应用层面数据管理,或者本地基板管理控制器实现硬件层面数据管理至应用层面数据管理,远程基板管理控制器监控本地基板管理控制器时仅具有工作状态监控的功能,所述本地基板管理控制器控制管理多台设备;
所述远程基板管理控制器,用于监控本地基板管理控制器的工作状态,如果本地基板管理控制器处于异常工作状态,通过远程基板管理控制器向所述本地基板管理控制器发送控制指令,以使所述本地基板管理控制器基于所述控制指令改善异常问题,其中所述控制指令用于指示所述本地基板管理控制器通过重启方式改善异常问题。
CN201811611694.7A 2018-12-27 2018-12-27 一种控制方法、基板管理控制器及控制系统 Active CN109766110B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811611694.7A CN109766110B (zh) 2018-12-27 2018-12-27 一种控制方法、基板管理控制器及控制系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811611694.7A CN109766110B (zh) 2018-12-27 2018-12-27 一种控制方法、基板管理控制器及控制系统

Publications (2)

Publication Number Publication Date
CN109766110A CN109766110A (zh) 2019-05-17
CN109766110B true CN109766110B (zh) 2022-05-31

Family

ID=66451073

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811611694.7A Active CN109766110B (zh) 2018-12-27 2018-12-27 一种控制方法、基板管理控制器及控制系统

Country Status (1)

Country Link
CN (1) CN109766110B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110531678B (zh) * 2019-09-16 2020-10-02 珠海格力电器股份有限公司 自控系统及其运维方法
US11537705B2 (en) * 2020-10-27 2022-12-27 Dell Products L.P. Device access control system
US11829493B2 (en) * 2020-10-27 2023-11-28 Dell Products L.P. Device access control system

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008003731A (ja) * 2006-06-21 2008-01-10 Hitachi Ltd 情報処理システム
CN101739406A (zh) * 2008-11-13 2010-06-16 英业达股份有限公司 双控制器上文件服务操作的同步方法
CN102622279B (zh) * 2012-03-16 2015-08-19 华为技术有限公司 冗余控制系统、方法及管理控制器
CN103577298A (zh) * 2012-07-31 2014-02-12 鸿富锦精密工业(深圳)有限公司 基板管理控制器监控系统及方法
CN104375930A (zh) * 2013-08-13 2015-02-25 鸿富锦精密工业(深圳)有限公司 固件检测系统及方法
CN104639380B (zh) * 2013-11-07 2018-03-09 英业达科技有限公司 服务器监控方法
TWI494754B (zh) * 2013-11-22 2015-08-01 Inventec Corp 伺服器監控裝置和其操作方法
CN104809044A (zh) * 2014-01-24 2015-07-29 鸿富锦精密工业(深圳)有限公司 基板管理控制器启动状态检测方法及系统
CN103905253B (zh) * 2014-04-04 2018-09-28 浪潮电子信息产业股份有限公司 一种基于Nagios和BMC的服务器监控管理方法
US9525608B2 (en) * 2015-02-25 2016-12-20 Quanta Computer, Inc. Out-of band network port status detection
US10157115B2 (en) * 2015-09-23 2018-12-18 Cloud Network Technology Singapore Pte. Ltd. Detection system and method for baseboard management controller
US10229290B2 (en) * 2016-04-27 2019-03-12 Dell Products L.P. Keyless method to secure physical access to information handling systems in a datacenter
CN105955858A (zh) * 2016-05-10 2016-09-21 浪潮电子信息产业股份有限公司 一种测试bmc日志记录功能的方法及装置
CN106411643B (zh) * 2016-09-22 2019-12-06 新华三信息技术有限公司 Bmc检测方法以及装置
CN107302465B (zh) * 2017-08-18 2021-06-29 郑州云海信息技术有限公司 一种PCIe Switch服务器整机管理方法

Also Published As

Publication number Publication date
CN109766110A (zh) 2019-05-17

Similar Documents

Publication Publication Date Title
US10693813B1 (en) Enabling and disabling links of a networking switch responsive to compute node fitness
CN109766110B (zh) 一种控制方法、基板管理控制器及控制系统
TWI618380B (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
CN107302465B (zh) 一种PCIe Switch服务器整机管理方法
TW201944236A (zh) 任務處理方法、裝置及系統
US11706080B2 (en) Providing dynamic serviceability for software-defined data centers
WO2016165242A1 (zh) 系统内节点数的调整方法和装置
US10340981B2 (en) Data center management using device identification over power-line
CN111008026B (zh) 集群管理方法、装置及系统
CN109240851A (zh) 一种自主式实现批量bmc自恢复的方法及系统
TW200426571A (en) Policy-based response to system errors occurring during os runtime
WO2013107170A1 (zh) 远程网管系统及其业务操作方法
US10298479B2 (en) Method of monitoring a server rack system, and the server rack system
CN105425932A (zh) 一种整机柜服务器电源的管理方法及系统
CN103631736B (zh) 设备资源控制方法和装置
CN111694707A (zh) 一种小型服务器集群管理系统及方法
CN103178977A (zh) 计算机系统及计算机系统的开机管理方法
CN111352662B (zh) 一种服务器启动顺序控制方法、系统、终端及存储介质
CN106411643B (zh) Bmc检测方法以及装置
CN112600842A (zh) 集群shell方法、装置、电子设备及计算机可读存储介质
US9973569B2 (en) System, method and computing apparatus to manage process in cloud infrastructure
CN115629936A (zh) 获取设备信息的方法及装置、计算机可读存储介质
CN111198765B (zh) 运算资源分配和管理方法及代理服务器
TW201408885A (zh) 風扇共用控制系統及方法
TW200945029A (en) Control system and management method utilizing the same

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant