CN106383770B - 一种服务器监控管理的方法及服务器 - Google Patents
一种服务器监控管理的方法及服务器 Download PDFInfo
- Publication number
- CN106383770B CN106383770B CN201610850864.1A CN201610850864A CN106383770B CN 106383770 B CN106383770 B CN 106383770B CN 201610850864 A CN201610850864 A CN 201610850864A CN 106383770 B CN106383770 B CN 106383770B
- Authority
- CN
- China
- Prior art keywords
- management controller
- system management
- main system
- controller
- communication link
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 41
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000004891 communication Methods 0.000 claims abstract description 67
- 230000002159 abnormal effect Effects 0.000 claims abstract description 27
- 230000004044 response Effects 0.000 claims description 39
- 239000000758 substrate Substances 0.000 claims description 7
- 230000005540 biological transmission Effects 0.000 claims description 4
- 230000003993 interaction Effects 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 6
- 230000001360 synchronised effect Effects 0.000 description 4
- 230000009514 concussion Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3055—Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer And Data Communications (AREA)
Abstract
本发明实施例公开了一种服务器监控管理的方法及服务器,该方法通过从系统管理控制器利用第一通信链路获取到主系统管理控制器的实时信息;从系统管理控制器去判断主系统管理控制器是否处于正常工作状态;当判断出主系统管理控制器处于异常工作状态时,从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息,并对基板管理控制器进行控制。实现主系统管理控制器和从系统管理控制器之间的信息同步,当主系统管理控制器发生故障时,从系统管理控制器接管主系统管理控制器对计算节点的状态进行监控管理。可见,本发明实施例通过主从系统管理控制器的切换对服务器稳定地监控管理,提高了服务器的监控管理系统的稳定性。
Description
技术领域
本发明涉及服务器领域,特别是涉及一种服务器监控管理的方法及服务器。
背景技术
随着服务器技术的发展进步,各种类型的服务器争奇斗艳,而高密度服务器的优点越来突出,其市场竞争力也在不断增强。
高密度服务器与市场上的机柜服务器相比较,高密度服务器的体积更小,但同时可以满足密集计算环境对于服务器的性能需求。在超级计算机中,高密度服务器应用在许多新增的集群系统中。因为高密度服务器的广泛使用,对高密度服务器运行可靠性提出了新的要求,而服务器的运行可靠性很大程度上是依靠服务器的监控管理系统来维持,故服务器的监控管理系统的稳定性是十分重要的。
每个计算机中都会有自身的基板管理控制器(Baseboard ManagementController,BMC),用于监控管理每个计算节点的状态。但是用户在日常管理服务器中不是通过BMC,而是通过系统管理控制器(System Management Controller,SMC)间接地监控管理每个计算节点的状态。SMC可以获取每个BMC的状态进而获取每个计算节点实时的状态。这样,用户就可以很方便地管理每个计算节点以及可以了解整个服务实时的工作状态。但是由于用户为了实现管理监控计算节点,需要对服务器进行十分频繁的操作,导致监控管理系统中的SMC的工作压力很大。如果因为某种原因导致了SMC出现故障不能对服务器进行监控管理时,就会影响到用户对于服务器的实时管理和使用。故保证服务器的监控管理系统的稳定性是十分必要的,基于此,本发明实施例提出了一种服务器监控管理的方法及服务器。
发明内容
本发明实施例的目的是提供一种服务器监控管理的方法,目的在于解决现有技术中服务器监控管理系统的稳定性低的问题;此外,本发明实施例的另一目的是提供一种服务器,其监控管理系统的稳定性高。
为解决上述技术问题,本发明实施例提供一种服务器监控管理的方法,该方法包括以下内容:
从系统管理控制器通过第一通信链路获取主系统管理控制器的实时信息,实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步;
所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态;
当判断出所述主系统管理控制器处于异常工作状态时,所述从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制。
可选地,还包括:
当判断出所述主系统管理控制器处于正常工作状态时,所述主系统管理控制器通过第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制。
可选地,所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态包括:
所述从系统管理控制器通过所述第一通信链路按预设时间频率向所述主系统管理控制器发送询问指令;
当所述从系统管理控制器接收到所述主系统管理控制器的应答指令时,所述从系统管理控制器比较所述应答指令与预设应答指令是否一致;
当所述应答指令与预设应答指令一致时,所述从系统管理控制器则判断所述主系统管理控制器处于正常工作状态;
当所述应答指令与预设应答指令不一致时,所述从系统管理控制器则判断所述主系统管理控制器处于异常工作状态。
可选地,所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态包括:
所述从系统管理控制器通过所述第一通信链路按预设时间频率向所述主系统管理控制器发送询问指令;
当所述从系统管理控制器没有接收到所述主系统管理控制的应答指令时,所述从系统管理控制器则判断所述主系统管理控制器处于异常工作状态;
或
当所述从系统管理控制器没有接收到所述主系统管理控制的应答指令的次数等于或者大于预设次数时,所述从系统管理控制器则判断所述主系统管理控制器处于异常工作状态。
可选地,所述从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息包括:
所述从系统管理控制器建立所述第二通信链路;
通过所述第二通信链路获取所述基板管理控制器的实时信息。
可选地,还包括:
当所述从系统管理控制器判断出处于异常工作状态下的主系统管理控制器重新处于正常工作状态时,所述主系统管理控制器通过所述第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
其中,所述从系统管理控制器切断用于与所述基板控制器进行信息的交互的所述第二通信链路。
可选地,所述第一通信链路、所述第二通信链路和所述第三通信链路均为网络。
此外,本发明实施例还提供了一种服务器,该服务器包括:
主系统管理控制器、从系统管理控制器和基板管理控制器;
其中,所述主系统管理控制器用于通过第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
所述从系统管理控制器用于通过第一通信链路获取主系统管理控制器的实时信息,实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步,且实时监控所述主系统管理控制器的工作状态,在判断出所述主系统管理控制器处于异常工作状态时,通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
所述基板管理控制器用于监控管理所述服务器中的计算节点的工作状态。
可选地,该服务器具体为高密度服务器。
本发明实施例所提供的一种服务器监控管理的方法及服务器,通过从系统管理控制器利用第一通信链路获取到主系统管理控制器的实时信息;从系统管理控制器去判断主系统管理控制器是否处于正常工作状态;当判断出主系统管理控制器处于异常工作状态时,从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制。从系统管理控制器实时地从主系统管理控制器的信息,其信息包括基板管理控制器内的每个计算节点的状态,这样可以实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步,而当主系统管理控制器发生故障时,从系统管理控制器接管主系统管理控制器对计算节点的状态进行监控管理,由于主从系统控制器的信息的完全同步,切换之后仍然可以稳定地进行监控管理,并不会造成管理监控系统的震荡。可见,本发明实施例通过主从系统管理控制器的切换来稳定地监控管理计算节点,提高了服务器的监控管理系统的稳定性。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所提供的服务监控管理的方法的一种具体实施方式的方法流程示意图;
图2为本发明实施例所提供的服务器的一种结构示意图;
图3为本发明实施例所提供的服务器内的连接关系示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参见图1,图1为本发明实施例提供的服务监控管理的方法的一种具体实施方式的方法流程示意图,该方法包括以下内容:
步骤S101:从系统管理控制器通过第一通信链路获取主系统管理控制器的实时信息,实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步;
具体地,从系统管理控制器利用第一通信链路向主系统管理控制器发送查询指令,用于查看主系统管理控制器上是否有信息的更新。如果有信息的更新,则通过上述第一通信链路获取主系统管理控制器上的更新信息,从系统管理控制器根据获得的更新信息对本地相应的信息进行更新,从而可以实现主从系统管理控制器的信息的同步。
其中,主系统管理控制器上的更新可以是配置信息的更新,可以是服务器中计算节点状态的更新,可以是既有配置信息的更新也有计算节点状态的更新,当然,也可以是其它类型信息的更新。
需要指出的是,从系统管理控制器向主系统管理控制器发送查询指令可以是每间隔一段时间发一次,也可以是一直无间隔地发。但是假如从系统管理控制器一直无间隔地发,主系统管理控制器需要一直应答不断发来的查询指令,可能会造成主系统管理控制器的运行压力过大。故优选地可以是每间隔一段时间发一次,其间隔的时间设置不宜过长,导致主从系统管理控制器之间不能实现信息最大限度地同步;当然也不宜过短,导致发送多次主系统管理控制也没有信息的更新,使得主从系统管理控制器需要进行许多不必要的操作。例如,可以将间隔时间设置为3秒。
可以理解的是,上述以及下文出现的第一通信链路可以为网络,可以为串口,也可以为其它的通信链路。
步骤S102:所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态;
具体地,上述从系统管理控制器通过第一通信链路向主系统管理控制器发送询问指令,主系统管理控制器在接收到询问指令后会向从系统管理控制器返回应答指令,从系统管理控制器通过判断接收到的应答指令来判断主系统管理控制器是否处于正常工作状态。
其中,从系统管理控制器将接收到的应答指令与本地上预设的应答指令相比较,如果一致,则从系统管理控制器可以判断主系统管理控制器在应答的过程中处于正常工作的状态,如果不一致,则从系统管理控制器可以判断主系统管理控制器在应答的过程中处于异常工作的状态。
而在本发明的一些实施例中,主系统管理控制器由于发生了故障,无法返回应答指令,故从系统管理控制器接收不到应答指令。此时,可以设定在预设时间内没有接收到应答指令,则判定主系统管理控制器处于异常工作状态下。
应答指令的发送和接收的过程是通过通信链路来实现的,在主系统管理控制器已经发送了应答指令之后,可能由于当前的通信链路发生了阻塞或者故障,从系统管理控制器无法在下一次发送询问指令之前或者是预设时间内接收到应答指令。故可以设定从系统管理控制器在没有接收到应答指令的次数达到预设次数后,判定当前的主系统管理控制器处于异常工作状态,其预设次数可以人为任意地设定。例如,可以将预设次数设为3次,从系统管理控制按照一定的时间间隔发送询问指令,当连续3次或者连续超过3次没有接收到应答指令时,则可以判定主系统管理控制器处于异常工作状态。
显而易见地,上述询问指令的发送时间间隔可以是人为任意地设定的。其中,从系统管理控制器可以一直不间断地发送询问指令,也可以按照一定的预设时间频率发送询问指令,但是考虑到主系统管理控制器的应答压力,其时间间隔不能过长,也不能过短。优选地,将发送询问指令的时间间隔设置为秒级,例如为5秒。
从系统管理控制器中的询问指令可以是各种指令的集合,即询问指令中包括需要查询的各种类型信息指令。而应答指令与询问指令是相对地,其生成过程可以是根据询问指令上各种需要查询的信息指令进行收集,并将收集的结果信息生成应答指令,以数据包或者是其它的形式的数据返回给询问指令的发出者。
在本发明的一些实施例中,从系统管理控制器发出的询问指令可以包括从系统管理控制器用于更新信息的查询指令,例如询问指令中可以包括查询主系统管理控制器的每个计算节点的状态和配置信息的指令,则相应地主系统控制器在接收到询问指令后,会收集当前状态下每个计算节点的状态和当前状态下的配置信息向从系统管理控制器发送携带着当前主系统管理控制器的计算节点状态和配置信息的应答指令,从系统管理控制器可以从应答指令中提取更新的信息对本地上的相应的信息进行更新。
步骤S103:当判断出所述主系统管理控制器处于异常工作状态时,所述从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制。
具体地,当从系统管理控制器判断应答指令与预设的应答指令一致时,则判断主系统管理控制器处于正常工作状态。此时,用户可以使用主系统管理控制器通过第三通信链路对基板管理控制器进行监控管理,从而实现用户对计算节点的状态的监控管理,保证了计算任务的稳定进行。而从系统管理控制器实时地通过第一通信链路来获取主系统控制管理器的信息,其中,该信息包括可以每个计算节点的状态,进而保持了主从系统管理控制器之间信息的完全同步。
当从系统管理控制器判断应答指令与预设的应答指令不一致或者没有接收到应答指令时,则判断主系统管理控制器处于异常工作状态。此时,从系统管理控制器通过第二通信链路来对基板控制器进行实时地监控管理,并且实时地获取基板控制器的状态信息。由于主从系统管理控制器之间的信息的同步,从系统管理控制器接管主系统管理器对基板控制器进行控制操作并不会影响用户对服务器中的计算节点的监控管理。
需要说明的是,上述第二通信链路可以是在从系统管理控制器判断主系统管理控制器处于异常工作状态下时,自主地建立第二通信链路,用于对基板控制器的监控管理和获取信息。当然,上述第二通信链路也可以是之前存在的,即在从系统管理控制器判断主系统管理控制器处于异常工作状态下时,直接利用存在的第二通信链路对基板控制器进行监控管理和获取信息。
可以理解的是,上述以及下文出现的第二通信链路和第三通信链路可以为网络,可以为串口,也可以为其它的通信链路。
在本发明的一些实施例中,处于异常工作状态下的主系统管理控制器不会对基板控制器进行监控管理,故其工作压力会相应地减少,可能重新处于正常工作状态下,亦或者是人为地修复异常的主系统管理控制器。此时,重新处于工作状态下的主系统管理控制器可以重新对基板控制器进行监控管理,而从系统管理控制器相应地可以切断与基板控制器相连的第二通信链路进而不对基板控制器进行监控管理。
本发明实施例所提供的一种服务器监控管理的方法,通过从系统管理控制器利用第一通信链路获取到主系统管理控制器的实时信息;从系统管理控制器去判断主系统管理控制器是否处于正常工作状态;当判断出主系统管理控制器处于异常工作状态时,从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制。从系统管理控制器实时地从主系统管理控制器的信息,其信息包括基板管理控制器内的每个计算节点的状态,这样可以实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步,而当主系统管理控制器发生故障时,从系统管理控制器接管主系统管理控制器对计算节点的状态进行监控管理,由于主从系统控制器的信息的完全同步,切换之后仍然可以稳定地进行监控管理,并不会造成管理监控系统的震荡。可见,本发明实施例通过主从系统管理控制器的切换来稳定地监控管理计算节点,提高了服务器的监控管理系统的稳定性。
由于上述方法应用于服务器,故本发明实施例还提供了一种服务器。请参见图2和图3,图2为本发明实施例所提供的服务器的一种结构示意图;图3为本发明实施例所提供的服务器内的连接关系示意图。
该服务器2包括主系统管理控制器21、从系统管理控制器22和基板管理控制器23;
其中,主系统管理控制器21用于通过第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
所述从系统管理控制器用于通过第一通信链路获取主系统管理控制器的实时信息,实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步,且实时监控所述主系统管理控制器的工作状态,在判断出所述主系统管理控制器处于异常工作状态时,通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
所述基板管理控制器用于监控管理所述服务器中的计算节点的工作状态。
需要说明的是,上述主系统管理控制器21和从系统管理控制器22可以是完全相同的两个控制器,即主系统管理控制器21和从系统管理控制器22的性能参数、规格以及各个方面均相同。当然,系统管理控制器21和从系统管理控制器22也可以是有差异的两个控制器。
在本发明的一些实施例中,上述服务器具体可以为高密度服务器,其服务器内置的主系统管理控制器21和从系统管理控制器22可以是完全相同的。这样可以避免在主从系统管理控制器切换时,由于主从系统管理控制器的性能存在差异,导致切换之后用户不能稳定地对服务器进行监控管理的问题。主从系统管理控制器的完成一致,切换后可以等同于没有切换,用户可以无缝地对服务器进行监控管理。
本发明实施例所提供的一种服务器,从系统管理控制器实时地从主系统管理控制器的信息,其信息包括基板管理控制器内的每个计算节点的状态,这样可以实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步,而当主系统管理控制器发生故障时,从系统管理控制器接管主系统管理控制器对计算节点的状态进行监控管理,由于主从系统控制器的信息的完全同步,切换之后仍然可以稳定地进行监控管理,并不会造成管理监控系统的震荡。通过主从系统管理控制器的切换来稳定地监控管理计算节点,提高了服务器的监控管理系统的稳定性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的一种服务器监控管理的方法及服务器进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
Claims (8)
1.一种服务器监控管理的方法,其特征在于,包括:
从系统管理控制器通过第一通信链路获取主系统管理控制器的实时信息,实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步;
所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态;
当判断出所述主系统管理控制器处于异常工作状态时,所述从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
其中,所述从系统管理控制器利用第一通信链路向所述主系统管理控制器发送查询指令,用于查看所述主系统管理控制器上是否有信息的更新;如果有信息的更新,则通过所述第一通信链路获取主系统管理控制器上的更新信息,所述从系统管理控制器根据获得的更新信息对本地相应的信息进行更新,实现主从系统管理控制器的信息的同步;
还包括:当所述从系统管理控制器判断出处于异常工作状态下的主系统管理控制器重新处于正常工作状态时,所述主系统管理控制器通过第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制;其中,所述从系统管理控制器切断用于与所述基板控制器进行信息的交互的所述第二通信链路。
2.如权利要求1所述的方法,其特征在于,还包括:
当判断出所述主系统管理控制器处于正常工作状态时,所述主系统管理控制器通过第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制。
3.如权利要求2所述的方法,其特征在于,所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态包括:
所述从系统管理控制器通过所述第一通信链路按预设时间频率向所述主系统管理控制器发送询问指令;
当所述从系统管理控制器接收到所述主系统管理控制器的应答指令时,所述从系统管理控制器比较所述应答指令与预设应答指令是否一致;
当所述应答指令与预设应答指令一致时,所述从系统管理控制器则判断所述主系统管理控制器处于正常工作状态;
当所述应答指令与预设应答指令不一致时,所述从系统管理控制器则判断所述主系统管理控制器处于异常工作状态。
4.如权利要求2所述的方法,其特征在于,所述从系统管理控制器判断所述主系统管理控制器是否处于正常工作状态包括:
所述从系统管理控制器通过所述第一通信链路按预设时间频率向所述主系统管理控制器发送询问指令;
当所述从系统管理控制器没有接收到所述主系统管理控制的应答指令时,所述从系统管理控制器则判断所述主系统管理控制器处于异常工作状态;
或
当所述从系统管理控制器没有接收到所述主系统管理控制的应答指令的次数等于或者大于预设次数时,所述从系统管理控制器则判断所述主系统管理控制器处于异常工作状态。
5.如权利要求2至4任意一项所述的方法,其特征在于,所述从系统管理控制器通过第二通信链路获取基板管理控制器的实时信息包括:
所述从系统管理控制器建立所述第二通信链路;
通过所述第二通信链路获取所述基板管理控制器的实时信息。
6.如权利要求5所述的方法,其特征在于,所述第一通信链路、所述第二通信链路和所述第三通信链路均为网络。
7.一种服务器,其特征在于,包括:
主系统管理控制器、从系统管理控制器和基板管理控制器;
其中,所述主系统管理控制器用于通过第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
所述从系统管理控制器用于通过第一通信链路获取主系统管理控制器的实时信息,实现所述主系统管理控制器和所述从系统管理控制器之间的信息同步,且实时监控所述主系统管理控制器的工作状态,在判断出所述主系统管理控制器处于异常工作状态时,通过第二通信链路获取基板管理控制器的实时信息,并对所述基板管理控制器进行控制;
所述基板管理控制器用于监控管理所述服务器中的计算节点的工作状态;
其中,所述从系统管理控制器利用第一通信链路向所述主系统管理控制器发送查询指令,用于查看所述主系统管理控制器上是否有信息的更新;如果有信息的更新,则通过所述第一通信链路获取主系统管理控制器上的更新信息,所述从系统管理控制器根据获得的更新信息对本地相应的信息进行更新,实现主从系统管理控制器的信息的同步;
还包括:当所述从系统管理控制器判断出处于异常工作状态下的主系统管理控制器重新处于正常工作状态时,所述主系统管理控制器通过所述第三通信链路获取所述基板管理控制器的实时信息,并对所述基板管理控制器进行控制;其中,所述从系统管理控制器切断用于与所述基板控制器进行信息的交互的所述第二通信链路。
8.如权利要求7所述的服务器,其特征在于,具体为高密度服务器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610850864.1A CN106383770B (zh) | 2016-09-26 | 2016-09-26 | 一种服务器监控管理的方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610850864.1A CN106383770B (zh) | 2016-09-26 | 2016-09-26 | 一种服务器监控管理的方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106383770A CN106383770A (zh) | 2017-02-08 |
CN106383770B true CN106383770B (zh) | 2019-05-10 |
Family
ID=57935993
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610850864.1A Active CN106383770B (zh) | 2016-09-26 | 2016-09-26 | 一种服务器监控管理的方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106383770B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107102927A (zh) * | 2017-04-12 | 2017-08-29 | 湖南大学 | 一种服务器监控管理系统 |
CN107465477A (zh) * | 2017-08-22 | 2017-12-12 | 郑州云海信息技术有限公司 | 一种多级监控网络时间同步方法及系统 |
CN108173959B (zh) * | 2018-01-09 | 2020-09-04 | 郑州云海信息技术有限公司 | 一种集群存储系统 |
CN110413303B (zh) * | 2019-07-23 | 2023-02-03 | 日立楼宇技术(广州)有限公司 | 一种控制器的同步方法、装置、设备和存储介质 |
CN110690998B (zh) * | 2019-10-11 | 2021-12-21 | 湖南长城银河科技有限公司 | 一种基于bmc的主从设备管理方法 |
CN111083198B (zh) * | 2019-11-22 | 2022-07-05 | 浙江中控技术股份有限公司 | 通信链路的切换方法、主域服务器、从域服务器及系统 |
CN111585806A (zh) * | 2020-04-30 | 2020-08-25 | 南通凡肯电子设备研发有限公司 | 一种双主机通信的控制系统及控制方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1650265A (zh) * | 2002-03-08 | 2005-08-03 | 英特尔公司 | 系统管理控制器协商协议 |
CN203554493U (zh) * | 2013-11-20 | 2014-04-16 | 天津市英贝特航天科技有限公司 | 一种服务器用远程管理接口系统 |
CN103995575A (zh) * | 2014-05-27 | 2014-08-20 | 浪潮(北京)电子信息产业有限公司 | 一种服务器启动方法和服务器 |
CN104035831A (zh) * | 2014-07-01 | 2014-09-10 | 浪潮(北京)电子信息产业有限公司 | 一种高端容错计算机管理系统及方法 |
CN105577430A (zh) * | 2015-12-15 | 2016-05-11 | 山东海量信息技术研究院 | 一种高端容错服务器的节点管理方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140337496A1 (en) * | 2013-05-13 | 2014-11-13 | Advanced Micro Devices, Inc. | Embedded Management Controller for High-Density Servers |
-
2016
- 2016-09-26 CN CN201610850864.1A patent/CN106383770B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1650265A (zh) * | 2002-03-08 | 2005-08-03 | 英特尔公司 | 系统管理控制器协商协议 |
CN203554493U (zh) * | 2013-11-20 | 2014-04-16 | 天津市英贝特航天科技有限公司 | 一种服务器用远程管理接口系统 |
CN103995575A (zh) * | 2014-05-27 | 2014-08-20 | 浪潮(北京)电子信息产业有限公司 | 一种服务器启动方法和服务器 |
CN104035831A (zh) * | 2014-07-01 | 2014-09-10 | 浪潮(北京)电子信息产业有限公司 | 一种高端容错计算机管理系统及方法 |
CN105577430A (zh) * | 2015-12-15 | 2016-05-11 | 山东海量信息技术研究院 | 一种高端容错服务器的节点管理方法 |
Also Published As
Publication number | Publication date |
---|---|
CN106383770A (zh) | 2017-02-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106383770B (zh) | 一种服务器监控管理的方法及服务器 | |
CN104283948B (zh) | 服务器集群系统及其负载均衡实现方法 | |
CN105376083B (zh) | 节能控制方法、管理服务器和网络设备 | |
CN105099789B (zh) | 一种网元升级方法及设备 | |
CN105141400B (zh) | 一种高可用性集群管理方法及相关设备 | |
CN103001806A (zh) | 用于it系统的分布式运维监控系统 | |
CN107544837B (zh) | 云服务设备性能数据采集系统、方法和装置 | |
CN105847237A (zh) | 一种基于nfv的安全管理方法和装置 | |
CN109101364A (zh) | 双中心双活数据处理系统和方法 | |
CN106161090A (zh) | 一种分区集群系统的监测方法及装置 | |
CN108847958A (zh) | 设备监控管理方法、装置、计算机设备及存储介质 | |
CN107968797A (zh) | 一种视频传输方法、装置及系统 | |
CN109391691A (zh) | 一种单节点故障下nas服务的恢复方法及相关装置 | |
CN101741635A (zh) | 一种同步告警信息的方法、系统及设备 | |
CN106452899B (zh) | 一种分布式数据挖掘系统及方法 | |
CN108388433A (zh) | 超融合系统的管理平台部署方法 | |
CN110750425A (zh) | 数据库监控方法、装置、系统和存储介质 | |
JP2012231636A (ja) | 電力系統の監視制御システム | |
CN109144737A (zh) | 一种分布式集群系统中控制器管理方法、装置及存储介质 | |
CN109639490A (zh) | 一种宕机通知方法及装置 | |
CN108874947A (zh) | 一种数据处理系统及数据处理方法 | |
CN103095532A (zh) | 网络游戏反外挂系统、方法及反外挂服务端 | |
CN107122230A (zh) | 一种基于服务器集群的高可用方法及其装置 | |
JP3563338B2 (ja) | 時刻同期方法及び通信装置 | |
CN110347531A (zh) | 一种避免数据丢失的机器热插拔工作方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20191125 Address after: 250001 North Zone, floor 3, building S05, Inspur Science Park, No. 1036, Inspur Road, high tech Zone, Jinan City, Shandong Province Patentee after: Shandong Yingxin Computer Technology Co., Ltd. Address before: 450018 Henan province Zheng Dong New District of Zhengzhou City Xinyi Road No. 278 16 floor room 1601 Patentee before: Zhengzhou Yunhai Information Technology Co. Ltd. |
|
TR01 | Transfer of patent right |