CN109582541A - 一种服务器管理方法、服务器管理模块组、服务器 - Google Patents

一种服务器管理方法、服务器管理模块组、服务器 Download PDF

Info

Publication number
CN109582541A
CN109582541A CN201811467768.4A CN201811467768A CN109582541A CN 109582541 A CN109582541 A CN 109582541A CN 201811467768 A CN201811467768 A CN 201811467768A CN 109582541 A CN109582541 A CN 109582541A
Authority
CN
China
Prior art keywords
server
management module
server management
main control
strategy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811467768.4A
Other languages
English (en)
Inventor
余隽
朱炎
王成巍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Swarm Bee Information Technology (shanghai) Co Ltd
Original Assignee
Swarm Bee Information Technology (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Swarm Bee Information Technology (shanghai) Co Ltd filed Critical Swarm Bee Information Technology (shanghai) Co Ltd
Priority to CN201811467768.4A priority Critical patent/CN109582541A/zh
Publication of CN109582541A publication Critical patent/CN109582541A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明实施例公开了一种服务器管理方法、服务器管理模块组、服务器。服务器管理方法包括:服务器管理模块组中的服务器管理模块根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;其中,所述服务器管理模块组中的一个服务器管理模块根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中其他服务器管理模块作为备份服务器管理模块;当所述主控服务器管理模块失效时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。本发明实施例解决了一旦BMC损坏,导致服务中断或者因无法监控异常情况而服务器损坏的问题。

Description

一种服务器管理方法、服务器管理模块组、服务器
技术领域
本发明涉及计算机技术领域,具体涉及一种服务器管理方法、服务器管理模块组、服务器。
背景技术
一般需要对服务器内部的模块进行管理,例如监控服务器内部的风扇、电源、温度传感器、处理器等模块的运行状态,如果发生错误,则报告相关错误,并对这些模块进行管理。
数据中心的服务器管理终端和服务器内部的服务器管理模块进行通讯,获得相关数据,然后以图表的形式展现在监视屏幕上,从而可以及时获得服务器的报警信息,以便数据中心的管理维护人员及时对服务器采取相应的维修措施,以避免更大的损失。
现有的服务器管理方式为在服务器内部设置一个基板管理控制器(BaseboardManagement Controller,BMC),用于对服务器内的各个模块进行状态监控和管理。
BMC安装在服务器内部,如果损坏,需要关闭服务器,并将外壳打开后才能进行更换和维修,这会导致服务器提供的服务中断。这在要求长时间不间断提供服务的高可靠性应用领域是不可接受的。
另外,BMC一旦损坏后,整个服务器虽然可以正常运行,但是处于一个不受监控和管理的状态下,一旦出现异常情况,服务器管理终端无法获得报警信息,也就无法采取主动的维修措施,最终可能会导致整个服务器的损坏。
发明内容
本发明实施例的目的在于提供一种服务器管理方法、服务器管理模块组、服务器,用以解决现有技术中服务器管理中一旦BMC损坏,导致服务中断或者因无法监控异常情况而服务器损坏的问题。
为实现上述目的,本发明实施例第一方面提供了一种服务器管理方法,所述方法包括:服务器管理模块组中的服务器管理模块根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;其中,所述服务器管理模块组中的一个服务器管理模块根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中其他服务器管理模块作为备份服务器管理模块;当所述主控服务器管理模块失效时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
在一种可能的实现方式中,所述管理策略包括所述服务器管理模块组中一个服务器管理模块通过竞选成为所述主控服务器管理模块。
在一种可能的实现方式中,所述服务器管理模块组预先配置有虚拟IP地址,所述服务器管理模块组中的服务器管理模块均包括VRRP路由器;所述管理策略包括所述服务器管理模块组中服务器管理模块的VRRP路由器竞选占有所述虚拟IP地址;占有了所述虚拟IP地址的VRRP路由器所属的服务器管理模块为所述主控服务器管理模块。
在一种可能的实现方式中,所述主控服务器管理模块通过所述虚拟IP地址接受管理命令,并执行所述管理命令,以及将执行结果通过所述虚拟IP地址返回。
在一种可能的实现方式中,所述管理策略包括所述服务器管理模块组中的服务器管理模块加入预先设置的组播,所述主控服务器管理模块根据预设周期向所述组播的地址发送心跳信号;当所述备份服务器管理模块超过一个预设周期没有接收到心跳信号时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
在一种可能的实现方式中,所述主控服务器管理模块获取服务器运行状态,并将获取的服务器运行状态写入存储器,以供新的主控服务器管理模块调用。
本发明实施例第二方面提供了一种服务器管理模块组,服务器管理模块组中的服务器管理模块用于根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;其中,所述服务器管理模块组中的一个服务器管理模块用于根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中的其他服务器管理模块作为备份服务器管理模块;当所述主控服务器管理模块失效时,所述备份服务器管理模块用于根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
在一种可能的实现方式中,所述管理策略包括所述服务器管理模块组中一个服务器管理模块通过竞选成为所述主控服务器管理模块。
在一种可能的实现方式中,所述服务器管理模块组预先配置有虚拟IP地址,所述服务器管理模块组中的服务器管理模块均包括VRRP路由器;所述管理策略包括所述服务器管理模块组中服务器管理模块的VRRP路由器竞选占有所述虚拟IP地址;占有了所述虚拟IP地址的VRRP路由器所属的服务器管理模块为所述主控服务器管理模块。
在一种可能的实现方式中,所述主控服务器管理模块用于通过所述虚拟IP地址接受管理命令,并执行所述管理命令,以及将执行结果通过所述虚拟IP地址返回。
在一种可能的实现方式中,所述管理策略包括所述服务器管理模块组中的服务器管理模块加入预先设置的组播,所述主控服务器管理模块用于根据预设周期向所述组播地址发送心跳信号;当所述备份服务器管理模块超过一个预设周期没有接收到心跳信号时,所述备份服务器管理模块用于根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
在一种可能的实现方式中,所述主控服务器管理模块用于获取服务器运行状态,并将获取的服务器运行状态写入存储器,以供新的主控服务器管理模块调用。
本发明实施例第三方面提供了一种服务器,包括第二方面所述的服务器管理模块组。
在一种可能的实现方式中,所述服务器还包括配置模块,用于配置管理策略。
在一种可能的实现方式中,所述服务器还包括抽屉,所述服务器管理模块组设置在所述抽屉中。
本发明实施例具有如下优点:用于管理服务器的服务器管理模块组包括至少两个服务器管理模块,其中一个服务器管理模块可以根据预先设置的管理策略成为主控服务器管理模块,用于管理服务器;当主控服务器管理模块失效时,备份服务器管理模块可以继续管理服务器,从而解决了服务器管理中一旦BMC损坏,导致服务中断或者因无法监控异常情况而服务器损坏的问题。
附图说明
图1为本发明实施例提供的服务管理方法适用的应用架构图。
图2为本发明实施例提供的服务管理模块组工作原理示意图。
具体实施方式
以下由特定的具体实施例说明本发明的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本发明的其他优点及功效。
须知,本说明书所附图式所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容得能涵盖的范围内。同时,本说明书中所引用的如“上”、“下”、“左”、右”、“中间”等的用语,亦仅为便于叙述的明了,而非用以限定本发明可实施的范围,其相对关系的改变或调整,在无实质变更技术内容下,当亦视为本发明可实施的范畴。
本发明实施例提供的服务器管理方法采用了服务器管理模块组,服务器管理模块组可以包括两个或更多个服务器管理模块。服务器管理模块组中的一个服务器管理模块作为主控服务器管理模块,来管理服务器。服务管理模块组中除主控服务器管理模块之外的服务器管理模块作为备份服务器管理模块。在主控服务器管理模块正常工作时,作为备份的服务器管理模块不参与服务器管理;当主控服务器管理模块失效时,例如,发送故障而无法正常工作时,一个备份服务器管理模块开始运行,成为新的主控服务器管理模块,继续管理服务器,从而可以保证服务器的服务不中断;并且服务器的各模块持续处于监控下,避免了因服务器的模块发送故障,不能及时报警,进而无法及时维护服务器,而导致服务器故障。
接下来,对本发明实施例提供的服务器管理方法和服务器管理模块组进行具体说明。
实施例1
本实施例提供了一种服务器管理方法,其应用于服务器管理模块组。
参考图1,服务器管理模块组包括至少两个服务器管理模块。服务器管理模块可以设置在服务器内。服务器管理模块具体可以为BMC。
服务器管理模块包括至少一个处理器,服务器管理的软件系统可以运行于该处理器上,并通过标准的总线接口和服务器内部的被管理模块来进行通讯。处理器安装在载板上,并通过扩展接口和背板相连。背板位于服务器内部,用于连接服务器管理模块和服务器内部的被管理模块,并进行数据和控制信号的传递。被管理模块可以包括风扇、电源、温度传感器、中央处理器等,其通过统一的控制总线接口接收服务器管理模块发出的命令,并返回其状态信息。
在一个示例中,服务器管理模块组可以被安装在一个抽屉里面,以方便从服务器后边抽出,以进行更换和维修。服务器管理模块的处理器模块通过标准的小型双列直插式内存模块(Small Outline Dual In-line Memory Module,SODIMM)接口连接在载板上。载板通过自定义的接口连接在背板上。所有被管理模块都连接在背板上,从而可以和服务器管理模块建立物理通讯的链路。这种硬件架构使得对服务器管理模块的更换和维修变得很容易。
本实施例提供的服务器管理方法,包括:服务器管理模块组中的服务器管理模块根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;
其中,所述服务器管理模块组中的一个服务器管理模块根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中其他服务器管理模块作为备份服务器管理模块;
当所述主控服务器管理模块失效时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
以服务器管理模块组包括两个服务器管理模块为例,在一个服务器管理模块发生故障无法正常工作的时候,另外一个服务器管理模块立刻投入运行,保证服务器始终处于正常的工作状态之下。另外更换损坏的服务器管理模块时,也不会中断服务器的运行。
参考图2,服务器管理终端可以通过局域网访问虚拟IP地址,该虚拟IP地址与服务器管理模块组中的服务器管理模块的IP地址绑定。在建立该虚拟IP的时候,可以把一个服务器管理模块设置为主控服务器管理模块(负责当前服务器的管理),把其余的服务器管理模块设置为备份服务器管理模块(当主控服务器管理模块正常运行时,备份服务器管理模块不工作)。
服务器管理终端可以为数据中心的服务器管理终端,其上可以运行外部用户应用程序,以实现管理人员对服务器的管理。
所述主控服务器管理模块获取服务器运行状态,并将获取的服务器运行状态写入存储器,以供新的主控服务器管理模块调用。
需要说明的是服务器运行状态是对该服务器的被管理模块的运行状态的统称。
所有通过虚拟IP地址的数据都从实际占有了该虚拟地址的主控服务器管理模块的网口进行通讯。在对服务进行管理时,服务器管理终端通过虚拟IP地址,将服务器管理命令发送给主控服务器管理模块,具体为服务器通信接口在接收到管理命令时,通过虚拟路由表,找到主控服务器管理模块,并将命令发送给主控服务器管理模块。主控服务器管理模块执行服务器管理命令,并将执行结果通过虚拟IP地址返回给服务器管理终端。主控服务器管理模块将当前变化的服务器中的被管理模块的运行状态写入存储单元,存储单元为公共的存储单元。公共的存储单元可以为外部公共的永久存储器。
各服务器管理模块对被管理模块进行管理时的被管理模块的状态信息都记录在该公共的存储单元中。主控服务器管理模块和备份服务器管理模块通过心跳协议进行通讯,以判断是否切换主控服务器管理模块和备份服务器管理模块。在发生切换主控服务器管理模块和备份服务器管理模块时,新的主控服务器从该公共的存储单元装载服务器的各被管理模块的运行状态数据,启动服务器管理程序,开始接管服务器的管理,运行信息的监控。
管理策略可以为竞选策略,服务器管理模块组中一个服务器管理模块通过竞选成为所述主控服务器管理模块。
在一个例子中,所述服务器管理模块组预先配置有虚拟IP地址,所述服务器管理模块组中的服务器管理模块均包括虚拟路由冗余协议(Virtual Router RedundancyProtocol,VRRP)路由器;所述管理策略包括所述服务器管理模块组中服务器管理模块的VRRP路由器竞选占有所述虚拟IP地址;占有了所述虚拟IP地址的VRRP路由器所属的服务器管理模块为所述主控服务器管理模块。
所述主控服务器管理模块通过所述虚拟IP地址接受管理命令,并执行所述管理命令,以及将执行结果通过所述虚拟IP地址返回。
当主控服务器管理模块占有了该虚拟IP地址时,所有通过该虚拟IP的数据都从该主控服务器管理模块的网口进行通讯。另外一个或多个没有竞选上的VRRP路由器所属的服务器管理模块成为备份服务器管理模块。
所述管理策略包括所述服务器管理模块组中的服务器管理模块加入预先设置的组播,所述主控服务器管理模块根据预设周期向所述组播的地址发送心跳信号;当所述备份服务器管理模块超过一个预设周期没有接收到心跳信号时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
主控服务器管理模块和备份服务器管理模块可以共同加入一个约定好的组播。启动一次心跳信号同步。首先主控服务器管理模块向组播地址发送一个VRRP协议包。如果备份服务器管理模块能够收到该协议包,就认为主控服务器管理模块能够正常的运行,维持当前的配置,开始下一次的心跳信号同步。如果备份服务器管理模块无法在规定时间(例如超过了约定的发送周期)内收到心跳协议包,就认为主控服务器管理模块无法正常工作。立即启动新的竞选,备份服务器管理模块中的一个服务器管理模块通过竞选成为新的主控服务器管理模块。而先前的主控服务器管理模块变成了备份。新的主控服务器管理模块从外部的永久存储器中装载服务器的运行状态数据,启动服务器管理程序,开始接管服务器的管理,运行信息的监控。
本实施例具有如下优点:用于管理服务器的服务器管理模块组包括至少两个服务器管理模块,其中一个服务器管理模块可以根据预先设置的管理策略成为主控服务器管理模块,用于管理服务器;当主控服务器管理模块失效时,备份服务器管理模块可以继续管理服务器,从而解决了服务器管理中一旦BMC损坏,导致服务中断或者因无法监控异常情况而服务器损坏的问题。
实施例2
本实施例提供了一种服务器管理模块组,服务器管理模块组中的服务器管理模块用于根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;其中,所述服务器管理模块组中的一个服务器管理模块用于根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中的其他服务器管理模块作为备份服务器管理模块;当所述主控服务器管理模块失效时,所述备份服务器管理模块用于根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
在一个示例中,所述管理策略包括所述服务器管理模块组中一个服务器管理模块通过竞选成为所述主控服务器管理模块。
在一个示例中,所述服务器管理模块组预先配置有虚拟IP地址,所述服务器管理模块组中的服务器管理模块均包括VRRP路由器;所述管理策略包括所述服务器管理模块组中服务器管理模块的VRRP路由器竞选占有所述虚拟IP地址;占有了所述虚拟IP地址的VRRP路由器所属的服务器管理模块为所述主控服务器管理模块。
在一个示例中,所述主控服务器管理模块用于通过所述虚拟IP地址接受管理命令,并执行所述管理命令,以及将执行结果通过所述虚拟IP地址返回。
在一个示例中,所述管理策略包括所述服务器管理模块组中的服务器管理模块加入预先设置的组播,所述主控服务器管理模块用于根据预设周期向所述组播地址发送心跳信号;当所述备份服务器管理模块超过一个预设周期没有接收到心跳信号时,所述备份服务器管理模块用于根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
在一个示例中,所述主控服务器管理模块用于获取服务器运行状态,并将获取的服务器运行状态写入存储器,以供新的主控服务器管理模块调用。
本实施例提供的服务器管理模块组可以参照实施例1记载的内容实现,此处不再赘述。
本实施例具有如下优点:用于管理服务器的服务器管理模块组包括至少两个服务器管理模块,其中一个服务器管理模块可以根据预先设置的管理策略成为主控服务器管理模块,用于管理服务器;当主控服务器管理模块失效时,备份服务器管理模块可以继续管理服务器,从而解决了服务器管理中一旦BMC损坏,导致服务中断或者因无法监控异常情况而服务器损坏的问题。
实施例3
本实施例提供了一种服务器,包括实施例2所述的服务器管理模块组。
在一个示例中,所述服务器还抽屉,所述服务器管理模块组设置在所述抽屉中。
本实施例提供的服务器可以参照实施例1记载的内容实现,此处不再赘述。
本实施例具有如下优点:用于管理服务器的服务器管理模块组包括至少两个服务器管理模块,其中一个服务器管理模块可以根据预先设置的管理策略成为主控服务器管理模块,用于管理服务器;当主控服务器管理模块失效时,备份服务器管理模块可以继续管理服务器,从而解决了服务器管理中一旦BMC损坏,导致服务中断或者因无法监控异常情况而服务器损坏的问题。
在本发明的实施例中,处理器可以是一种集成电路芯片,具有信号的处理能力。处理器可以是通用处理器、数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuit,简称ASIC)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。处理器读取存储介质中的信息,结合其硬件完成上述方法的步骤。
存储介质可以是存储器,例如可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
其中,非易失性存储器可以是只读存储器(Read-Only Memory,简称ROM)、可编程只读存储器(Programmable ROM,简称PROM)、可擦除可编程只读存储器(Erasable PROM,简称EPROM)、电可擦除可编程只读存储器(Electrically EPROM,简称EEPROM)或闪存。
易失性存储器可以是随机存取存储器(Random Access Memory,简称RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用,例如静态随机存取存储器(Static RAM,简称SRAM)、动态随机存取存储器(Dynamic RAM,简称DRAM)、同步动态随机存取存储器(Synchronous DRAM,简称SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data RateSDRAM,简称DDRSDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM,简称ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM,简称SLDRAM)和直接内存总线随机存取存储器(DirectRambus RAM,简称DRRAM)。
本发明实施例描述的存储介质旨在包括但不限于这些和任意其它适合类型的存储器。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件与软件组合来实现。当应用软件时,可以将相应功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

Claims (10)

1.一种服务器管理方法,其特征在于,所述方法包括:
服务器管理模块组中的服务器管理模块根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;
其中,所述服务器管理模块组中的一个服务器管理模块根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中其他服务器管理模块作为备份服务器管理模块;
当所述主控服务器管理模块失效时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
2.根据权利要求1所述的方法,其特征在于,所述管理策略包括所述服务器管理模块组中一个服务器管理模块通过竞选成为所述主控服务器管理模块。
3.根据权利要求2所述的方法,其特征在于,所述服务器管理模块组预先配置有虚拟IP地址,所述服务器管理模块组中的服务器管理模块均包括VRRP路由器;
所述管理策略包括所述服务器管理模块组中服务器管理模块的VRRP路由器竞选占有所述虚拟IP地址;
占有了所述虚拟IP地址的VRRP路由器所属的服务器管理模块为所述主控服务器管理模块。
4.根据权利要求3所述的方法,其特征在于,所述主控服务器管理模块通过所述虚拟IP地址接受管理命令,并执行所述管理命令,以及将执行结果通过所述虚拟IP地址返回。
5.根据权利要求1所述的方法,其特征在于,所述管理策略包括所述服务器管理模块组中的服务器管理模块加入预先设置的组播,所述主控服务器管理模块根据预设周期向所述组播的地址发送心跳信号;
当所述备份服务器管理模块超过一个预设周期没有接收到心跳信号时,所述备份服务器管理模块根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
6.根据权利要求1所述的方法,其特征在于,所述主控服务器管理模块获取服务器运行状态,并将获取的服务器运行状态写入存储器,以供新的主控服务器管理模块调用。
7.一种服务器管理模块组,其特征在于,服务器管理模块组中的服务器管理模块用于根据管理策略管理服务器,所述服务器管理模块组中包括至少两个服务器管理模块;所述管理策略为预先配置的策略;
其中,所述服务器管理模块组中的一个服务器管理模块用于根据所述管理策略成为主控服务器管理模块,以管理服务器;所述服务器管理模块组中的其他服务器管理模块作为备份服务器管理模块;
当所述主控服务器管理模块失效时,所述备份服务器管理模块用于根据所述管理策略成为新的主控服务器管理模块,以继续管理服务器。
8.根据权利要求7所述的服务器管理模块组,其特征在于,所述管理策略包括所述服务器管理模块组中一个服务器管理模块通过竞选成为所述主控服务器管理模块。
9.一种服务器,其特征在于,包括权利要求7或8所述的服务器管理模块组。
10.根据权利要求9所述的服务器,其特征在于,所述服务器还包括抽屉,所述服务器管理模块组设置在所述抽屉中。
CN201811467768.4A 2018-12-03 2018-12-03 一种服务器管理方法、服务器管理模块组、服务器 Pending CN109582541A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811467768.4A CN109582541A (zh) 2018-12-03 2018-12-03 一种服务器管理方法、服务器管理模块组、服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811467768.4A CN109582541A (zh) 2018-12-03 2018-12-03 一种服务器管理方法、服务器管理模块组、服务器

Publications (1)

Publication Number Publication Date
CN109582541A true CN109582541A (zh) 2019-04-05

Family

ID=65926572

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811467768.4A Pending CN109582541A (zh) 2018-12-03 2018-12-03 一种服务器管理方法、服务器管理模块组、服务器

Country Status (1)

Country Link
CN (1) CN109582541A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157493A (zh) * 2021-04-09 2021-07-23 广州广电运通智能科技有限公司 基于检票系统的备份方法、装置、系统和计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101635648A (zh) * 2009-08-05 2010-01-27 中兴通讯股份有限公司 一种对虚拟冗余路由协议组进行管理及快速切换的方法
US20100098202A1 (en) * 2008-10-21 2010-04-22 Industrial Technology Research Institute Network connection apparatus and communication system and method applying the same
CN101815007A (zh) * 2010-03-17 2010-08-25 杭州华三通信技术有限公司 一种基于vrrp负载均衡的快速切换方法和设备
CN102591764A (zh) * 2011-12-31 2012-07-18 曙光信息产业股份有限公司 服务器
CN104615506A (zh) * 2015-02-13 2015-05-13 浪潮电子信息产业股份有限公司 一种基于逻辑控制的bios和bmc备份方法
CN104899170A (zh) * 2014-03-07 2015-09-09 中兴通讯股份有限公司 分布式智能平台管理总线ipmb连接方法及atca机框
CN107911291A (zh) * 2017-11-28 2018-04-13 中国移动通信集团湖北有限公司 Vrrp路由器切换方法、路由器、vrrp主备切换系统及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100098202A1 (en) * 2008-10-21 2010-04-22 Industrial Technology Research Institute Network connection apparatus and communication system and method applying the same
CN101635648A (zh) * 2009-08-05 2010-01-27 中兴通讯股份有限公司 一种对虚拟冗余路由协议组进行管理及快速切换的方法
CN101815007A (zh) * 2010-03-17 2010-08-25 杭州华三通信技术有限公司 一种基于vrrp负载均衡的快速切换方法和设备
CN102591764A (zh) * 2011-12-31 2012-07-18 曙光信息产业股份有限公司 服务器
CN104899170A (zh) * 2014-03-07 2015-09-09 中兴通讯股份有限公司 分布式智能平台管理总线ipmb连接方法及atca机框
CN104615506A (zh) * 2015-02-13 2015-05-13 浪潮电子信息产业股份有限公司 一种基于逻辑控制的bios和bmc备份方法
CN107911291A (zh) * 2017-11-28 2018-04-13 中国移动通信集团湖北有限公司 Vrrp路由器切换方法、路由器、vrrp主备切换系统及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113157493A (zh) * 2021-04-09 2021-07-23 广州广电运通智能科技有限公司 基于检票系统的备份方法、装置、系统和计算机设备

Similar Documents

Publication Publication Date Title
US9916113B2 (en) System and method for mirroring data
US11194679B2 (en) Method and apparatus for redundancy in active-active cluster system
CN109408203B (zh) 一种队列消息一致性的实现方法、装置、计算系统
CN104503965A (zh) PostgreSQL高弹性的高可用及负载均衡实现方法
WO2016058307A1 (zh) 资源的故障处理方法及装置
CN103647668A (zh) 一种高可用集群内主机群体决策系统及切换方法
CN101483540A (zh) 一种高端数据通信设备中的主备倒换方法
CN101841408A (zh) 主备路由设备切换方法及路由设备
CN1770707A (zh) 计算机簇中基于法定成员数关无响应服务器的装置和方法
CN110704250B (zh) 一种分布式系统的热备份装置
CN107766181A (zh) 一种基于PCIe非透明桥的双控制器存储高可用子系统
CN111585835B (zh) 一种带外管理系统的控制方法、装置和存储介质
CN116126457A (zh) 容器迁移方法和服务器集群
CN109582541A (zh) 一种服务器管理方法、服务器管理模块组、服务器
WO2009052741A1 (fr) Système de microarchitecture informatique pour les télécommunications et procédé pour sa gestion de fiabilité
WO2024198629A1 (zh) 计算机设备、数据处理器、处理系统及切换方法
CN111262745A (zh) 信息处理平台冗余系统设计
CN110399254A (zh) 一种服务器cmc双机热活方法、系统、终端及存储介质
CN113742142B (zh) 存储系统管理sata硬盘的方法及存储系统
CN109039747A (zh) Dpdk服务的双机热备控制方法及装置
CN107888491A (zh) Hsb备份系统及基于二层组网vrrp协议的ac双机热备方法
CN107423167A (zh) 一种基于双控存储的ISCSI target冗余控制方法和系统
CN102412973A (zh) 一种引擎模块、线卡、通信设备及其优雅重启的方法
WO2012149744A1 (zh) 主备管理软件的切换方法及系统
CN108415797A (zh) 一种避免服务器故障切换时数据库数据丢失的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190405