CN109471770A - 一种系统管理方法和装置 - Google Patents

一种系统管理方法和装置 Download PDF

Info

Publication number
CN109471770A
CN109471770A CN201811057410.4A CN201811057410A CN109471770A CN 109471770 A CN109471770 A CN 109471770A CN 201811057410 A CN201811057410 A CN 201811057410A CN 109471770 A CN109471770 A CN 109471770A
Authority
CN
China
Prior art keywords
bmc
cpld
state information
calculate node
activestandby state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811057410.4A
Other languages
English (en)
Other versions
CN109471770B (zh
Inventor
陈焱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
XFusion Digital Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201811057410.4A priority Critical patent/CN109471770B/zh
Publication of CN109471770A publication Critical patent/CN109471770A/zh
Application granted granted Critical
Publication of CN109471770B publication Critical patent/CN109471770B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请实施例公开了一种系统管理方法,应用于服务器,所述服务器包括复杂可编程逻辑器件CPLD、第一基板管理控制器BMC、第二BMC和第一计算节点,该CPLD存储用于指示该第一BMC作为主BMC以及该第二BMC作为备BMC的第一主备状态信息;该第一BMC和该第二BMC根据该第一主备状态信息管理第一计算节点;该CPLD实时监测该第一BMC和该第二BMC;在该第一BMC发生异常时,该CPLD将该第一主备状态信息更新为第二主备状态信息,该第二主备状态信息用于指示该第一BMC作为备BMC,该第二BMC作为主BMC;该第一BMC和该第二BMC根据该第二主备状态信息管理该第一计算节点。由于,该服务器布置主备BMC,从而实现在主BMC出现异常时,可以即时切换备BMC管理计算节点,解决了BMC的单点故障问题。

Description

一种系统管理方法和装置
技术领域
本申请涉及计算机领域,尤其涉及一种系统管理方法和装置。
背景技术
随着信息技术(information technology,IT)技术的迅猛发展,各类IT系统中的数据量越来越大。例如现在一些应用于企业关键业务的服务器。这些服务器处理的业务处于企业应用中的核心地位,即该服务器处理的数据和信息都是用户核心的商业数据和信息,因此对于业务处理的可靠性要求非常高。而在普通机架服务器系统中,一般由一个基板管理控制器(baseboard management controller,BMC)来管理服务器系统。
目前一些多路服务器具有包含多个计算节点的特性,每个计算节点可单独作为一个系统或者和其他计算节点组合成一个大系统,比如一个4P的计算框按照2P一个计算节点的粒度来划分,可划分成2个系统,按正常一个BMC管理一个系统的约束,计算框需有2个BMC和每个系统一一对应管理。
而在一个系统对应一个BMC的方式中,存在管理单点故障,如果任意一个BMC故障,则会导致与BMC对应的计算节点无法被监控管理。
发明内容
本申请实施例提供了一种系统管理方法和装置,用于解决系统管理中的单点故障问题,并减少硬件布置复杂度。
第一方面,本申请实施例提供一种系统管理方法,具体包括:
该系统管理方法应用于服务器,该服务器包括复杂可编程逻辑器件(complexprogrammable logic device,CPLD)、第一BMC、第二BMC和第一计算节点。其中,该CPLD存储第一主备状态信息,该第一主备状态信息用于指示该第一BMC作为主BMC,该第二BMC作为备BMC;可以理解的是,该主BMC用于访问该服务器的全部硬件信息,该备BMC用于访问该CPLD中存储的该第一主备状态信息;在该第一BMC和该第二BMC运行时,该第一BMC和该第二BMC根据该第一主备状态信息通过该CPLD管理第一计算节点,即该第一BMC可以访问该服务器的全部硬件信息,然后通过该CPLD管理该第一计算节点,而该第二BMC仅可以访问该CPLD中存储的该第一主备状态信息,从而获取自身的备BMC状态信息;在运行过程中,该CPLD实时监测该第一BMC和该第二BMC;在该第一BMC发生异常时,该CPLD将该第一主备状态信息更新为第二主备状态信息,该第二主备状态信息用于指示该第一BMC作为备BMC,该第二BMC作为主BMC;最后该第一BMC和该第二BMC根据该第二主备状态信息通过该CPLD管理该第一计算节点。即该第二BMC作为主BMC访问该服务器的全部硬件信息,然后通过该CPLD管理该第一计算节点,该CPLD控制该第一BMC重启,然后该第一BMC作为备BMC访问该CPLD存储的第二主备状态信息。
可以理解的是,该主备状态信息可以通过该CPLD的主备标记寄存器对外呈现。如该主备标记寄存器将该第一BMC记为1,该第二BMC记为0;在该第一BMC为主BMC时,该主备标记寄存器的槽位标记为1;而在该第一BMC发生异常,将该第二BMC切换为主BMC时,该主备标记寄存器刷新槽位,将该主备标记寄存器的槽位标记为0。具体来说,该第一BMC和该第二MBC通过该CPLD管理该第一计算节点可以如此理解:在该第一BMC为主BMC时,该第二BMC为备BMC时,该第一BMC可以访问该服务器的全部硬件信息,并通过该CPLD监控该第一计算节点的运行情况;该第二BMC访问该CPLD的硬件信息(如指示主备状态信息的主备标记寄存器等),此时该第二BMC并未监控该第一计算节点的运行情况;当该第一BMC发生异常,主备BMC切换后(即该第一BMC为备BMC,该第二BMC为主BMC时)该第二BMC访问该服务器的全部硬件信息,并通过该CPLD监控该第一计算节点的运行情况;该第一BMC在重启之后作为备BMC仅访问该CPLD的硬件信息,此时该第一BMC并未监控该第一计算节点的运行情况。同时,本实施例中,该第一BMC和该第二BMC的数量并不限定,即该服务器中可以包括多种BMC的配置情况,比如一个主BMC,一个或多个备BMC。
本实施例提供的技术方案中,该服务器布置主备BMC,且主备BMC管理相同的计算节点,在主BMC出现异常时,该服务器可以立刻切换至备BMC管理该计算节点,从而保证可以实时监控服务器中的计算节点,解决了BMC的单点故障问题。
可选的,该第一BMC和该第二BMC的配置数据保存在与该第一BMC和该第二BMC分离的存储设备中,且该第一BMC或该第二BMC作为主BMC时,可以通过该CPLD访问该存储设备。这样在主备BMC进行切换或者BMC在线更换之后,运行的BMC可以不丢失配置数据,从而实现快速恢复。其中,该配置数据包括配置参数或者日志等数据。
可选的,根据业务场景的不同,该第一BMC和该第二BMC根据该第一主备状态信息通过该CPLD管理第一计算节点的具体方式不同,具体如下:
一种可能实现方式中,该CPLD模拟第一块传输(Block Transfer,BT)寄存器,该第一BT寄存器与该第一计算节点对应;然后该第一BMC和该第二BMC根据该第一主备状态信息通过访问该第一BT寄存器管理该第一计算节点。
可以理解的是,在该服务器中还可以包括第二计算节点,因此,该CPLD还可以同时模拟第二BT寄存器,其中,该第二BT寄存器与第二计算节点对应;然后,该第一BMC和该第二BMC根据该第一主备状态信息通过访问该第二BT寄存器管理该第二计算节点。这样单个的BMC可以通过该CPLD同时管理多个计算节点。
本实施例提供的技术方案中,该第一BMC和该第二BMC与该CPLD之间可以本地总线(又称LocalBus)相连,而该CPLD与计算节点之间通过CPLD模拟出的(low pin count,LPC)或者增强串行外设接口(enhanced serial peripheral interface,eSPI)等低速总线相连。
另一种可能实现方式中,该第一BMC和该第二BMC通过第一通用串行总线(universalserial bus,USB)接口与该第一计算节点相连,该CPLD通过通用输入/输出(general purpose input output,GPIO)控制第一USB接口的有效性;然后在该第一USB接口有效时,该第一BMC和该第二BMC根据该第一主备状态信息通过该第一USB接口管理该第一计算节点。
可以理解的是,该服务器还可以包括第二计算节点,因此,该第一BMC和该第二BMC可以通过扩展接口设置第二USB接口与该第二计算节点相连;然后该CPLD通过GPIO控制该第一USB和该第二USB的有效性;最后在该CPLD通过该GPIO确定该第二USB有效时,该第一BMC和该第二BMC根据该第一主备状态信息通过该第二USB接口管理该第二计算节点。
可以理解的,当该第一BMC和该第二BMC根据该第二主备状态信息通过该CPLD管理该第二计算节点时,也可以采用上述方案,具体实施方式,此处不再赘述。
本实施例提供的技术方案中,该第一BMC和该第二BMC与该CPLD之间可以通过本地总线(又称LocalBus)相连,该第一BMC和该第二BMC通过USB接口与各计算节点相连;而该CPLD通过GPIO控制该第一BMC和该第二BMC与各计算节点之间USB接口的有效性,从而控制BMC管理多个计算节点。
根据上述方案,在不同业务场景下,该BMC可以实现单个BMC管理多个计算节点,从而避免BMC太多造成的硬件设计和布局问题,减少硬件的整体复杂度。
可选的,该第一BMC和该第二BMC之间可以实现网络通道心跳检测,从而该第一BMC可以确定自身的状态信息和该第二BMC的状态信息;同时该第二BMC也可以确定自身的状态信息和该第一BMC的状态信息。然后,在该第一BMC和该第二BMC出现异常BMC时,该正常BMC发出异常告警,而异常BMC可以被CPLD重启。这样BMC实时确定各自的状态信息,并在出现异常时,迅速进行主备BMC切换,可以有效的保证BMC对计算节点的监控。
第二方面,本申请实施例提供了一种系统管理装置,该系统管理装置包括CPLD、第一BMC和第二BMC。该系统管理装置通过该CPLD、该第一BMC和该第二BMC实现上述第一方面的功能。所述功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。
在一个可能的实现方式中,该系统管理装置包括用于执行以上第一方面各个步骤的单元或模块。例如,该系统管理装置包括:该CPLD,用于存储第一主备状态信息,该第一主备状态信息用于指示该第一BMC作为主BMC,该第二BMC作为备BMC,其中,该主BMC用于访问该服务器的硬件信息,该备BMC用于访问该CPLD的硬件信息;
该第一BMC和该第二BMC,用于根据该第一主备状态信息通过该CPLD管理第一计算节点;
该CPLD,用于实时监测该第一BMC和该第二BMC;在该第一BMC发生异常时,将该第一主备状态信息更新为第二主备状态信息,该第二主备状态信息用于指示该第一BMC作为备BMC,该第二BMC作为主BMC;
该第一BMC和该第二BMC,用于根据该第二主备状态信息通过该CPLD管理该第一计算节点。
可选的,还包括存储设备,用于保存系统管理装置必要的数据。其中,该存储设备与该第一BMC和该第二BMC分离且该第一BMC与该第二BMC可以通过该CPLD访问该存储设备。
在一种可能的实现方式中,该CPLD、该第一BMC和该第二BMC包含在同一个单板中,该单板包括:该CPLD、该第一BMC和该第二BMC;该CPLD,用于存储第一主备状态信息,所述第一主备状态信息用于指示所述第一BMC作为主BMC,所述第二BMC作为备BMC,其中,所述主BMC用于访问服务器的硬件信息,所述备BMC用于访问所述CPLD的主备状态信息;该单板上还包括输入/输出接口、管脚或电路等,将相关信息或指令发送给与此单板耦合的其他芯片或模块中。该CPLD、该第一BMC和该第二BMC可执行存储单元存储的计算机执行指令,以支持系统管理装置执行上述第一方面提供的方法。可选地,所述存储单元可以为所述单板内的存储单元,如寄存器、缓存等,所述存储单元还可以是位于所述单板外部的存储单元,如只读存储器(read-only memory,简称ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,简称RAM)等。可选的,该第一BMC和该第二BMC可以插入包含该CPLD的主板上,即该第一BMC和该第二BMC作为独立的单板,与包含该CPLD的主板进行嵌合。
第三方面,本申请实施例提供一种服务器,该服务器包括该系统管理装置和计算节点,该系统管理装置用于管理该计算节点,并实现上述第一方面的方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机存储介质存储有计算机指令,所述计算机指令用于执行上述第一方面中可能的实施方式所述的方法。
第五方面,本申请实施例提供一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面中任意一方面所述的方法。
第六方面,本申请提供了一种芯片系统,该芯片系统包括处理器,用于支持系统管理装置实现上述方面中所涉及的功能,例如生成或处理上述方法中所涉及的数据和/或信息。在一种可能的设计中,所述芯片系统还包括存储器,所述存储器,用于保存系统管理装置必要的程序指令和数据,以实现上述各方面中任意一方面的功能。该芯片系统可以由芯片构成,也可以包含芯片和其他分立器件。
附图说明
图1为单个BMC管理单个计算节点的结构示意图;
图2为本申请实施例中系统架构示意图;
图3为本申请实施例中系统管理方法的实施例示意图;
图4为本申请实施例中BMC运行流程示意图;
图5为本申请实施例中系统管理装置的一个实施例示意图;
图6为本申请实施例中服务器的一个装置示意图。
具体实施方式
本申请实施例提供了一种系统管理方法和装置,用于解决系统管理中的单点故障问题,并减少硬件布置复杂度。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
随着IT技术的迅猛发展,各类IT系统中的数据量越来越大。例如现在一些应用于企业关键业务的服务器。这些服务器处理的业务处于企业应用中的核心地位,即该服务器处理的数据和信息都是用户核心的商业数据和信息,因此对于业务处理的可靠性要求非常高。而在普通机架服务器系统中,一般由BMC来管理服务器系统。目前服务器大多包含多个计算节点,每个计算节点可单独作为一个系统或者和其他计算节点组合成一个大系统,比如一个4P的计算框按照2P一个计算节点的粒度来划分,可划分成2个系统,按正常一个BMC管理一个系统的约束,计算框需有2个BMC和每个系统一一对应管理,如图1所示,该计算框中包括计算节点1和计算节点2,其中,该计算节点1对应BMC1,该计算节点2对就BMC2。当BMC1出现故障时,该计算节点1则无法进行监控,即BMC会出现单点故障问题。
为了解决这一问题,本申请实施例提供如下技术方案:该系统管理方法应用于服务器,如图2所示,该服务器包括复杂可编程逻辑器件(complex programmable logicdevice,CPLD)、第一BMC和第二BMC以及第一计算节点。其中,该CPLD与该第一BMC和该第二BMC之间可以通过本地总线(比如localbusu总线)相连,该第一BMC和该第二BMC可以通过USB接口或由CPLD模拟的低速总线(比如LPC或者eSPI)相连。其中,该CPLD存储第一主备状态信息,该第一主备状态信息用于指示该第一BMC作为主BMC,该第二BMC作为备BMC;可以理解的是,该主BMC用于访问该服务器的全部硬件信息,该备BMC用于访问该CPLD中的主备状态信息;在该第一BMC和该第二BMC运行时,该第一BMC和该第二BMC分别访问该CPLD中的主备状态信息,然后该第一BMC和该第二BMC根据该第一主备状态信息通过该CPLD管理第一计算节点,即该第一BMC可以访问该服务器的全部硬件信息,然后通过该CPLD管理该第一计算节点,而该第二BMC仅可以访问该CPLD和硬件信息从而获取自身的备BMC状态信息;在运行过程中,该CPLD实时监测该第一BMC和该第二BMC;在该第一BMC发生异常时,该CPLD将该第一主备状态信息更新为第二主备状态信息,该第二主备状态信息用于指示该第一BMC作为备BMC,该第二BMC作为主BMC;最后该第一BMC和该第二BMC根据该第二主备状态信息通过该CPLD管理该第一计算节点。即该第二BMC作为主BMC访问该服务器的全部硬件信息,然后通过该CPLD管理该第一计算节点,该第一BMC重启然后作为备BMC访问该CPLD中的主备状态信息。
具体请参阅图3所示,本申请实施例中系统管理方法的一个实施例包括:
301、该CPLD存储第一主备状态信息,该第一主备状态信息用于指示该第一BMC为主BMC,该第二BMC为备BMC,其中,该主BMC用于访问该服务器的硬件信息,该备BMC用于访问该CPLD中的主备状态信息。
该CPLD通过主备标记寄存器标识该第一主备状态信息,其中,该第一主备状态信息用于指示该第一BMC为主BMC,该第二BMC为备队BMC。在本实施例中,该主BMC用于访问该服务器的全部硬件信息,即该主BMC可以访问服务器构成的计算系统内全部的资源,进而对该第一计算节点进行监控管理;该备BMC可以访问该CPLD中的主备状态信息(即该备BMC访问主备标记寄存器。,即该备BMC可以获知其自身的主备状态信息以及主BMC的状态信息,但其并不能在主BMC正常运行时管理该计算节点。
可以理解的是,该主备状态信息可以通过该CPLD的主备标记寄存器存储,如该主备标记寄存器将该第一BMC记为1,该第二BMC记为0;在该第一BMC为主BMC时,该主备标记寄存器的槽位标记为1;而在该第一BMC发生异常,将该第二BMC切换为主BMC时,该主备标记寄存器刷新槽位,将该主备标记寄存器的槽位标记为0。具体来说,该第一BMC和该第二MBC通过该CPLD管理该第一计算节点可以如此理解:在该第一BMC为主BMC时,该第二BMC为备BMC时,该第一BMC可以访问该服务器的全部硬件信息,并通过该CPLD监控该第一计算节点的运行情况;该第二BMC访问该CPLD中的主备状态信息(如指示主备状态信息的主备标记寄存器等),此时该第二BMC并未监控该第一计算节点的运行情况;当该第一BMC发生异常,主备BMC切换后(即该第一BMC为备BMC,该第二BMC为主BMC时)该第二BMC访问该服务器的全部硬件信息,并通过该CPLD监控该第一计算节点的运行情况;该第第一BMC在重启之后作为备BMC仅访问该CPLD的硬件信息,此时该第一BMC并未监控该第一计算节点的运行情况。同时,本实施例中,该第一BMC和该第二BMC的数量并不限定,即该服务器中可以包括多种BMC的配置情况,比如一个主BMC,一个或多个备BMC;或者,两个主BMC,然后两个BMC各自分别配置一个或多个备BMC等。
可选的,该第一BMC和该第二BMC的配置数据保存在与该第一BMC和该第二BMC分离的存储设备中,且在该第一BMC或该第二BMC作为主BMC时,可以通过该CPLD访问该存储设备。这样在主备BMC进行切换或者BMC在线更换之后,运行的BMC可以不丢失配置数据,从而快速运行。其中,可以理解的是,该第一BMC和该第二BMC的日志数据也可以保存在该存储设备中。
302、该第一BMC和该第二BMC获取该第一主备状态信息。
303、该第一BMC和该第二BMC根据该第一主备状态信息管理该第一计算节点。
该第一BMC和该第二BMC在启动之后,从该CPLD查询第一主备状态信息;然后根据该第一主备状态信息确定该第一BMC为主BMC,该第二BMC为备BMC。然后该第一BMC和该第二BMC根据业务场景不同,分别采用如下几种可能方式管理该第一计算节点:
一种可能实现方式中,该CPLD模拟第一块传输(Block Transfer,BT)寄存器,该第一BT寄存器与该第一计算节点对应;然后该第一BMC和该第二BMC根据该第一主备状态信息通过访问该第一BT寄存器管理该第一计算节点。
可以理解的是,在该服务器中还可以包括第二计算节点,因此,该CPLD还可以同时模拟第二BT寄存器,其中,该第二BT寄存器与第二计算节点对应;然后,该第一BMC和该第二BMC根据该第一主备状态信息通过访问该第二BT寄存器管理该第二计算节点。这样单个的BMC可以通过该CPLD同时管理多个计算节点。
本实施例提供的技术方案中,该第一BMC和该第二BMC与该CPLD之间可以通过本地总线(又称LocalBus)相连,而该CPLD与计算节点之间通过CPLD模拟出的(low pin count,LPC)或者增强串行外设接口(enhanced serial peripheral interface,eSPI)等低速总线相连。
另一种可能实现方式中,该第一BMC和该第二BMC通过第一USB接口与该第一计算节点相连,该CPLD通过GPIO控制第一USB接口的有效性;然后在该第一USB接口有效时,该第一BMC和该第二BMC根据该第一主备状态信息通过该第一USB接口管理该第一计算节点。
可以理解的是,该服务器还可以包括第二计算节点,因此,该第一BMC和该第二BMC可以通过扩展接口设置第二USB接口与该第二计算节点相连;然后该CPLD通过该GPIO控制该第一USB和该第二USB的有效性;最后在该CPLD通过该GPIO确定该第二USB有效时,该第一BMC和该第二BMC根据该第一主备状态信息通过该第二USB接口管理该第二计算节点。
本实施例提供的技术方案中,该第一BMC和该第二BMC与该CPLD之间可以通过本地总线(又称LocalBus)相连,该第一BMC和该第二BMC通过USB接口与各计算节点相连;而该CPLD通过GPIO控制该第一BMC和该第二BMC与各计算节点之间USB接口的有效性,从而控制BMC管理多个计算节点。
根据上述方案,在不同业务场景下,该BMC可以实现单个BMC管理多个计算节点,从而避免BMC太多造成的硬件设计和布局问题,减少硬件的整体复杂度。
304、该CPLD实时获取该第一BMC和该第二BMC的状态信息。
在主备BMC正常运行期间,该CPLD实时获取该第一BMC的状态信息和该第二BMC的状态信息。
本实施例中,该第一BMC和该第二BMC分别对该CPLD进行喂狗,然后CPLD接收该第一BMC和该第二BMC的喂狗信息,若该CPLD确定该第一BMC(即主BMC)出现喂狗超时,则该CPLD确定该第一BMC出现故障;若该CPLD确定该第二BMC(即备BMC)出现喂狗超时,则该CPLD确定该第二BMC出现故障。
305、在该第一BMC的状态信息指示该第一BMC出现故障时,该CPLD将该第一主备状态信息更新为第二主备状态信息,该第二主备状态信息用于指示该第一BMC为备BMC,该第二BMC为主BMC。
该第一BMC的状态信息指示该第一BMC出现故障时,该CPLD将该第一主备状态信息更新为该第二主备状态信息,其中,该第二主备状态信息用于指示该第一BMC为备BMC,该第二BMC为主BMC。
可以理解的是,若该CPLD通过主备标记寄存器指示主备状态信息,则该CPLD在将该第一主备状态信息更新为该第二主备状态信息时更新槽位信息即可;若是该CPLD采用字段的方式指示主备状态信息,则该CPLD需要将该第一主备状态信息进行字段更新,比如删除用于指示该第一主备状态信息的字段,然后写入用于指示该第二主备状态信息的字段。
306、该第一BMC和该第二BMC获取该第二主备状态信息。
307、该第一BMC和该第二BMC根据该第二主备状态信息该第一计算节点。
在该CPLD将该第一主备状态信息更新为该第二主备状态信息之后,该第一BMC和该第二BMC将会重新根据该第二主备状态信息确定自身的主备状态信息,然后通过该CPLD管理该第一计算节点。
可以理解的,该第一BMC和该第二BMC根据业务场景不同,分别采用如下几种可能方式管理该第一计算节点:
一种可能实现方式中,该CPLD模拟第一BT寄存器,该第一BT寄存器与该第一计算节点对应;然后该第一BMC和该第二BMC根据该第二主备状态信息通过访问该第一BT寄存器管理该第一计算节点。
可以理解的是,在该服务器中还可以包括第二计算节点,因此,该CPLD还可以同时模拟第二BT寄存器,其中,该第二BT寄存器与第二计算节点对应;然后,该第一BMC和该第二BMC根据该第二主备状态信息通过访问该第二BT寄存器管理该第二计算节点。这样单个的BMC可以通过该CPLD同时管理多个计算节点。
本实施例提供的技术方案中,该第一BMC和该第二BMC与该CPLD之间可以通过本地总线(又称LocalBus)相连,而该CPLD与计算节点之间通过CPLD模拟出的(low pin count,LPC)或者增强串行外设接口(enhanced serial peripheral interface,eSPI)等低速总线相连。
另一种可能实现方式中,该第一BMC和该第二BMC通过第一USB接口与该第一计算节点相连,该CPLD通过GPIO控制第一USB接口的有效性;然后在该第一USB接口有效时,该第一BMC和该第二BMC根据该第二主备状态信息通过该第一USB接口管理该第一计算节点。
可以理解的是,该服务器还可以包括第二计算节点,因此,该第一BMC和该第二BMC可以通过扩展接口设置第二USB接口与该第二计算节点相连;然后该CPLD通过该GPIO控制该第一USB和该第二USB的有效性;最后在该CPLD通过该GPIO确定该第二USB有效时,该第一BMC和该第二BMC根据该第二主备状态信息通过该第二USB接口管理该第二计算节点。
本实施例提供的技术方案中,该第一BMC和该第二BMC与该CPLD之间可以通过本地总线(又称LocalBus)相连,该第一BMC和该第二BMC通过USB接口与各计算节点相连;而该CPLD通过GPIO控制该第一BMC和该第二BMC与各计算节点之间USB接口的有效性,从而控制BMC管理多个计算节点。
根据上述方案,在不同业务场景下,该BMC可以实现单个BMC管理多个计算节点,从而避免BMC太多造成的硬件设计和布局问题,减少硬件的整体复杂度。
基于上述技术方案,该第一BMC或该第二BMC在启动时还可以执行如下流程,具体如图4所示:
首先,BMC启动;然后该BMC查询该CPLD中存储的主备状态信息确定自身是否为主BMC;若该BMC识别出自身为主BMC,则该BMC设置自身主备状态信息为主BMC状态,然后访问服务器内部的全部硬件信息,然后正常运行;若该BMC识别出自身为备BMC,则该BMC设置自身主备状态信息为备BMC状态,然后正常运行。
而在该BMC对其自身的主备状态进行识别时,具体方式如下:该BMC查询到该CPLD中的主备状态信息之后判断该CPLD存储的主备状态信息与该BMC自身存储的主备状态信息进行比对;若该CPLD存储的主备状态信息与该BMC自身存储的主备状态信息一致,则该BMC可以正常运行;若该CPLD存储的主备状态信息与该BMC自身存储的主备状态信息不一致,则该BMC判断该CPLD存储的主备状态信息指示该BMC是主BMC还是备BMC;若该CPLD存储的主备状态信息指示该BMC为主BMC,则该BMC刷新自身所存储的主备状态信息,然后访问该服务器的全部硬件信息;若该CPLD存储的主备状态信息指示该BMC为备BMC,则该BMC刷新自身所存储的主备状态信息,然后不主动访问该服务器的硬件信息。
本实施例中,该服务器布置主备BMC,且主备BMC管理相同的计算节点,在主BMC出现异常时,该服务器可以立刻切换至备BMC管理该计算节点,从而保证可以实时监控服务器中的计算节点,解决了BMC的单点故障问题。同时通过CPLD实现在不同业务场景下,单个BMC管理多个计算节点,从而避免BMC太多造成的硬件设计和布局问题,减少硬件的整体复杂度。
上面对本申请实施例中的系统管理方法进行了描述,下面对本申请实施例中系统管理装置进行描述。
具体请参阅图5所示,本申请实施例中该系统管理装置500包括:CPLD501、第一BMC502和第二BMC503。系统管理装置500可以用于实现上述方法实施例中的部分或全部功能。
例如,该CPLD501,用于存储第一主备状态信息,该第一主备状态信息用于指示该第一BMC502作为主BMC,该第二BMC503作为备BMC,其中,该主BMC用于访问该服务器的硬件信息,该备BMC用于访问该CPLD的中的主备状态信息;
该第一BMC502和该第二BMC503,用于根据该第一主备状态信息通过该CPLD501管理第一计算节点;
该CPLD501,用于实时监测该第一BMC502和该第二BMC503;在该第一BMC502发生异常时,将该第一主备状态信息更新为第二主备状态信息,该第二主备状态信息用于指示该第一BMC502作为备BMC,该第二BMC503作为主BMC;
该第一BMC502和该第二BMC503,用于根据该第二主备状态信息通过该CPLD管理该第一计算节点。
可选的,该系统管理装置500还可以包括:存储设备504,用于存储该第一BMC502和该第二BMC 503的配置数据,其中,该存储设备504与该第一BMC502和该第二BMC503分离,且该第一BMC502和该第二BMC503均可以通过该CPLD501访问该存储设备504。
应理解,上述图5对应实施例中各模块之间所执行的流程与前述图3至图4中对应方法实施例中的流程类似,具体此处不再赘述。
上述涉及的计算机可读存储介质/存储设备504还可以保存有操作系统和其他应用程序。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,上述存储器可以是只读存储器(read-only memory,ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory,RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器等等。存储设备504可以是上述存储类型的组合。并且上述计算机可读存储介质/存储器可以在处理器中,还可以在处理器的外部,或在包括处理器或处理电路的多个实体上分布。上述计算机可读存储介质/存储器可以具体体现在计算机程序产品中。举例而言,计算机程序产品可以包括封装材料中的计算机可读介质。
可以替换的,本申请实施例还提供一种通用处理系统,例如通称为芯片,该通用处理系统包括:提供处理器功能的一个或多个微处理器;以及提供存储介质的至少一部分的外部存储器,所有这些都通过外部总线体系结构与其它支持电路连接在一起。当存储器存储的指令被处理器执行时,使得系统管理装置执行上述该实施例中的系统管理方法中的部分或全部步骤,和/或用于本申请所描述的技术的其它过程。
结合本申请公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于用户设备中。当然,处理器和存储介质也可以作为分立组件存在于用户设备中。
具体请参阅图6所示,本申请实施例中服务器600包括该系统管理装置500和计算节点700,其中,该系统管理装置500实现上述实施例中的部分或全部功能,该计算节点700用于处理相应的业务或数据。可以理解的是,该计算节点700的数目为一个或多个,具体此处不做限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,该单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (17)

1.一种系统管理方法,应用于服务器,所述服务器包括复杂可编程逻辑器件CPLD、第一基板管理控制器BMC、第二BMC和第一计算节点,其特征在于,包括:
所述CPLD存储第一主备状态信息,所述第一主备状态信息用于指示所述第一BMC作为主BMC,所述第二BMC作为备BMC,其中,所述主BMC用于访问服务器的硬件信息,所述备BMC用于访问所述CPLD中的主备状态信息;
所述第一BMC和所述第二BMC根据所述第一主备状态信息通过所述CPLD管理第一计算节点;
所述CPLD实时监测所述第一BMC和所述第二BMC;
在所述第一BMC发生异常时,所述CPLD将所述第一主备状态信息更新为第二主备状态信息,所述第二主备状态信息用于指示所述第一BMC作为备BMC,所述第二BMC作为主BMC;
所述第一BMC和所述第二BMC根据所述第二主备状态信息通过所述CPLD管理所述第一计算节点。
2.根据权利要求1所述的方法,其特征在于,所述第一BMC和所述第二BMC的配置数据保存在存储设备,所述存储设备与所述第一BMC和所述第二BMC分离,且当所述第一BMC或所述第二BMC作为主BMC时,可通过所述CPLD访问所述存储设备。
3.根据权利要求1或2所述的方法,其特征在于,所述第一BMC和所述第二BMC根据所述第一主备状态信息通过所述CPLD管理第一计算节点包括:
所述CPLD模拟第一块传输BT寄存器,所述第一BT寄存器与所述第一计算节点对应;
所述第一BMC和所述第二BMC根据所述第一主备状态信息通过访问所述第一BT寄存器管理所述第一计算节点。
4.根据权利要求3所述的方法,其特征在于,在所述服务器计算系统包括至少两个计算节点时,所述方法还包括:
所述CPLD模拟第二BT寄存器,所述第二BT寄存器与第二计算节点对应;
所述第一BMC和所述第二BMC根据所述第一主备状态信息通过访问所述第二BT寄存器管理所述第二计算节点。
5.根据权利要求1或2所述的方法,其特征在于所述第一BMC和所述第二BMC根据所述第一主备状态信息通过所述CPLD管理第一计算节点包括:
所述CPLD通过通用输入/输出GPIO控制第一通用串行总线USB接口,所述第一USB接口与所述第一计算节点对应;
在所述第一USB接口有效时,所述第一BMC和所述第二BMC根据所述第一主备状态信息通过所述第一USB接口管理所述第一计算节点。
6.根据权利要求5所述的方法,其特征在于,在所述服务器计算系统包括至少两个计算节点时,所述方法还包括:
所述CPLD通过GPIO控制第二USB接口,所述第二USB接口与第二计算节点对应;
在所述第二USB接口有效时,所述第一BMC和所述第二BMC根据所述第一主备状态信息通过所述第二USB接口管理所述第二计算节点。
7.根据权利要求1至6中任一项所述的方法,其特征在于,所述方法还包括:
所述第一BMC与所述第二BMC之间实现网络通道心跳检测;
当所述第一BMC与所述第二BMC中存在异常BMC时,所述CPLD控制所述异常BMC重启。
8.一种系统管理装置,其特征在于,包括:
CPLD、第一BMC和第二BMC;
所述CPLD,用于存储第一主备状态信息,所述第一主备状态信息用于指示所述第一BMC作为主BMC,所述第二BMC作为备BMC,其中,所述主BMC用于访问所述服务器的硬件信息,所述备BMC用于访问所述CPLD中的主备状态信息;
所述第一BMC和所述第二BMC,用于根据所述第一主备状态信息通过所述CPLD管理第一计算节点;
所述CPLD,用于实时监测所述第一BMC和所述第二BMC;在所述第一BMC发生异常时,将所述第一主备状态信息更新为第二主备状态信息,所述第二主备状态信息用于指示所述第一BMC作为备BMC,所述第二BMC作为主BMC;
所述第一BMC和所述第二BMC,用于根据所述第二主备状态信息通过所述CPLD管理所述第一计算节点。
9.根据权利要求8所述的系统管理装置,其特征在于,所述系统管理装置还包括存储设备,用于存储所述第一BMC和所述第二BMC的配置数据,所述存储设备与所述第一BMC和所述第二BMC分离,且所述第一BMC或所述第二BMC作为主BMC时,可通过所述CPLD访问所述存储设备。
10.根据权利要求8或9所述的系统管理装置,其特征在于,所述CPLD,具体用于模拟第一BT寄存器,所述第一BT寄存器与所述第一计算节点对应;
所述第一BMC和所述第二BMC,具体用于根据所述第一主备状态信息通过访问所述第一BT寄存器管理所述第一计算节点。
11.根据权利要求10所述的系统管理装置,其特征在于,所述CPLD,还用于模拟第二BT寄存器,所述第二BT寄存器与第二计算节点对应;
所述第一BMC和所述第二BMC,还用于根据所述第一主备状态信息通过访问所述第二BT寄存器管理所述第二计算节点。
12.根据权利要求8或9所述的系统管理装置,其特征在于,所述CPLD,具体用于通过GPIO控制第一通用串行总线USB接口,所述第一USB接口与所述第一计算节点对应;
在所述第一USB接口有效时,所述第一BMC和所述第二BMC,具体用于根据所述第一主备状态信息通过所述第一USB接口管理所述第一计算节点。
13.根据权利要求12所述的系统管理装置,其特征在于,所述CPLD,还用于通过GPIO控制第二USB接口,所述第二USB接口与第二计算节点对应;
在所述第二USB接口有效时,所述第一BMC和所述第二BMC,还用于根据所述第一主备状态信息通过所述第二USB接口管理所述第二计算节点。
14.根据权利要求8至13中任一项所述的系统管理装置,其特征在于,所述第一BMC与所述第二BMC之间实现网络通道心跳检测;
当所述第一BMC与所述第二BMC中存在异常BMC时,所述CPLD,还用于控制所述异常BMC重启。
15.一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,所述计算机执行上述权利要求1至权利要求7所述的方法。
16.一种包含指令的计算机程序产品,当所述计算机程序产品在计算机上运行时,所述计算机执行上述权利要求1至权利要求7所述的方法。
17.一种服务器,其特征在于,包括权利要求8至14所述的系统管理装置和计算节点,用于执行上述权利要求1至权利要求7所述的方法。
CN201811057410.4A 2018-09-11 2018-09-11 一种系统管理方法和装置 Active CN109471770B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811057410.4A CN109471770B (zh) 2018-09-11 2018-09-11 一种系统管理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811057410.4A CN109471770B (zh) 2018-09-11 2018-09-11 一种系统管理方法和装置

Publications (2)

Publication Number Publication Date
CN109471770A true CN109471770A (zh) 2019-03-15
CN109471770B CN109471770B (zh) 2021-09-03

Family

ID=65664241

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811057410.4A Active CN109471770B (zh) 2018-09-11 2018-09-11 一种系统管理方法和装置

Country Status (1)

Country Link
CN (1) CN109471770B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109776A (zh) * 2019-05-21 2019-08-09 无锡华云数据技术服务有限公司 一种节点处理方法、装置及电子设备
CN110908953A (zh) * 2019-11-25 2020-03-24 山东超越数控电子股份有限公司 一种处理器互连系统及方法
CN111045866A (zh) * 2019-12-06 2020-04-21 锐捷网络股份有限公司 一种bmc故障处理方法、装置、电子设备及存储介质
CN111740864A (zh) * 2020-06-19 2020-10-02 苏州浪潮智能科技有限公司 一种带外网口切换管理方法及系统
CN111800298A (zh) * 2020-07-08 2020-10-20 苏州浪潮智能科技有限公司 一种网络节点的管理方法、装置、设备及可读介质
CN111984471A (zh) * 2020-08-14 2020-11-24 苏州浪潮智能科技有限公司 一种机柜电源bmc冗余管理系统及方法
CN112380083A (zh) * 2020-10-23 2021-02-19 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和系统
CN113032026A (zh) * 2021-03-19 2021-06-25 山东英信计算机技术有限公司 一种服务器主板的固件管理方法、装置、设备及介质
CN113835770A (zh) * 2021-11-30 2021-12-24 四川华鲲振宇智能科技有限责任公司 一种服务器管理模块在线更换方法及系统
CN113872796A (zh) * 2021-08-26 2021-12-31 浪潮电子信息产业股份有限公司 服务器及其节点设备信息获取方法、装置、设备、介质
CN113868161A (zh) * 2021-09-29 2021-12-31 苏州浪潮智能科技有限公司 一种基于i3c的设备管理方法、装置、设备及可读介质
CN113886307A (zh) * 2021-09-30 2022-01-04 阿里巴巴(中国)有限公司 Bmc模块、服务器主板、bmc模块的热维护方法及系统
CN115529261A (zh) * 2022-08-31 2022-12-27 苏州浪潮智能科技有限公司 一种多bmc的通信方法、装置、设备和存储介质
WO2024082870A1 (zh) * 2022-10-21 2024-04-25 超聚变数字技术有限公司 一种计算设备及数据获取方法

Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567889A (zh) * 2003-06-25 2005-01-19 华为技术有限公司 一种主备设备自动切换的方法
CN1783803A (zh) * 2004-12-03 2006-06-07 华为技术有限公司 一种在主备倒换中处理介质访问控制地址的方法
US7526568B1 (en) * 2004-02-20 2009-04-28 Broadcast Pix, Inc. Integrated live video production system
CN102340517A (zh) * 2010-07-15 2012-02-01 英业达股份有限公司 一种具有多主机板的服务器系统
CN103077151A (zh) * 2013-01-25 2013-05-01 上海斐讯数据通信技术有限公司 一种用于切换usb接口和标准串口的装置
CN103378902A (zh) * 2013-06-19 2013-10-30 上海斐讯数据通信技术有限公司 光线路终端系统的主备切换方法及光线路终端系统
CN103473152A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种刀片服务器主备管理模块备份及更新方法
CN104468210A (zh) * 2014-12-01 2015-03-25 国家计算机网络与信息安全管理中心 一种快速主备倒换控制方法
CN104516751A (zh) * 2013-09-29 2015-04-15 英业达科技有限公司 服务器系统
CN105224045A (zh) * 2015-11-18 2016-01-06 英业达科技有限公司 刀片式服务器
CN105488004A (zh) * 2015-11-27 2016-04-13 山东超越数控电子有限公司 一种服务器开关机状态下的i2c线路复用控制逻辑方法
CN106487941A (zh) * 2015-08-31 2017-03-08 北京华为数字技术有限公司 一种配置介质访问控制地址的方法和设备
CN206610287U (zh) * 2017-02-22 2017-11-03 郑州云海信息技术有限公司 一种基于时序控制的lpc主从切换控制系统
CN107835089A (zh) * 2017-09-28 2018-03-23 华为技术有限公司 管理资源的方法和装置
CN107908582A (zh) * 2017-11-06 2018-04-13 杭州宏杉科技股份有限公司 串口切换装置和存储设备
CN107943623A (zh) * 2017-12-13 2018-04-20 郑州云海信息技术有限公司 一种存储系统
CN108021518A (zh) * 2017-11-17 2018-05-11 华为技术有限公司 一种数据交互方法和计算设备

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1567889A (zh) * 2003-06-25 2005-01-19 华为技术有限公司 一种主备设备自动切换的方法
US7526568B1 (en) * 2004-02-20 2009-04-28 Broadcast Pix, Inc. Integrated live video production system
CN1783803A (zh) * 2004-12-03 2006-06-07 华为技术有限公司 一种在主备倒换中处理介质访问控制地址的方法
CN102340517A (zh) * 2010-07-15 2012-02-01 英业达股份有限公司 一种具有多主机板的服务器系统
CN103077151A (zh) * 2013-01-25 2013-05-01 上海斐讯数据通信技术有限公司 一种用于切换usb接口和标准串口的装置
CN103378902A (zh) * 2013-06-19 2013-10-30 上海斐讯数据通信技术有限公司 光线路终端系统的主备切换方法及光线路终端系统
CN103473152A (zh) * 2013-09-25 2013-12-25 浪潮电子信息产业股份有限公司 一种刀片服务器主备管理模块备份及更新方法
CN104516751A (zh) * 2013-09-29 2015-04-15 英业达科技有限公司 服务器系统
CN104468210A (zh) * 2014-12-01 2015-03-25 国家计算机网络与信息安全管理中心 一种快速主备倒换控制方法
CN106487941A (zh) * 2015-08-31 2017-03-08 北京华为数字技术有限公司 一种配置介质访问控制地址的方法和设备
CN105224045A (zh) * 2015-11-18 2016-01-06 英业达科技有限公司 刀片式服务器
CN105488004A (zh) * 2015-11-27 2016-04-13 山东超越数控电子有限公司 一种服务器开关机状态下的i2c线路复用控制逻辑方法
CN206610287U (zh) * 2017-02-22 2017-11-03 郑州云海信息技术有限公司 一种基于时序控制的lpc主从切换控制系统
CN107835089A (zh) * 2017-09-28 2018-03-23 华为技术有限公司 管理资源的方法和装置
CN107908582A (zh) * 2017-11-06 2018-04-13 杭州宏杉科技股份有限公司 串口切换装置和存储设备
CN108021518A (zh) * 2017-11-17 2018-05-11 华为技术有限公司 一种数据交互方法和计算设备
CN107943623A (zh) * 2017-12-13 2018-04-20 郑州云海信息技术有限公司 一种存储系统

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109776A (zh) * 2019-05-21 2019-08-09 无锡华云数据技术服务有限公司 一种节点处理方法、装置及电子设备
CN110908953A (zh) * 2019-11-25 2020-03-24 山东超越数控电子股份有限公司 一种处理器互连系统及方法
CN111045866A (zh) * 2019-12-06 2020-04-21 锐捷网络股份有限公司 一种bmc故障处理方法、装置、电子设备及存储介质
CN111045866B (zh) * 2019-12-06 2023-06-16 锐捷网络股份有限公司 一种bmc故障处理方法、装置、电子设备及存储介质
CN111740864A (zh) * 2020-06-19 2020-10-02 苏州浪潮智能科技有限公司 一种带外网口切换管理方法及系统
CN111800298A (zh) * 2020-07-08 2020-10-20 苏州浪潮智能科技有限公司 一种网络节点的管理方法、装置、设备及可读介质
CN111800298B (zh) * 2020-07-08 2022-12-16 苏州浪潮智能科技有限公司 一种网络节点的管理方法、装置、设备及可读介质
CN111984471A (zh) * 2020-08-14 2020-11-24 苏州浪潮智能科技有限公司 一种机柜电源bmc冗余管理系统及方法
CN111984471B (zh) * 2020-08-14 2022-11-25 苏州浪潮智能科技有限公司 一种机柜电源bmc冗余管理系统及方法
CN112380083A (zh) * 2020-10-23 2021-02-19 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和系统
CN112380083B (zh) * 2020-10-23 2023-01-06 浪潮电子信息产业股份有限公司 一种bmc主备切换稳定性测试方法和系统
CN113032026A (zh) * 2021-03-19 2021-06-25 山东英信计算机技术有限公司 一种服务器主板的固件管理方法、装置、设备及介质
CN113872796A (zh) * 2021-08-26 2021-12-31 浪潮电子信息产业股份有限公司 服务器及其节点设备信息获取方法、装置、设备、介质
CN113872796B (zh) * 2021-08-26 2024-04-23 浪潮电子信息产业股份有限公司 服务器及其节点设备信息获取方法、装置、设备、介质
CN113868161A (zh) * 2021-09-29 2021-12-31 苏州浪潮智能科技有限公司 一种基于i3c的设备管理方法、装置、设备及可读介质
CN113868161B (zh) * 2021-09-29 2023-08-25 苏州浪潮智能科技有限公司 一种基于i3c的设备管理方法、装置、设备及可读介质
CN113886307A (zh) * 2021-09-30 2022-01-04 阿里巴巴(中国)有限公司 Bmc模块、服务器主板、bmc模块的热维护方法及系统
CN113835770B (zh) * 2021-11-30 2022-02-18 四川华鲲振宇智能科技有限责任公司 一种服务器管理模块在线更换方法及系统
CN113835770A (zh) * 2021-11-30 2021-12-24 四川华鲲振宇智能科技有限责任公司 一种服务器管理模块在线更换方法及系统
CN115529261A (zh) * 2022-08-31 2022-12-27 苏州浪潮智能科技有限公司 一种多bmc的通信方法、装置、设备和存储介质
WO2024082870A1 (zh) * 2022-10-21 2024-04-25 超聚变数字技术有限公司 一种计算设备及数据获取方法

Also Published As

Publication number Publication date
CN109471770B (zh) 2021-09-03

Similar Documents

Publication Publication Date Title
CN109471770A (zh) 一种系统管理方法和装置
CN104750658B (zh) 辅助式一致共享存储器
US20240143204A1 (en) Techniques for implementing fault domain sets
CN102103518B (zh) 一种在虚拟化环境中管理资源的系统及其实现方法
US8732282B1 (en) Model framework to facilitate robust programming of distributed workflows
US11048538B2 (en) Autonomous cell-based control plane for scalable virtualized computing
CN107181679A (zh) 一种端口绑定实现方法及装置
JP2003131900A (ja) サーバシステム運用管理方式
US10942824B2 (en) Programming model and framework for providing resilient parallel tasks
US8612973B2 (en) Method and system for handling interrupts within computer system during hardware resource migration
CN102597963B (zh) 集群中的动态副本卷交换
CN103649923B (zh) 一种numa系统内存镜像配置方法、解除方法、系统和主节点
CN104424122B (zh) 一种电子设备及内存划分方法
JP2004145885A (ja) 遠隔コンピュータへのオペレーションの分散方法、装置、及び記憶媒体
WO2008078281A2 (en) Distributed platform management for high availability systems
CN114580344A (zh) 测试激励生成方法、验证方法、验证系统及相关设备
CN112463239A (zh) Bios与bmc交互选项默认值修改方法、系统、终端及存储介质
JP2013508839A5 (zh)
WO2021004256A1 (zh) 一种节点故障时进行节点切换的方法及相关设备
CN112162852A (zh) 一种多架构cpu节点的管理方法、装置及相关组件
CN111506331A (zh) 一种服务器bmc刷新方法、系统、终端及存储介质
CN110908644B (zh) 状态节点的配置方法、装置、计算机设备和存储介质
CN105103139B (zh) 用于改善跨越相干总线的信号量管理序列的性能的方法和设备
CN115470303B (zh) 一种数据库访问方法、装置、系统、设备及可读存储介质
CN114371939A (zh) 任务处理方法、装置、电子设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20211222

Address after: 450046 Floor 9, building 1, Zhengshang Boya Plaza, Longzihu wisdom Island, Zhengdong New Area, Zhengzhou City, Henan Province

Patentee after: Super fusion Digital Technology Co.,Ltd.

Address before: 518129 Bantian HUAWEI headquarters office building, Longgang District, Guangdong, Shenzhen

Patentee before: HUAWEI TECHNOLOGIES Co.,Ltd.