CN116820827A - 一种节点服务器的基板管理控制器的控制方法及其系统 - Google Patents

一种节点服务器的基板管理控制器的控制方法及其系统 Download PDF

Info

Publication number
CN116820827A
CN116820827A CN202311087332.3A CN202311087332A CN116820827A CN 116820827 A CN116820827 A CN 116820827A CN 202311087332 A CN202311087332 A CN 202311087332A CN 116820827 A CN116820827 A CN 116820827A
Authority
CN
China
Prior art keywords
management controller
baseboard management
network card
signal
programmable logic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311087332.3A
Other languages
English (en)
Other versions
CN116820827B (zh
Inventor
程子强
田东顺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202311087332.3A priority Critical patent/CN116820827B/zh
Publication of CN116820827A publication Critical patent/CN116820827A/zh
Application granted granted Critical
Publication of CN116820827B publication Critical patent/CN116820827B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/076Error or fault detection not based on redundancy by exceeding limits by exceeding a count or rate limit, e.g. word- or bit count limit
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种节点服务器的基板管理控制器的控制方法、系统和复杂可编程逻辑器件,包括:检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器;当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。上述方法,能够自动检测出节点服务器的基板管理控制器出现问题时,重启基板控制管理器,并且通过接收远程发送的远程复位信号,以在基板管理控制器发生故障时通过远程重启基板管理控制器,使得基板管理控制器正常工作。

Description

一种节点服务器的基板管理控制器的控制方法及其系统
技术领域
本申请涉及数字芯片技术领域,特别是涉及一种节点服务器的基板管理控制器的控制方法、系统和复杂可编程逻辑器件。
背景技术
服务器集群一般使用 BMC (Baseboard Management Controller,基板管理控制器)指令进行大规模无人值守操作,包括服务器的远程管理、监控、安装、重启等。作为服务器的核心管理组件,基板管理控制器的工作状态直接影响服务器的工作稳定及后台运维动作,如果节点服务器的基板管理控制器出现故障,大多运维都是远程操作。
因此,需要一种稳定可靠的远程重启节点服务器的基板管理控制器的措施,确保能在基板管理控制器发生故障时通过远程重启基板管理控制器以使得基板管理控制器正常工作。
发明内容
基于此,有必要针对上述技术问题,提供一种节点服务器的基板管理控制器的控制方法、系统和复杂可编程逻辑器件,能够自动检测出节点服务器的基板管理控制器出现问题时,重启基板控制管理器,并且通过接收远程发送的远程复位信号,以在基板管理控制器发生故障时通过远程重启基板管理控制器,使得基板管理控制器正常工作。
一种节点服务器的基板管理控制器的控制方法,控制方法应用于复杂可编程逻辑器件,复杂可编程逻辑器件与基板管理控制器连接,复杂可编程逻辑器件还与网卡连接,包括:检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器;当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。
在其中一个实施例中,一种节点服务器的基板管理控制器的控制方法还包括:若检测到看门狗定时器发出的信号为持续的低电平信号或高电平信号,则确定检测出看门狗定时器发出的信号为非方波信号。
在其中一个实施例中,重启基板管理控制器,包括:向基板管理控制器的外部复位管脚发送低电平信号,以使得基板管理控制器进行重启。
在其中一个实施例中,向基板管理控制器的外部复位管脚发送低电平信号,以使得基板管理控制器进行重启,包括:在设定时间段内向基板管理控制器的外部复位管脚持续性发送低电平信号,以使得基板管理控制器在设定时间段内检测到持续性的低电平信号时进行重启。
在其中一个实施例中,复杂可编程逻辑器件与网卡的预留管脚通信连接,网卡通过预留管脚向复杂可编程逻辑器件发送远程复位信号。
在其中一个实施例中,网卡通过预留管脚向复杂可编程逻辑器件发送脉冲信号,脉冲信号中的低电平信号为远程复位信号。
在其中一个实施例中,一种节点服务器的基板管理控制器的控制方法还包括:接收网卡发送的脉冲信号,对脉冲信号进行滤波处理,得到脉冲信号中的低电平信号。
在其中一个实施例中,一种节点服务器的基板管理控制器的控制方法还包括:若检测出看门狗定时器发出的信号为非方波信号,将基板管理控制器的状态标志位设置为第一标识;若检测出看门狗定时器发出的信号为方波信号,将基板管理控制器的状态标志位设置为第二标识;当识别到基板管理控制器的状态标志位为第一标识时,确定基板管理控制器需要重启;当识别到基板管理控制器的状态标志位为第二标识时,确定基板管理控制器不需要重启。
在其中一个实施例中,网卡还通过PCIE总线与节点服务器的处理器连接,节点服务器的处理器通过PCIE总线与基板管理控制器连接;网卡通过节点服务器的处理器执行IPMI指令,以对基板管理控制器进行重启。
在其中一个实施例中,基板管理控制器为多个,网卡为多个,复杂可编程逻辑器件分别与各基板管理控制器连接,复杂可编程逻辑器件还分别与各网卡连接;若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器,包括:若检测出任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启任一基板管理控制器;当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器,包括:当接收到任一网卡发送的远程复位信号时,识别出远程复位信号对应的基板管理控制器,识别对应的基板管理控制器是否需要重启,若是,重启对应的基板管理控制器。
一种复杂可编程逻辑器件,复杂可编程逻辑器件与节点服务器的基板管理控制器连接,复杂可编程逻辑器件还与网卡连接,其中,复杂可编程逻辑器件中设置有存储单元、处理单元及存储在存储单元上并可在处理单元上运行的计算机程序,处理单元执行计算机程序时实现上述任一项方法的步骤。
一种节点服务器的基板管理控制器的控制系统,控制系统包括复杂可编程逻辑器件以及网卡,网卡与复杂可编程逻辑器件连接,复杂可编程逻辑器件还与基板管理控制器连接;其中,复杂可编程逻辑器件检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器;复杂可编程逻辑器件接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。
在其中一个实施例中,网卡还与节点服务器的处理器连接,网卡的全部PCIE链路均连接到节点服务器的处理器的PCIE端口,节点服务器的处理器通过PCIE总线与基板管理控制器连接;网卡通过节点服务器的处理器执行IPMI指令,以对基板管理控制器进行重启。
在其中一个实施例中,网卡的金手指与节点服务器的PCIE端口连接,节点服务器的PCIE总线连接到节点服务器的处理器的PCIE端口。
在其中一个实施例中,网卡通过网卡的预留管脚向复杂可编程逻辑器件发出金手指的边带信号,金手指的边带信号作为远程复位信号。
在其中一个实施例中,网卡为多通路网卡,网卡为多个,各网卡分别与复杂可编程逻辑器件连接,各网卡还与多个基板管理控制器连接,复杂可编程逻辑器件分别与各基板管理控制器连接;复杂可编程逻辑器件检测到任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启任一基板管理控制器;复杂可编程逻辑器件接收到任一网卡发送的远程复位信号时,识别出远程复位信号对应的基板管理控制器,识别对应的基板管理控制器是否需要重启,若是,重启对应的基板管理控制器。
在其中一个实施例中,各网卡的金手指均插到转接板的PCIE端口,转接板转通过线缆将PCIE总线拆分为多个PCIE线路并通过各PCIE线路与各节点服务器的处理器的PCIE端口连接,各节点服务器的处理器通过PCIE总线与对应的基板管理控制器连接。
在其中一个实施例中,网卡为两个,两个网卡的金手指均插到转接板的PCIE端口,转接板转通过线缆将每个网卡的PCIE X16总线拆分为2个PCIE X8线路,各PCIE X8线路分别与一个节点服务器的处理器的PCIE端口连接。
在其中一个实施例中,任一网卡通过任一网卡的预留管脚向复杂可编程逻辑器件发出任一网卡的金手指的边带信号,任一网卡的金手指的边带信号作为任一网卡发出的远程复位信号。
在其中一个实施例中,控制系统还包括管理交换机,管理交换机与网卡连接,管理交换机用于控制网卡发出远程复位信号。
上述一种节点服务器的基板管理控制器的控制方法、系统和复杂可编程逻辑器件,复杂可编程逻辑器件与基板管理控制器连接,复杂可编程逻辑器件还与网卡连接。复杂可编程逻辑器件检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,则确定基板管理控制器出现故障,重启基板管理控制器;当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。因此,通过复杂可编程逻辑器件,能够自动化检测基板管理控制器的故障问题并自动重启基板管理控制器,且能够通过网卡接收远程发送的远程复位信号并基于远程复位信号和基板管理控制器是否需要重启的状态,重启基板管理控制器,从而能够远程检测出节点服务器的基板管理控制器出现问题时,重启基板控制管理器,确保在基板控制管理器发生故障时通过远程重启基板控制管理器。
附图说明
图1为一个实施例中一种节点服务器的基板管理控制器的控制系统的结构框图;
图2为一个实施例中一种远程控制节点服务器的基板管理控制器重启的电路连接示意图;
图3为一个实施例中一种节点服务器的基板管理控制器的控制方法的流程示意图;
图4为一个实施例中一种远程控制节点服务器的基板管理控制器重启的流程示意图;
图5为一个实施例中复杂可编程逻辑器件的内部结构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应当理解,在本申请的描述中,除非上下文明确要求,否则整个说明书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
还应当理解,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
需要注意的是,术语“S1”、“S2”等仅用于步骤的描述目的,并非特别指称次序或顺位的意思,亦非用以限定本申请,其仅仅是为了方便描述本申请的方法,而不能理解为指示步骤的先后顺序。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本申请要求的保护范围之内。
本申请提供的一种节点服务器的基板管理控制器的控制系统,如图1所示,一种节点服务器的基板管理控制器的控制系统包括复杂可编程逻辑器件以及网卡,网卡与复杂可编程逻辑器件连接,复杂可编程逻辑器件还与基板管理控制器连接;其中,复杂可编程逻辑器件检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器;复杂可编程逻辑器件接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。因此,能够远程检测出节点服务器的基板管理控制器出现问题时,重启基板控制管理器,确保在基板控制管理器发生故障时通过远程重启基板控制管理器。
在一个实施例中,如图1所示,网卡还与节点服务器的处理器连接,网卡的全部PCIE链路均连接到节点服务器的处理器的PCIE端口,节点服务器的处理器通过PCIE总线与基板管理控制器连接;网卡通过节点服务器的处理器执行IPMI指令,以对基板管理控制器进行重启。
具体地,PCIE网卡的全部PCIE链路全部接到同一个节点服务器的处理器的PCIE端口上,这样一个网卡只与一个节点服务器的处理器连通,即网卡只负责管理一个节点服务器。PCIE(peripheral component interconnect express)是一种高速串行计算机扩展总线标准。PCIE链路是PCIE X8或X16。
在一个实施例中,网卡的金手指与节点服务器的PCIE端口连接,节点服务器的PCIE总线连接到节点服务器的处理器的PCIE端口。
具体地,网卡网口通过网线或光缆与管理交换机网口相连,网卡金手指插在服务器PCIE插槽里,通过PCIE总线与节点服务器的处理器相连,节点服务器的基板管理控制器也通过PCIE总线与处理器相连。因此后台运维可以远程登陆服务器的操作系统,在操作系统下执行IPMI指令,以对节点服务器的基板管理控制器进行重启。IPMI 是一组交互标准管理规范,IPMI的核心部件是基板管理控制器,通过IPMI指令可以让基板管理控制器与CPU、BIOS等进行交互。
在一个实施例中,网卡通过网卡的预留管脚向复杂可编程逻辑器件发出金手指的边带信号,金手指的边带信号作为远程复位信号。
具体地,网卡的金手指利用一个预留管脚连接到复杂可编程逻辑器件,向复杂可编程逻辑器件发送边带信号(Sideband信号),以作为远程复位信号。
在一个实施例中,网卡为多通路网卡,网卡为多个,各网卡分别与复杂可编程逻辑器件连接,各网卡还与多个基板管理控制器连接,复杂可编程逻辑器件分别与各基板管理控制器连接;复杂可编程逻辑器件检测到任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启任一基板管理控制器;复杂可编程逻辑器件接收到任一网卡发送的远程复位信号时,识别出远程复位信号对应的基板管理控制器,识别对应的基板管理控制器是否需要重启,若是,重启对应的基板管理控制器。其中,各网卡的金手指均插到转接板的PCIE端口,转接板转通过线缆将PCIE总线拆分为多个PCIE线路并通过各PCIE线路与各节点服务器的处理器的PCIE端口连接,各节点服务器的处理器通过PCIE总线与对应的基板管理控制器连接。
在一个示例中,网卡为两个,两个网卡的金手指均插到转接板的PCIE端口,转接板转通过线缆将每个网卡的PCIE X16总线拆分为2个PCIE X8线路,各PCIE X8线路分别与一个节点服务器的处理器的PCIE端口连接。
在一个示例中,任一网卡通过任一网卡的预留管脚向复杂可编程逻辑器件发出任一网卡的金手指的边带信号,任一网卡的金手指的边带信号作为任一网卡发出的远程复位信号。
具体地,一种节点服务器的基板管理控制器的控制系统还包括管理交换机,管理交换机与网卡连接,管理交换机用于控制网卡发出远程复位信号。
具体地,如图2所示,多个网卡包括PCIE网卡1和PCIE网卡2,各网卡内设置有IC主控。PCIE网卡1和PCIE网卡2均通过其内部的IC主控与CPLD(Complex Programmable LogicDevice,复杂可编程逻辑器件)连接。PCIE网卡1和PCIE网卡2均为PCIE X16带宽,可以分成2个PCIE X8,这两个PCIE X8分别连到2个不同节点服务器的处理器。如图2所示,即节点1CPU和节点2 CPU,因此一张网卡可以管理两个节点服务器。
PCIE网卡1和PCIE网卡2的金手指插到转接板的标准PCIE 端口上,转接板通过线缆将PCIE X16分成2个PCIE X8,分别接到2个不同节点的CPU PCIE 端口上。两张网卡的金手指利用预留管脚分别向CPLD发送REMOTE_RST_BMC1信号和REMOTE_RST_BMC2信号。REMOTE_RST_BMC1信号和REMOTE_RST_BMC2信号分别为两张网卡的金手指的边带信号,且均为对应的远程复位信号。REMOTE_RST_BMC1信号和REMOTE_RST_BMC2信号均为脉冲信号,且脉冲信号中的低电平为有效的远程复位信号。
CPLD将REMOTE_RST_BMC1信号滤波处理后发出FM_BMC1_RST_N信号到节点1 BMC,将REMOTE_RST_BMC2信号滤波处理后发出FM_BMC2_RST_N信号到节点2 BMC。具体地,CPLD分别与节点1 BMC和节点2 BMC的外部复位管脚连接。节点1 BMC通过外部复位管脚接收FM_BMC1_RST_N信号,节点2 BMC通过外部复位管脚接收FM_BMC2_RST_N信号。其中,FM_BMC1_RST_N信号和FM_BMC2_RST_N信号分别为对应的触发信号,触发信号为低电平信号。
节点1 BMC发出BMC1_WDT信号连到CPLD。BMC1_WDT信号为节点1 BMC内看门狗定时器发出的信号。当BMC1_WDT信号持续为方波脉冲时,CPLD认为节点1 BMC工作正常。当BMC1_WDT信号持续为低电平或者高电平而不发生变化时,CPLD认为节点1 BMC已经挂死。同理,类推节点1 BMC的情况。
当CPLD检测到BMC1_WDT信号持续为方波脉冲时,置位内部标志位flag_bmc1_alive为1;当CPLD检测到BMC1_WDT信号持续为低电平或者高电平而不发生变化时,清零内部标志位flag_bmc1_alive。CPLD对BMC2_WDT信号的处理方式依此类推。
如图2所示,当PCIE网卡1发出REMOTE_RST_BMC1信号并持续一定时间,CPLD检测到之后会先判断内部标志位flag_bmc1_alive的值。当内部标志位flag_bmc1_alive为1时,此标志位对应的节点1 BMC并不会重启;当flag_bmc1_alive为0时,CPLD会拉低此节点1BMC对应的FM_BMC1_RST_N信号,进而拉低对应节点1 BMC的外部复位管脚,重启此节点1BMC,重新设备重置。以此类推出PCIE网卡2和CPLD的信息交互过程。
上述一种节点服务器的基板管理控制器的控制系统,不使用PCIE网卡带内,或者BMC RJ45网络远程重启基板管理控制器,而是使用PCIE网卡的非PCIE协议规范内的预留管脚作为GPIO(General-purpose input/output,通用型之输入输出)发出基板管理控制器的重启信号。GPIO信号稳定可靠,不受OS权限或基板管理控制器工作状态限制。
CPLD使用基板管理控制器发出的看门狗定时器发出的信号作为过滤条件,看门狗定时器发出的信号为方波时,表示基板管理控制器运行正常,即使远程发出了重启信号,也不会重启基板管理控制器,保证基板管理控制器的工作不会被打断;只有当看门狗定时器发出的信号不是方波时,CPLD才会接收远程重启信号,进而拉低对应节点基板管理控制器的外部复位管脚重启基板管理控制器。
此设计依托服务器现有硬件条件,即本身服务器就配有网卡,也都有基板管理控制器、CPLD芯片,仅是修改GPIO设计就可实现远程控制节点服务器的重启,不需要额外硬件消耗,可降低成本。
上述实施例的一种节点服务器的基板管理控制器的控制系统,具备以下技术效果:
(1)潜在市场:
BMC在服务器内扮演着重要角色,是服务器必不可少的组成部分,因此本申请应用前景广阔,市场潜力巨大。
(2)解决问题的价值:
该申请有效地解决了远程重启服务器BMC的问题,极大的减轻了运维的负担,减少了线上工单,减少了人力投入。
(3)节省成本:
该申请基于现有硬件,并无额外硬件投入,相比其它复杂方案,节省了成本。
(4)先进性:
该申请采用网卡、BMC、CPLD等常规硬件的配合,实现远程重启BMC,减少服务器维护成本,可极大增强服务器产品竞争力。
(5)创新性:
利用网卡Reserved PIN加上BMC、CPLD的配合,实现远程重启服务器BMC,并可应用于单个或多个节点的场景,较传统方案稳定性更强,适用性更强,具有一定的创新性。
(6)可实现性:
本申请中提及的方案,可以通过硬件走线连接及BMC、CPLD的配合,易于实现。
本申请还提供一种节点服务器的基板管理控制器的控制方法,应用于图1所示的复杂可编程逻辑器件。如图3所示,一种节点服务器的基板管理控制器的控制方法包括以下步骤:
S302,检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器。
在一个示例中,上述检测基板管理控制器的看门狗定时器发出的信号之后,还包括:若检测到看门狗定时器发出的信号为持续的低电平信号或高电平信号,则确定检测出看门狗定时器发出的信号为非方波信号。
S304,当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。
在一个示例中,上述重启基板管理控制器,包括:向基板管理控制器的外部复位管脚发送低电平信号,以使得基板管理控制器进行重启。
其中,向基板管理控制器的外部复位管脚发送低电平信号,以使得基板管理控制器进行重启,包括:在设定时间段内向基板管理控制器的外部复位管脚持续性发送低电平信号,以使得基板管理控制器在设定时间段内检测到持续性的低电平信号时进行重启。
在一个实施例中,上述识别基板管理控制器是否需要重启之前,还包括:若检测出看门狗定时器发出的信号为非方波信号,将基板管理控制器的状态标志位设置为第一标识;若检测出看门狗定时器发出的信号为方波信号,将基板管理控制器的状态标志位设置为第二标识;当识别到基板管理控制器的状态标志位为第一标识时,确定基板管理控制器需要重启;当识别到基板管理控制器的状态标志位为第二标识时,确定基板管理控制器不需要重启。
具体地,节点服务器的基板管理控制器发出BMC_WDT(看门狗定时器,单片机的一个组成部分)信号连到复杂可编程逻辑器件。当此信号为持续发出的方波脉冲时,复杂可编程逻辑器件认为基板管理控制器工作正常。当此信号持续为低电平或者高电平而不发生变化时,复杂可编程逻辑器件认为基板管理控制器已经挂死,重启基板管理控制器。
当复杂可编程逻辑器件检测到BMC_WDT信号持续为方波时,置位内部标志位flag_bmc_alive为1,即第二标识为标志位1,此时即使网卡发送了基板管理控制器的远程复位信号,复杂可编程逻辑器也不会响应,即也不会拉低基板管理控制器的外部复位管脚,基板管理控制器并不会重启。
当复杂可编程逻辑器检测到BMC_WDT信号为非方波信号时,即持续为低电平或者高电平而不发生变化时,清零内部标志位flag_bmc_alive,即第一标识为标志位0,此时当网卡发送基板管理控制器的远程复位信号,复杂可编程逻辑器就会响应,即拉低基板管理控制器的外部复位管脚,基板管理控制器重启。具体地,复杂可编程逻辑器向基板管理控制器发出低脉冲信号并持续一定时间,此持续时间由基板管理控制器芯片复位管脚的要求决定,即拉低基板管理控制器的外部复位管脚一定时间,基板管理控制器重启,重设备重置。
因此,通过复杂可编程逻辑器件,能够自动化检测基板管理控制器的故障问题并自动重启基板管理控制器,且能够通过网卡接收远程发送的远程复位信号并基于远程复位信号和基板管理控制器是否需要重启的状态,重启基板管理控制器,从而能够远程检测出节点服务器的基板管理控制器出现问题时,重启基板控制管理器,确保在基板控制管理器发生故障时通过远程重启基板控制管理器。
在一个实施例中,复杂可编程逻辑器件与网卡的预留管脚通信连接,网卡通过预留管脚向复杂可编程逻辑器件发送远程复位信号。其中,网卡通过预留管脚向复杂可编程逻辑器件发送脉冲信号,脉冲信号中的低电平信号为远程复位信号。
在一个示例中,上述S304的步骤之前,还包括:接收网卡发送的脉冲信号,对脉冲信号进行滤波处理,得到脉冲信号中的低电平信号。
具体地,网卡的金手指利用预留管脚向复杂可编程逻辑器件发送脉冲信号,脉冲信号中的低电平为有效信号。即,使用脉冲信号中的低电平信号作为远程复位信号。复杂可编程逻辑器件将使用脉冲信号进行滤波处理后,得到脉冲信号中的低电平信号,并基于得到脉冲信号中的低电平信号发出FM_BMC_RST_N信号接到基板管理控制器的外部复位管脚。
在一个实施例中,如图1所示,网卡还通过PCIE总线与节点服务器的处理器连接,节点服务器的处理器通过PCIE总线与基板管理控制器连接;网卡通过节点服务器的处理器执行IPMI指令,以对基板管理控制器进行重启。
在一个实施例中,基板管理控制器为多个,网卡为多个,复杂可编程逻辑器件分别与各基板管理控制器连接,复杂可编程逻辑器件还分别与各网卡连接;若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器,包括:若检测出任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启任一基板管理控制器;当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器,包括:当接收到任一网卡发送的远程复位信号时,识别出远程复位信号对应的基板管理控制器,识别对应的基板管理控制器是否需要重启,若是,重启对应的基板管理控制器。
其中,多个基板管理控制器以及多个网卡与复杂可编程逻辑器件的连接关系参见图2所示。具体地,以两个网卡和两个基板管理控制器为例进行说明。如图4所示:
1)整套系统上电开机后,系统的复杂可编程逻辑器件检测各个网卡是否拉低了REMOTE_RST_BMC*信号,如没有拉低,则继续重复该步骤检测;如果检测到任何一个网卡的REMOTE_RST_BMC*信号被拉低,进入下一步,3)步骤。其中,REMOTE_RST_BMC*信号指的是对应网卡发出的远程复位信号。
2)整套系统上电开机后,系统的复杂可编程逻辑器件同时检测各节点服务器的基板管理控制器发出的BMC*_WDT信号是否为方波信号。若是,则在复杂可编程逻辑器件内部将该节点服务器的基板管理控制器对应的内部标志位flag_bmc*_alive置位为1;若否,BMC*_WDT信号是高电平或低电平且不变化,则在复杂可编程逻辑器件内部将该节点服务器的基板管理控制器内部标志位对应的flag_bmc*_alive清零。其中,BMC*_WDT信号指的是对应基板管理控制器的门狗定时器发出的信号。
3)如果第1)步检测到了任何一个网卡的REMOTE_RST_BMC*信号被拉低,且某个节点服务器的基板管理控制器对应的内部标志位flag_bmc*_alive=0,则复杂可编程逻辑器件拉低该节点服务器的对应的FM_BMC*_RST信号一定时间,该节点服务器的基板管理控制器重启,重新设备重置,然后回到开头继续检测REMOTE_RST_BMC*信号和BMC*_WDT信号。其中,FM_BMC*_RST信号指的是对应基板管理控制器的触发信号,低电平有效,即低电平触发基板管理控制器重启。
4)如果第1)步检测到了任何一个网卡的REMOTE_RST_BMC*信号被拉低,但某个节点服务器的内部标志位flag_bmc*_alive=1,则复杂可编程逻辑器件不会拉低该节点服务器对应的FM_BMC*_RST信号,该节点服务器的基板管理控制器不会重启,然后回到开头继续检测REMOTE_RST_BMC*信号和BMC*_WDT信号。
上述实施例的一种节点服务器的基板管理控制器的控制方法,使用网卡的非PCIE协议规范内的预留管脚发出基板管理控制器的重启信号到系统复杂可编程逻辑器件。系统复杂可编程逻辑器件使用基板管理控制器的看门狗定时器发出的信号作为锁定条件。看门狗定时器发出的信号为方波信号时,表示基板管理控制器运行正常,即使远程发出了重启基板管理控制器的信号,也不会重启基板管理控制器,保证基板管理控制器的工作不会被打断;只有当看门狗定时器发出的信号不是方波信号时,系统复杂可编程逻辑器件才会接收远程复位信号,进而拉低对应节点服务器的复杂可编程逻辑器件的外部复位管脚,重启基板管理控制器。
上述实施例的一种节点服务器的基板管理控制器的控制方法,具备以下技术效果:
(1)潜在市场:
BMC在服务器内扮演着重要角色,是服务器必不可少的组成部分,因此本申请应用前景广阔,市场潜力巨大。
(2)解决问题的价值:
该申请有效地解决了远程重启服务器BMC的问题,极大的减轻了运维的负担,减少了线上工单,减少了人力投入。
(3)节省成本:
该申请基于现有硬件,并无额外硬件投入,相比其它复杂方案,节省了成本。
(4)先进性:
该申请采用网卡、BMC、CPLD等常规硬件的配合,实现远程重启BMC,减少服务器维护成本,可极大增强服务器产品竞争力。
(5)创新性:
利用网卡Reserved PIN加上BMC、CPLD的配合,实现远程重启服务器BMC,并可应用于单个或多个节点的场景,较传统方案稳定性更强,适用性更强,具有一定的创新性。
(6)可实现性:
本申请中提及的方案,可以通过硬件走线连接及BMC、CPLD的配合,易于实现。
应该理解的是,虽然流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,提供了一种复杂可编程逻辑器件。如图5所示,复杂可编程逻辑器件与节点服务器的基板管理控制器连接,复杂可编程逻辑器件还与网卡连接,其中,复杂可编程逻辑器件中设置有存储单元、处理单元及存储在存储单元上并可在处理单元上运行的计算机程序。当存储单元中的计算机程序被处理单元执行时,实现本申请的一种节点服务器的基板管理控制器的控制方法。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种复杂可编程逻辑器件,复杂可编程逻辑器件与节点服务器的基板管理控制器连接,复杂可编程逻辑器件还与网卡连接,其中,复杂可编程逻辑器件中设置有存储单元、处理单元及存储在存储单元上并可在处理单元上运行的计算机程序,处理单元执行计算机程序时实现以下步骤:检测基板管理控制器的看门狗定时器发出的信号,若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器;当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器。
在其中一个实施例中,处理单元执行计算机程序时还实现以下步骤:若检测到看门狗定时器发出的信号为持续的低电平信号或高电平信号,则确定检测出看门狗定时器发出的信号为非方波信号。
在其中一个实施例中,处理单元执行计算机程序实现上述的重启基板管理控制器的步骤时,具体实现以下步骤:向基板管理控制器的外部复位管脚发送低电平信号,以使得基板管理控制器进行重启。
在其中一个实施例中,处理单元执行计算机程序实现上述的向基板管理控制器的外部复位管脚发送低电平信号,以使得基板管理控制器进行重启的步骤时,具体实现以下步骤:在设定时间段内向基板管理控制器的外部复位管脚持续性发送低电平信号,以使得基板管理控制器在设定时间段内检测到持续性的低电平信号时进行重启。
在其中一个实施例中,复杂可编程逻辑器件与网卡的预留管脚通信连接,网卡通过预留管脚向复杂可编程逻辑器件发送远程复位信号。
在其中一个实施例中,网卡通过预留管脚向复杂可编程逻辑器件发送脉冲信号,脉冲信号中的低电平信号为远程复位信号。
在其中一个实施例中,处理单元执行计算机程序时还实现以下步骤:接收网卡发送的脉冲信号,对脉冲信号进行滤波处理,得到脉冲信号中的低电平信号。
在其中一个实施例中,处理单元执行计算机程序时还实现以下步骤:若检测出看门狗定时器发出的信号为非方波信号,将基板管理控制器的状态标志位设置为第一标识;若检测出看门狗定时器发出的信号为方波信号,将基板管理控制器的状态标志位设置为第二标识;当识别到基板管理控制器的状态标志位为第一标识时,确定基板管理控制器需要重启;当识别到基板管理控制器的状态标志位为第二标识时,确定基板管理控制器不需要重启。
在其中一个实施例中,网卡还通过PCIE总线与节点服务器的处理器连接,节点服务器的处理器通过PCIE总线与基板管理控制器连接;网卡通过节点服务器的处理器执行IPMI指令,以对基板管理控制器进行重启。
在其中一个实施例中,基板管理控制器为多个,网卡为多个,复杂可编程逻辑器件分别与各基板管理控制器连接,复杂可编程逻辑器件还分别与各网卡连接;处理单元执行计算机程序实现上述的若检测出看门狗定时器发出的信号为非方波信号,重启基板管理控制器的步骤时,具体实现以下步骤:若检测出任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启任一基板管理控制器;处理单元执行计算机程序实现上述的当接收到网卡发送的基板管理控制器的远程复位信号时,识别基板管理控制器是否需要重启,若是,重启基板管理控制器的步骤时,具体实现以下步骤:当接收到任一网卡发送的远程复位信号时,识别出远程复位信号对应的基板管理控制器,识别对应的基板管理控制器是否需要重启,若是,重启对应的基板管理控制器。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。

Claims (20)

1.一种节点服务器的基板管理控制器的控制方法,其特征在于,所述控制方法应用于复杂可编程逻辑器件,所述复杂可编程逻辑器件与所述基板管理控制器连接,所述复杂可编程逻辑器件还与网卡连接,所述方法包括:
检测所述基板管理控制器的看门狗定时器发出的信号,若检测出所述看门狗定时器发出的信号为非方波信号,重启所述基板管理控制器;
当接收到所述网卡发送的所述基板管理控制器的远程复位信号时,识别所述基板管理控制器是否需要重启,若是,重启所述基板管理控制器。
2.根据权利要求1所述的控制方法,其特征在于,所述方法还包括:
若检测到所述看门狗定时器发出的信号为持续的低电平信号或高电平信号,则确定检测出所述看门狗定时器发出的信号为非方波信号。
3.根据权利要求1所述的控制方法,其特征在于,所述重启所述基板管理控制器,包括:
向所述基板管理控制器的外部复位管脚发送低电平信号,以使得所述基板管理控制器进行重启。
4.根据权利要求3所述的控制方法,其特征在于,所述向所述基板管理控制器的外部复位管脚发送低电平信号,以使得所述基板管理控制器进行重启,包括:
在设定时间段内向所述基板管理控制器的外部复位管脚持续性发送低电平信号,以使得所述基板管理控制器在所述设定时间段内检测到持续性的低电平信号时进行重启。
5.根据权利要求1所述的控制方法,其特征在于,所述复杂可编程逻辑器件与所述网卡的预留管脚通信连接,所述网卡通过所述预留管脚向所述复杂可编程逻辑器件发送所述远程复位信号。
6.根据权利要求5所述的控制方法,其特征在于,所述网卡通过所述预留管脚向所述复杂可编程逻辑器件发送脉冲信号,所述脉冲信号中的低电平信号为所述远程复位信号。
7.根据权利要求6所述的控制方法,其特征在于,所述方法还包括:
接收所述网卡发送的所述脉冲信号,对所述脉冲信号进行滤波处理,得到所述脉冲信号中的低电平信号。
8.根据权利要求1所述的控制方法,其特征在于,所述方法还包括:
若检测出所述看门狗定时器发出的信号为非方波信号,将所述基板管理控制器的状态标志位设置为第一标识;
若检测出所述看门狗定时器发出的信号为方波信号,将所述基板管理控制器的状态标志位设置为第二标识;
当识别到所述基板管理控制器的状态标志位为所述第一标识时,确定所述基板管理控制器需要重启;
当识别到所述基板管理控制器的状态标志位为所述第二标识时,确定所述基板管理控制器不需要重启。
9.根据权利要求1所述的控制方法,其特征在于,所述网卡还通过PCIE总线与所述节点服务器的处理器连接,所述节点服务器的处理器通过PCIE总线与所述基板管理控制器连接;
所述网卡通过所述节点服务器的处理器执行IPMI指令,以对所述基板管理控制器进行重启。
10.根据权利要求1所述的控制方法,其特征在于,所述基板管理控制器为多个,所述网卡为多个,所述复杂可编程逻辑器件分别与各基板管理控制器连接,所述复杂可编程逻辑器件还分别与各网卡连接;
所述若检测出所述看门狗定时器发出的信号为非方波信号,重启所述基板管理控制器,包括:若检测出任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启所述任一基板管理控制器;
所述当接收到所述网卡发送的所述基板管理控制器的远程复位信号时,识别所述基板管理控制器是否需要重启,若是,重启所述基板管理控制器,包括:当接收到任一网卡发送的远程复位信号时,识别出所述远程复位信号对应的基板管理控制器,识别所述对应的基板管理控制器是否需要重启,若是,重启所述对应的基板管理控制器。
11.一种复杂可编程逻辑器件,其特征在于,所述复杂可编程逻辑器件与节点服务器的基板管理控制器连接,所述复杂可编程逻辑器件还与网卡连接,其中,所述复杂可编程逻辑器件中设置有存储单元、处理单元及存储在存储单元上并可在处理单元上运行的计算机程序,所述处理单元执行所述计算机程序时实现权利要求1至10中任一项所述方法的步骤。
12.一种节点服务器的基板管理控制器的控制系统,其特征在于,所述控制系统包括复杂可编程逻辑器件以及网卡,所述网卡与所述复杂可编程逻辑器件连接,所述复杂可编程逻辑器件还与所述基板管理控制器连接;其中,
所述复杂可编程逻辑器件检测所述基板管理控制器的看门狗定时器发出的信号,若检测出所述看门狗定时器发出的信号为非方波信号,重启所述基板管理控制器;
所述复杂可编程逻辑器件接收到所述网卡发送的所述基板管理控制器的远程复位信号时,识别所述基板管理控制器是否需要重启,若是,重启所述基板管理控制器。
13.根据权利要求12所述的控制系统,其特征在于,所述网卡还与所述节点服务器的处理器连接,所述网卡的全部PCIE链路均连接到所述节点服务器的处理器的PCIE端口,所述节点服务器的处理器通过PCIE总线与所述基板管理控制器连接;
所述网卡通过所述节点服务器的处理器执行IPMI指令,以对所述基板管理控制器进行重启。
14.根据权利要求13所述的控制系统,其特征在于,所述网卡的金手指与所述节点服务器的PCIE端口连接,所述节点服务器的PCIE总线连接到所述节点服务器的处理器的PCIE端口。
15.根据权利要求14所述的控制系统,其特征在于,所述网卡通过所述网卡的预留管脚向所述复杂可编程逻辑器件发出所述金手指的边带信号,所述金手指的边带信号作为所述远程复位信号。
16.根据权利要求12所述的控制系统,其特征在于,所述网卡为多通路网卡,所述网卡为多个,各网卡分别与所述复杂可编程逻辑器件连接,各网卡还与多个基板管理控制器连接,所述复杂可编程逻辑器件分别与各基板管理控制器连接;
所述复杂可编程逻辑器件检测到任一基板管理控制器的看门狗定时器发出的信号为非方波信号,重启所述任一基板管理控制器;
所述复杂可编程逻辑器件接收到任一网卡发送的远程复位信号时,识别出所述远程复位信号对应的基板管理控制器,识别所述对应的基板管理控制器是否需要重启,若是,重启所述对应的基板管理控制器。
17.根据权利要求16所述的控制系统,其特征在于,各网卡的金手指均插到转接板的PCIE端口,所述转接板转通过线缆将PCIE总线拆分为多个PCIE线路并通过各PCIE线路与各节点服务器的处理器的PCIE端口连接,各节点服务器的处理器通过PCIE总线与对应的基板管理控制器连接。
18. 根据权利要求17所述的控制系统,其特征在于,所述网卡为两个,两个网卡的金手指均插到转接板的PCIE端口,所述转接板转通过线缆将每个网卡的PCIE X16总线拆分为2个PCIE X8线路,各PCIE X8线路分别与一个节点服务器的处理器的PCIE端口连接。
19.根据权利要求17所述的控制系统,其特征在于,任一网卡通过所述任一网卡的预留管脚向所述复杂可编程逻辑器件发出所述任一网卡的金手指的边带信号,所述任一网卡的金手指的边带信号作为所述任一网卡发出的远程复位信号。
20.根据权利要求12所述的控制系统,其特征在于,所述控制系统还包括管理交换机,所述管理交换机与所述网卡连接,所述管理交换机用于控制所述网卡发出所述远程复位信号。
CN202311087332.3A 2023-08-28 2023-08-28 一种节点服务器的基板管理控制器的控制方法及其系统 Active CN116820827B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311087332.3A CN116820827B (zh) 2023-08-28 2023-08-28 一种节点服务器的基板管理控制器的控制方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311087332.3A CN116820827B (zh) 2023-08-28 2023-08-28 一种节点服务器的基板管理控制器的控制方法及其系统

Publications (2)

Publication Number Publication Date
CN116820827A true CN116820827A (zh) 2023-09-29
CN116820827B CN116820827B (zh) 2024-01-23

Family

ID=88113074

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311087332.3A Active CN116820827B (zh) 2023-08-28 2023-08-28 一种节点服务器的基板管理控制器的控制方法及其系统

Country Status (1)

Country Link
CN (1) CN116820827B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117234812A (zh) * 2023-11-16 2023-12-15 中科泓泰电子有限公司 一种控制服务器重启的系统及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038019A (zh) * 2017-12-25 2018-05-15 曙光信息产业(北京)有限公司 一种基板管理控制器的故障自动恢复方法及系统
CN109656739A (zh) * 2018-12-10 2019-04-19 英业达科技有限公司 服务方法、系统、主板及计算机可读存储介质
CN111694710A (zh) * 2020-06-10 2020-09-22 浪潮商用机器有限公司 基板管理控制器故障监控方法、装置、设备及存储介质
CN114691408A (zh) * 2022-04-18 2022-07-01 苏州浪潮智能科技有限公司 一种基板管理控制器故障检测装置
CN115145381A (zh) * 2022-07-29 2022-10-04 苏州浪潮智能科技有限公司 一种远程重置bmc芯片的方法、系统、存储介质及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108038019A (zh) * 2017-12-25 2018-05-15 曙光信息产业(北京)有限公司 一种基板管理控制器的故障自动恢复方法及系统
CN109656739A (zh) * 2018-12-10 2019-04-19 英业达科技有限公司 服务方法、系统、主板及计算机可读存储介质
CN111694710A (zh) * 2020-06-10 2020-09-22 浪潮商用机器有限公司 基板管理控制器故障监控方法、装置、设备及存储介质
CN114691408A (zh) * 2022-04-18 2022-07-01 苏州浪潮智能科技有限公司 一种基板管理控制器故障检测装置
CN115145381A (zh) * 2022-07-29 2022-10-04 苏州浪潮智能科技有限公司 一种远程重置bmc芯片的方法、系统、存储介质及设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117234812A (zh) * 2023-11-16 2023-12-15 中科泓泰电子有限公司 一种控制服务器重启的系统及方法
CN117234812B (zh) * 2023-11-16 2024-01-30 中科泓泰电子有限公司 一种控制服务器重启的系统及方法

Also Published As

Publication number Publication date
CN116820827B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
TWI618380B (zh) 管理方法、服務控制器裝置以及非暫態電腦可讀取媒體
CN105700969B (zh) 服务器系统
CN102761439B (zh) Pon接入系统中基于看门狗的异常检测记录装置及方法
US20060161714A1 (en) Method and apparatus for monitoring number of lanes between controller and PCI Express device
CN116820827B (zh) 一种节点服务器的基板管理控制器的控制方法及其系统
WO2018095107A1 (zh) 一种bios程序的异常处理方法及装置
RU2614569C2 (ru) Стойка с функцией автоматического восстановления и способ автоматического восстановления для этой стойки
CN114116280B (zh) 交互式bmc自恢复方法、系统、终端及存储介质
CN112199240B (zh) 一种节点故障时进行节点切换的方法及相关设备
CN112825011A (zh) PCIe设备的上下电控制方法以及系统
CN113360347A (zh) 一种服务器及其控制方法
CN101751265B (zh) 服务器的基本输入/输出系统的更新系统及其方法
CN114443394A (zh) I2c总线解挂死的方法、装置、计算机设备和存储介质
CN112000535A (zh) 一种基于SAS Expander卡的硬盘异常识别方法及处理方法
CN114003445B (zh) Bmc的i2c监控功能测试方法、系统、终端及存储介质
CN111090537B (zh) 集群启动方法、装置、电子设备及可读存储介质
CN111813596A (zh) 芯片重启方法、装置及计算设备
CN111858148A (zh) 一种PCIE Switch芯片配置文件恢复系统及方法
CN114461286B (zh) 一种服务器启动方法、装置、电子设备及可读存储介质
CN114201439B (zh) 服务器信号识别优化方法、系统及存储介质
CN114116276A (zh) Bmc挂死自恢复方法、系统、终端及存储介质
CN114253573A (zh) PCIe设备固件批量升级方法、系统、终端及存储介质
CN112988517A (zh) 一种基于bmc的gpu掉卡监控方法
CN106844113B (zh) 一种采用冗余pch的服务器故障恢复系统及方法
CN112667544A (zh) 一种控制主板插槽使能的方法、装置、系统及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant