CN109408269A - 一种基板管理控制器宕机重启系统及重启方法 - Google Patents

一种基板管理控制器宕机重启系统及重启方法 Download PDF

Info

Publication number
CN109408269A
CN109408269A CN201811207511.5A CN201811207511A CN109408269A CN 109408269 A CN109408269 A CN 109408269A CN 201811207511 A CN201811207511 A CN 201811207511A CN 109408269 A CN109408269 A CN 109408269A
Authority
CN
China
Prior art keywords
management controller
chip
baseboard management
module
connect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201811207511.5A
Other languages
English (en)
Inventor
郭乃慎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811207511.5A priority Critical patent/CN109408269A/zh
Publication of CN109408269A publication Critical patent/CN109408269A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • G06F11/0757Error or fault detection not based on redundancy by exceeding limits by exceeding a time limit, i.e. time-out, e.g. watchdogs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1415Saving, restoring, recovering or retrying at system level
    • G06F11/1438Restarting or rejuvenating

Abstract

本发明公开了一种基板管理控制器宕机重启系统,包括基板管理控制器、监视计时器模块、计数器模块和系统电源模块,基板管理控制器的时钟信号端与监视计时器模块的时钟信号输入端连接,监视计时器模块的重启输出端一路与基板管理控制器的复位端连接,另一路与计数器模块的重置输入端连接,计数器模块的输出端与系统电源模块的控制端连接。此设计可以快速的进行基板管理控制器的重新启动,让维护人员可以在较快的时间内去存取基板管理控制器内的记录报告,检视异常状况并加以处理修正。

Description

一种基板管理控制器宕机重启系统及重启方法
技术领域
本发明涉及服务器管理技术领域,尤其是一种基板管理控制器宕机重启系统及重启方法。
背景技术
基板管理控制器(Baseboard Management Controller,BMC)是服务器中无比重要的单元,主要负责服务器中的平台管理。平台管理表示的是一系列的监视和控制功能,操作的对象是系统硬件。比如通过监视系统的温度,电压,风扇、电源等等,并做相应的调节工作,以保证系统处于健康的状态。
除上述功能以外,基板管理控制器还提供虚拟的键盘、接口、鼠标、电源等为服务器提供远程管理功能,用户可透过基板管理控制器的管理接口登录基板管理控制器内建的管理网页监视服务器的物理特征,如主板各部件的温度、电压、电源供应以及机箱入侵等。因为基板管理控制器十分的重要,必须保证二十四小时一直在运作,一但出现异常或宕机,必须进快恢复其功能。
以往在基板管理控制器宕机时必须将整个系统断电后再重新上电,才能让基板管理控制器重新启动,此设计可以在系统不用断电的情况下进行基板管理控制器的重新启动,让系统可以继续运作,延长系统断电维护的周期。
发明内容
本发明的目的是提供一种基板管理控制器宕机重启系统及重启方法,在基板管理控制器在遇到偶发的意外性错误宕机时,可以快速重启基板管理控制器并且恢复服务器平台管理功能。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种基板管理控制器宕机重启系统,包括基板管理控制器、监视计时器模块、计数器模块和系统电源模块,基板管理控制器的时钟信号端与监视计时器模块的时钟信号输入端连接,监视计时器模块的重启输出端一路与基板管理控制器的复位端连接,另一路与计数器模块的重置输入端连接,计数器模块的输出端与系统电源模块的控制端连接。
结合第一方面,在第一方面第一种可能的实现方式中,基板管理控制器的启动状态输出端与监视计时器模块的启动输入端连接,基板管理控制器在固件载入完成后通过启动状态端发送启动信号到监视计数器模块。
结合第一方面,在第一方面第二种可能的实现方式中,所述监视计时器模块采用芯片UCC2946,芯片UCC2946的看门狗输入时钟信号引脚WDI与基板管理控制器的时钟信号端连接,芯片UCC2946的看门狗时钟输出引脚与反相器芯片的输入端连接,反相器芯片的输出端与缓冲器芯片的输入端连接,缓冲期芯片的输出端与芯片UCC2946的重置信号端连接。
结合第一方面,在第一方面第三种可能的实现方式中,所述计数器模块包括若干颗计数器芯片,计数器芯片的数目与设置的监视计时器模块发出重置信号次数阈值相关,监视计时器模块的重置信号端经反相器后与计数器芯片的时脉输入端连接,计数器模块的输出端与系统电源模块的控制端连接。
结合第一方面,在第一方面第四种可能的实现方式中,所述计数器模块包括三颗计数器芯片,分别为芯片U1、芯片U2和芯片U3,监视计时器模块的重置信号端经反相器后与芯片U1的时脉输入端连接,芯片U1的引脚与D引脚连接,Q引脚与芯片U2的CLK引脚连接,芯片U2的引脚与D引脚连接,Q引脚与芯片U3的CLK引脚连接,芯片U3的引脚与D引脚连接,Q引脚与与系统电源模块的控制端连接。
本发明第二方面提供了一种基板管理控制器宕机重启方法,包括以下步骤:
主机板电源打开,基板管理控制器启动后,载入基板管理控制器固件,待固件加载完成后,基板管理控制器发送启动信号到监视计时器模块;
监视计时器模块检测基板管理控制器发送的时钟信号是否有中断,一旦时钟信号中断超过设定的时间阈值,监视计时器发出重置信号给基板管理控制器;
计数器模块计算监视计时器模块发出的重置信号次数,超过设定次数阈值,计数器发送断电信号到系统电源模块。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明实现了基板管理控制器宕机自动重启的具体功能。此设计不用亲自到机房重启系统,减轻维护人员因基板管理控制器意外宕机而需要到场维护的负担。此设计不仅可以减上系统维护的周期,减轻维护人员的负担,也可以初步过滤造成基板管理控制器宕机的原因为偶发状况或是有重大设计缺失存在。此设计可以快速的进行基板管理控制器的重新启动,让维护人员可以在较快的时间内去存取基板管理控制器内的记录报告,检视异常状况并加以处理修正。
附图说明
图1是本发明基板管理控制器宕机重启系统示意图;
图2是本发明监视计时器模块原理图;
图3是本发明技术器模块原理图;
图4是本发明重启方法流程图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,一种基板管理控制器宕机重启系统,包括基板管理控制器、监视计时器模块、计数器模块和系统电源模块,基板管理控制器的时钟信号端与监视计时器模块的时钟信号输入端连接,基板管理控制器的启动状态输出端与监视计时器模块的启动输入端连接,基板管理控制器在固件载入完成后通过启动状态端发送启动信号到监视计数器模块。监视计时器模块的重启输出端一路与基板管理控制器的复位端连接,另一路与计数器模块的重置输入端连接,计数器模块的输出端与系统电源模块的控制端连接。
如图2所示,监视计时器模块采用芯片UCC2946,芯片UCC2946的看门狗输入时钟信号引脚WDI与基板管理控制器的时钟信号端连接,芯片UCC2946的看门狗时钟输出引脚与反相器芯片的输入端连接,反相器芯片的输出端与缓冲器芯片的输入端连接,缓冲期芯片的输出端与芯片UCC2946的重置信号端连接。芯片UCC2946会开始去计算收到基板管理控制器送到WDI脚位的时间,当超过设定的时间T1没有收到讯号输入,就会发出重置讯号给基板管理控制器使其重置
如图3所示,计数器模块包括三颗计数器芯片,分别为芯片U1、芯片U2和芯片U3,监视计时器模块的重置信号端经反相器后与芯片U1的时脉输入端连接,芯片U1的引脚与D引脚连接,Q引脚与芯片U2的CLK引脚连接,芯片U2的引脚与D引脚连接,Q引脚与芯片U3的CLK引脚连接,芯片U3的引脚与D引脚连接,Q引脚与与系统电源模块的控制端连接。。将监视计时器发发出的重置讯号反向后送给计数器的时脉输入,当计数器收到时脉输入达八次以上会触发Q2为高电位,利用这个高电位去关闭系统电源。计数器的计算次数可以依需求增减,或是用CPLD来实现也可以。当监视计时器发出重置讯号超过设定的次数时,则视为严重问题,将会通知监视计时器停止发送重置讯号给基板管理控制器,关闭主要电源系统,等待维护人员前来检查。
如图4所示,一种基板管理控制器宕机重启方法,包括以下步骤:
S1、主机板电源打开,基板管理控制器启动后,载入基板管理控制器固件,待固件加载完成后,基板管理控制器发送启动信号到监视计时器模块;
S2、监视计时器模块检测基板管理控制器发送的时钟信号是否有中断,一旦时钟信号中断超过设定的时间阈值,监视计时器发出重置信号给基板管理控制器;
S3、计数器模块计算监视计时器模块发出的重置信号次数,超过设定次数阈值,计数器发送断电信号到系统电源模块。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (6)

1.一种基板管理控制器宕机重启系统,其特征是,包括基板管理控制器、监视计时器模块、计数器模块和系统电源模块,基板管理控制器的时钟信号端与监视计时器模块的时钟信号输入端连接,监视计时器模块的重启输出端一路与基板管理控制器的复位端连接,另一路与计数器模块的重置输入端连接,计数器模块的输出端与系统电源模块的控制端连接。
2.如权利要求1所述的系统,其特征是,基板管理控制器的启动状态输出端与监视计时器模块的启动输入端连接,基板管理控制器在固件载入完成后通过启动状态端发送启动信号到监视计数器模块。
3.如权利要求1所述的系统,其特征是,所述监视计时器模块采用芯片UCC2946,芯片UCC2946的看门狗输入时钟信号引脚WDI与基板管理控制器的时钟信号端连接,芯片UCC2946的看门狗时钟输出引脚与反相器芯片的输入端连接,反相器芯片的输出端与缓冲器芯片的输入端连接,缓冲期芯片的输出端与芯片UCC2946的重置信号端连接。
4.如权利要求1所述的系统,其特征是,所述计数器模块包括若干颗计数器芯片,计数器芯片的数目与设置的监视计时器模块发出重置信号次数阈值相关,监视计时器模块的重置信号端经反相器后与计数器芯片的时脉输入端连接,计数器模块的输出端与系统电源模块的控制端连接。
5.如权利要求4所述的系统,其特征是,所述计数器模块包括三颗计数器芯片,分别为芯片U1、芯片U2和芯片U3,监视计时器模块的重置信号端经反相器后与芯片U1的时脉输入端连接,芯片U1的引脚与D引脚连接,Q引脚与芯片U2的CLK引脚连接,芯片U2的引脚与D引脚连接,Q引脚与芯片U3的CLK引脚连接,芯片U3的引脚与D引脚连接,Q引脚与与系统电源模块的控制端连接。
6.一种基板管理控制器宕机重启方法,其特征是,包括以下步骤:
主机板电源打开,基板管理控制器启动后,载入基板管理控制器固件,待固件加载完成后,基板管理控制器发送启动信号到监视计时器模块;
监视计时器模块检测基板管理控制器发送的时钟信号是否有中断,一旦时钟信号中断超过设定的时间阈值,监视计时器发出重置信号给基板管理控制器;
计数器模块计算监视计时器模块发出的重置信号次数,超过设定次数阈值,计数器发送断电信号到系统电源模块。
CN201811207511.5A 2018-10-17 2018-10-17 一种基板管理控制器宕机重启系统及重启方法 Withdrawn CN109408269A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811207511.5A CN109408269A (zh) 2018-10-17 2018-10-17 一种基板管理控制器宕机重启系统及重启方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811207511.5A CN109408269A (zh) 2018-10-17 2018-10-17 一种基板管理控制器宕机重启系统及重启方法

Publications (1)

Publication Number Publication Date
CN109408269A true CN109408269A (zh) 2019-03-01

Family

ID=65468276

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811207511.5A Withdrawn CN109408269A (zh) 2018-10-17 2018-10-17 一种基板管理控制器宕机重启系统及重启方法

Country Status (1)

Country Link
CN (1) CN109408269A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109901974A (zh) * 2019-03-12 2019-06-18 浪潮商用机器有限公司 一种监控方法、装置、设备、系统及介质
CN111158944A (zh) * 2019-12-30 2020-05-15 联想(北京)有限公司 一种信息处理方法、电源系统及电子设备系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109901974A (zh) * 2019-03-12 2019-06-18 浪潮商用机器有限公司 一种监控方法、装置、设备、系统及介质
CN111158944A (zh) * 2019-12-30 2020-05-15 联想(北京)有限公司 一种信息处理方法、电源系统及电子设备系统
CN111158944B (zh) * 2019-12-30 2022-10-25 联想(北京)有限公司 一种信息处理方法、电源系统及电子设备系统

Similar Documents

Publication Publication Date Title
CN107193713B (zh) 一种实现主板管理控制的fpga及方法
US9207948B2 (en) Multi-BIOS circuit and switching method between multiple BIOS chips
CN103324546B (zh) 一种延时喂狗的方法及装置
CN102163071B (zh) 一种控制电路及其复位时的电源控制方法
CN102467417B (zh) 计算机系统
CN102681907A (zh) 一种多功能看门狗电路
US10528113B2 (en) Low latency computer system power reduction
CN109408269A (zh) 一种基板管理控制器宕机重启系统及重启方法
CN103645794A (zh) 一种通过边沿检测电路实现睡眠模式唤醒的芯片及方法
CN108304223A (zh) 一种用于电源休眠机制的操作系统与硬件平台交互方法
CN106445057A (zh) 一种监控电源掉电自动快速放电电路及方法
CN106055440A (zh) 一种通过bmc实现服务器异常断电的测试方法及系统
CN107193708A (zh) 一种状态检测方法及系统
CN109582505B (zh) 一种bios选项默认值的恢复系统、方法及装置
CN104156289A (zh) 基于检测电路的同步控制方法及系统
CN102929381A (zh) 电子系统及其电源管理方法
CN108459984A (zh) 一种机柜i2c总线死锁处理方法、系统、介质及设备
CN108647124A (zh) 一种存储跳变信号的方法及其装置
CN100555260C (zh) 主控底层管理平面的集成装置及方法
CN110377135B (zh) 一种psu的管理方法、系统及装置
CN104008019A (zh) 一种实现刀片服务器中服务器电源功率自动分配的方法
US11762033B2 (en) Power failure monitoring device and power failure monitoring method
CN107291206A (zh) 一种主板与bbu的互联架构
CN114610562A (zh) 服务器功耗管控方法、系统、终端及存储介质
CN106557138B (zh) 伺服系统及随机启动装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190301