CN116028123A - 一种服务器安全开关机方法及系统 - Google Patents

一种服务器安全开关机方法及系统 Download PDF

Info

Publication number
CN116028123A
CN116028123A CN202211728315.9A CN202211728315A CN116028123A CN 116028123 A CN116028123 A CN 116028123A CN 202211728315 A CN202211728315 A CN 202211728315A CN 116028123 A CN116028123 A CN 116028123A
Authority
CN
China
Prior art keywords
bmc
subsystem
server
state
shutdown
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211728315.9A
Other languages
English (en)
Inventor
陈小春
张超
朱立森
孙亮
康红宝
王亚洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunlun Taike Beijing Technology Co ltd
Original Assignee
Kunlun Taike Beijing Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunlun Taike Beijing Technology Co ltd filed Critical Kunlun Taike Beijing Technology Co ltd
Priority to CN202211728315.9A priority Critical patent/CN116028123A/zh
Publication of CN116028123A publication Critical patent/CN116028123A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Power Sources (AREA)

Abstract

本发明公开了一种服务器安全开关机方法及系统,采用基板管理控制器BMC检测服务器的操作系统的状态信息,根据状态信息进行开机决策,在开机动作前检测服务器硬件健康状态,判断硬件是否处于故障异常状态,确保服务器在硬件安全可靠的情况下进行上电开机。通过BMC控制器与操作系统进行关机流程状态验证,根据验证结果进行关机决策,通过BMC与系统OS反复确认关机流程状态,确保了服务器业务的可靠性。

Description

一种服务器安全开关机方法及系统
技术领域
本发明涉及计算机固件技术领域,具体涉及一种服务器安全开关机方法及系统。
背景技术
现有的服务器进行远程电源管理时,存在以下问题:
1)现有的服务器使用远程开关机时,直接通过复杂可编程逻辑器件(ComplexProgrammable Logic Device,CPLD)进行直流电(Direct Current,DC)上下电操作,存在误动作或重复动作的风险。
2)服务器硬件设备异常时,直接开机导致中央处理器(Center Processing Unit,CPU)、图形处理器(Graphics Processing Unit,GPU)等重要部件出现过热损坏。
3)服务器操作系统(Operating System,OS)正在运行时,直接远程关机进行DC下电时,若系统正在读写磁盘操作,会导致系统崩溃、储磁盘内文件损坏或丢失等问题,不利于系统可靠运行。
发明内容
有鉴于此,本发明提供了一种服务器安全开关机的方法,能够安全地有效地进行服务器电源管理,提高服务器开关机的安全性。
本发明采用的具体技术方案如下:
一种服务器安全开关机方法,包括:
采用基板管理控制器BMC检测服务器的操作系统的状态信息,根据所述状态信息进行开机决策;
通过所述BMC控制器与所述操作系统进行关机流程状态验证,根据验证结果进行关机决策。
进一步地,所述状态信息至少包括:服务器电源开机或者关机状态信息、硬件设备状态信息;
其中,所述硬件设备状态信息至少包括:备用电源BBU接入信息、中央处理器CPU温度信息、风扇冗余信息。
进一步地,所述根据状态信息进行开机决策,包括:
A1、所述BMC控制器检测服务器电源状态,若为关机状态,则检测硬件状态;若为开机状态,则结束流程;
A2、在所述服务器电源为备用电源BBU时,所述BMC控制器检测所述BBU电源线是否接入正常,若正常,则继续检测所述硬件状态;若不正常,则结束流程;
A3、所述BMC控制器依次检测CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,完成服务器安全开机。
进一步地,所述通过BMC控制器与所述操作系统进行关机流程状态验证,根据验证结果进行关机决策,包括:
B1、所述BMC控制器接收关机请求指令,将关机事件存入事件消息缓冲区,并在比特流协议接口BT置起中断事件EVT_ATN;
B2、所述操作系统通过智能型平台管理接口IPMI监听并接收所述中断事件EVT_ATN;
B3、所述操作系统将与所述中断事件EVT_ATN对应的中断信号发送至IPMI工具包,并通过所述IPMI工具包向所述BMC控制器发送获取消息标识;
B4、所述BMC控制器对所述获取消息标识进行应答,将获取事件消息标识发送至所述IPMI工具包;
B5、所述操作系统的所述IPMI工具包向所述BMC控制器发送读取事件消息缓冲区指令;
B6、所述BMC控制器将所述事件消息缓冲区中的所述关机事件发送至所述IPMI工具包;
B7、所述IPMI工具包解析验证所述关机事件,先停止服务进程,再向所述BMC控制器将发送强制下电命令;
B8、所述BMC控制器根据所述强制下电命令,通过CPLD进行下电操作,完成服务器安全关机。
一种服务器安全开关机系统,包括:操作子系统和基板管理控制器BMC子系统;所述操作子系统和所述BMC子系统设置于服务器;
通过所述BMC子系统检测所述操作子系统的状态信息,根据所述状态信息进行开机决策;
通过所述BMC子系统与所述操作子系统进行关机流程状态验证,根据验证结果进行关机决策。
进一步地,所述状态信息至少包括:服务器电源开机或者关机状态信息、硬件设备状态信息;
其中,所述硬件设备状态信息至少包括:备用电源BBU接入信息、中央处理器CPU温度信息、风扇冗余信息。
进一步地,所述操作子系统包括:用于监听所述BMC子系统的消息事件的应用程序模块;用于来实现智能型平台管理接口IPMI协议规范的IPMI驱动模块;用于与所述BMC子系统进行通讯的IPMI通讯模块;
所述BMC子系统包括:用于提供人机管理界面的网页模块;用于为所述操作子系统提供服务端响应的IPMI模块;用于提供所述BMC子系统与CPU处理器进行物理信息交互的低引脚数总线LPC模块;用于通过复杂可编程逻辑器件CPLD对所述操作子系统进行上下电操作的通用型输入输出接口GPIO模块。
进一步地,所述BMC子系统检测所述操作子系统的状态信息,根据所述状态信息进行开机决策,包括:
A1、所述BMC子系统检测的所述操作子系统的电源状态,若为关机状态,则检测硬件状态;若为开机状态,则结束流程;
A2、在所述操作子系统的电源为备用电源BBU时,所述BMC子系统检测所述BBU电源线是否接入正常,若正常,则继续检测所述硬件状态;若不正常,则结束流程;
A3、所述BMC子系统依次检测所述操作子系统的CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,完成服务器安全开机。
进一步地,所述BMC子系统与所述操作子系统进行关机流程状态验证,根据验证结果进行关机决策,包括:
B1、所述BMC子系统接收关机请求指令,将关机事件存入事件消息缓冲区,并在比特流协议接口BT置起中断事件EVT_ATN;
B2、所述操作子系统通过IPMI驱动模块监听并接收所述中断事件EVT_ATN;
B3、所述操作子系统将与所述中断事件EVT_ATN对应的中断信号发送至IPMI通讯模块,并通过所述IPMI通讯模块向所述BMC子系统发送获取消息标识;
B4、所述BMC子系统的IPMI模块对所述获取消息标识进行应答,将获取事件消息标识发送至所述IPMI通讯模块;
B5、所述操作子系统的所述IPMI通讯模块向所述BMC子系统发送读取事件消息缓冲区指令;
B6、所述BMC子系统将所述事件消息缓冲区中的所述关机事件发送至所述IPMI通讯模块;
B7、所述IPMI通讯模块解析验证所述关机事件,先停止服务进程,再向所述BMC子系统将发送强制下电命令;
B8、所述BMC子系统根据所述强制下电命令,GPIO模块通过CPLD进行下电操作,完成服务器安全关机。
有益效果:
(1)一种服务器安全开关机方法,采用基板管理控制器BMC检测服务器的操作系统的状态信息,根据状态信息进行开机决策,在开机动作前检测服务器硬件健康状态,判断硬件是否处于故障异常状态,确保服务器在硬件安全可靠的情况下进行上电开机。通过BMC控制器与操作系统进行关机流程状态验证,根据验证结果进行关机决策,通过BMC与系统OS反复确认关机流程状态,确保了服务器业务的可靠性。
(2)BMC子系统检测BBU电源线是否接入正常,若正常,则继续检测硬件状态;若不正常,则结束流程,可以防止BBU电源在电池待机状态下开机,导致BBU电池电量快速消耗。
(3)BMC子系统依次检测操作子系统的CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,防止CPU再次过热导致CPU芯片损坏,并防止散热风扇数量不足情况下开机,避免服务器内部温度上升故障的产生。
(4)IPMI通讯模块解析验证关机事件,先停止服务进程,再向BMC子系统将发送强制下电命令,能够在BMC子系统执行关机时与操作子系统的应用层交互关机事件消息信息,实现了先关闭系统业务再关机下电,保证了应用层业务执行的可靠性。
附图说明
图1是本发明的服务器安全开关机系统的结构框图;
图2是本发明的一种服务器安全开机方法流程图;
图3是本发明的一种服务器安全关机方法流程图。
具体实施方式
本发明提供了一种服务器安全开关机方法及系统,采用基板管理控制器BMC检测服务器的操作系统的状态信息,根据状态信息进行开机决策,在开机动作前检测服务器硬件健康状态,判断硬件是否处于故障异常状态,确保服务器在硬件安全可靠的情况下进行上电开机。通过BMC控制器与操作系统进行关机流程状态验证,根据验证结果进行关机决策,通过BMC与操作系统OS反复确认关机流程状态,确保了服务器业务的可靠性。
下面结合附图并举实施例,对本发明进行详细描述。
基板管理控制器(Baseboard Management Controller,BMC)与智能型平台管理接口(Intelligent Platform Management Interface,IPMI)是服务器的基本核心功能子系统,负责服务器的硬件状态管理、操作系统管理、健康状态管理、电源管理等核心功能。
BMC是独立于服务器系统之外的小型操作系统,是一个集成在主板上的芯片。服务器集群一般使用BMC指令或进行大规模无人值守操作,包括服务器的远程管理、监控、安装、重启电源等。
本发明实施例提供了一种服务器安全开关机方法,包括:
步骤一、采用基板管理控制器BMC检测服务器的操作系统的状态信息,根据状态信息进行开机决策;
在一具体实施例中,状态信息至少包括:服务器电源开机或者关机状态信息、硬件设备状态信息;其中,硬件设备状态信息至少包括:备用电源(Battery Backup Unit,BBU)接入信息、中央处理器CPU温度信息、风扇冗余信息。
步骤二、通过BMC控制器与操作系统进行关机流程状态验证,根据验证结果进行关机决策。
在一具体实施例中,步骤一中,根据状态信息进行开机决策,包括:
A1、BMC控制器检测服务器电源状态,若为关机状态,则检测硬件状态;若为开机状态,则结束流程;
A2、在服务器电源为备用电源BBU时,BMC控制器检测BBU电源线是否接入正常,若正常,则继续检测硬件状态;若不正常,则结束流程;
A3、BMC控制器依次检测CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,完成服务器安全开机。
在一具体实施例中,在步骤二中,通过BMC控制器与操作系统进行关机流程状态验证,根据验证结果进行关机决策,包括:
B1、BMC控制器接收关机请求指令,将关机事件存入事件消息缓冲区,并在比特流协议接口(Bit Torrent,BT)置起中断事件EVT_ATN;
B2、操作系统通过智能型平台管理接口IPMI监听并接收中断事件EVT_ATN;
B3、操作系统将与中断事件EVT_ATN对应的中断信号发送至IPMI工具包,并通过IPMI工具包向BMC控制器发送获取消息标识;
B4、BMC控制器对获取消息标识进行应答,将获取事件消息标识发送至IPMI工具包;
B5、操作系统的IPMI工具包向BMC控制器发送读取事件消息缓冲区指令;
B6、BMC控制器将事件消息缓冲区中的关机事件发送至IPMI工具包;
B7、IPMI工具包解析验证关机事件,先停止服务进程,再向BMC控制器将发送强制下电命令;
B8、BMC控制器根据强制下电命令,通过CPLD进行下电操作,完成服务器安全关机。
本发明实施例还提供了一种服务器安全开关机系统,包括:操作子系统和基板管理控制器BMC子系统;操作子系统和BMC子系统设置于服务器;通过BMC子系统检测操作子系统的状态信息,根据状态信息进行开机决策;通过BMC子系统与操作子系统进行关机流程状态验证,根据验证结果进行关机决策。
在一具体实施例中,状态信息至少包括:服务器电源开机或者关机状态信息、硬件设备状态信息;
其中,硬件设备状态信息至少包括:备用电源BBU接入信息、中央处理器CPU温度信息、风扇冗余信息。
在一具体实施例中,操作子系统包括:用于监听BMC子系统的消息事件的应用程序模块;用于来实现智能型平台管理接口IPMI协议规范的IPMI驱动模块;用于与BMC子系统进行通讯的IPMI通讯模块;
BMC子系统包括:用于提供人机管理界面的网页模块;用于为操作子系统提供服务端响应的IPMI模块;用于提供BMC子系统与CPU处理器进行物理信息交互的低引脚数总线(Low Pin Count,LPC)模块;用于通过复杂可编程逻辑器件CPLD对操作子系统进行上下电操作的通用型输入输出接口(General Purpose Input/Output,GPIO)模块。
在一具体实施例中,BMC子系统检测操作子系统的状态信息,根据状态信息进行开机决策,包括:
A1、BMC子系统检测的操作子系统的电源状态,若为关机状态,则检测硬件状态;若为开机状态,则结束流程;
A2、在操作子系统的电源为备用电源BBU时,BMC子系统检测BBU电源线是否接入正常,若正常,则继续检测硬件状态;若不正常,则结束流程;
A3、BMC子系统依次检测操作子系统的CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,完成服务器安全开机。
在一具体实施例中,BMC子系统与操作子系统进行关机流程状态验证,根据验证结果进行关机决策,包括:
B1、BMC子系统接收关机请求指令,将关机事件存入事件消息缓冲区,并在比特流协议接口BT置起中断事件EVT_ATN;
B2、操作子系统通过IPMI驱动模块监听并接收中断事件EVT_ATN;
B3、操作子系统将与中断事件EVT_ATN对应的中断信号发送至IPMI通讯模块,并通过IPMI通讯模块向BMC子系统发送获取消息标识;
B4、BMC子系统的IPMI模块对获取消息标识进行应答,将获取事件消息标识发送至IPMI通讯模块;
B5、操作子系统的IPMI通讯模块向BMC子系统发送读取事件消息缓冲区指令;
B6、BMC子系统将事件消息缓冲区中的关机事件发送至IPMI通讯模块;
B7、IPMI通讯模块解析验证关机事件,先停止服务进程,再向BMC子系统将发送强制下电命令;
B8、BMC子系统根据强制下电命令,GPIO模块通过CPLD进行下电操作,完成服务器安全关机。
为了使得本领域的技术人员更好地可理解本发明的技术方案,下面结合具体的场景实施例进行阐述。
场景实施例一
在本场景实施例中,根据具体的系统框架附图和开关机方法流程图,对本发明提供的系统和方法进行详细介绍。
图1是本发明的服务器安全开关机系统的结构框图,如图1所示,硬件层面,硬件层主要提供服务器子系统模块之间通讯物理接口,其物理接口包括了负责执行程序任务的CPU处理器、负责提供服务器电源输入的电脑电能供应单元(PC Power supply unit,PSU)、负责处理硬件逻辑的CPLD器件、负责BMC与CPLD之间传递电平信号或数据的GPIO/I2C接口(即上述实施例中的GPIO模块)。操作系统层提供OS下监听BMC消息事件的应用程序、内核用于来实现IPMI协议规范的IPMI驱动。通讯层主要为监听解析IPMI消息的ipmiutil通讯模块(即上述实施例中的IPMI通讯模块)、提供用户人机界面管理单元的WEB模块、提供IPMI服务端响应的IPMI模块、带外控制的简单网络管理协议(Simple Network ManagementProtocol,SNMP)模块、提供以太网接口的网络模块、提供BMC与CPU信息交互物理接口的LPC模块。
操作系统通过IPMI驱动,实现了与BMC的信息交互;通过LPC通信总线,使BMC可以向操作系统OS发送BT接口的Evt_ATN中断信号,操作系统OS收到信号后,触发ipmiutil使用IPMI标准协议发送Get Message Flags消息。
BMC系统通过IPMI模块,对服务器发送Get Message Flags消息进行应答,当通过IPMI或WEB控制安全关机时,BMC将Message Flags置位,操作系统进行检查Get MessageFlags置位标志,再通过ipmiutil通讯模块使用IPMI标准协议发送Read Event Message消息来读取详细的事件消息,BMC通过IPMI模块将当前安全关机的事件消息进行返回。操作系统解析时间消息为关机指令时,进入停机HALT状态关闭系统后,再通过ipmiutil向BMC发送下电指令。
图2是本发明的一种服务器安全开机方法流程图,如图2所示,该流程包括以下步骤:
步骤一、服务器安全开机。可通过向BMC发送IPMI开机命令或在BMC web页面点击开机按键。
步骤二、BMC检查当前服务器电源状态,为关机状态时,再继续流程检测硬件状态;若检测到当前状态为开机状态时,则忽略此次开机请求,结束流程,防止开机误动作。
步骤三、服务器电源若为备用电源BBU电源时,则检测BBU电源线接入是否正常,为接入交流电源(Alternating Current,AC)、DC电源线正常接入时继续流程检测硬件状态;若BBU电源未接入AC、DC电源线时则忽略此次开机请求,防止BBU电源在电池待机状态下开机,导致BBU电池电量快速消耗。
步骤四、检测服务器CPU内部温度是否超温,未超温则继续流程检测硬件状态;若CPU处于超温状态,则忽略此次开机请求,防止CPU再次过热导致CPU芯片损坏。
步骤五、检测风扇冗余是否正常,若正常散热风扇个数不足时,则忽略此次开机请求,防止散热风扇数量不足情况下开机,避免服务器内部温度上升故障的产生。
步骤六、以上检测均通过时,则控制CPLD进行DC上电。
步骤七、流程结束。
图3是本发明的一种服务器安全关机方法流程图,如图3所示,该流程包括以下步骤:
步骤一、服务器安全关机,可通过BMC发送IPMI关机命令或在BMC web页面点击安全关机按键。
步骤二、BMC收到请求后将关机事件放入事件消息缓冲区Event Message Buffer,BMC通过低引脚数(Low Pin Count,LPC)总线将BT通讯接口置起EVT_ATN中断事件。
步骤三、服务器OS系统的IPMI驱动使用中断方式进行监听BT中断。
步骤四、服务器OS系统收到BT通道的EVT_ATN中断后,将IPMI中断信号传递给ipmiutil服务,ipmiutil收到中断后向BMC发送Get Message Flags的ipmi命令。
步骤五、BMC的ipmi模块对Get Message Flags命令进行应答,回复当前有中断事件发生。
步骤六、ipmiutil服务收到有Get Event Message Flags状态置位后,继续发送查询详细事件信息的Read Event Message Buffer命令。
步骤七、BMC将Event Message Buffer里的关机事件应答给ipmiutil服务。
步骤八、ipmiutil服务收到安全开机消息后,置起异步信号,通知应用层处理关机消息。
步骤九、ipmiutil服务解析消息事件,如果为关机事件,将OS系统置为“HALT”状态,停止正在运行的服务进程,待所有服务进程都停止后向BMC发送强制下电命令。
步骤十、BMC收到下电命令,控制CPLD进行DC下电。
步骤十一、结束流程。
本发明方案通过可以在BMC冷重启后提取BMC web概览页面信息,包括:主机名、服务器信息、BMC信息;网页化WEB硬件状态页面信息:硬盘信息;通过操作系统层面提取laninfo(BMC IP信息)、mc info(BMC固件版本信息)、sensor(机箱传感器信息)、sel(系统日志信息)、bios ver info(BIOS固件版本信息)、Device GUID(服务器全局唯一标识符信息),检测BMC在冷重启后与基本输入输出系统(Basic Input Output System,BIOS)交互的连通性,确保BMC和BIOS双方测试信息一致性。针对BMC与操作系统登录的用户名和密码可以进行配置,可以在多个环境之间来回切换。具有高并发性,支持同时启动多个环境压力测试。
在方法层面,本发明的安全开关机的方法,通过在开机动作前检测服务器硬件健康状态,判断硬件是否处于故障异常状态,确保服务器在硬件安全可靠的情况下进行上电开机。本发明的安全开关机的方法,在执行软关机的动作时,通过BMC与系统OS反复确认关机流程状态,从而达到系统OS先关闭,再执行下电关机动作,确保了服务器业务的可靠性。
在系统层面,采用模块通讯、应答流程化的方式,确保开关机事件的可靠性。能够在服务器开机前通过BMC进行自检硬件状态,相对传统直接上电开机提高了安全性。能够在BMC侧执行关机时与系统OS应用层交互关机事件消息信息,实现了先关闭系统业务再关机下电。
以上的具体实施例仅描述了本发明的设计原理,该描述中的部件形状,名称可以不同,不受限制。所以,本发明领域的技术人员可以对前述实施例记载的技术方案进行修改或等同替换;而这些修改和替换未脱离本发明创造宗旨和技术方案,均应属于本发明的保护范围。

Claims (9)

1.一种服务器安全开关机方法,其特征在于,包括:
采用基板管理控制器BMC检测服务器的操作系统的状态信息,根据所述状态信息进行开机决策;
通过所述BMC控制器与所述操作系统进行关机流程状态验证,根据验证结果进行关机决策。
2.如权利要求1所述的方法,其特征在于,所述状态信息至少包括:服务器电源开机或者关机状态信息、硬件设备状态信息;
其中,所述硬件设备状态信息至少包括:备用电源BBU接入信息、中央处理器CPU温度信息、风扇冗余信息。
3.如权利要求1所述的方法,其特征在于,所述根据状态信息进行开机决策,包括:
A1、所述BMC控制器检测服务器电源状态,若为关机状态,则检测硬件状态;若为开机状态,则结束流程;
A2、在所述服务器电源为备用电源BBU时,所述BMC控制器检测所述BBU电源线是否接入正常,若正常,则继续检测所述硬件状态;若不正常,则结束流程;
A3、所述BMC控制器依次检测CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,完成服务器安全开机。
4.如权利要求1所述的方法,其特征在于,所述通过BMC控制器与所述操作系统进行关机流程状态验证,根据验证结果进行关机决策,包括:
B1、所述BMC控制器接收关机请求指令,将关机事件存入事件消息缓冲区,并在比特流协议接口BT置起中断事件EVT_ATN;
B2、所述操作系统通过智能型平台管理接口IPMI监听并接收所述中断事件EVT_ATN;
B3、所述操作系统将与所述中断事件EVT_ATN对应的中断信号发送至IPMI工具包,并通过所述IPMI工具包向所述BMC控制器发送获取消息标识;
B4、所述BMC控制器对所述获取消息标识进行应答,将获取事件消息标识发送至所述IPMI工具包;
B5、所述操作系统的所述IPMI工具包向所述BMC控制器发送读取事件消息缓冲区指令;
B6、所述BMC控制器将所述事件消息缓冲区中的所述关机事件发送至所述IPMI工具包;
B7、所述IPMI工具包解析验证所述关机事件,先停止服务进程,再向所述BMC控制器将发送强制下电命令;
B8、所述BMC控制器根据所述强制下电命令,通过CPLD进行下电操作,完成服务器安全关机。
5.一种服务器安全开关机系统,其特征在于,包括:操作子系统和基板管理控制器BMC子系统;所述操作子系统和所述BMC子系统设置于服务器;
通过所述BMC子系统检测所述操作子系统的状态信息,根据所述状态信息进行开机决策;
通过所述BMC子系统与所述操作子系统进行关机流程状态验证,根据验证结果进行关机决策。
6.如权利要求5所述的系统,其特征在于,所述状态信息至少包括:服务器电源开机或者关机状态信息、硬件设备状态信息;
其中,所述硬件设备状态信息至少包括:备用电源BBU接入信息、中央处理器CPU温度信息、风扇冗余信息。
7.如权利要求5所述的系统,其特征在于,
所述操作子系统包括:用于监听所述BMC子系统的消息事件的应用程序模块;用于来实现智能型平台管理接口IPMI协议规范的IPMI驱动模块;用于与所述BMC子系统进行通讯的IPMI通讯模块;
所述BMC子系统包括:用于提供人机管理界面的网页模块;用于为所述操作子系统提供服务端响应的IPMI模块;用于提供所述BMC子系统与CPU处理器进行物理信息交互的低引脚数总线LPC模块;用于通过复杂可编程逻辑器件CPLD对所述操作子系统进行上下电操作的通用型输入输出接口GPIO模块。
8.如权利要求5所述的系统,其特征在于,所述BMC子系统检测所述操作子系统的状态信息,根据所述状态信息进行开机决策,包括:
A1、所述BMC子系统检测的所述操作子系统的电源状态,若为关机状态,则检测硬件状态;若为开机状态,则结束流程;
A2、在所述操作子系统的电源为备用电源BBU时,所述BMC子系统检测所述BBU电源线是否接入正常,若正常,则继续检测所述硬件状态;若不正常,则结束流程;
A3、所述BMC子系统依次检测所述操作子系统的CPU温度和风扇冗余,在CPU温度信息和风扇冗余信息均满足条件的情况下,通过复杂可编程逻辑器件CPLD控制电源上电,完成服务器安全开机。
9.如权利要求5所述的系统,其特征在于,所述BMC子系统与所述操作子系统进行关机流程状态验证,根据验证结果进行关机决策,包括:
B1、所述BMC子系统接收关机请求指令,将关机事件存入事件消息缓冲区,并在比特流协议接口BT置起中断事件EVT_ATN;
B2、所述操作子系统通过IPMI驱动模块监听并接收所述中断事件EVT_ATN;
B3、所述操作子系统将与所述中断事件EVT_ATN对应的中断信号发送至IPMI通讯模块,并通过所述IPMI通讯模块向所述BMC子系统发送获取消息标识;
B4、所述BMC子系统的IPMI模块对所述获取消息标识进行应答,将获取事件消息标识发送至所述IPMI通讯模块;
B5、所述操作子系统的所述IPMI通讯模块向所述BMC子系统发送读取事件消息缓冲区指令;
B6、所述BMC子系统将所述事件消息缓冲区中的所述关机事件发送至所述IPMI通讯模块;
B7、所述IPMI通讯模块解析验证所述关机事件,先停止服务进程,再向所述BMC子系统将发送强制下电命令;
B8、所述BMC子系统根据所述强制下电命令,GPIO模块通过CPLD进行下电操作,完成服务器安全关机。
CN202211728315.9A 2022-12-29 2022-12-29 一种服务器安全开关机方法及系统 Pending CN116028123A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211728315.9A CN116028123A (zh) 2022-12-29 2022-12-29 一种服务器安全开关机方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211728315.9A CN116028123A (zh) 2022-12-29 2022-12-29 一种服务器安全开关机方法及系统

Publications (1)

Publication Number Publication Date
CN116028123A true CN116028123A (zh) 2023-04-28

Family

ID=86075433

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211728315.9A Pending CN116028123A (zh) 2022-12-29 2022-12-29 一种服务器安全开关机方法及系统

Country Status (1)

Country Link
CN (1) CN116028123A (zh)

Similar Documents

Publication Publication Date Title
CN107885686B (zh) 一种采用bmc控制单个硬盘重启的系统及方法
CN111831488B (zh) 具有安全等级设计的tcms-mpu控制单元
US8578182B2 (en) Power lock-up setting method performed by baseboard management controller and electronic apparatus using the same
CN102880527B (zh) 一种基板管理控制器的数据恢复方法
CN106055440B (zh) 一种通过bmc实现服务器异常断电的测试方法及系统
CN104899120A (zh) 一种基于bmc开关机功能的服务器稳定性测试方法
CN100378617C (zh) 网络唤醒装置与方法
TW201430541A (zh) 電源管理電路、伺服器與其電源管理方法
CN110764973A (zh) 基于识别工控主机关机状态的整机设备断电系统及方法
CN111737064A (zh) 一种bmc系统控制方法、装置、存储介质和计算机设备
CN110769051B (zh) 基于国产处理器的嵌入式服务器远程管理系统及方法
CN115686935A (zh) 数据备份方法、计算机设备及存储介质
WO2023029375A1 (zh) 一种四路服务器电源功耗管理装置
EP2924538B1 (en) Computer system and method for its operation
CN109582505B (zh) 一种bios选项默认值的恢复系统、方法及装置
CN113609051A (zh) 一种扩展板的热插拔方法、系统、装置及计算机存储介质
CN218824636U (zh) 一种用于服务器硬盘背板的电源检测装置
CN116028123A (zh) 一种服务器安全开关机方法及系统
CN110109525A (zh) 一种远程控制主板断电的方法
CN115407861A (zh) 目标设备供电方法、系统、装置及计算机可读存储介质
CN114385405A (zh) 一种实现服务器重启原因记录的方法、装置、系统
CN114443067A (zh) 一种cpld文件烧录系统及cpld文件烧录方法
CN114138567A (zh) 一种基板管理控制模块维护方法、装置、设备及存储介质
CN110647435A (zh) 服务器、硬盘远程控制方法及控制组件
CN216486425U (zh) 一种刀片服务器交叉控制装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination