CN117687491A - 电源故障处理方法、系统、终端及存储介质 - Google Patents

电源故障处理方法、系统、终端及存储介质 Download PDF

Info

Publication number
CN117687491A
CN117687491A CN202311457197.7A CN202311457197A CN117687491A CN 117687491 A CN117687491 A CN 117687491A CN 202311457197 A CN202311457197 A CN 202311457197A CN 117687491 A CN117687491 A CN 117687491A
Authority
CN
China
Prior art keywords
power supply
power
state
fault
configuration scheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311457197.7A
Other languages
English (en)
Inventor
王树
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311457197.7A priority Critical patent/CN117687491A/zh
Publication of CN117687491A publication Critical patent/CN117687491A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Power Sources (AREA)

Abstract

本发明涉及服务器技术领域,具体提供一种电源故障处理方法、系统、终端及存储介质,包括:BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;定位故障电源,将故障电源对应的电源线路断开。本发明通过监控电源状态,并在监控到电源故障后,调取相应的电源工作模式配置方案,实现对电源的精细化管理,进一步的,将故障电源所在的线路断开,降低故障电源对服务器电源器件的损害。

Description

电源故障处理方法、系统、终端及存储介质
技术领域
本发明属于服务器技术领域,具体涉及一种电源故障处理方法、系统、终端及存储介质。
背景技术
随着大数据及云计算的发展,对服务器的计算能力以及系统运行稳定性要求越来越高。服务器电源作为整机能量提供单元,为提高系统的稳定性,通常会设计冗余电源。所以服务器电源通常设计支持N+N 冗余,当一个电源发生故障,冗余电源可以继续提供能量,保障系统正常运行。
相关冗余电源控制方法是通过BMC控制电源的工作状态,即在系统支持电源N+N冗余时,设置N个电源处于主输出工作状态(active),N个电源处于备用状态(standby)。当其中一个电源发生故障,处于备用状态的电源立即进入正常工作模式,保障系统的正常运行,及所有电源退出active+standby的工作模式,都进入正常工作模式。当服务器电源出现故障,会触发电源的保护机制,服务器电源的状态灯由绿色常亮变为橙色常亮,通过服务器系统发送电源状态字查询命令,根据返回的状态字确定电源的故障原因。
这种处理方式比较粗放,不能针对故障电源进行精细化控制,此外并未对故障电源进行断开处理,故障因素可能对电源本身器件造成损害。
发明内容
针对现有技术的上述不足,本发明提供一种电源故障处理方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种电源故障处理方法,包括:
BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;
将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;
定位故障电源,将故障电源对应的电源线路断开。
在一个可选的实施方式中,BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案,包括:
BMC轮询所有电源的状态字;
基于状态字的数值与电源状态的对应关系,解析电源的状态字表示的电源状态;
若所述电源状态为故障状态,则解析故障电源的规格,基于所述规格调取相应的电源工作模式配置方案。
在一个可选的实施方式中,所述方法还包括:
预先配置不同规格故障电源对应的电源工作模式配置方案,电源工作模式配置方案限定了剩余的不同规格电源对应的工作模式,所述工作模式为均衡模式、主供电模式、备供电模式中的任一种。
在一个可选的实施方式中,将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式,包括:
BMC采集电源的规格,基于电源的规格和电源工作模式配置方案为电源分配工作模式;
将分配的工作模式写入电源的控制器的寄存器中,所述控制器为控制所述电源工作状态的CPLD。
在一个可选的实施方式中,在BMC确认冗余电源中存在故障电源之后,所述方法还包括:
利用电压隔离模块将BMC的供电网络由服务器的电源切换至POE系统由交换机的PSE进行供电,所述BMC通过网络接口连接交换机。
在一个可选的实施方式中,定位故障电源,将故障电源对应的电源线路断开,包括:
建立电源的线路编号与继电器编号的对应关系;
若电源的电源状态为输入电压过压状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
若电源的电源状态为输出短路状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
在监控到生成故障电源处理完成的提示信息之后,将电源的编号发送至电源移除装置,电源移除装置基于预设电源编号与电源所在机柜的位置坐标对应信息,将相应的电源从服务器中拔出。
在一个可选的实施方式中,所述电源移除装置包括机械手。
第二方面,本发明提供一种电源故障处理系统,包括:
配置调取模块,用于BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;
模式调整模块,用于将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;
线路处理模块,用于定位故障电源,将故障电源对应的电源线路断开。
在一个可选的实施方式中,配置调取模块包括:
状态轮询单元,用于BMC轮询所有电源的状态字;
状态解析单元,用于基于状态字的数值与电源状态的对应关系,解析电源的状态字表示的电源状态;
方案调取单元,用于若所述电源状态为故障状态,则解析故障电源的规格,基于所述规格调取相应的电源工作模式配置方案。
在一个可选的实施方式中,所述系统还包括:
预先配置不同规格故障电源对应的电源工作模式配置方案,电源工作模式配置方案限定了剩余的不同规格电源对应的工作模式,所述工作模式为均衡模式、主供电模式、备供电模式中的任一种。
在一个可选的实施方式中,模式调整模块包括:
模式分配单元,用于BMC采集电源的规格,基于电源的规格和电源工作模式配置方案为电源分配工作模式;
模式下发单元,用于将分配的工作模式写入电源的控制器的寄存器中,所述控制器为控制所述电源工作状态的CPLD。
在一个可选的实施方式中,所述系统还包括:
电源切换模块,用于利用电压隔离模块将BMC的供电网络由服务器的电源切换至POE系统由交换机的PSE进行供电,所述BMC通过网络接口连接交换机。
在一个可选的实施方式中,线路处理模块包括:
关系建立单元,用于建立电源的线路编号与继电器编号的对应关系;
第一控制单元,用于若电源的电源状态为输入电压过压状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
第一校对单元,用于查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
第二控制单元,用于若电源的电源状态为输出短路状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
第二校对单元,用于查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
线路处理单元,用于在监控到生成故障电源处理完成的提示信息之后,将电源的编号发送至电源移除装置,电源移除装置基于预设电源编号与电源所在机柜的位置坐标对应信息,将相应的电源从服务器中拔出。
在一个可选的实施方式中,所述电源移除装置包括机械手。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,本发明提供的电源故障处理方法、系统、终端及存储介质,通过监控电源状态,并在监控到电源故障后,调取相应的电源工作模式配置方案,实现对电源的精细化管理,进一步的,将故障电源所在的线路断开,降低故障电源对服务器电源器件的损害。
本发明通过轮询电源状态字实现对电源的状态监控,进一步基于故障状态的电源的规格调取相应的电源工作模式配置方案,并基于该方案和剩余正常电源的规格为各电源分配工作模式,进而实现对不同规格的电源的精细化管理。
本发明通过识别电源状态,对处于短路输出状态的电源进行继电器控制,使其断开,通过识别电源状态,对处于短路输出状态的电源进行继电器控制,使其断开,进一步控制电源移除装置,如机械手,将故障电源从服务器中移除,进一步避免了异常因素或异常电压电流对服务器器件可能存在的冲击影响。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的移除电源的示意性流程图。
图3是本发明一个实施例的方法的对于一种故障状态的移除电源的示意性流程图。
图4是是本发明一个实施例的方法的对于另一种故障状态的移除电源的示意性流程图。
图5是本发明一个实施例的系统的示意性框图。
图6为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
下面对本发明中出现的关键术语进行解释。
BMC,执行伺服器远端管理控制器,英文全称为Baseboard ManagementController. 为基板管理控制器。它可以在机器未开机的状态下,对机器进行固件升级、查看机器设备、等一些操作。在BMC中完全实现IPMI功能需要一个功能强大的16位元或32位元微控制器以及用于数据储存的RAM、用于非挥发性数据储存的快闪记忆体和韧体,在安全远程重启、安全重新上电、LAN警告和系统健康监视方面能提供基本的远程可管理性。除了基本的IPMI功能和系统工作监视功能外,通过利用2个快闪记忆体之一储存以前的BIOS,mBMC还能实现BIOS快速元件的选择和保护。例如,在远程BIOS升级後系统不能启动时,远程管理人员可以切换回以前工作的BIOS映像来启动系统。一旦BIOS升级後,BIOS映像还能被锁住,可有效防止病毒对它的侵害。
远程电源管理器(Reachctrl Power)又叫智能PDU、IP电源、智能电源、机架式电源分配单元,同时兼具电源分配和管理功能。智能PDU既可以监测供电电压、供电电压频率、每路输出电流等参数,还能够实现远程控制、集中式管理、自动周期控制、安全性管理、可靠性管理等,是电源管理的好帮手。
本发明实施例提供的电源故障处理方法由计算机设备执行,相应地,电源故障处理系统运行于计算机设备中。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种电源故障处理系统。根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
如图1所示,该方法包括:
步骤110,BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;
步骤120,将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;
步骤130,定位故障电源,将故障电源对应的电源线路断开。
为了便于对本发明的理解,下面以本发明电源故障处理方法的原理,结合实施例中对电源故障进行处理的过程,对本发明提供的电源故障处理方法做进一步的描述。
具体的,所述电源故障处理方法包括:
S1、BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案。
利用电压隔离模块将BMC的供电网络由服务器的电源切换至POE系统由交换机的PSE进行供电,所述BMC通过网络接口连接交换机。
采样BMC进行电源故障处理,因此为了保证BMC的供电,为其设置独立电源。
预先配置不同规格故障电源对应的电源工作模式配置方案,电源工作模式配置方案限定了剩余的不同规格电源对应的工作模式,所述工作模式为均衡模式、主供电模式、备供电模式中的任一种。
BMC轮询所有电源的状态字;基于状态字的数值与电源状态的对应关系,解析电源的状态字表示的电源状态;若所述电源状态为故障状态,则解析故障电源的规格,基于所述规格调取相应的电源工作模式配置方案。
具体的,配置不同规格故障电源对应的电源工作模式配置方案包括:将不同供电功率的电源划分至不同规格等级,供电功率越大对应的规格等级越高,若低规格等级电源故障,则从冗余电源中选取一个中等级规格的电源,将其工作状态由备供电模式变更为主供电模式;若中规格等级的电源故障,则从冗余电源中选取一个高等级规格的电源,将其工作状态由备供电模式变更为主供电模式;若高规格等级的电源故障,则将所有正常电源设置为均衡模式,在均衡模式下由所有电源均摊功耗。
BMC通过进入服务器系统向各个电源状态寄存器发送查询命令,返回值状态字为0000时,表示电源工作状态正常。若返回值状态字不是0000时,认定为电源异常。
S2、将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式。
BMC采集电源的规格,基于电源的规格和电源工作模式配置方案为电源分配工作模式;将分配的工作模式写入电源的控制器的寄存器中,所述控制器为控制所述电源工作状态的CPLD。
以低规格等级电源故障为例,调取的相应电源工作模式配置方案将一个中规格等级的电源的工作模式变更为主供电模式。获取所有正常电源的规格,从中随机选取一个工作模式为备供电模式的中规格等级电源,获取该中规格等级电源对应的CPLD寄存器地址,向该CPLD寄存器写入主供电模式,以使该CPLD将电源的工作模式变更为主供电模式。
S3、定位故障电源,将故障电源对应的电源线路断开。
请参考图3,机柜、智能PDU、机械手三者通过无线模块进行通信,将机柜无线模块设为主模块,智能PDU和机械手无线模块设为从模块,当主模块发出信号,从模块都能收到相应信号。从模块收到信号后,将信号传递给各自的信号处理单元,信号处理单元根据电源故障类型,通过控制单元去控制PDU的接通与关断,以及触发机械手的任务去锁定故障电源并将故障电源拔出。机柜的服务器通过交换机用网线连接机柜电源信息采集模块,通过轮询机柜服务器电源的状态字,将电源状态信号传递给机柜电源信息处理模块,当出现电源故障信号,通过机柜主模块发出。
将机柜服务器电源进行编号,分别命名PSU0、PSU1……PSUn,同时将PDU每个电源插孔进行编号,分别命名A0、A1……An。在机柜竖排和每一横排上面都贴有含有位置信息的条形码,将服务器位置固定好后,每一个电源的位置可用横排和竖排条形码的坐标组合来代替。将每一个电源的条形码坐标组合,作为控制参数,通过机械手的位置读取操作,反馈给控制单元。机械手前方装有位置读卡器,在接到控制单元发出的拔出电源命令后,机械手通过读卡器扫描条形码,确定电源位置,继而进行拔出电源的操作。服务器电源与PDU通过电源线连接,连接关系为PSU0对应A0,……,PSUn对应An。
机柜服务器电源正常运行后,机柜的服务器通过交换机用网线连接机柜电源信息采集模块。通过轮询机柜服务器所有电源的状态字,监测服务器电源状态。服务器电源故障产生自我保护,一般包括风扇故障保护、入风口过温保护、输出过压保护、输出欠压保护、输出过流保护、输入过压保护、输入欠压保护、12V输出短路保护。当电源正常工作时,电源信息采集模块通过进入服务器系统向电源状态寄存器发送查询命令,返回正常的状态字。当电源出现故障时,电源信息采集模块通过进入服务器系统向电源状态寄存器发送查询命令,返回异常的状态字。
当机柜电源信息采集模块通过进入服务器系统向各个电源状态寄存器发送查询命令,返回值状态字为0000时,表示电源工作状态正常。电源信息采集模块将电源状态字信息,传递给机柜电源信息处理模块,经过状态字识别,将各个电源工作状态正常的信号通过机柜无线主模块发出,当智能PDU与机械手无线从模块收到各个电源工作正常的信号后,传递给各自的信号处理单元,通过信号识别到各个电源工作正常,智能PDU与机械手的控制单元控制相应的响应机构保持工作状态不变。
对于过电压故障类型:建立电源的线路编号与继电器编号的对应关系;若电源的电源状态为输入电压过压状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息。
具体的,如图3所示,当机柜电源信息采集模块通过进入服务器系统向各个电源状态寄存器发送查询命令,返回值状态字为2840时,表示电源工作状态为输入电压过压状态。电源信息采集模块将电源状态字信息,传递给机柜电源信息处理模块,经过状态字识别,将工作状态为输入电压过压的电源信息,通过机柜无线主模块发出,当智能PDU与机械手无线从模块收到处于异常工作状态的电源信息后,传递给各自的信号处理单元,智能PDU根据电源故障分类,判定电源处于输入过压工作状态时需要切断该电源的输入电压。智能PDU信号处理单元将需要切断输入电压的电源信息传递给控制单元,通过控制与该电源对应PDU电源插孔的继电器断开,使故障电源断电。故障电源断电后,机柜电源信息采集模块通过进入服务器系统,向该故障电源状态寄存器发送查询命令,返回值状态字为2004时,表示电源输入电压已切断。机械手根据电源故障分类,判定电源处于输入过压工作状态时,不需要执行拔出故障电源的操作,机械手控制单元控制相应的响应机构保持工作状态不变。
对于短路故障类型:若电源的电源状态为输出短路状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;在监控到生成故障电源处理完成的提示信息之后,将电源的线路编号发送至电源移除装置,电源移除装置基于预设电源编号与电源所在机柜的位置坐标对应信息,将相应的电源从服务器中拔出。
具体的,如图4所示,当机柜电源信息采集模块通过进入服务器系统向各个电源状态寄存器发送查询命令,返回值状态字为4820时,表示电源工作状态为输出短路状态。电源信息采集模块将电源状态字信息,传递给机柜电源信息处理模块,经过状态字识别,将工作状态为输出短路的电源信息,通过机柜无线主模块发出,当智能PDU与机械手无线从模块收到处于异常工作状态的电源信息后,传递给各自的信号处理单元,智能PDU根据电源故障分类,判定电源处于输出短路工作状态时需要切断该电源的输入电压。
智能PDU信号处理单元将需要切断输入电压的电源信息传递给控制单元,通过控制与该电源对应PDU电源插孔的继电器断开,使故障电源断电。故障电源断电后,机柜电源信息采集模块通过进入服务器系统,向该故障电源状态寄存器发送查询命令,返回值状态字为2004时,表示电源输入电压已切断。机柜电源信息采集模块将电源状态字信息,传递给机柜电源信息处理模块,经过状态字识别,将该故障电源输入电压已切断的信号通过机柜无线主模块发出。机械手信号处理单元根据电源故障分类,判定电源处于输出短路工作状态时,需要执行拔出故障电源的操作。机械手在执行拔出故障电源操作前,要确认该故障电源的输入电压已切断,因此当机械手无线从模块收到机柜无线主模块发出的故障电源输入电压已切断的信号后,执行拔出故障电源操作。机械手信号处理单元根据收到的故障电源编号,确定电源的位置,与电源所在机柜的位置条形码坐标相对应,并将电源位置信号传递给机械手控制单元。机械手控制单元触发拔出故障电源任务,机械手通过读卡器扫描条形码,确定电源位置,继而进行将电源从机箱拔出的操作。
在一些实施例中,所述电源故障处理系统可以包括多个由计算机程序段所组成的功能模块。所述电源故障处理系统中的各个程序段的计算机程序可以存储于计算机设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)电源故障处理的功能。
本实施例中,所述电源故障处理系统根据其所执行的功能,可以被划分为多个功能模块,如图5所示。系统500的功能模块可以包括:配置调取模块510、模式调整模块520、线路处理模块530。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
配置调取模块,用于BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;
模式调整模块,用于将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;
线路处理模块,用于定位故障电源,将故障电源对应的电源线路断开。
可选地,作为本发明一个实施例,配置调取模块包括:
状态轮询单元,用于BMC轮询所有电源的状态字;
状态解析单元,用于基于状态字的数值与电源状态的对应关系,解析电源的状态字表示的电源状态;
方案调取单元,用于若所述电源状态为故障状态,则解析故障电源的规格,基于所述规格调取相应的电源工作模式配置方案。
可选地,作为本发明一个实施例,所述系统还包括:
预先配置不同规格故障电源对应的电源工作模式配置方案,电源工作模式配置方案限定了剩余的不同规格电源对应的工作模式,所述工作模式为均衡模式、主供电模式、备供电模式中的任一种。
可选地,作为本发明一个实施例,模式调整模块包括:
模式分配单元,用于BMC采集电源的规格,基于电源的规格和电源工作模式配置方案为电源分配工作模式;
模式下发单元,用于将分配的工作模式写入电源的控制器的寄存器中,所述控制器为控制所述电源工作状态的CPLD。
可选地,作为本发明一个实施例,所述系统还包括:
电源切换模块,用于利用电压隔离模块将BMC的供电网络由服务器的电源切换至POE系统由交换机的PSE进行供电,所述BMC通过网络接口连接交换机。
可选地,作为本发明一个实施例,线路处理模块包括:
关系建立单元,用于建立电源的线路编号与继电器编号的对应关系;
第一控制单元,用于若电源的电源状态为输入电压过压状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
第一校对单元,用于查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
第二控制单元,用于若电源的电源状态为输出短路状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
第二校对单元,用于查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
线路处理单元,用于在监控到生成故障电源处理完成的提示信息之后,将电源的编号发送至电源移除装置,电源移除装置基于预设电源编号与电源所在机柜的位置坐标对应信息,将相应的电源从服务器中拔出。
可选地,作为本发明一个实施例,所述电源移除装置包括机械手。
图6为本发明实施例提供的一种终端600的结构示意图,该终端600可以用于执行本发明实施例提供的电源故障处理方法。
其中,该终端600可以包括:处理器610、存储器620及通信模块630。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器620可以用于存储处理器610的执行指令,存储器620可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器620中的执行指令由处理器610执行时,使得终端600能够执行以下上述方法实施例中的部分或全部步骤。
处理器610为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器620内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC) 组成,例如可以由单颗封装的IC 所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器610可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信模块630,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明通过监控电源状态,并在监控到电源故障后,调取相应的电源工作模式配置方案,实现对电源的精细化管理,进一步的,将故障电源所在的线路断开,降低故障电源对服务器电源器件的损害,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

Claims (10)

1.一种电源故障处理方法,其特征在于,包括:
BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;
将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;
定位故障电源,将故障电源对应的电源线路断开。
2.根据权利要求1所述的方法,其特征在于,BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案,包括:
BMC轮询所有电源的状态字;
基于状态字的数值与电源状态的对应关系,解析电源的状态字表示的电源状态;
若所述电源状态为故障状态,则解析故障电源的规格,基于所述规格调取相应的电源工作模式配置方案。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
预先配置不同规格故障电源对应的电源工作模式配置方案,电源工作模式配置方案限定了剩余的不同规格电源对应的工作模式,所述工作模式为均衡模式、主供电模式、备供电模式中的任一种。
4.根据权利要求1所述的方法,其特征在于,将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式,包括:
BMC采集电源的规格,基于电源的规格和电源工作模式配置方案为电源分配工作模式;
将分配的工作模式写入电源的控制器的寄存器中,所述控制器为控制所述电源工作状态的CPLD。
5.根据权利要求1所述的方法,其特征在于,在BMC确认冗余电源中存在故障电源之后,所述方法还包括:
利用电压隔离模块将BMC的供电网络由服务器的电源切换至POE系统由交换机的PSE进行供电,所述BMC通过网络接口连接交换机。
6.根据权利要求2所述的方法,其特征在于,定位故障电源,将故障电源对应的电源线路断开,包括:
建立电源的线路编号与继电器编号的对应关系;
若电源的电源状态为输入电压过压状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
若电源的电源状态为输出短路状态,查询与所述电源具有对应关系的继电器,控制所述继电器断开;
查询所述电源的状态字,并解析所述状态字对应的电源状态,若所述电源状态为电压已切断,则生成故障电源处理完成的提示信息;若所述电源状态不是电压已切断,则生成告警提示信息;
在监控到生成故障电源处理完成的提示信息之后,将电源的编号发送至电源移除装置,电源移除装置基于预设电源编号与电源所在机柜的位置坐标对应信息,将相应的电源从服务器中拔出。
7.根据权利要求6所述的方法,其特征在于,所述电源移除装置包括机械手。
8.一种电源故障处理系统,其特征在于,包括:
配置调取模块,用于BMC确认冗余电源中存在故障电源,基于预存的故障处理机制调取相应的电源工作模式配置方案;
模式调整模块,用于将所述电源工作模式配置方案下发至电源的控制器,以使控制器按照相应配置方案配置电源的实际工作模式;
线路处理模块,用于定位故障电源,将故障电源对应的电源线路断开。
9.一种终端,其特征在于,包括:
存储器,用于存储电源故障处理程序;
处理器,用于执行所述电源故障处理程序时实现如权利要求1-7任一项所述电源故障处理方法的步骤。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,所述可读存储介质上存储有电源故障处理程序,所述电源故障处理程序被处理器执行时实现如权利要求1-7任一项所述电源故障处理方法的步骤。
CN202311457197.7A 2023-11-03 2023-11-03 电源故障处理方法、系统、终端及存储介质 Pending CN117687491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311457197.7A CN117687491A (zh) 2023-11-03 2023-11-03 电源故障处理方法、系统、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311457197.7A CN117687491A (zh) 2023-11-03 2023-11-03 电源故障处理方法、系统、终端及存储介质

Publications (1)

Publication Number Publication Date
CN117687491A true CN117687491A (zh) 2024-03-12

Family

ID=90127416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311457197.7A Pending CN117687491A (zh) 2023-11-03 2023-11-03 电源故障处理方法、系统、终端及存储介质

Country Status (1)

Country Link
CN (1) CN117687491A (zh)

Similar Documents

Publication Publication Date Title
US7844768B2 (en) Blade server system and method of managing same
CN103748569B (zh) Usb设备的无驱动操作的系统和方法
CN106850286B (zh) 单板上的基板管理控制器及网元管理盘的基板管理控制器
CN102081567B (zh) 服务器
CN114116280B (zh) 交互式bmc自恢复方法、系统、终端及存储介质
CN111045866A (zh) 一种bmc故障处理方法、装置、电子设备及存储介质
US7685348B2 (en) Dedicated server management card with hot swap functionality
CN109976926A (zh) 一种屏蔽重启保护bmc更新过程的方法、电路、终端及存储介质
CN101494564A (zh) 一种电源监控装置及单板热备份的实现方法
CN103019905A (zh) 一种基板管理控制器及其数据处理方法
US7490252B2 (en) Abnormal power interruption internal circuitry protection method and system for computer platform
US20030115397A1 (en) Computer system with dedicated system management buses
CN117453036A (zh) 调整服务器中的设备的功耗的方法、系统及装置
CN111352662B (zh) 一种服务器启动顺序控制方法、系统、终端及存储介质
CN110825547B (zh) 一种基于smbus的pcie卡异常恢复装置及方法
CN117559357A (zh) 服务器电源保护方法、系统及装置
CN117251333A (zh) 一种硬盘信息获取方法、装置、设备及存储介质
CN117687491A (zh) 电源故障处理方法、系统、终端及存储介质
CN107632782B (zh) 一种基于arm整机柜服务器节点的bmc代码保护方法及装置
CN113467595B (zh) 一种四路服务器电源功耗管理装置
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
US11703936B2 (en) Master-slave interchangeable power supply device and host thereof, master-slave interchangeable power supply method and computer-readable storage medium thereof
US9018797B2 (en) Power distribution management
CN110647435A (zh) 服务器、硬盘远程控制方法及控制组件
CN215987147U (zh) 一种税控usb管理服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination