CN113448421A - 一种设备掉电管理方法和装置 - Google Patents
一种设备掉电管理方法和装置 Download PDFInfo
- Publication number
- CN113448421A CN113448421A CN202110583072.3A CN202110583072A CN113448421A CN 113448421 A CN113448421 A CN 113448421A CN 202110583072 A CN202110583072 A CN 202110583072A CN 113448421 A CN113448421 A CN 113448421A
- Authority
- CN
- China
- Prior art keywords
- power
- signal
- external memory
- band manager
- sending
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/30—Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/0703—Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
- G06F11/0766—Error or fault reporting or storing
- G06F11/0787—Storage of error reports, e.g. persistent data storage, storage using memory protection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Power Sources (AREA)
Abstract
本发明公开了一种设备掉电管理方法和装置,方法包括:由掉电控制器判定发生设备异常掉电;进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。本发明能够在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力。
Description
技术领域
本发明涉及故障处理领域,更具体地,特别是指一种设备掉电管理方法和装置。
背景技术
目前随着大数据、云计算、人工智能等技术的成熟以及在各行各业的应用,在人工智能时代,服务器这个新兴名词也频繁地出现在人们的视线范围内,有人预测在人工智能时代,服务器将会广泛的应用于各个行业。普通的服务器是以CPU为算力的提供者,采用的是串行架构,在逻辑计算、浮点型计算等方面很擅长。因为在进行逻辑判断时需要大量的分支跳转处理,使得CPU的结构复杂,而算力的提升主要依靠堆砌更多的核心数来实现。
但是在大数据、云计算、人工智能以及物联网等网络技术的应用,充斥在互联网中的数据呈现几何倍数的增长,这对以CPU为主要算力来源的传统服务提出了严重的考验,并且在目前CPU的制程工艺、单个CPU的核心数已经接近极限,但数据的增加却还在持续,因此必须提升服务器的数据处理能力。
目前,服务器行业竞争日趋激烈,服务器的基本功能,各大生成厂商都可以实现。服务器厂家只能从成本、客户体验等方面提升自己的产品优势,增加产品竞争力。如果说服务器是网络数据的核心,那么服务器硬盘就是这个核心的数据仓库,所有的软件和用户数据都存储在这里。BMC在服务器中担当管理角色,负责监控整个系统的运行状态,用户跟服务器之间的交互都是通过BMC来实现,所以它的作用是非常重要的。
在云计算、大数据时代,海量的数据需要存储和计算,数据中心的服务器部署密度越来越大。在数据量暴增的时代,数据时时刻刻都在被分类存储和计算,这就对数据中心服务器的长期稳定性和可靠性要求越来越高;虽然服务器的稳定性较高,但是随着服务器的使用时间变长,服务器的故障率不可避免的会上升,服务器一旦发生异常掉电导致关机故障需要以最快的速度去定位问题点,分析出根本原因并提供解决办法,避免大批量机器出现同样问题。
服务器在客户数据中心机房发生掉电故障时,故障原因通常会和客户当时的使用环境以及运行的业务有一定的相关性,而且故障通常不会稳定的出现,这就给故障的判断和处理的准确性提出了更高的要求,因此,这就要求能够在客户现场第一时间判断故障类型及故障点,然后进行针对性的分析。故障的判断通常是根据BMC记录的日志,但是对于服务器宕机、自动关机等故障的日志如何保存成为关键。
针对现有技术中掉电故障难以抓取和保存故障数据的问题,目前尚无有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种设备掉电管理方法和装置,能够在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力。
基于上述目的,本发明实施例的第一方面提供了一种设备掉电管理方法,包括执行以下步骤:
响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;
响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;
响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;
响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,还包括:响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源不在位的电源在位信号,而由掉电控制器判定发生设备正常掉电,并直接向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,由掉电控制器向外部存储器发送指示关闭写保护的写保护信号包括:
由掉电控制器向选通器的切换端发送切换信号使连接到掉电控制器的第一选通端导通、并且使连接到带外管理器的第二选通端切断;
将指示关闭写保护的写保护信号通过选通器发送到外部存储器以使外部存储器关闭写保护。
在一些实施方式中,在由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号、并从带外管理器接收指示存储信号已经执行完成的响应信号之间,还包括:
由带外管理器在内部集成电路总线上将使用第一电平参数的与设备异常掉电相关联的记录传输到第一电平转换器;
在第一电平转换器将与设备异常掉电相关联的记录使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器;
由外部存储器在内部集成电路总线上将使用第二电平参数的执行完成信号传输到第一电平转换器;
在第一电平转换器将执行完成信号使用的电平参数从第二电平参数改变为第一电平参数并发送到外部存储器。
在一些实施方式中,在由掉电控制器向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器的同时,还向外部存储器持续发送指示外部存储器不复位的复位信号,具体包括:
由掉电控制器将使用第一电平参数的复位信号传输到第二电平转换器;
在第二电平转换器将复位信号使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器。
在一些实施方式中,还包括:掉电控制器还在设备正常上电过程中向外部存储器发送一次指示外部存储器复位的复位信号。
在一些实施方式中,第一电平参数为3.3伏,第二电平参数为1.8伏。
在一些实施方式中,电源供电信号在高电位指示电源供电,在低电位指示电源掉电;电源在位信号在高电位指示电源在位,在低电位指示电源不在位;电压使能信号在高电位指示启用供电,在低电位指示停用供电;
在一些实施方式中,方法还包括:响应于带外管理器已经关闭而使用外部设备访问外部存储器以从外部存储器中读取和分析与设备异常掉电相关联的记录。
本发明实施例的第二方面提供了一种装置,包括:
处理器;
控制器,存储有处理器可运行的程序代码,处理器在运行程序代码时执行以下步骤:
响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;
响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;
响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;
响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,步骤还包括:响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源不在位的电源在位信号,而由掉电控制器判定发生设备正常掉电,并直接向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,由掉电控制器向外部存储器发送指示关闭写保护的写保护信号包括:
由掉电控制器向选通器的切换端发送切换信号使连接到掉电控制器的第一选通端导通、并且连接到带外管理器的第二选通端切断;
将指示关闭写保护的写保护信号通过选通器发送到外部存储器以使外部存储器关闭写保护。
在一些实施方式中,在由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号、并从带外管理器接收指示存储信号已经执行完成的响应信号之间,还包括:
由带外管理器在内部集成电路总线上将使用第一电平参数的与设备异常掉电相关联的记录传输到第一电平转换器;
在第一电平转换器将与设备异常掉电相关联的记录使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器;
由外部存储器在内部集成电路总线上将使用第二电平参数的执行完成信号传输到第一电平转换器;
在第一电平转换器将执行完成信号使用的电平参数从第二电平参数改变为第一电平参数并发送到外部存储器。
在一些实施方式中,在由掉电控制器向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器的同时,还向外部存储器持续发送指示外部存储器不复位的复位信号,具体包括:
由掉电控制器将使用第一电平参数的复位信号传输到第二电平转换器;
在第二电平转换器将复位信号使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器。
在一些实施方式中,掉电控制器还在设备正常上电过程中向外部存储器发送一次指示外部存储器复位的复位信号。
在一些实施方式中,第一电平参数为3.3伏,第二电平参数为1.8伏。
在一些实施方式中,电源供电信号在高电位指示电源供电,在低电位指示电源掉电;电源在位信号在高电位指示电源在位,在低电位指示电源不在位;电压使能信号在高电位指示启用供电,在低电位指示停用供电;
在一些实施方式中,步骤还包括:响应于带外管理器已经关闭而使用外部设备访问外部存储器以从外部存储器中读取和分析与设备异常掉电相关联的记录。
本发明具有以下有益技术效果:本发明实施例提供的设备掉电管理方法和装置,通过响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器的技术方案,能够在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明提供的设备掉电管理方法的流程示意图;
图2为本发明提供的设备掉电管理方法的整体电路原理图;
图3为本发明提供的设备掉电管理方法的第一电平转换器相关的电路原理图;
图4为本发明提供的设备掉电管理方法的第二电平转换器和选通器相关的电路原理图;
图5为本发明提供的设备掉电管理方法的详细流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明实施例进一步详细说明。
需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。
基于上述目的,本发明实施例的第一个方面,提出了一种在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力的设备掉电管理方法的一个实施例。图1示出的是本发明提供的设备掉电管理方法的流程示意图。
所述的设备掉电管理方法,如图1所示,包括执行以下步骤:
步骤S101,响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;
步骤S103,响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;
步骤S105,响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;
步骤S107,响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
本发明通过调整硬件线路,实现服务器异常掉电时防止BMC数据丢失的设计方法,当系统出现异常掉电时,CPLD可以保持BMC短时间内不掉电,同时通知BMC尽快开始存放log到TF卡中,当整个过程完成以后再允许BMC掉电。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,可以通过计算机程序来指令相关硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。所述计算机程序的实施例,可以达到与之对应的前述任意方法实施例相同或者相类似的效果。
在一些实施方式中,方法还包括:响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源不在位的电源在位信号,而由掉电控制器判定发生设备正常掉电,并直接向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,由掉电控制器向外部存储器发送指示关闭写保护的写保护信号包括:
由掉电控制器向选通器的切换端发送切换信号使连接到掉电控制器的第一选通端导通、并且连接到带外管理器的第二选通端切断;
将指示关闭写保护的写保护信号通过选通器发送到外部存储器以使外部存储器关闭写保护。
在一些实施方式中,在由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号、并从带外管理器接收指示存储信号已经执行完成的响应信号之间,还包括:
由带外管理器在内部集成电路总线上将使用第一电平参数的与设备异常掉电相关联的记录传输到第一电平转换器;
在第一电平转换器将与设备异常掉电相关联的记录使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器;
由外部存储器在内部集成电路总线上将使用第二电平参数的执行完成信号传输到第一电平转换器;
在第一电平转换器将执行完成信号使用的电平参数从第二电平参数改变为第一电平参数并发送到外部存储器。
在一些实施方式中,在由掉电控制器向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器的同时,还向外部存储器持续发送指示外部存储器不复位的复位信号,具体包括:
由掉电控制器将使用第一电平参数的复位信号传输到第二电平转换器;
在第二电平转换器将复位信号使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器。
在一些实施方式中,方法还包括:掉电控制器还在设备正常上电过程中向外部存储器发送一次指示外部存储器复位的复位信号。
在一些实施方式中,第一电平参数为3.3伏,第二电平参数为1.8伏。
在一些实施方式中,电源供电信号在高电位指示电源供电,在低电位指示电源掉电;电源在位信号在高电位指示电源在位,在低电位指示电源不在位;电压使能信号在高电位指示启用供电,在低电位指示停用供电;
在一些实施方式中,方法还包括:响应于带外管理器已经关闭而使用外部设备访问外部存储器以从外部存储器中读取和分析与设备异常掉电相关联的记录。
结合这里的公开所描述的方法或算法的步骤可以直接包含在硬件中、由处理器执行的软件模块中或这两者的组合中。软件模块可以驻留在RAM存储器、快闪存储器、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域已知的任何其它形式的存储介质中。示例性的存储介质被耦合到处理器,使得处理器能够从该存储介质中读取信息或向该存储介质写入信息。在一个替换方案中,所述存储介质可以与处理器集成在一起。处理器和存储介质可以驻留在ASIC中。ASIC可以驻留在用户终端中。在一个替换方案中,处理器和存储介质可以作为分立组件驻留在用户终端中。
现有技术中的PSU(电源模块)给整个系统上电,在正常运行过程中,PSU的在位信号PSU_PRSNT会接到CPLD(复杂可编程逻辑器件)的GPIO(通用输入输出总线)。CPLD通过该信号电平高(PSU在位)低(PSU不在位)来判断PSU的在位状态。正常上电以后,PSU会发出供电信号PSU_PWROK给到CPLD,用来判断电源的状态是否正常。BMC(基板管理控制器)的供电由CPLD控制,包括3.3V/1.8V/1.2V的PWR_EN电源使能信号。
在现有技术中,如果PSU_PWROK信号在系统正常运行过程中突然变为低电平,但是PSU_PRSNT信号依然有效,说明PSU在位,则为出现异常掉电。此时,CPLD进入掉电模式,拉低VR(电压调节器)PWR_EN信号,BMC供电中断,但是BMC无法将出现异常掉电时的log(日志)及时记录下来,导致BMC内部数据丢失,用户无法准确定位到故障原因。
本文所述的计算机可读存储介质(例如,存储器)可以是易失性存储器或非易失性存储器,或者可以包括易失性存储器和非易失性存储器两者。作为例子而非限制性的,非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦写可编程ROM(EEPROM)或快闪存储器。易失性存储器可以包括随机存取存储器(RAM),该RAM可以充当外部高速缓存存储器。作为例子而非限制性的,RAM可以以多种形式获得,比如同步RAM(DRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据速率SDRAM(DDR SDRAM)、增强SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、以及直接Rambus RAM(DRRAM)。所公开的方面的存储设备意在包括但不限于这些和其它合适类型的存储器。
下面根据图2所示的具体实施例进一步阐述本发明的具体实施方式。首先说明在本发明实施例中使用PSU作为电源模块,使用CPLD作为掉电控制器,使用BMC作为带外管理器,使用TF卡作为外部存储器,使用VR作为电压调节器,使用level shift(电平转换线路)作为第一电平转换器,使用MOS(场效应晶体管)作为第二电平转换器。
掉电总体分为两种情况:正常情况掉电与异常情况掉电。
如果PSU_PWROK出现异常,CPLD接收到该信号为低后判断系统出现掉电情况,但是还要进一步判断PSU_PRSNT信号是否为高电平,若PSU_PRSNT信号为高电平,则说明PSU不在位,那么此时为正常掉电。CPLD直接走正常掉电流程,关闭BMC power。
若PSU_PRSNT信号为低电平,则说明PSU在位,那么CPLD判断该情况属于异常掉电。CPLD会拉住BMC到VR的power enable信号,保持短时间内BMC不会掉电。同时,CPLD通过TF_CARD_WP信号解除TF卡的写保护状态,使得数据可以正常存入。CPLD发出save(存储)信号给到BMC,通知BMC把异常情况下记录的log存入TF卡中。当数据存放完成以后,BMC发出ACK信号给到CPLD,CPLD检测到ACK(相应)信号有效以后判断BMC log已存放完毕。CPLD开始走正常掉电模式,拉低BMC到VR power enable信号,此时系统完全掉电,用户可以通过TF卡中的log分析异常掉电的原因。
BMC与TF卡之间是经过I2C进行通信,其具体连接方式详见图3。TF卡的I2C电平为1.8V,BMC输出的I2C电平为3.3V,两者之间的通信需要加电平转换线路。
另一方面,TF卡的RST以及WP信号在正常工作中分别由CPLD以及BMC控制,具体控制逻辑如图4所示。CPLD控制TF卡RST信号,在正常上电过程中要进行一次复位操作,由于CPLD输出IO电平为3.3V,TF卡的RST电平为1.8V,所以要经过MOS管进行一次电平转换。
在出现异常掉电时,CPLD要保证BMC在存储log过程中,RST一直为高电平,保证数据可以全部存入TF卡。TF卡的WP信号为写保护信号,当该信号有效时,无法往TF卡存入数据。CPLD以及BMC输出的WP信号分别通过MUX(多路选通)芯片,芯片的sel信号由CPLD控制。正常运行时,CPLD控制芯片的sel pin把WP信号切到BMC控制,BMC可以自由控制TF卡WP信号读写。当系统出现异常掉电时,CPLD控制芯片的sel pin把WP信号切到CPLD控制,并设置为WP停用,便可对TF卡执行读写操作。上述整体流程对应图5中的各步骤。
从上述实施例可以看出,本发明实施例提供的设备掉电管理方法,通过响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器的技术方案,能够在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力。
需要特别指出的是,上述设备掉电管理方法的各个实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于设备掉电管理方法也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
基于上述目的,本发明实施例的第二个方面,提出了一种在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力的设备掉电管理装置的一个实施例。装置包括:
处理器;
控制器,存储有处理器可运行的程序代码,处理器在运行程序代码时执行以下步骤:
响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;
响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;
响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;
响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,步骤还包括:响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源不在位的电源在位信号,而由掉电控制器判定发生设备正常掉电,并直接向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器。
在一些实施方式中,由掉电控制器向外部存储器发送指示关闭写保护的写保护信号包括:
由掉电控制器向选通器的切换端发送切换信号使连接到掉电控制器的第一选通端导通、并且连接到带外管理器的第二选通端切断;
将指示关闭写保护的写保护信号通过选通器发送到外部存储器以使外部存储器关闭写保护。
在一些实施方式中,在由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号、并从带外管理器接收指示存储信号已经执行完成的响应信号之间,还包括:
由带外管理器在内部集成电路总线上将使用第一电平参数的与设备异常掉电相关联的记录传输到第一电平转换器;
在第一电平转换器将与设备异常掉电相关联的记录使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器;
由外部存储器在内部集成电路总线上将使用第二电平参数的执行完成信号传输到第一电平转换器;
在第一电平转换器将执行完成信号使用的电平参数从第二电平参数改变为第一电平参数并发送到外部存储器。
在一些实施方式中,在由掉电控制器向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器的同时,还向外部存储器持续发送指示外部存储器不复位的复位信号,具体包括:
由掉电控制器将使用第一电平参数的复位信号传输到第二电平转换器;
在第二电平转换器将复位信号使用的电平参数从第一电平参数改变为第二电平参数并发送到外部存储器。
在一些实施方式中,步骤还包括:掉电控制器还在设备正常上电过程中向外部存储器发送一次指示外部存储器复位的复位信号。
在一些实施方式中,第一电平参数为3.3伏,第二电平参数为1.8伏。
在一些实施方式中,电源供电信号在高电位指示电源供电,在低电位指示电源掉电;电源在位信号在高电位指示电源在位,在低电位指示电源不在位;电压使能信号在高电位指示启用供电,在低电位指示停用供电;
在一些实施方式中,步骤还包括:响应于带外管理器已经关闭而使用外部设备访问外部存储器以从外部存储器中读取和分析与设备异常掉电相关联的记录。
本发明例公开所述的装置、设备等可为各种电子终端设备,例如手机、个人数字助理(PDA)、平板电脑(PAD)、智能电视等,也可以是大型终端设备,如服务器等,因此本发明实施例公开的保护范围不应限定为某种特定类型的装置、设备。本发明实施例公开所述的客户端可以是以电子硬件、计算机软件或两者的组合形式应用于上述任意一种电子终端设备中。
从上述实施例可以看出,本发明实施例提供的设备掉电管理装置,通过响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;响应于由掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;响应于带外管理器保持开启并且外部存储器关闭写保护,而由掉电控制器向带外管理器发送指示带外管理器将与设备异常掉电相关联的记录存储到外部存储器的存储信号;响应于由掉电控制器从带外管理器接收指示存储信号已经执行完成的响应信号,而向电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭带外管理器的技术方案,能够在异常掉电时存储故障设备的日志记录,允许事后分析和处理相应故障,提升设备稳定性和竞争力。
需要特别指出的是,上述装置的实施例采用了所述设备掉电管理方法的实施例来具体说明各模块的工作过程,本领域技术人员能够很容易想到,将这些模块应用到所述设备掉电管理方法的其他实施例中。当然,由于所述设备掉电管理方法实施例中的各个步骤均可以相互交叉、替换、增加、删减,因此,这些合理的排列组合变换之于所述装置也应当属于本发明的保护范围,并且不应将本发明的保护范围局限在所述实施例之上。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上所述的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。
Claims (10)
1.一种设备掉电管理方法,其特征在于,包括执行以下步骤:
响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;
响应于由所述掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;
响应于所述带外管理器保持开启并且所述外部存储器关闭写保护,而由所述掉电控制器向所述带外管理器发送指示所述带外管理器将与设备异常掉电相关联的记录存储到所述外部存储器的存储信号;
响应于由所述掉电控制器从所述带外管理器接收指示所述存储信号已经执行完成的响应信号,而向所述电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭所述带外管理器。
2.根据权利要求1所述的方法,其特征在于,还包括:响应于从所述电源模块接收到指示电源掉电的电源供电信号和指示电源不在位的电源在位信号,而由所述掉电控制器判定发生设备正常掉电,并直接向所述电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭所述带外管理器。
3.根据权利要求1所述的方法,其特征在于,由所述掉电控制器向外部存储器发送指示关闭写保护的写保护信号包括:
由所述掉电控制器向选通器的切换端发送切换信号使连接到所述掉电控制器的第一选通端导通、并且使连接到所述带外管理器的第二选通端切断;
将指示关闭写保护的所述写保护信号通过所述选通器发送到所述外部存储器以使所述外部存储器关闭写保护。
4.根据权利要求1所述的方法,其特征在于,在由所述掉电控制器向所述带外管理器发送指示所述带外管理器将与设备异常掉电相关联的记录存储到所述外部存储器的存储信号、并从所述带外管理器接收指示所述存储信号已经执行完成的响应信号之间,还包括:
由所述带外管理器在内部集成电路总线上将使用第一电平参数的与设备异常掉电相关联的记录传输到第一电平转换器;
在所述第一电平转换器将与设备异常掉电相关联的记录使用的电平参数从第一电平参数改变为第二电平参数并发送到所述外部存储器;
由所述外部存储器在内部集成电路总线上将使用第二电平参数的执行完成信号传输到所述第一电平转换器;
在所述第一电平转换器将所述执行完成信号使用的电平参数从第二电平参数改变为第一电平参数并发送到所述外部存储器。
5.根据权利要求1所述的方法,其特征在于,在由所述掉电控制器向所述电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器的同时,还向所述外部存储器持续发送指示所述外部存储器不复位的复位信号,具体包括:
由所述掉电控制器将使用第一电平参数的复位信号传输到第二电平转换器;
在所述第二电平转换器将所述复位信号使用的电平参数从第一电平参数改变为第二电平参数并发送到所述外部存储器。
6.根据权利要求5所述的方法,其特征在于,还包括:所述掉电控制器还在设备正常上电过程中向所述外部存储器发送一次指示所述外部存储器复位的复位信号。
7.根据权利要求4或5所述的方法,其特征在于,所述第一电平参数为3.3伏,所述第二电平参数为1.8伏。
8.根据权利要求1所述的方法,其特征在于,所述电源供电信号在高电位指示电源供电,在低电位指示电源掉电;所述电源在位信号在高电位指示电源在位,在低电位指示电源不在位;所述电压使能信号在高电位指示启用供电,在低电位指示停用供电。
9.根据权利要求1所述的方法,其特征在于,还包括:
响应于所述带外管理器已经关闭而使用外部设备访问所述外部存储器以从所述外部存储器中读取和分析与设备异常掉电相关联的记录。
10.一种设备掉电管理装置,其特征在于,包括:
处理器;
控制器,存储有所述处理器可运行的程序代码,所述处理器在运行所述程序代码时执行以下步骤:
响应于从电源模块接收到指示电源掉电的电源供电信号和指示电源在位的电源在位信号,而由掉电控制器判定发生设备异常掉电;
响应于由所述掉电控制器判定发生设备异常掉电,而进一步向电压调节器持续发送指示启用供电的电压使能信号以保持开启带外管理器,并向外部存储器发送指示关闭写保护的写保护信号;
响应于所述带外管理器保持开启并且所述外部存储器关闭写保护,而由所述掉电控制器向所述带外管理器发送指示所述带外管理器将与设备异常掉电相关联的记录存储到所述外部存储器的存储信号;
响应于由所述掉电控制器从所述带外管理器接收指示所述存储信号已经执行完成的响应信号,而向所述电压调节器发送指示停用供电的电压使能信号以执行设备正常掉电流程来关闭所述带外管理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110583072.3A CN113448421B (zh) | 2021-05-27 | 2021-05-27 | 一种设备掉电管理方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110583072.3A CN113448421B (zh) | 2021-05-27 | 2021-05-27 | 一种设备掉电管理方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113448421A true CN113448421A (zh) | 2021-09-28 |
CN113448421B CN113448421B (zh) | 2023-02-28 |
Family
ID=77810443
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110583072.3A Active CN113448421B (zh) | 2021-05-27 | 2021-05-27 | 一种设备掉电管理方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113448421B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117093140A (zh) * | 2023-07-12 | 2023-11-21 | 荣耀终端有限公司 | 控制电子设备关机的方法及装置 |
WO2024016864A1 (zh) * | 2022-07-19 | 2024-01-25 | 华为技术有限公司 | 处理器、获取信息的方法、单板及网络设备 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933182A (zh) * | 2019-03-20 | 2019-06-25 | 浪潮商用机器有限公司 | 一种服务器掉电诊断方法、装置和系统 |
CN111078445A (zh) * | 2019-11-15 | 2020-04-28 | 苏州浪潮智能科技有限公司 | 一种psu掉电原因检测方法及装置 |
CN111324192A (zh) * | 2020-02-26 | 2020-06-23 | 苏州浪潮智能科技有限公司 | 一种系统板卡电源检测方法、装置、设备及存储介质 |
CN112463479A (zh) * | 2020-11-19 | 2021-03-09 | 苏州浪潮智能科技有限公司 | 一种检测vr异常掉电定位功能自动化测试方法与系统 |
CN212723938U (zh) * | 2020-07-30 | 2021-03-16 | 苏州浪潮智能科技有限公司 | 一种在服务器s5状态下监测电源工作状态的装置 |
CN112596568A (zh) * | 2020-11-27 | 2021-04-02 | 苏州浪潮智能科技有限公司 | 一种读取电压调节器报错信息的方法、系统、设备及介质 |
US20210109582A1 (en) * | 2019-10-10 | 2021-04-15 | Dell Products, Lp | System and method for using input power line telemetry in an information handling system |
-
2021
- 2021-05-27 CN CN202110583072.3A patent/CN113448421B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109933182A (zh) * | 2019-03-20 | 2019-06-25 | 浪潮商用机器有限公司 | 一种服务器掉电诊断方法、装置和系统 |
US20210109582A1 (en) * | 2019-10-10 | 2021-04-15 | Dell Products, Lp | System and method for using input power line telemetry in an information handling system |
CN111078445A (zh) * | 2019-11-15 | 2020-04-28 | 苏州浪潮智能科技有限公司 | 一种psu掉电原因检测方法及装置 |
CN111324192A (zh) * | 2020-02-26 | 2020-06-23 | 苏州浪潮智能科技有限公司 | 一种系统板卡电源检测方法、装置、设备及存储介质 |
CN212723938U (zh) * | 2020-07-30 | 2021-03-16 | 苏州浪潮智能科技有限公司 | 一种在服务器s5状态下监测电源工作状态的装置 |
CN112463479A (zh) * | 2020-11-19 | 2021-03-09 | 苏州浪潮智能科技有限公司 | 一种检测vr异常掉电定位功能自动化测试方法与系统 |
CN112596568A (zh) * | 2020-11-27 | 2021-04-02 | 苏州浪潮智能科技有限公司 | 一种读取电压调节器报错信息的方法、系统、设备及介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024016864A1 (zh) * | 2022-07-19 | 2024-01-25 | 华为技术有限公司 | 处理器、获取信息的方法、单板及网络设备 |
CN117093140A (zh) * | 2023-07-12 | 2023-11-21 | 荣耀终端有限公司 | 控制电子设备关机的方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113448421B (zh) | 2023-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113448421B (zh) | 一种设备掉电管理方法和装置 | |
CN111124722B (zh) | 一种隔离故障内存的方法、设备及介质 | |
US11449406B2 (en) | Controlling a storage system based on available power | |
CN106354241A (zh) | 一种数据的掉电保护装置、系统及方法 | |
CN111078515B (zh) | Ssd分层日志记录方法、装置、计算机设备及存储介质 | |
WO2023071701A1 (zh) | 一种日志记录方法、装置及电子设备 | |
CN112506739B (zh) | 一种解决风扇逆转问题的方法、系统、设备及介质 | |
CN112015683B (zh) | Pcie链路的动态切换方法、装置、计算机设备及存储介质 | |
CN111090324B (zh) | 一种服务器硬盘错峰上电的方法、设备及介质 | |
CN112506427A (zh) | 一种降低固态硬盘功耗的方法、系统、设备及介质 | |
CN111176414A (zh) | 一种服务器网卡的供电方法、设备及可读介质 | |
CN110569573A (zh) | 一种基于可编程逻辑器件的故障确认与通信的方法 | |
US20190011977A1 (en) | Predicting voltage guardband and operating at a safe limit | |
CN111045710A (zh) | 一种基于IPMI命令的SAS-Expander固件升级的方法、设备及介质 | |
CN111856257B (zh) | 一种cpld固件检测及保护的方法、系统、设备及介质 | |
CN113448783B (zh) | 一种硬复位式数据的测试方法和装置 | |
CN115098305A (zh) | 一种主板备电切换方法、装置、电子设备和存储介质 | |
CN113204279A (zh) | 基于冗余电源提高服务器效能的方法、系统、设备及介质 | |
KR20220095608A (ko) | 보조 전원 관리 장치 및 이를 포함하는 전자 시스템 | |
US20230143343A1 (en) | Method and system for regular testing of datacenter hardware | |
US20180103130A1 (en) | Communication device, method of communication device, and non-transitory computer readable storage medium | |
CN115022019B (zh) | 基于区块链的异常文件检测方法、装置和设备 | |
CN117489627B (zh) | 风扇堵转测试方法、装置、控制终端设备及存储介质 | |
CN114879811B (zh) | 一种芯片的时序控制方法 | |
CN114217750B (zh) | Ssd低功耗优化方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |