CN109240846A - 一种电源故障诊断方法、装置及服务器 - Google Patents

一种电源故障诊断方法、装置及服务器 Download PDF

Info

Publication number
CN109240846A
CN109240846A CN201811098831.1A CN201811098831A CN109240846A CN 109240846 A CN109240846 A CN 109240846A CN 201811098831 A CN201811098831 A CN 201811098831A CN 109240846 A CN109240846 A CN 109240846A
Authority
CN
China
Prior art keywords
black box
box log
read
server
order
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811098831.1A
Other languages
English (en)
Inventor
袁传博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811098831.1A priority Critical patent/CN109240846A/zh
Publication of CN109240846A publication Critical patent/CN109240846A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种电源故障诊断方法中,通过设置待循环执行的黑盒日志读取命令,以循环执行命令的方式从电源模块中读取对应的黑盒日志信息,并将读取到的黑盒日志信息存储在服务器中,这样,服务器就能够为用户提供黑盒日志信息,一旦用户需要对电源故障进行诊断,则直接从服务器中导出相关的黑盒日志信息即可,相比现有技术的方案,利用本申请提供的方法,用户无需采用专用工具,无需拆解电源模块,而是通过网络通信从服务器中直接下载所需的黑盒日志信息即可。因此,利用本申请提供的该方法,能够提高电源故障的诊断效率,降低成本,而且其时效性能够得到提高。另外,本申请还提供了对应的装置和服务器。

Description

一种电源故障诊断方法、装置及服务器
技术领域
本申请涉及计算机技术领域,尤其涉及一种电源故障诊断方法、装置及服务器。
背景技术
随着信息技术的飞速发展以及云计算和物联网的落地应用,用户对服务器的可靠性有了更高的要求。在实际应用中,电源模块的性能好坏会直接影响服务器的可靠性,当电源模块出现故障时,会降低服务器的可靠性,严重时会直接导致服务器瘫痪。因此,对电源模块故障的及时诊断是保证服务器可靠性的重要手段之一。
目前,对电源模块的故障诊断主要是在服务器出现故障之后,由工程师将服务器中的电源模块拆解下来,通过特定的软件获取电源模块中的黑盒日志,通过黑盒日志中的电源相关信息以了解电源模块的故障情况,及时诊断出问题。这种方式既要求专业的工程师采用的专业的工具,还需要将电源模块从服务器中拆解下容易对服务器造成硬件损伤,其诊断效率较低且成本较高,也无法满足对电源模块故障及时诊断的业务需求。
发明内容
本申请实施例提供了一种电源故障诊断方法,利用该方法能够自动地将电源模块记录的黑盒日志信息读取处理,以存储在服务器中,以此,用户可以从服务器中导出黑盒日志信息以用于电源故障诊断,相比现有技术的方案,该方法能够提高诊断效率并且降低成本,能够满足对电源模块故障及时诊断的需求。
本申请第一方面提供了一种电源故障诊断方法,该方法应用于服务器中,该方法包括:
从循环任务列表中获取黑盒日志读取命令,所述黑盒日志读取命令用于指示从电源模块中读取黑盒日志信息;所述循环任务列表中记录有待循环执行的黑盒日志读取命令;
执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息;
将读取到的黑盒日志信息存储在服务器中,以便所述服务器能够提供所述黑盒日志信息,以用于电源故障诊断。
可选的,所述从循环任务列表中获取黑盒日志读取命令,包括:
按照预设周期,周期性地从循环任务列表中获取黑盒日志读取命令。
可选的,所述执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息,包括:
根据所述黑盒日志读取命令确定与其对应的所述电源模块的寄存器的指定地址,根据所述指定地址修改所述寄存器的当前地址;
向所述电源模块发送所述黑盒日志读取命令,接收所述电源模块根据所述黑盒日志读取命令返回的黑盒日志信息。
可选的,所述循环任务列表中记录有待循环执行的多个黑盒日志读取命令。
可选的,所述多个黑盒日志读取命令中每个黑盒日志读取命令用于读取电源模块中记录的最近5次中任一次电源故障时的电源相关信息。
可选的,所述黑盒日志读取命令包括指定地址信息和指定字段,所述指定地址信息用于表征待获取的黑盒日志信息对应的所述电源模块的寄存器的地址,所述指定字段用于表征待获取的黑盒日志信息所处的字段。
可选的,所述方法应用于服务器中的基板管理控制器中。
本申请第二方面提供了一种电源故障诊断装置,所述装置包括:
命令获取模块,用于从循环任务列表中获取黑盒日志读取命令,所述黑盒日志读取命令用于指示从电源模块中读取黑盒日志信息;所述循环任务列表中记录有待循环执行的黑盒日志读取命令;
命令执行模块,用于执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息;
信息存储模块,用于将读取到的黑盒日志信息存储在服务器中,以便所述服务器能够提供所述黑盒日志信息,以用于电源故障诊断。
本申请第三方面提供了一种服务器,该服务器包括:基板管理控制器、电源模块以及存储器;
所述基板管理控制器上配置有程序,并在运行所述程序时以实现上述本申请第一方面提供的电源故障诊断方法,并且能够响应终端发送的黑盒日志信息获取请求,向所述终端返回所述黑盒日志信息;
所述电源模块,用于为所述服务器供电,并记录电源模块故障时的黑盒日志信息;
所述存储器,用于存储所述基板管理控制器从所述电源模块中获取的黑盒日志信息。
本申请第四方面提供了一种计算机存储介质,其上存储有程序,所述程序在被处理器执行时实现如上述本申请第一方面提供的电源故障诊断方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
在本申请实施例提供的一种电源故障诊断方法中,通过设置待循环执行的黑盒日志读取命令,以循环执行命令的方式,自动地从电源模块中读取对应的黑盒日志信息,并将读取到的黑盒日志信息存储在服务器中,基于此,服务器中存储有黑盒日志信息,这样,服务器就能够为用户提供黑盒日志信息,一旦用户需要对电源故障进行诊断,则直接从服务器中导出相关的黑盒日志信息即可,相比现有技术的方案,利用本申请提供的方法,用户无需采用专用工具,无需拆解电源模块,而是通过网络通信从服务器中直接下载所需的黑盒日志信息即可,而对于服务器而言,其只需要在工作时运行该方法就能够自动收集到所需的黑盒日志信息,以为电源故障诊断打好数据基础。因此,利用本申请提供的该方法,能够提高电源故障的诊断效率,降低成本,而且其时效性能够得到提高。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种电源故障诊断方法的应用场景图;
图2为本申请实施例提供的一种电源故障诊断方法的流程图;
图3为本申请实施例提供的一种电源故障诊断装置的结构图;
图4为本申请实施例提供的一种服务器的结构图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应理解,本申请提供的一种电源故障诊断方法,其能够应用于各个行业中需要进行电源故障诊断的场景中。为了便于理解,下面结合图1对本申请提供的一种电源故障诊断方法在实际场景中的应用情况进行示例性说明。
参见图1示出的本申请实施例提供的一种电源故障诊断方法的应用场景图,如图1所示,本申请实施例提供的一种电源故障诊断方法可以程序形式应用于服务器100中,该服务器100是指能够提供数据支持的服务器,其能够客户端/服务器模式(简称C/S)或者Web浏览器/服务器模式(简称B/S)的工作模式,为用户提供黑盒日志信息,当然也可以提供其他数据服务,例如文件存储,文件读取等数据服务。
应理解的是,该服务器可以是应用服务器,也可以为web服务器,还可以存储服务器等等。在实际应用中,该服务器100通过基板管理控制器运行程序以实现本申请提供的电源故障诊断方法,该方法的具体实现过程将在下文进行详细说明,此处暂不展开说明。该服务器100实现该电源故障诊断方法主要是自动循环式运行黑盒日志读取命令,以从电源模块中读取黑盒日志信息并将读取到的黑盒日志信息存储于本地存储器中,这样服务器100就能够保存该黑盒日志信息,以此能够为用户提供黑盒日志信息。
对于用户而言,在需要对电源故障进行诊断时,则可以通过终端200与服务器100通信以获取指定的黑盒日志信息。具体的,用户通过终端200中配置的客户端或者浏览器向服务器100发起黑盒日志信息获取请求,图1中仅以通过浏览器访问服务器为例说明,则服务器100响应于该黑盒日志获取请求,从存储器中读取指定黑盒日志信息,返回给终端200,基于此,用户就能够快速获得所需的黑盒日志信息,能够基于这些黑盒日志信息及时完成电源故障诊断。
可见,利用本申请提供的方法,用户仅需要从服务器中下载所需的黑盒日志信息即可,无需在从服务器中拆解电源模块,也无需采用专业工具,从而大大提高了诊断效率,也降低了诊断成本,能够满足电源故障诊断的时效性需求。
下面从服务器的角度对本申请提供的一种电源故障诊断方法进行解释说明。
参见图2示出的本申请实施例提供的一种电源故障诊断方法的流程图,该方法应用于服务器中,如图2所示,该方法包括:
S201:从循环任务列表中获取黑盒日志读取命令,所述黑盒日志读取命令用于指示从电源模块中读取黑盒日志信息;所述循环任务列表中记录有待循环执行的黑盒日志读取命令;
在具体实现时,由服务器中的基板管理控制器(英文全称为BaseboardManagement Controller,英文简称BMC)执行图2所示实施例的方法步骤。BMC它可以在机器未开机的状态下,执行图2所示实施例的方法步骤。即不论服务器处于开机状态,还是关机状态,BMC都能够执行图2所示实施例的方法步骤,以实现自动收集电源模块的黑盒日志信息,为电源故障诊断打好数据基础。当然,BMC自身还可以支持行业标准的IPMI规范,该规范描述了已经内置到主板上的管理功能。这些功能包括:本地和远程诊断、控制台支持、配置管理、硬件管理和故障排除等。
在具体实现时,需要先配置好循环任务列表,该循环任务列表中记录有待循环执行的黑盒日志读取命令,应理解的是,预选设置好循环任务列表就是预先创建好需要被循环执行的黑盒日志读取任务,该任务通过黑盒日志读取命令来表达,在具体实现时,黑盒日志信息读取命令可以采用Unix和类Unix的操作系统之中Crontab命令,Crontab命令用于设置周期性被执行的指令,其在执行时用于周期性地读取相关信息,这些Crontab命令被存放于crontab文件,即循环任务列表存放于该crontab文件,以供之后读取和执行。crontab文件中的任务常常在后台运行,周期性检查是否有任务需要被执行。
在具体实现时,由于一般的电源模块会记录最近5次电源故障时的电源相关信息,而在实际电源故障诊断时,有时用户仅需要获取最近一次电源故障时的电源相关信息,基于此,该循环任务列表中仅配置有待循环执行的一种黑盒日志读取命令,该种黑盒日志读取命令用于读取电源模块记录的最近一次电源故障时的电源相关信息。由于,一个命令只能获取一个指定信息,因此,为了能够获取电源最近一次故障时的多种相关信息,该循环任务列表中可以配置有多个黑盒日志读取命令,不同的黑盒日志读取命令用于读取电源模块记录的最近一次电源故障时的电源相关信息中的一种信息。
当然,在具体实现时,为了获取更多更全面的黑盒日志信息,该循环任务列表中可以预先配置多种黑盒日志读取命令,这些黑盒日志读取命令被执行后,能够获取到电源模块所记录的所有次数的所有种类的黑盒日志信息。
需要说明的时,由于电源故障时不可控的,因此任意时刻都会出现电源故障的问题,因此,为了防止黑盒日志信息遗漏,可以设置任务执行周期,则在具体实现,BMS按照预设周期,周期性地从循环任务列表中获取黑盒日志读取命令。例如,该预设周期可以设置为一分钟,2分钟,10分钟等等。基于此,BMS周期性执行黑盒日志读取命令,进而能够周期性地读取到电源模块记录的黑盒日志信息。
应理解的是,电源模块本身就有记录黑盒日志的功能,其所记录的黑盒日志包括但不限定于:电源温度,风扇转速,电压,电流,功耗,电源自身状态等信息。
在BMC获取得到黑盒日志读取命令之后,BMC执行步骤S202。
S202:执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息;
在具体实现时,BMC每当从循环任务列表中获取到黑盒日志读取命令中读取到一个命令时就立即执行该命令。该循环任务列表中可能仅包括一个命令,也可以包括多个命令,当其包括多个命令时,则BMC从该循环任务列表中依次获取命令并进行命令。
在具体实现时,由于服务器在正常工作时,电源MFR_PAGE寄存器默认值为0xFF,该指标识寄存器中存储的电源相关信息是电源当前的实时信息。为了能够读取到电源的黑盒日志信息,则在执行该命令时,先修改电源MFR_PAGE寄存器默认值,将该默认值修改为需要获取的信息对应的寄存器的值,也称为寄存器的地址。为了便于理解下面通过表1来描述电源MFR_PAGE寄存器对应的值以及对应的寄存器所记录的信息。
表1电源寄存器对应的值及其所记录的信息
应理解的是,一般情况下,电源模块会记录最近5次的电源故障时的电源相关信息,依次记为如表1中的Fault History 1、Fault History2、Fault History3、FaultHistory4和Fault History5。
若黑盒日志获取命令用于指示获取某一次电源故障时的黑盒日志信息,则需要针对性地将电源寄存器当前值进行适应性修改,使得后续能够获取到所需的黑盒日志信息。具体的,根据所述黑盒日志读取命令确定与其对应的所述电源模块的寄存器的指定地址,根据所述指定地址修改所述寄存器的当前地址;然后,向所述电源模块发送所述黑盒日志读取命令,接收所述电源模块根据所述黑盒日志读取命令返回的黑盒日志信息。
例如,若一个黑盒日志读取命令用于指示获取最近一次的黑盒日志,即用于指示获取Fault History 1中的信息,则该黑盒日志读取命令所对应的寄存器的指定地址就为0x00,则根据该指定地址修改寄存器当前的值,即将寄存器的值更新为0x00。
再例如,若另一个黑盒日志读取命令用于指示获取次近一次的黑盒日志,即用于指示获取Fault History 2中的信息,则该黑盒日志读取命令所对应的寄存器的指定地址就为0x01,则根据该指定地址修改寄存器当前的值,即将寄存器的值更新为0x01。
以此类推,每个黑盒日志读取命令都指示获取指定次数对应的黑盒日志信息,而每个黑盒日志读取命令就对应有指定地址,该指定地址就表征了所需获取的黑盒日志信息所对应的寄存器的值。基于此,为了能够获取到对应的黑盒日志信息,则需要将寄存器的值修改为该指定地址,从而为实现后续的获取黑盒日志打好基础。
在具体实现时,黑盒日志读取命令中可以包括指定地址、指定信息标识和指定字节,所述指定地址用于表征待获取的黑盒日志信息对应的所述电源模块的寄存器的值,所述指定信息标识用于标识待获取的信息,所述指定字节用于表征待获取的黑盒日志信息的字节数。
应理解的是,一般电源模块中存储有最近5次的电源故障时的电源相关信息,这里的电源相关信息包括多种多样的与电源工作状态相关的信息。但一个黑盒日志读取命令仅指示获取某一次电源故障时的某一种信息。因此,通过指定地址来指示需要获取的是最近5次中的哪一次电源故障时的信息,而通过指定信息标识来指示需要获取电源相关信息中的哪种信息,再通过指定字节来指示需要获取的信息所占的字节个数。
在从电源模块中读取到黑盒日志信息之后,执行步骤S203;
S203:将读取到的黑盒日志信息存储在服务器中,以便所述服务器能够提供所述黑盒日志信息,以用于电源故障诊断。
在具体实现时,BMC将从电源模块读取到的黑盒日志信息自动存储于服务器中,例如,预先设置好存储地址,则BMC直接将读取到的黑盒日志信息存储于指定存储地址,例如,指定存储地址为服务器的/var/onekeylog/目录,则BMC直接将读取到的黑盒日志信息存储于此。从而用户在服务器发生故障时,需要排查电源故障时,可以直接通过BMC导出该黑盒日志信息以进行电源故障诊断。
在具体实现时,用户可以通过终端上配置的浏览器或者客户端与服务器交互,下载所需要的黑盒日志信息,例如,用户可以通过终端向服务器发送黑盒日志获取请求,该黑盒日志获取请求中携带有指定时间,以请求获取指定时间内产生的黑盒日志信息,从而有针对性地进行电源故障诊断。该指定时间可以理解为是一个时间范围,例如从一个时间点至另一个时间点,该指定时间也可以理解为获取距离当前时间最近的时间点。可见,相比现有技术方案,用户无需再从服务器中拆解电源模块,无需通过专用软件从电源模块中导出黑盒日志信息,利用本申请提供的方法,能够提高诊断效率并且降低成本,能够满足对电源模块故障及时诊断的需求。
与上述方法相对于的本申请还提供了一种电源故障诊断装置,下面结合图3对该装置进行解释说明。参见图3示出的本申请实施例提供的一种电源故障诊断装置的结构图,如图3所示,该装置300包括:
命令获取模块301,用于从循环任务列表中获取黑盒日志读取命令,所述黑盒日志读取命令用于指示从电源模块中读取黑盒日志信息;所述循环任务列表中记录有待循环执行的黑盒日志读取命令;
命令执行模块302,用于执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息;
信息存储模块303,用于将读取到的黑盒日志信息存储在服务器中,以便所述服务器能够提供所述黑盒日志信息,以用于电源故障诊断。
可选的,所述获取命令获取模块301,具体用于按照预设周期,周期性地从循环任务列表中获取黑盒日志读取命令。
可选的,所述命令执行模块302,具体用于根据所述黑盒日志读取命令确定与其对应的所述电源模块的寄存器的指定地址,根据所述指定地址修改所述寄存器的当前地址;以及,向所述电源模块发送所述黑盒日志读取命令,接收所述电源模块根据所述黑盒日志读取命令返回的黑盒日志信息。
可选的,所述循环任务列表中记录有待循环执行的多个黑盒日志读取命令。
可选的,所述多个黑盒日志读取命令中每个黑盒日志读取命令用于读取电源模块中记录的最近5次中任一次电源故障时的电源相关信息。
可选的,所述黑盒日志读取命令包括指定地址、指定信息标识和指定字节,所述指定地址用于表征待获取的黑盒日志信息对应的所述电源模块的寄存器的值,所述指定信息标识用于标识待获取的信息,所述指定字节用于表征待获取的黑盒日志信息的字节数。
在具体实现时,上述图3所示各个模块可以以程序功能模块的形式部署于BMC中,从而使得BMC实现自动收集电源模块的黑盒日志信息以存储于服务器中,为电源故障诊断提供基础信息。
为了保证本申请提供的电源故障诊断方法在实际中的应用与实现,本申请还提供了一种服务器。下面结合图4对该服务器进行解释说明。
参见图4示出的一种服务器的结构图,如图4所示,该服务器400包括基板管理控制器401、电源模块402以及存储器403;
所述基板管理控制器401上配置有程序,并在运行所述程序时以实现本申请上述实施例描述的电源故障诊断方法,并且能够响应终端发送的黑盒日志信息获取请求,向所述终端返回所述黑盒日志信息;
所述电源模块402,用于为所述服务器供电,并记录电源模块故障时的黑盒日志信息;
所述存储器403,用于存储所述基板管理控制器从所述电源模块中获取的黑盒日志信息。
其中,所述存储器403可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
对于用户来讲,在需要进行电源故障诊断时,只需要利用终端从服务器处下载所需的电源模块的黑盒日志信息,就能够实现对电源故障的诊断,在具体实现时,用户可以获取指定时间段内产生的黑盒日志信息,也可以仅获取当前最近一次产生的黑盒日志信息,可以获取某种特定的信息,例如风扇转速信息,电源温度信息等等,也可以获得电源故障时的所有相关信息。
另外,本申请还提供了一种计算机存储介质,其特征在于,其上存储有程序,所述程序在被处理器执行时实现如图2所示实施例提供的电源故障诊断方法。该计算机存储介质能够被移植到任意设备中以使地本申请提供的电源故障诊断方法得以实现。
另外,本申请还提供了一种计算机程序产品,当在设备上执行时,适于执行初始化有如上述本申请实施例提供的一种电源故障诊断方法的步骤的程序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (10)

1.一种电源故障诊断方法,其特征在于,所述方法包括:
从循环任务列表中获取黑盒日志读取命令,所述黑盒日志读取命令用于指示从电源模块中读取黑盒日志信息;所述循环任务列表中记录有待循环执行的黑盒日志读取命令;
执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息;
将读取到的黑盒日志信息存储在服务器中,以便所述服务器能够提供所述黑盒日志信息,以用于电源故障诊断。
2.根据权利要求1所述的电源故障诊断方法,其特征在于,所述从循环任务列表中获取黑盒日志读取命令,包括:
按照预设周期,周期性地从循环任务列表中获取黑盒日志读取命令。
3.根据权利要求1所述的电源故障诊断方法,其特征在于,所述执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息,包括:
根据所述黑盒日志读取命令确定与其对应的所述电源模块的寄存器的指定地址,根据所述指定地址修改所述寄存器的当前地址;
向所述电源模块发送所述黑盒日志读取命令,接收所述电源模块根据所述黑盒日志读取命令返回的黑盒日志信息。
4.根据权利要求1所述的电源故障诊断方法,其特征在于,所述循环任务列表中记录有待循环执行的多个黑盒日志读取命令。
5.根据权利要求1所述的电源故障诊断方法,其特征在于,所述多个黑盒日志读取命令中每个黑盒日志读取命令用于读取电源模块中记录的最近5次中任一次电源故障时的电源相关信息。
6.根据权利要求1所述的电源故障诊断方法,其特征在于,所述黑盒日志读取命令包括指定地址、指定信息标识和指定字节,所述指定地址用于表征待获取的黑盒日志信息对应的所述电源模块的寄存器的值,所述指定信息标识用于标识待获取的信息,所述指定字节用于表征待获取的黑盒日志信息的字节数。
7.根据权利要求1所述的电源故障诊断方法,其特征在于,所述方法应用于服务器中的基板管理控制器中。
8.一种电源故障诊断装置,其特征在于,所述装置包括:
命令获取模块,用于从循环任务列表中获取黑盒日志读取命令,所述黑盒日志读取命令用于指示从电源模块中读取黑盒日志信息;所述循环任务列表中记录有待循环执行的黑盒日志读取命令;
命令执行模块,用于执行所述黑盒日志读取命令从所述电源模块中读取对应的黑盒日志信息;
信息存储模块,用于将读取到的黑盒日志信息存储在服务器中,以便所述服务器能够提供所述黑盒日志信息,以用于电源故障诊断。
9.一种服务器,其特征在于,所述服务器包括:基板管理控制器、电源模块以及存储器;
所述基板管理控制器上配置有程序,并在运行所述程序时以实现上述权利要求1至7任一项所述的电源故障诊断方法,并且能够响应终端发送的黑盒日志信息获取请求,向所述终端返回所述黑盒日志信息;
所述电源模块,用于为所述服务器供电,并记录电源模块故障时的黑盒日志信息;
所述存储器,用于存储所述基板管理控制器从所述电源模块中获取的黑盒日志信息。
10.一种计算机存储介质,其特征在于,其上存储有程序,所述程序在被处理器执行时实现如权利要求1至7任一项所述的电源故障诊断方法。
CN201811098831.1A 2018-09-19 2018-09-19 一种电源故障诊断方法、装置及服务器 Pending CN109240846A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811098831.1A CN109240846A (zh) 2018-09-19 2018-09-19 一种电源故障诊断方法、装置及服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811098831.1A CN109240846A (zh) 2018-09-19 2018-09-19 一种电源故障诊断方法、装置及服务器

Publications (1)

Publication Number Publication Date
CN109240846A true CN109240846A (zh) 2019-01-18

Family

ID=65059194

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811098831.1A Pending CN109240846A (zh) 2018-09-19 2018-09-19 一种电源故障诊断方法、装置及服务器

Country Status (1)

Country Link
CN (1) CN109240846A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109741A (zh) * 2019-05-09 2019-08-09 北京旷视科技有限公司 循环任务的管理方法、装置、电子设备及存储介质
CN110209564A (zh) * 2019-06-03 2019-09-06 宜春宜联科技有限公司 打印机日志的获取方法、打印机、服务器和打印机系统
CN110377136A (zh) * 2019-06-18 2019-10-25 苏州浪潮智能科技有限公司 一种psu原始值日志记录方法及装置
CN110555006A (zh) * 2019-08-23 2019-12-10 宝能汽车有限公司 日志记录方法、电池管理系统、车辆及电子设备
CN110618909A (zh) * 2019-09-27 2019-12-27 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN110850951A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种psu信息的刷新和读取方法、系统及设备
CN111897710A (zh) * 2020-08-21 2020-11-06 中国工商银行股份有限公司 定时任务诊断方法及装置
CN112395126A (zh) * 2020-11-20 2021-02-23 北京百度网讯科技有限公司 故障日志处理方法、装置、电子设备和存储介质
CN113176973A (zh) * 2021-05-14 2021-07-27 山东英信计算机技术有限公司 Psu电源黑盒日志时间戳记录方法、装置、设备及介质
WO2022206246A1 (zh) * 2021-03-30 2022-10-06 山东英信计算机技术有限公司 一种服务器电源黑盒数据解析系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101458929B1 (ko) * 2013-11-27 2014-11-07 주식회사 디지캡 3자 인증을 이용한 로그 정보 인증 시스템의 osp 서버에 포함된 로그 블랙박스 장치 및 그 운영방법
CN105912086A (zh) * 2016-04-26 2016-08-31 浪潮(北京)电子信息产业有限公司 电源模块故障诊断方法、电源模块及整机柜服务器
CN107247505A (zh) * 2017-06-12 2017-10-13 郑州云海信息技术有限公司 一种易于查看的云服务器电源blackbox设计方法
CN108090000A (zh) * 2018-01-11 2018-05-29 郑州云海信息技术有限公司 一种获取cpu寄存器信息的方法及系统
CN108388489A (zh) * 2018-02-27 2018-08-10 郑州云海信息技术有限公司 一种服务器故障诊断方法、系统、设备及存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101458929B1 (ko) * 2013-11-27 2014-11-07 주식회사 디지캡 3자 인증을 이용한 로그 정보 인증 시스템의 osp 서버에 포함된 로그 블랙박스 장치 및 그 운영방법
CN105912086A (zh) * 2016-04-26 2016-08-31 浪潮(北京)电子信息产业有限公司 电源模块故障诊断方法、电源模块及整机柜服务器
CN107247505A (zh) * 2017-06-12 2017-10-13 郑州云海信息技术有限公司 一种易于查看的云服务器电源blackbox设计方法
CN108090000A (zh) * 2018-01-11 2018-05-29 郑州云海信息技术有限公司 一种获取cpu寄存器信息的方法及系统
CN108388489A (zh) * 2018-02-27 2018-08-10 郑州云海信息技术有限公司 一种服务器故障诊断方法、系统、设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
程和侠 程和生: "《Linux操作系统》", 31 January 2017, 中国科学技术大学出版社 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110109741A (zh) * 2019-05-09 2019-08-09 北京旷视科技有限公司 循环任务的管理方法、装置、电子设备及存储介质
CN110109741B (zh) * 2019-05-09 2021-08-27 北京旷视科技有限公司 循环任务的管理方法、装置、电子设备及存储介质
CN110209564A (zh) * 2019-06-03 2019-09-06 宜春宜联科技有限公司 打印机日志的获取方法、打印机、服务器和打印机系统
CN110377136A (zh) * 2019-06-18 2019-10-25 苏州浪潮智能科技有限公司 一种psu原始值日志记录方法及装置
CN110555006A (zh) * 2019-08-23 2019-12-10 宝能汽车有限公司 日志记录方法、电池管理系统、车辆及电子设备
WO2021056913A1 (zh) * 2019-09-27 2021-04-01 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置及系统
CN110618909B (zh) * 2019-09-27 2021-03-26 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN110618909A (zh) * 2019-09-27 2019-12-27 苏州浪潮智能科技有限公司 基于i2c通讯的故障定位方法、装置、设备及存储介质
CN110850951A (zh) * 2019-09-29 2020-02-28 苏州浪潮智能科技有限公司 一种psu信息的刷新和读取方法、系统及设备
CN111897710A (zh) * 2020-08-21 2020-11-06 中国工商银行股份有限公司 定时任务诊断方法及装置
CN112395126A (zh) * 2020-11-20 2021-02-23 北京百度网讯科技有限公司 故障日志处理方法、装置、电子设备和存储介质
WO2022206246A1 (zh) * 2021-03-30 2022-10-06 山东英信计算机技术有限公司 一种服务器电源黑盒数据解析系统
CN113176973A (zh) * 2021-05-14 2021-07-27 山东英信计算机技术有限公司 Psu电源黑盒日志时间戳记录方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
CN109240846A (zh) 一种电源故障诊断方法、装置及服务器
US8238256B2 (en) System and method for cloud computing
CN109885316B (zh) 基于kubernetes的hdfs-hbase部署方法及装置
CN102622298B (zh) 一种软件测试系统及方法
CN107451147B (zh) 一种kafka集群动态切换的方法和装置
CN111124277B (zh) 一种深度学习数据集缓存方法、系统、终端及存储介质
US20150067410A1 (en) Hardware failure prediction system
CN102546224A (zh) 服务器的远程管理系统及方法
JP2014142957A5 (zh)
CN107870802B (zh) 一种虚拟机迁移方法和装置
TW201709081A (zh) 自動修復映像檔的方法及伺服器系統
CN105450759A (zh) 一种系统镜像的管理方法和装置
CN110535671B (zh) 云平台的管理方法及装置
CN103064717A (zh) 一种集群系统并行安装软件的装置和方法
CN108427635A (zh) 快速测试web页面的方法、服务器及计算机可读存储介质
CN103401701A (zh) 一种网络管理装置和方法
CN109379223A (zh) 一种实现网卡自动化设置的方法和装置
CN110162312B (zh) 一种基于IML的BeeGFS配置方法与装置
CN110532150B (zh) 一种机箱管理方法、装置、存储介质及处理器
CN112073499A (zh) 一种多机型云物理服务器的动态服务方法
CN109614139A (zh) 一种系统服务配置方法、装置、设备及介质
CN110880990A (zh) 一种大数据集群组件的配置核查方法、装置及计算设备
CN115080309A (zh) 数据备份系统、方法、存储介质以及电子设备
CN115080191A (zh) 一种管理i2c链路的方法、装置、设备及可读介质
CN112256384B (zh) 基于容器技术的服务集合处理方法、装置和计算机设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190118