CN117149491A - 一种电源监测方法、系统、装置及存储介质 - Google Patents

一种电源监测方法、系统、装置及存储介质 Download PDF

Info

Publication number
CN117149491A
CN117149491A CN202311104388.5A CN202311104388A CN117149491A CN 117149491 A CN117149491 A CN 117149491A CN 202311104388 A CN202311104388 A CN 202311104388A CN 117149491 A CN117149491 A CN 117149491A
Authority
CN
China
Prior art keywords
power supply
abnormal
state
information
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311104388.5A
Other languages
English (en)
Inventor
孙平平
戴明甫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Shandong Computer Technology Co Ltd
Original Assignee
Inspur Shandong Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Shandong Computer Technology Co Ltd filed Critical Inspur Shandong Computer Technology Co Ltd
Priority to CN202311104388.5A priority Critical patent/CN117149491A/zh
Publication of CN117149491A publication Critical patent/CN117149491A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0778Dumping, i.e. gathering error/state information after a fault for later diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/30Means for acting in the event of power-supply failure or interruption, e.g. power-supply fluctuations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种电源监测方法、系统、装置及存储介质,涉及存储领域,用于解决无法抓取整机断电瞬间的最终状态的问题。该方法处理器获取双电源的供电状态,并根据供电状态确定双电源是否发生异常;若发生异常,则将异常断电信息存储在与自身连接的存储单元中,以便服务器上电后基板管理控制器读取异常断电信息。可见,本申请中在服务器整机断电时,服务器主板会延时断电,因此选用服务器主板上的任一处理器获取双电源的状态,并在双电源异常时,将异常断电信息存储在与处理器连接的存储单元中,可以在服务器重新上电后基板管理控制器读取并记录供电状态,可以解决无法抓取整机断电瞬间的最终状态的问题。

Description

一种电源监测方法、系统、装置及存储介质
技术领域
本申请涉及存储领域,特别涉及一种电源监测方法、系统、装置及存储介质。
背景技术
随着服务器整机应用的广泛,供电状态的监测和记录成为了关键需求。目前国产服务器整机已普遍配置双电源,以提高供电可靠性。在单个电源掉电的情况下,基于BMC(Baseboard Management Controller,主板管理控制器)的系统可以记录掉电的告警日志。然而,在双电源同时掉电(例如机房异常断电)的情况下,由于BMC缺乏一种缓存供电机制,导致无法抓取整机断电瞬间的最终状态,从而无法记录整机断电的瞬时信息。
因此,提供一种电源监测方法,以记录整机断电时的瞬时信息是十分必要的。
发明内容
本申请的目的是提供一种电源监测方法、系统、装置及存储介质,在服务器整机断电时,服务器主板会延时断电,因此选用服务器主板上的任一处理器获取双电源的状态,并在双电源异常时,将异常断电信息存储在与处理器连接的存储单元中,可以在服务器重新上电后基板管理控制器读取并记录供电状态,可以解决无法抓取整机断电瞬间的最终状态的问题。
为解决上述技术问题,第一方面本申请提供了一种电源监测方法,应用于服务器主板上的任意处理器,所述处理器与基板管理控制器连接,包括:
获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常;
若发生异常,则在6毫秒内将异常断电信息存储在与自身连接的存储单元中,以便所述服务器上电后所述基板管理控制器读取所述异常断电信息。
在一种实施例中,获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常,包括:
获取第一引脚的引脚状态,所述第一引脚的引脚状态用于表征输入至所述双电源的交流电的状态;
根据所述第一引脚的引脚状态确定所述双电源是否发生异常;
若所述第一引脚的引脚状态表征所述交流电的状态异常,则判定所述双电源发生异常。
在一种实施例中,获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常,包括:
获取所述双电源的在位引脚的状态,根据所述在位引脚的状态确定所述双电源是否发生异常;
若根据所述在位引脚的状态确定所述双电源均不在位,则判定所述双电源发生异常。
在一种实施例中,将异常断电信息存储在与自身连接的存储单元中,包括:
将所述异常断电信息存储在与自身对应的寄存器中。
在一种实施例中,所述基板管理控制器读取所述异常断电信息之后,还包括:
将所述异常断电信息转换为告警日志,上报至基板管理控制器告警平台。
在一种实施例中,将所述异常断电信息转换为告警日志,上报至基板管理控制器告警平台之后,还包括:
将告警解除日志上传至所述基板管理控制器告警平台。
在一种实施例中,所述基板管理控制器读取所述异常断电信息之后,还包括:
判断所述基板管理控制器是否完成对所述异常断电信息的读取;
若完成,则下发信息清除指令,以清除所述存储单元存储的所述异常断电信息。
第二方面,本申请还提供了一种电源监测系统,应用于服务器主板上的任意处理器,所述处理器与基板管理控制器连接,包括:
获取单元,用于获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常;
执行单元,用于在双电源发生异常时,在6毫秒内将异常断电信息存储在与自身连接的存储单元中,以便所述服务器上电后所述基板管理控制器读取所述异常断电信息。
在一种实施例中,获取单元具体用于:获取第一引脚的引脚状态,所述第一引脚的引脚状态用于表征输入至所述双电源的交流电的状态;根据所述第一引脚的引脚状态确定所述双电源是否发生异常;若所述第一引脚的引脚状态表征所述交流电的状态异常,则判定所述双电源发生异常。
在一种实施例中,获取单元具体用于:获取所述双电源的在位引脚的状态,根据所述在位引脚的状态确定所述双电源是否发生异常;若根据所述在位引脚的状态确定所述双电源均不在位,则判定所述双电源发生异常。
在一种实施例中,将异常断电信息存储在与自身连接的存储单元中,包括:将所述异常断电信息存储在与自身对应的寄存器中。
在一种实施例中,还包括:
日志转换单元,用于所述基板管理控制器读取所述异常断电信息之后,将所述异常断电信息转换为告警日志,上报至基板管理控制器告警平台。
在一种实施例中,还包括:
告警解除单元,用于将所述异常断电信息转换为告警日志,上报至基板管理控制器告警平台之后,将告警解除日志上传至所述基板管理控制器告警平台。
在一种实施例中,还包括:
清除单元,用于在所述基板管理控制器读取所述异常断电信息之后,判断所述基板管理控制器是否完成对所述异常断电信息的读取;若完成,则下发信息清除指令,以清除所述存储单元存储的所述异常断电信息。
第三方面,本申请还提供了一种电源监测装置,包括:
存储器,用于存储计算机程序;
处理器,用于在存储计算机程序时,实现如上述所述的电源监测方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的电源监测方法的步骤。
本申请提供了一种电源监测方法、系统、装置及存储介质,涉及存储领域,用于解决无法抓取整机断电瞬间的最终状态的问题。该方法处理器获取双电源的供电状态,并根据供电状态确定双电源是否发生异常;若发生异常,则将异常断电信息存储在与自身连接的存储单元中,以便服务器上电后基板管理控制器读取异常断电信息。可见,本申请中在服务器整机断电时,服务器主板会延时断电,因此选用服务器主板上的任一处理器获取双电源的状态,并在双电源异常时,将异常断电信息存储在与处理器连接的存储单元中,可以在服务器重新上电后基板管理控制器读取并记录供电状态,可以解决无法抓取整机断电瞬间的最终状态的问题。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种电源监测方法的流程示意图;
图2为本申请提供的一种引脚状态示意图;
图3为本申请提供的一种电源监测方法的具体实施例的流程图;
图4为本申请提供的一种服务器上电之后的流程图;
图5为本申请提供的一种电源监测系统的结构框图;
图6为本申请提供的一种电源监测装置的结构框图;
图7为本申请提供的一种计算机可读存储介质的结构框图。
具体实施方式
本申请的核心是提供一种电源监测方法、系统、装置及存储介质,在服务器整机断电时,服务器主板会延时断电,因此选用服务器主板上的任一处理器获取双电源的状态,并在双电源异常时,将异常断电信息存储在与处理器连接的存储单元中,可以在服务器重新上电后基板管理控制器读取并记录供电状态,可以解决无法抓取整机断电瞬间的最终状态的问题。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前在服务器的双电源同时掉电(例如机房异常断电)的情况下,由于BMC缺乏一种缓存供电机制,导致无法抓取整机断电瞬间的最终状态,从而无法记录整机断电的瞬时信息。
为解决上述技术问题,本申请提供了一种电源监测方法,应用于服务器主板上的任意处理器,处理器与基板管理控制器连接,包括:
S11:获取双电源的供电状态,并根据供电状态确定双电源是否发生异常;
本步骤主要用于获取双电源的供电状态,并根据供电状态来确定双电源是否发生异常。具体地,双电源指的是两个供电源(如两个PSU(Power supply unit,电源供应单元)),可能是两个不同的电源插头或两个不同的电源线路。这些电源提供电力给处理器和其他组件。
在本步骤中,处理器与基板管理控制器相连接,通过该连接获取并传输供电状态信息。供电状态指的是电源的工作状态,包括是否工作正常或发生异常等情况。通过获取双电源的供电状态,本步骤可以判断双电源是否发生异常。异常指的是掉电、电源故障、电压波动或其他供电问题。如果检测到供电状态异常,则会进行相应的处理措施。一种处理异常的方式是将异常断电信息存储在与该处理器连接的存储单元中。该存储单元可以是处理器上的内存、硬盘或其他存储设备。通过将异常断电信息存储在存储单元中,可以在服务器重新上电后,由基板管理控制器读取这些信息。这样,基板管理控制器可以记录供电状态的异常情况,以便进行后续的分析、故障排除或其他操作。
其中,处理器与基板管理控制器相连接为通讯连接,可以但不限于是通过I2C(Inter-Integrated Circuit,串行通信总线)连接。此外,本申请中处理与基板管理控制器之间可以使用有线或无线通信方式,如以太网、Wi-Fi或蓝牙等,实现异常断电信息与基板管理控制器的通信。
总之,本步骤通过获取双电源的供电状态并判断是否发生异常,以及在异常情况下将异常断电信息存储在存储单元中,实现在服务器重新上电后记录供电状态的目的。这样能解决无法抓取整机断电瞬间的最终状态的问题。
S12:若发生异常,则在6毫秒内将异常断电信息存储在与自身连接的存储单元中,以便服务器上电后基板管理控制器读取异常断电信息。
本步骤具体是描述在双电源发生异常时,将异常断电信息存储在与处理器连接的存储单元中的方法。具体来说,当双电源发生异常时,处理器会检测到这个异常,并将相关的断电信息保存在其连接的存储单元中。这个存储单元可以是处理器内部的寄存器、缓存等等。在服务器重新上电后,基板管理控制器可以读取并记录这些供电状态信息。
进一步的,可以对异常断电信息的显示方式进行优化,具体地,可以在服务器主板上添加一个显示屏或指示灯,用于显示异常断电信息,方便维护人员快速识别并解决问题。此外,对于异常断电信息的通知方式:除了可以在服务器上电之后使基板管理控制器读取异常断电信息之外,还可以在异常断电发生时或服务器上电通过电子邮件、短信或手机应用程序发送通知给管理人员,提醒他们及时处理并修复异常。
本实施例的作用是解决无法抓取整机断电瞬间的最终状态的问题。在服务器整机断电时,服务器主板会延时断电,主板上的任意处理器可以直接获取到整机断电瞬间的准确状态。通过利用主板上任意处理器连接的存储单元,将异常断电信息保存下来,可以在服务器重新上电后,基板管理控制器读取并记录这些信息,从而获取到断电瞬间的最终状态。
如图2所示,在AC电源断电时,首先AC_VIN输入拉低,然后AC_OK引脚(即为上述第一引脚)拉低,然后PSU_PWR_OK引脚(电源的在位引脚)也拉低,此时服务器整机断电。因此,在本实施例中,可以是通过检测第一引脚判断整机供电是否异常,也可以是通过检测在位引脚判断整机供电是否异常,也可以是综合二者同时判断,以提高判断的准确性。
此外,图2中标示除了各个引脚拉低的时间,具体来说,AC_VIN输入拉低到PSU_PWR_OK拉低的这段时间是10ms;AC_OK拉低是在AC_VIN输入拉低后2-4ms拉低;PSU_PWR_OK是在AC_OK拉低后6-8ms左右拉低;PSU_PWR_OK拉低后PSU不再给主板供电。所以本申请中处理器记录双电源供电的状态至寄存器,并且信息会存储在寄存器中这个动作需要在6ms内完成。
本实施例中的方式简单且可靠。由于处理器与基板管理控制器之间的连接已经存在,不需要额外的硬件设备或复杂的通信方式。同时,基板管理控制器可以直接读取处理器的存储单元,确保了异常断电信息的准确性和可靠性。
综上,本实施例中在服务器整机断电时,服务器主板会延时断电,因此选用服务器主板上的任一处理器获取双电源的状态,并在双电源异常时,将异常断电信息存储在与处理器连接的存储单元中,可以在服务器重新上电后基板管理控制器读取并记录供电状态,可以解决无法抓取整机断电瞬间的最终状态的问题。
在一种实施例中,获取双电源的供电状态,并根据供电状态确定双电源是否发生异常,包括:
获取第一引脚的引脚状态,第一引脚的引脚状态用于表征输入至双电源的交流电的状态;
根据第一引脚的引脚状态确定双电源是否发生异常;
若第一引脚的引脚状态表征交流电的状态异常,则判定双电源发生异常。
本实施例描述了一种电源监测方法,用于服务器主板上的任意处理器。具体地,本实施例通过连接处理器和基板管理控制器,实现对双电源供电状态的监测。具体步骤如下:1.获取第一引脚的引脚状态:第一引脚是用来表征输入至双电源的交流电的状态的。通过获取该引脚的引脚状态,可以了解双电源供电状态。2.根据第一引脚的引脚状态确定双电源是否发生异常:根据第一引脚的引脚状态,可以判断交流电的状态是否正常。如果第一引脚的引脚状态表征交流电的状态异常(比如交流电中断或其他故障),则可以判定双电源发生异常。3.若第一引脚的引脚状态表征交流电的状态异常,则判定双电源发生异常:如果根据第一引脚的引脚状态判断出交流电的状态异常,就可以确定双电源供电发生了异常。如果发生异常,还包括将异常断电信息存储在与自身连接的存储单元中。这样,在服务器上电后,基板管理控制器可以读取存储单元中的异常断电信息,以便进行异常处理和故障排查。
综上,本实施例详细描述了一种基于引脚状态的双电源供电状态监测方法,通过这种方法可以实时监测电源供电状态的异常,并为后续故障排查提供异常断电信息。
在一种实施例中,获取双电源的供电状态,并根据供电状态确定双电源是否发生异常,包括:
获取双电源的在位引脚的状态,根据在位引脚的状态确定双电源是否发生异常;
若根据在位引脚的状态确定双电源均不在位,则判定双电源发生异常。
本实施例提供了一种具体的实施例,用于获取双电源的供电状态并确定是否发生异常。具体而言,包括以下步骤:首先,通过连接处理器与基板管理控制器来建立通信连接。基板管理控制器(BMC)是服务器系统中的一个关键组件,用于监控和控制服务器的各个部分。其次,在建立通信连接后,执行以下步骤:获取双电源的在位引脚的状态。在位引脚是指电源插座中的一个针脚或引脚,用于检测电源是否正常连接。根据在位引脚的状态确定双电源是否发生异常。如果在位引脚的状态显示双电源均在位,则表示电源连接正常;如果在位引脚的状态显示双电源均不在位(即未正确连接),则表示电源发生异常。若根据在位引脚的状态确定双电源发生异常,则将异常断电信息存储在与自身连接的存储单元中。存储单元可以是处理器内部的内存或外部存储设备,用于记录异常断电的相关信息。最后,在服务器上电后,基板管理控制器可以读取存储在存储单元中的异常断电信息,从而判断服务器的电源情况,并采取相应的措施进行处理。
总的来说,本实施例所描述的是一种利用在位引脚状态检测双电源是否发生异常的方法,并将异常断电信息存储起来供后续处理的技术方案。通过这种方法,可以更准确地监测和管理服务器的电源状态,提高系统的可靠性和稳定性。
在一种实施例中,将异常断电信息存储在与自身连接的存储单元中,包括:
将异常断电信息存储在与自身对应的寄存器中。
本实施例要求将异常断电信息存储在与自身对应的寄存器中。在这种实施例中,该电源监测方法会为每个处理器分配一个与其对应的寄存器。当双电源供电状态发生异常时,异常断电信息将被存储在与发生异常的处理器所对应的寄存器中。这意味着该处理器都有一个专门用于存储异常断电信息的寄存器。当异常断电发生时,将把相关信息写入到该寄存器中,以便以后基板管理控制器进行读取。
将异常断电信息存储在与自身对应的寄存器中有几个好处。首先,处理器与寄存器之间的连接是直接的,这样可以提高数据传输的效率和速度。其次,处理器有自己的寄存器,这样可以保持信息的独立性,不会与其他处理器的信息混淆。最后,基板管理控制器可以根据需要有选择地读取每个处理器的寄存器,从而实现个性化的异常断电信息处理。
其中,处理器可以是设于主板上的CPLD(Complex Programmable LogicDevice,复杂可编程逻辑器件),那么对应的,寄存器为和CPLD对应的寄存器。
此外,对于异常断电信息的存储方式而言:除了存储在与基板管理控制器连接的存储单元中,也可以将异常断电信息存储在其他媒介中,如固态硬盘或云存储系统中,以便更加灵活地管理和访问这些信息。
总之,本实施例中将异常断电信息存储在与处理器自身对应的寄存器中,以提高信息处理的效率和灵活性。
在一种实施例中,基板管理控制器读取异常断电信息之后,还包括:
将异常断电信息转换为告警日志,上报至基板管理控制器告警平台。
本实施例描述了一种电源监测方法的附加功能。该方法应用于服务器主板上的任意处理器,并与基板管理控制器连接。具体地,本实施例中进一步描述了基板管理控制器在读取异常断电信息后的附加功能。基板管理控制器会将异常断电信息转换为告警日志,并上报至基板管理控制器的告警平台。这样,基本管理控制器可以及时获得有关服务器电源的异常情况的信息,并可以通过告警日志进行更详细的分析和处理。
通过将异常断电信息转换为告警日志并上报至基板管理控制器告警平台,该功能可以帮助管理员及时了解服务器电源的异常状况,并采取相应的措施来处理或修复这些问题。这有助于确保服务器的稳定运行,并提供及时的维护和管理。
进一步的,在BMC将告警日志上报至告警平台之后,还会通过IPMI(IntelligentPlatform Management Interface,智能平台管理接口)协议记录到SEL日志(系统事件日志)中,如图4所示。
综上所述,本实施例提供了一种将异常断电信息转换为告警日志并上报至基板管理控制器告警平台的功能,通过该功能可以使管理员能够及时获得有关服务器电源异常的信息,并能够做出相应的应对和处理。
在一种实施例中,将异常断电信息转换为告警日志,上报至基板管理控制器告警平台之后,还包括:
将告警解除日志上传至基板管理控制器告警平台。
本实施例描述了在一种实施例中,将异常断电信息转换为告警日志并上报至基板管理控制器告警平台之后,还包括将告警解除日志上传至基板管理控制器告警平台。具体地,在这个实施例中,当双电源发生异常并被检测到后,异常断电信息将会被记录并存储在与自身连接的存储单元中。基板管理控制器会读取存储的异常断电信息,并将其转换为告警日志的形式。告警日志是以文本形式记录发生异常断电的详细信息,如异常断电发生的时间、异常发生的具体原因等。基板管理控制器会将这些告警日志上报至基板管理控制器告警平台,以便管理员或操作人员能够及时了解服务器的异常情况。
同时,本实施例还指出,在整机重新上电之后,也即是在异常解除后,也会生成告警解除日志,并上传至基板管理控制器告警平台。告警解除日志记录了异常断电解除的相关信息,如解除异常断电的时间、解除异常的原因等。通过上传告警解除日志,管理员或操作人员可以知道服务器已经恢复正常运行。
总之,本实施例中,异常断电信息被转换为告警日志并上报至基板管理控制器告警平台,同时还包括将告警解除日志上传至告警平台,以提供全面的异常断电监控和管理功能。
在一种实施例中,基板管理控制器读取异常断电信息之后,还包括:
判断基板管理控制器是否完成对异常断电信息的读取;
若完成,则下发信息清除指令,以清除存储单元存储的异常断电信息。
本实施例中,基板管理控制器读取异常断电信息之后,处理器还会进行一系列操作判断基板管理控制器是否完成对异常断电信息的读取。这是为了确保异常断电信息已经被成功读取并处理,从而能够准确判断双电源是否发生异常,并采取适当措施解决问题。此外,进一步的,如果基板管理控制器完成了对异常断电信息的读取,意味着已经成功地获取了异常断电信息,并进行了相应的处理操作。在这种情况下,基板管理控制器会下发信息清除指令,以清除存储单元中存储的异常断电信息。这样可以保证下一次服务器上电时,存储单元中不会有过时的异常断电信息干扰正常的电源监测操作。通过擦除该寄存器中的异常断电信息,可以防止多次上报告警日志,以及无法触发下次异常告警。
综上,本实施例具体描述了基板管理控制器在读取异常断电信息后的操作流程,确保异常断电信息得到了正确的处理和清除。这有助于提高电源监测的可靠性和准确性,进一步确保服务器正常运行并提供稳定的服务。
为便于理解,本申请还提供了一个具体实施例,如图3所示,该具体实施例包括以下步骤:
服务器包括两个电源,分别为PSU1和PSU2;CPLD读取PSU的供电状态;判断PSU模块在位供电状态信号是否为低(也即通过PSU的在位引脚判断PSU是否在位);若在位供电状态信号为低,则CPLD记录此供电状态(异常断电信息)至寄存器flash,在服务器整机上电之后,BMC模块通过I2C协议读取寄存器flash中的异常断电信息,并转换为告警日志上报至告警平台;CPLD通过I2C判断寄存器flash中的信息是否被BMC读取,若已读,则删除寄存器falsh中的信息。
综上,本申请提供的电源监测方法在服务器整机断电时,服务器主板会延时断电,因此选用服务器主板上的任一处理器获取双电源的状态,并在双电源异常时,将异常断电信息存储在与处理器连接的存储单元中,可以在服务器重新上电后基板管理控制器读取并记录供电状态,可以解决无法抓取整机断电瞬间的最终状态的问题。
第二方面,本申请还提供了一种电源监测系统,如图5所示,该系统应用于服务器主板上的任意处理器,处理器与基板管理控制器连接,包括:
获取单元51,用于获取双电源的供电状态,并根据供电状态确定双电源是否发生异常;
执行单元52,用于在双电源发生异常时,在6毫秒内将异常断电信息存储在与自身连接的存储单元中,以便服务器上电后基板管理控制器读取异常断电信息。
在一种实施例中,获取单元具体用于:获取第一引脚的引脚状态,第一引脚的引脚状态用于表征输入至双电源的交流电的状态;根据第一引脚的引脚状态确定双电源是否发生异常;若第一引脚的引脚状态表征交流电的状态异常,则判定双电源发生异常。
在一种实施例中,获取单元具体用于:获取双电源的在位引脚的状态,根据在位引脚的状态确定双电源是否发生异常;若根据在位引脚的状态确定双电源均不在位,则判定双电源发生异常。
在一种实施例中,将异常断电信息存储在与自身连接的存储单元中,包括:将异常断电信息存储在与自身对应的寄存器中。
在一种实施例中,还包括:
日志转换单元,用于基板管理控制器读取异常断电信息之后,将异常断电信息转换为告警日志,上报至基板管理控制器告警平台。
在一种实施例中,还包括:
告警解除单元,用于将异常断电信息转换为告警日志,上报至基板管理控制器告警平台之后,将告警解除日志上传至基板管理控制器告警平台。
在一种实施例中,还包括:
清除单元,用于在基板管理控制器读取异常断电信息之后,判断基板管理控制器是否完成对异常断电信息的读取;若完成,则下发信息清除指令,以清除存储单元存储的异常断电信息。
对于电源监测系统的介绍请参照上述实施例,本申请在此不再赘述。
第三方面,本申请还提供了一种电源监测装置,如图6所示,该装置包括:
存储器61,用于存储计算机程序;
处理器62,用于在存储计算机程序时,实现如上述的电源监测方法的步骤。
本实施例提供的电源监测装置可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。其中,处理器62可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器62可以采用数字信号处理器(DigitalSignal Processor,DSP)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)、可编程逻辑阵列(ProgrammableLogic Array,PLA)中的至少一种硬件形式来实现。处理器62也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器(CentralProcessingUnit,CPU);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器62可以集成有图像处理器(Graphics Processing Unit,GPU),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器62还可以包括人工智能(Artificial Intelligence,AI)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器61可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器61还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器61至少用于存储以下计算机程序61,其中,该计算机程序被处理器62加载并执行之后,能够实现前述任一实施例公开的电源监测方法的相关步骤。另外,存储方式可以是短暂存储或者永久存储。其中,操作系统可以包括Windows、Unix、Linux等。对于电源监测装置的介绍请参照上述实施例,本申请在此不再赘述。
第四方面,本申请还提供了一种计算机可读存储介质70,如图6所示,该计算机可读存储介质70上存储有计算机程序71,计算机程序71被处理器62执行时实现如上述的电源监测方法的步骤。
最后,本申请还提供一种计算机可读存储介质70对应的实施例。计算机可读存储介质70上存储有计算机程序71,计算机程序71被处理器执行时实现如上述方法实施例中记载的步骤。
可以理解的是,如果上述实施例中的方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。计算机可读存储介质70可以为非暂态存储介质,也可以为暂态存储介质。对于计算机可读存储介质70的介绍请参照上述实施例,本申请在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种电源监测方法,其特征在于,应用于服务器主板上的任意处理器,所述处理器与基板管理控制器连接,包括:
获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常;
若发生异常,则在6毫秒内将异常断电信息存储在与自身连接的存储单元中,以便所述服务器上电后所述基板管理控制器读取所述异常断电信息。
2.如权利要求1所述的电源监测方法,其特征在于,获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常,包括:
获取第一引脚的引脚状态,所述第一引脚的引脚状态用于表征输入至所述双电源的交流电的状态;
根据所述第一引脚的引脚状态确定所述双电源是否发生异常;
若所述第一引脚的引脚状态表征所述交流电的状态异常,则判定所述双电源发生异常。
3.如权利要求1所述的电源监测方法,其特征在于,获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常,包括:
获取所述双电源的在位引脚的状态,根据所述在位引脚的状态确定所述双电源是否发生异常;
若根据所述在位引脚的状态确定所述双电源均不在位,则判定所述双电源发生异常。
4.如权利要求1所述的电源监测方法,其特征在于,将异常断电信息存储在与自身连接的存储单元中,包括:
将所述异常断电信息存储在与自身对应的寄存器中。
5.如权利要求1所述的电源监测方法,其特征在于,所述基板管理控制器读取所述异常断电信息之后,还包括:
将所述异常断电信息转换为告警日志,上报至基板管理控制器告警平台。
6.如权利要求5所述的电源监测方法,其特征在于,将所述异常断电信息转换为告警日志,上报至基板管理控制器告警平台之后,还包括:
将告警解除日志上传至所述基板管理控制器告警平台。
7.如权利要求1-6任一项所述的电源监测方法,其特征在于,所述基板管理控制器读取所述异常断电信息之后,还包括:
判断所述基板管理控制器是否完成对所述异常断电信息的读取;
若完成,则下发信息清除指令,以清除所述存储单元存储的所述异常断电信息。
8.一种电源监测系统,其特征在于,应用于服务器主板上的任意处理器,所述处理器与基板管理控制器连接,包括:
获取单元,用于获取双电源的供电状态,并根据所述供电状态确定所述双电源是否发生异常;
执行单元,用于在双电源发生异常时,在6毫秒内将异常断电信息存储在与自身连接的存储单元中,以便所述服务器上电后所述基板管理控制器读取所述异常断电信息。
9.一种电源监测装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于在存储计算机程序时,实现如权利要求1-7任一项所述的电源监测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1-7任一项所述的电源监测方法的步骤。
CN202311104388.5A 2023-08-30 2023-08-30 一种电源监测方法、系统、装置及存储介质 Pending CN117149491A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311104388.5A CN117149491A (zh) 2023-08-30 2023-08-30 一种电源监测方法、系统、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311104388.5A CN117149491A (zh) 2023-08-30 2023-08-30 一种电源监测方法、系统、装置及存储介质

Publications (1)

Publication Number Publication Date
CN117149491A true CN117149491A (zh) 2023-12-01

Family

ID=88883704

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311104388.5A Pending CN117149491A (zh) 2023-08-30 2023-08-30 一种电源监测方法、系统、装置及存储介质

Country Status (1)

Country Link
CN (1) CN117149491A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117453494A (zh) * 2023-12-25 2024-01-26 北京万界数据科技有限责任公司 一种数据服务器异常事件监管系统

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117453494A (zh) * 2023-12-25 2024-01-26 北京万界数据科技有限责任公司 一种数据服务器异常事件监管系统

Similar Documents

Publication Publication Date Title
CN102789305B (zh) 推迟挂起
CN108089964A (zh) 一种通过bmc监控服务器cpld状态的装置及方法
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
TWI512490B (zh) 擷取控制台訊息的系統及其方法及非暫態電腦可讀媒體
CN116107819A (zh) 一种服务器启动故障检测系统、方法、装置以及介质
CN117149491A (zh) 一种电源监测方法、系统、装置及存储介质
CN112596568B (zh) 一种读取电压调节器报错信息的方法、系统、设备及介质
CN108287780A (zh) 一种监控服务器cpld状态的装置及方法
US20240053812A1 (en) Power supply control method and apparatus, and server and non-volatile storage medium
CN114978883B (zh) 网络唤醒的管理方法、装置、电子设备及存储介质
CN113672306B (zh) 服务器组件自检异常恢复方法、装置、系统及介质
CN116225812B (zh) 基板管理控制器系统运行方法、装置、设备及存储介质
CN108399116A (zh) 一种服务器上电状态监测系统及方法
US7290172B2 (en) Computer system maintenance and diagnostics techniques
CN105975382A (zh) 一种硬件配置变动的报警方法
CN115102937A (zh) 一种服务器电源自适应通讯方法、设备及介质
US20220082634A1 (en) Power failure monitoring device and power failure monitoring method
CN115470056A (zh) 服务器硬件上电启动故障排查方法、系统、装置及介质
CN114372003A (zh) 测试环境监控方法、装置与电子设备
CN114218001A (zh) 故障修复方法、装置、电子设备及可读存储介质
CN114189429A (zh) 一种服务器集群故障的监测系统、方法、装置及介质
CN117055718B (zh) 一种服务器功耗检测系统、方法、装置、设备和存储介质
CN110647435A (zh) 服务器、硬盘远程控制方法及控制组件
CN110119370A (zh) 一种基于peci总线的vr芯片控制方法与系统
CN114884021B (zh) 一种供电电路的供电控制方法及相关组件

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination