CN117055718B - 一种服务器功耗检测系统、方法、装置、设备和存储介质 - Google Patents

一种服务器功耗检测系统、方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN117055718B
CN117055718B CN202311309122.4A CN202311309122A CN117055718B CN 117055718 B CN117055718 B CN 117055718B CN 202311309122 A CN202311309122 A CN 202311309122A CN 117055718 B CN117055718 B CN 117055718B
Authority
CN
China
Prior art keywords
power consumption
component
data
register
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311309122.4A
Other languages
English (en)
Other versions
CN117055718A (zh
Inventor
杨孝然
王武军
李大利
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202311309122.4A priority Critical patent/CN117055718B/zh
Publication of CN117055718A publication Critical patent/CN117055718A/zh
Application granted granted Critical
Publication of CN117055718B publication Critical patent/CN117055718B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/28Supervision thereof, e.g. detecting power-supply failure by out of limits supervision
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Power Sources (AREA)

Abstract

本发明涉及服务器技术领域,公开了一种服务器功耗检测系统、方法、装置、设备和存储介质,监控部件将采集的待检测部件的部件功耗数据存储至对应的实时数据寄存器;接收到功耗读取信号时,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。电源供应器将采集的电源功耗数据存储至对应的实时数据寄存器;接收到功耗读取信号时,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器。基板管理控制器在接收到读取整机功耗命令时,同时向各电源供应器以及各监控部件传输功耗读取信号;从功耗暂存寄存器中读取同一时刻下的所有部件功耗数据和电源功耗数据,提升了功耗监控的准确度。

Description

一种服务器功耗检测系统、方法、装置、设备和存储介质
技术领域
本发明涉及服务器技术领域,特别是涉及一种服务器功耗检测系统、方法、装置、设备和存储介质。
背景技术
随着服务器性能的不断提升,服务器整机功耗也在不断增加。服务器中包含有不同类型的部件,如风扇、图形处理器(Graphics Processing Unit,GPU)、硬盘、中央处理器(Central Processing Unit,CPU)、内存等。每个部件都会产生相应的功耗。图1为目前获取整机功耗的逻辑框图,基板管理控制器(Baseboard Management Controller,BMC)通过智能平台管理接口(Intelligent Platform Management Interface,IPMI)下发IPMI命令,通过通信总线(Inter-Integrated Circuit,I2C)获取风扇、GPU、硬盘这些部件的功耗。BMC通过与南桥芯片(PCH)通信,依靠PCH内置的英特尔管理引擎(Intel Management Engine,ME)获取CPU和内存的功耗。通过获取各部件的功耗,可以得到整机功耗的分布情况。
服务器中包括多个电源供应器(Power Supply Unit,PSU),所有PSU的功耗之和可以作为服务器整机功耗。由于BMC轮巡机制的限制,BMC无法同时读取多个PSU功耗。由于功耗动态性质的存在,导致最终获取的整机功耗是不同时刻下PSU功耗之和,最终获取的整机功耗与实际整机功耗存在较大的偏差。同理,各部件功耗是一个动态值,BMC轮巡读取功耗,读取其中一个PSU功耗后,BMC再发出命令去读取剩余PSU和各部件功耗,由于命令间时间差的存在,会导致采集到的PSU功耗以及各部件功耗处于不同时刻,无法满足客户对于功耗监控的准确度要求。
可见,如何提升功耗监控的准确度,是本领域技术人员需要解决的问题。
发明内容
本发明实施例的目的是提供一种服务器功耗检测系统、方法、装置、设备和存储介质,可以提升功耗监控的准确度。
为解决上述技术问题,本发明实施例提供一种服务器功耗检测系统,包括基板管理控制器、多个电源供应器、各待检测部件各自对应的监控部件;其中,每个所述电源供应器以及每个所述监控部件有其对应的实时数据寄存器和功耗暂存寄存器;
所述监控部件,用于将采集的所述待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到所述基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
所述电源供应器,用于将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到所述基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器;
所述基板管理控制器分别与各所述电源供应器以及各所述监控部件连接,用于在接收到读取整机功耗命令的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号;从所述功耗暂存寄存器中读取部件功耗数据和电源功耗数据。
一方面,所述基板管理控制器的通用输入输出引脚与各所述电源供应器的告警信号引脚以及各所述监控部件的告警信号引脚串联连接;其中,各所述告警信号引脚为支持输入和输出的双向端口引脚;
所述基板管理控制器,用于在接收到读取整机功耗命令的情况下,同时向各所述电源供应器以及各所述监控部件的告警信号引脚传输功耗读取信号。
一方面,所述监控部件,用于在检测到所述待检测部件出现异常的情况下,通过所述告警信号引脚向所述基板管理控制器传输告警信号;
所述基板管理控制器,用于在接收到所述监控部件传输的告警信号的情况下,将自身切换为从属模式;其中,从属模式下所述基板管理控制器停止向所述监控部件传输功耗读取信号。
一方面,所述监控部件,用于获取其所监控的待检测部件的设备类型;按照所述设备类型匹配的数据格式生成告警信号。
一方面,所述基板管理控制器,用于在接收到所述监控部件传输的告警信号的情况下,根据所述告警信号的数据格式,确定出所述告警信号对应的目标待检测部件;通过前面板展示所述目标待检测部件故障的提示信息。
一方面,所述监控部件,用于在将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器之后,按照设定的时间间隔将其对应的功耗暂存寄存器清空,并将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
一方面,所述监控部件,用于在将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器之后,再次接收到所述基板管理控制器传输的功耗读取信号的情况下,将其对应的功耗暂存寄存器清空,并将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
一方面,所述基板管理控制器,用于将读取的所述部件功耗数据和所述电源功耗数据转换为柱状图,并通过前面板展示所述柱状图;其中,所述柱状图以部件类型作为横轴,以功耗作为纵轴。
一方面,所述基板管理控制器,用于按照设定的时间间隔从所述功耗暂存寄存器中读取部件功耗数据和电源功耗数据;依据当前读取的部件功耗数据和电源功耗数据,更新所述柱状图。
一方面,所述功耗暂存寄存器的个数为多个;各所述电源供应器以及各所述监控部件均有其各自对应的一个功耗暂存寄存器;所述功耗暂存寄存器为各所述电源供应器内嵌的空白寄存器以及各所述监控部件内嵌的空白寄存器自定义出的寄存器。
一方面,所述基板管理控制器通过串行总线分别与各所述监控部件内嵌的功耗暂存寄存器以及各所述电源供应器内嵌的功耗暂存寄存器连接,用于获取各所述功耗暂存寄存器记录的部件功耗数据和电源功耗数据。
一方面,所述功耗暂存寄存器的个数为一个;各所述电源供应器以及各所述监控部件均对应同一个功耗暂存寄存器;所述功耗暂存寄存器为独立设置的寄存器;各所述电源供应器各自内嵌的实时数据寄存器以及各所述监控部件各自内嵌的实时数据寄存器均与所述功耗暂存寄存器连接。
一方面,所述基板管理控制器,用于对所有所述电源功耗数据进行求和,以得到电源总功耗;对所有所述部件功耗数据进行求和,以得到部件总功耗;判断所述电源总功耗与所述部件总功耗的偏差是否小于设定阈值;在所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
一方面,所述基板管理控制器,用于每出现一次所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况,则将误差次数加一;判断所述误差次数是否大于或等于设定的误差限值;在所述误差次数小于所述误差限值的情况下,执行所述同时向各所述电源供应器以及各所述监控部件传输功耗读取信号的步骤;在所述误差次数大于或等于所述误差限值的情况下,通过前面板展示功耗异常的提示信息。
一方面,所述基板管理控制器,用于在接收到读取整机功耗命令的情况下,判断是否接收到告警信号;在未接收到告警信号的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
一方面,所述监控部件,用于在接收到所述基板管理控制器传输的功耗读取信号的情况下,判断是否存在无法识别的数据格式;在存在无法识别的数据格式的情况下,向所述基板管理控制器传输告警信号;在不存在无法识别的数据格式的情况下,执行所述将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器的步骤。
一方面,所述待检测部件包括内存;
所述内存对应的监控部件通过精密电阻和电流监控芯片与内存连接,用于根据所述精密电阻的电阻值与所述电流监控芯片检测的电流值,确定出内存对应的内存电压值;
所述内存对应的监控部件与所述内存的供电电源连接,用于获取所述供电电源的供电电压值,并将所述内存电压值以及所述供电电压值存储至对应的实时数据寄存器;
所述基板管理控制器,用于从所述功耗暂存寄存器中获取所述内存电压值以及所述供电电压值;将所述内存电压值转换为对应的内存电流值;基于所述内存电流值以及所述供电电压值,计算出内存功耗。
一方面,所述待检测部件包括中央处理器;
在所述中央处理器前端的信息存储单元支持功耗读取功能的情况下,所述基板管理控制器与所述信息存储单元连接,用于读取所述信息存储单元中记录的总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
一方面,所述待检测部件包括中央处理器;
在所述中央处理器前端的信息存储单元不支持功耗读取功能的情况下,所述中央处理器对应的监控部件的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及所述中央处理器的供电电源引脚连接,用于根据获取的电流值和电压值,确定出总功耗;将所述总功耗存储至所述中央处理器对应的功耗暂存寄存器;
所述基板管理控制器,用于从所述中央处理器对应的功耗暂存寄存器中获取所述总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
本发明实施例还提供了一种服务器功耗检测方法,包括:
在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号,以便于各所述电源供应器将实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器,各所述监控部件将实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
从所述功耗暂存寄存器中读取部件功耗数据和电源功耗数据。
一方面,所述在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号包括:
在接收到读取整机功耗命令的情况下,同时向各所述电源供应器以及各所述监控部件的告警信号引脚传输功耗读取信号。
一方面,还包括:
在接收到所述监控部件传输的告警信号的情况下,将自身切换为从属模式;其中,从属模式下基板管理控制器停止向所述监控部件传输功耗读取信号;所述告警信号为监控部件在检测到待检测部件出现异常的情况下,通过所述告警信号引脚向所述基板管理控制器传输的告警信号。
一方面,还包括:
在接收到所述监控部件传输的告警信号的情况下,根据所述告警信号的数据格式,确定出所述告警信号对应的目标待检测部件;
通过前面板展示所述目标待检测部件故障的提示信息。
一方面,还包括:
将读取的所述部件功耗数据和所述电源功耗数据转换为柱状图,并通过前面板展示所述柱状图;其中,所述柱状图以部件类型作为横轴,以功耗作为纵轴。
一方面,还包括:
按照设定的时间间隔从所述功耗暂存寄存器中读取部件功耗数据和电源功耗数据;依据当前读取的部件功耗数据和电源功耗数据,更新所述柱状图。
一方面,还包括:
对所有所述电源功耗数据进行求和,以得到电源总功耗;
对所有所述部件功耗数据进行求和,以得到部件总功耗;
判断所述电源总功耗与所述部件总功耗的偏差是否小于设定阈值;
在所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
一方面,还包括:
每出现一次所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况,则将误差次数加一;
判断所述误差次数是否大于或等于设定的误差限值;
在所述误差次数小于所述误差限值的情况下,执行所述同时向各所述电源供应器以及各所述监控部件传输功耗读取信号的步骤;
在所述误差次数大于或等于所述误差限值的情况下,通过前面板展示功耗异常的提示信息。
一方面,所述在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号包括:
在接收到读取整机功耗命令的情况下,判断是否接收到告警信号;
在未接收到告警信号的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
一方面,所述待检测部件包括内存;
相应的,所述从所述功耗暂存寄存器中读取部件功耗数据包括:
从所述功耗暂存寄存器中获取内存电压值以及供电电压值;其中,所述内存电压值为内存对应的监控部件通过精密电阻和电流监控芯片与内存连接,根据所述精密电阻的电阻值与所述电流监控芯片检测的电流值,确定出的内存电压值;所述供电电压值为内存对应的监控部件与内存的供电电源连接,获取的所述供电电源的供电电压值;
将所述内存电压值转换为对应的内存电流值;
基于所述内存电流值以及所述供电电压值,计算出内存功耗。
一方面,所述待检测部件包括中央处理器;
相应的,所述从所述功耗暂存寄存器中读取部件功耗数据包括:
在所述中央处理器前端的信息存储单元支持功耗读取功能的情况下,读取所述信息存储单元中记录的总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
一方面,所述待检测部件包括中央处理器;
相应的,所述从所述功耗暂存寄存器中读取部件功耗数据包括:
从所述中央处理器对应的功耗暂存寄存器中获取所述总功耗;其中,所述总功耗为所述中央处理器对应的监控部件的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及所述中央处理器的供电电源引脚连接,根据获取的电流值和电压值,确定出的总功耗;
将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
本发明实施例还提供了一种服务器功耗检测装置,包括传输单元和读取单元;
所述传输单元,用于在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号,以便于各所述电源供应器将实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器,各所述监控部件将实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
所述读取单元,用于从所述功耗暂存寄存器中读取部件功耗数据和电源功耗数据。
一方面,所述传输单元用于在接收到读取整机功耗命令的情况下,同时向各所述电源供应器以及各所述监控部件的告警信号引脚传输功耗读取信号。
一方面,还包括切换单元;
所述切换单元,用于在接收到所述监控部件传输的告警信号的情况下,将自身切换为从属模式;其中,从属模式下基板管理控制器停止向所述监控部件传输功耗读取信号;所述告警信号为监控部件在检测到待检测部件出现异常的情况下,通过所述告警信号引脚向所述基板管理控制器传输的告警信号。
一方面,还包括确定单元和展示单元;
所述确定单元,用于在接收到所述监控部件传输的告警信号的情况下,根据所述告警信号的数据格式,确定出所述告警信号对应的目标待检测部件;
所述展示单元,用于通过前面板展示所述目标待检测部件故障的提示信息。
一方面,还包括转换单元;
所述转换单元,用于将读取的所述部件功耗数据和所述电源功耗数据转换为柱状图,并通过前面板展示所述柱状图;其中,所述柱状图以部件类型作为横轴,以功耗作为纵轴。
一方面,还包括更新单元;
所述更新单元,用于按照设定的时间间隔从所述功耗暂存寄存器中读取部件功耗数据和电源功耗数据;依据当前读取的部件功耗数据和电源功耗数据,更新所述柱状图。
一方面,还包括求和单元、判断单元;
所述求和单元,用于对所有所述电源功耗数据进行求和,以得到电源总功耗;对所有所述部件功耗数据进行求和,以得到部件总功耗;
所述判断单元,用于判断所述电源总功耗与所述部件总功耗的偏差是否小于设定阈值;在所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况下,触发所述传输单元执行所述同时向各所述电源供应器以及各所述监控部件传输功耗读取信号的步骤。
一方面,还包括累加单元、次数判断单元和提示单元;
所述累加单元,用于每出现一次所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况,则将误差次数加一;
所述次数判断单元,用于判断所述误差次数是否大于或等于设定的误差限值;在所述误差次数小于所述误差限值的情况下,触发所述传输单元执行所述同时向各所述电源供应器以及各所述监控部件传输功耗读取信号的步骤;
所述提示单元,用于在所述误差次数大于或等于所述误差限值的情况下,通过前面板展示功耗异常的提示信息。
一方面,所述传输单元用于在接收到读取整机功耗命令的情况下,判断是否接收到告警信号;在未接收到告警信号的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
一方面,所述待检测部件包括内存;
相应的,所述读取单元用于从所述功耗暂存寄存器中获取内存电压值以及供电电压值;其中,所述内存电压值为内存对应的监控部件通过精密电阻和电流监控芯片与内存连接,根据所述精密电阻的电阻值与所述电流监控芯片检测的电流值,确定出的内存电压值;所述供电电压值为内存对应的监控部件与内存的供电电源连接,获取的所述供电电源的供电电压值;将所述内存电压值转换为对应的内存电流值;基于所述内存电流值以及所述供电电压值,计算出内存功耗。
一方面,所述待检测部件包括中央处理器;
相应的,所述读取单元用于在所述中央处理器前端的信息存储单元支持功耗读取功能的情况下,读取所述信息存储单元中记录的总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
一方面,所述待检测部件包括中央处理器;
相应的,所述读取单元用于从所述中央处理器对应的功耗暂存寄存器中获取所述总功耗;其中,所述总功耗为所述中央处理器对应的监控部件的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及所述中央处理器的供电电源引脚连接,根据获取的电流值和电压值,确定出的总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
本发明实施例还提供了一种服务器功耗检测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如上述服务器功耗检测方法的步骤。
本发明实施例还提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述服务器功耗检测方法的步骤。
由上述技术方案可以看出,服务器功耗检测系统包括基板管理控制器、多个电源供应器、各待检测部件各自对应的监控部件;其中,每个电源供应器以及每个监控部件有其对应的实时数据寄存器和功耗暂存寄存器。监控部件将采集的待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。电源供应器将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器。基板管理控制器分别与各电源供应器以及各监控部件连接,在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号;从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。本发明的有益效果在于,通过优化基板管理控制器读取部件功耗的方式,由基板管理控制器同时向各电源供应器以及各监控部件传输功耗读取信号,保证了功耗暂存寄存器记录了同一时刻下所有电源供应器和所有待检测部件对应的功耗数据,可以精确的展现出当前时刻对应的服务器整机功耗及部件功耗的分布情况,提高了读取整机功耗值的准确度,更好的满足了客户对于服务器整机功耗监控的需求。
附图说明
为了更清楚地说明本发明实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种服务器功耗检测系统的结构示意图;
图2为本发明实施例提供的一种整机功耗获取逻辑框图;
图3为本发明实施例提供的一种服务器功耗分布柱状图;
图4为本发明实施例提供的一种服务器功耗检测方法的流程图;
图5为本发明实施例还提供的一种服务器功耗检测装置的结构示意图;
图6为本发明实施例提供的一种服务器功耗检测设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”,以及与“包括”和“具有”相关的任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
服务器的功耗可以包括服务器整机功耗和各部件功耗的分布情况。通过获取各部件的功耗,可以得到各部件功耗的分布情况。服务器整机功耗可以根据电源供应器(PowerSupply Unit,PSU)的功耗确定出,即将所有PSU的功耗之和作为整机功耗。当研发人员要分析服务器整机在不同功率端的运行情况,整机中各部件功耗的分布情况和整机功耗便会影响分析结论。
传统方式中,BMC发命令读取各PSU以及各部件功耗存在时间差,导致读取到的各PSU功耗值和各部件功耗值不是在同一时刻下的功耗,从而影响服务器功耗性能的分析。如果能获取同一时刻下的PSU输出的功耗和各部件功耗,并将各部件功耗直观呈现出来,便能掌握某时刻下整机功耗的分布情况,能更好的满足客户对于功耗监控准确度的需求。
故此,本发明实施了提供了一种服务器功耗检测系统、方法、装置、设备和存储介质,针对于每个待检测部件设置了各自对应的监控部件,每个电源供应器以及每个监控部件有其对应的实时数据寄存器和功耗暂存寄存器。通过优化基板管理控制器读取部件功耗的方式,由基板管理控制器同时向各电源供应器以及各监控部件传输功耗读取信号,保证了功耗暂存寄存器可以记录同一时刻下所有电源供应器和所有待检测部件对应的功耗数据,从而精确的展现出当前时刻对应的服务器整机功耗及部件功耗的分布情况。
接下来,详细介绍本发明实施例所提供的一种服务器功耗检测系统。图1为本发明实施例提供的一种服务器功耗检测系统的结构示意图,该系统包括基板管理控制器11、多个电源供应器12、各待检测部件各自对应的监控部件13;其中,每个电源供应器12以及每个监控部件13有其对应的实时数据寄存器和功耗暂存寄存器。
待检测部件指的是服务器中包含的核心部件,如CPU、内存、硬盘、GPU等。为了实现对各待检测部件功耗的同步检测,可以依赖于监控部件13对待检测部件的功耗数据进行实时采集。每个待检测部件有其对应的监控部件13。
图1中是以三个电源供应器12,三个监控部件13为例。在实际应用中,根据服务器中包含的电源供应器的个数以及各部件的类型,可以适应性调整电源供应器12和监控部件13的个数,图1中三个电源供应器12,三个监控部件13仅为举例说明。
电源供应器12内部部署有功耗检测电路,可以实现对供电电源的功耗检测。
在电源供应器12和监控部件13内部均设置有用于存储实时功耗数据的实时寄存器,并且还会留有一些供客户自定义使用的空白寄存器。由于实时寄存器中记录的功耗数据在不断地更新变化,为了保证基板管理控制器能够获取同一时刻下所有电源供应器12对应的电源功耗以及各待检测部件的部件功耗数据,可以设置一个用于存储当前时刻功耗数据的功耗暂存寄存器。
监控部件13,用于将采集的待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器11传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
电源供应器12,用于将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器11传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器。
基板管理控制器11分别与各电源供应器12以及各监控部件13连接,用于在接收到读取整机功耗命令的情况下,同时向各电源供应器12以及各监控部件13传输功耗读取信号;从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。
在实际应用中,可以在基板管理控制器11的前端页面( Web)下新增一个功耗信息面板示意图,客户打开功耗信息菜单后,当选哟获取功耗信息时,可以点击“read”,此时相当于向基板管理控制器11输入了读取整机功耗命令,相应的,基板管理控制器11会同时向各电源供应器12以及各监控部件13传输功耗读取信号。
在实际应用中,功耗暂存寄存器的个数可以为一个;各电源供应器12以及各监控部件13均对应同一个功耗暂存寄存器;功耗暂存寄存器为独立设置的寄存器;各电源供应器12各自内嵌的实时数据寄存器以及各监控部件13各自内嵌的实时数据寄存器均与功耗暂存寄存器连接。不同实时数据寄存器中记录的功耗数据可以携带其所对应的部件的标识,以便于基板管理控制器11从功耗暂存寄存器中读取出功耗数据后,可以根据各功耗数据携带的部件标识,区分出各功耗所对应的是哪个部件或者是哪个电源供应器12。
除了设置一个共用的功耗暂存寄存器外,功耗暂存寄存器的个数也可以为多个;各电源供应器12以及各监控部件13均有其各自对应的一个功耗暂存寄存器。
功耗暂存寄存器可以为各电源供应器12内嵌的空白寄存器以及各监控部件13内嵌的空白寄存器自定义出的寄存器。也即可以将每个电源供应器12内嵌的空白寄存器自定义为功耗暂存寄存器,将每个监控部件13内嵌的空白寄存器自定义为功耗暂存寄存器。
在本发明实施例中,基板管理控制器11可以通过通信总线即串行总线(I2C总线)分别与各监控部件13内嵌的功耗暂存寄存器以及各电源供应器12内嵌的功耗暂存寄存器连接,用于获取各功耗暂存寄存器记录的部件功耗数据和电源功耗数据。
在本发明实施例中,CPU和内存的功耗读取放弃用BMC从PCH的ME获取的方式,而与其余部件统一,通过串行总线从功耗暂存寄存器中读取功耗数据,保证了方案的通用性,适用于Intel及AMD(Advanced Micro Devices,微处理器)平台,并不受CPU类型限制。
对于一个服务器而言,其对应的电源供应器12往往有多个,所有电源供应器12的功耗和可以作为服务器的整机功耗。服务器中包含有多个核心部件,这些核心部件各自的功耗,反映了服务器的功耗分布情况。
图2为本发明实施例提供的一种整机功耗获取逻辑框图,考虑到每个电源供应器与基板管理控制器的交互方式类似,因此图2中是以一个电源供应器为例,以图形处理器、硬盘、中央处理器和内存等待检测部件为例。GPU对应的监控部件13可以为图形处理器功耗监控芯片即GPU功耗监控芯片,硬盘对应的监控部件13为硬盘功耗监控芯片,CPU对应的监控部件13可以为中央处理器的控制器即CPU控制器,内存对应的监控部件13可以为内存功耗监控控制器。
基板管理控制器11的通用输入输出引脚(General-Purpose Input /Output,GPIO)与各电源供应器12的告警信号引脚(ALERT)以及各监控部件13的告警信号引脚串联连接;其中,告警信号引脚可以为支持输入和输出的双向端口引脚。
基板管理控制器11在接收到读取整机功耗命令的情况下,同时向各电源供应器12以及各监控部件13的告警信号引脚传输功耗读取信号。
基板管理控制器11可以通过串行总线分别与各监控部件13内嵌的功耗暂存寄存器以及各电源供应器12内嵌的功耗暂存寄存器连接,从而获取同一时刻下的功耗数据。
在本发明实施例中,可以通过修改IC芯片底层的管脚属性程序(FW),将ALERT定义成同时支持输入输出的双向端口,赋予ALERT信号管脚一个新功能,以使得各监控部件13通过ALERT可以接收基板管理控制11下发的信息,也可以通过ALERT向基板管理控制11上传信息。
通过基板管理控制器11的一个GPIO端口将所有功耗监控芯片的ALERT以及所有电源供应器的ALERT串联起来,该GPIO端口信号作为指示信号,连接到功耗监控芯片的ALERT管脚以及电源供应器的ALERT管脚。
在实际应用中,监控部件13在检测到待检测部件出现异常的情况下,可以通过告警信号引脚向基板管理控制器11传输告警信号。
相应的,基板管理控制器11在接收到监控部件13传输的告警信号的情况下,可以将自身切换为从属模式;其中,从属模式下基板管理控制器11停止向监控部件13传输功耗读取信号。
由于将ALERT定义成了同时支持输入输出的双向端口,因此为避免两个设备主从(master-slave)冲突,默认设置基板管理控制器11为主设备(master),各电源供应器12以及各监控部件13为从属设备(slave)。
在实际应用中,可以将各电源供应器12以及各监控部件13传输过来的数据设为高优先级,当各电源供应器12以及各监控部件13检测到异常信息后,可以发出4bit的低电平0000,当基板管理控制器11检测到4bit低电平时,主动将自身设置为从属模式,即基板管理控制器11作为slave,接收来自电源供应器12或者监控部件13传输的数据。
上述介绍中,以监控部件13发出4bit的低电平0000,实现基板管理控制器11切换为从属模式。除了基于低电平的告警信号实现主从模式的切换外,监控部件13也可以发出不同格式的告警信号,实现向基板管理控制器11传递信息的目的。
在实际应用中,ALERT信号默认为高,当监控部件13检测到过流过压等异常信息时,监控部件13可以通过ALERT管脚发出一段固定数据的高低电平比如“高低高低高低高低”(称为告警信号),每个电平持续时间为1ms。在BMC中设定,接收到高电平时,判断为1,接收到低电平判断为0,1ms为周期判断一次,那么接收到的数据会判断为“10101010”,便称“10101010”为ALERT告警信号。
在本发明实施例中,为了便于基板管理控制器11区分告警信号所对应的部件,可以针对于不同设备类型设置不同的数据格式。
监控部件13可以获取其所监控的待检测部件的设备类型;按照设备类型匹配的数据格式生成告警信号。
例如,风扇的监控部件13采用的告警信号可以为11001100,内存的监控部件13采用的告警信号可以为10010010等。
基板管理控制器11在接收到监控部件13传输的告警信号的情况下,可以根据告警信号的数据格式,确定出告警信号对应的目标待检测部件。为了便于管理人员及时了解服务器中各部件的运行情况,可以通过前面板展示目标待检测部件故障的提示信息。
在本发明实施例中,监控部件13在将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器之后,可以按照设定的时间间隔将其对应的功耗暂存寄存器清空,并将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
时间间隔的取值可以根据实际需求灵活设置,例如,时间间隔可以设置为20秒(s)。
监控部件13在将实时数据寄存器中的功耗数据复制到功耗暂存寄存器中,基板管理控制器11在从功耗暂存寄存器中读取完所有功耗数据后,监控部件13计时20s后自动清除功耗暂存寄存中的数据,然后重新将实时数据寄存器中当前时刻对应的功耗数据重新复制到功耗暂存寄存器中,循环往复。
举例说明,功耗监控芯片和PSU利用现有的ALERT信号,通过修改芯片底层FW,将ALERT定义成同时支持输入输出的双向端口,从空白寄存器中新定义一个功耗暂存寄存器。BMC的一个GPIO口将所有ALERT信号连接起来,正常情况下ALERT信号为高,当BMC收到读取整机功耗命令时,可以发出一段8bit的固定数据,各待检测部件各自对应的监控部件和PSU的ALERT管脚接收到此数据后,便将实时数据寄存器中的数据复制到功耗暂存寄存器中,然后BMC再依次读取PSU、CPU等核心部件功耗。待功耗全部读取完成后,各监控部件和PSU便开始计时,每20s便将实时数据寄存器中数据复制到功耗暂存寄存器中,覆盖原有数据。
上述是以监控部件13为例,介绍了向功暂存寄存器中记录数据的实现方式,电源供电器12向功耗暂存寄存器中记录数据的实现方式与其相同,在此不再赘述。
考虑到实际应用中,可能会存在还未达到设定的时间间隔时,基板管理控制器11便需要重新获取功耗数据,因此监控部件13在将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器之后,再次接收到基板管理控制器11传输的功耗读取信号的情况下,将其对应的功耗暂存寄存器清空,并将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
举例说明,假设监控部件13在将实时数据寄存器中的功耗数据复制到功耗暂存寄存器中,基板管理控制器11在从功耗暂存寄存器中读取完所有功耗数据后,监控部件13开始计时。在计时到第10s时,监控部件13再次接收到了基板管理控制器11传输的功耗读取信号,则可以自动清除功耗暂存寄存中的数据,然后将实时数据寄存器中记录的第10s的功耗数据重新复制到功耗暂存寄存器中,以保证基板管理控制器11可以获取到当前时刻所对应的功耗数据。
为了便于管理人直观的了解到不同部件的功耗情况,基板管理控制器11可以将读取的部件功耗数据和电源功耗数据转换为柱状图,并通过前面板展示柱状图;其中,柱状图以部件类型作为横轴,以功耗作为纵轴。
图3为本发明实施例提供的一种服务器功耗分布柱状图,柱状图中横轴对应的是不同的部件,图3中是以电源供应器、中央处理器、内存、风扇、硬盘和图形处理器为例。图3中纵轴是不同部件所对应的功耗值,例如,PSU对应的功耗值为2000,CPU对应的功耗值为700,内存对应的功耗值为60,风扇对应的功耗值为300,硬盘对应的功耗值为440,GPU对应的功耗值为500。
需要说明的是,在本发明实施例中对于柱状图中所包含的部件类型不做限定,图3仅为举例说明。在实际应用中,柱状图中所包含的部件类型可以是所有核心部件,也可以由用户选定所需展示柱状图的部件。
在实际应用中,为了保证柱状图的有效性,基板管理控制器11可以按照设定的时间间隔从功耗暂存寄存器中读取部件功耗数据和电源功耗数据;依据当前读取的部件功耗数据和电源功耗数据,更新柱状图。
通过将不同部件所对应的功耗值以柱状图的方式在前面板上展示,可以便于操作人员快速直观的了解到服务器中各部件的功耗分布情况。
在实际应用中,当获取的所有电源供应器12的电源功耗,与所有待检测部件的部件功耗为同一时刻下的功耗时,此时所有电源供应器12的电源功耗之和与所有待检测部件的部件功耗之和相同或相近。
因此,在本发明实施例中,基板管理控制器11可以对所有电源功耗数据进行求和,以得到电源总功耗;对所有部件功耗数据进行求和,以得到部件总功耗。判断电源总功耗与部件总功耗的偏差是否小于设定阈值。
阈值的取值可以根据实际需求设置。对功耗数据的时间精度要求越严格,阈值的取值可以越小。
在电源总功耗与部件总功耗的偏差大于或等于设定阈值的情况下,说明此时获取的电源功耗和部件功耗并不属于同一时刻,因此基板管理控制器11可以重新获取功耗数据,即再次同时向各电源供应器12以及各监控部件13传输功耗读取信号。
每出现一次电源总功耗与部件总功耗的偏差大于或等于设定阈值的情况,基板管理控制器11可以将误差次数加一。判断误差次数是否大于或等于设定的误差限值。
在误差次数小于误差限值的情况下,基板管理控制器11可以重新获取功耗数据,即执行同时向各电源供应器12以及各监控部件13传输功耗读取信号的步骤。
在误差次数大于或等于误差限值的情况下,说明基板管理控制器11通过多次传输功耗读取信号都无法获取到同一时刻下的所有功耗数据,此时可以通过前面板展示功耗异常的提示信息。
通过将所有电源供应器的电源总功耗与所有待检测部件的部件总功耗进行比较,可以识别出当前获取的所有功耗数据是否属于同一时刻下的功耗数据。在所有电源供应器的电源总功耗与所有待检测部件的部件总功耗的偏差较小的情况下,说明当前获取的所有功耗数据属于同一时刻下的功耗数据。在所有电源供应器的电源总功耗与所有待检测部件的部件总功耗的偏差较大的情况下,可以重新获取功耗数据。在多次都无法获取到同一时刻下的所有功耗数据时,通过前面板展示功耗异常的提示信息,可以便于管理人员及时对服务器各部件的功耗进行检测,以确保各部件的正常工作,提升服务器运行的稳定性。
在实际应用中,在基板管理控制器11获取功耗数据期间,可能会存在待检测部件异常的情况,当待检测部件出现异常时,监控部件13会向基板管理控制器反馈告警信号。
因此基板管理控制器11在接收到读取整机功耗命令的情况下,可以判断是否接收到告警信号;在未接收到告警信号的情况下,可以同时向各电源供应器12以及各监控部件13传输功耗读取信号。
监控部件13在接收到基板管理控制器11传输的功耗读取信号的情况下,可以判断是否存在无法识别的数据格式。在存在无法识别的数据格式的情况下,说明待检测部件存在异常情况,此时可以向基板管理控制器11传输告警信号。在不存在无法识别的数据格式的情况下,执行将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器的步骤。
举例说明,如果待检测部件发生异常,ALERT信号会主动发出告警数据信号,传递给BMC告知异常。如果BMC发出功耗读取信号的同时,待检测部件发生异常,便有可能会发生数据冲突,如果检测到未识别数据或ALERT的告警信号,统一判定为芯片异常,记录相关告警。
待检测部件的类型多种多样,以待检测部件为内存为例,在实际应用中,内存对应的监控部件13可以通过精密电阻和电流监控芯片与内存连接,用于根据精密电阻的电阻值与电流监控芯片检测的电流值,确定出内存对应的内存电压值。
内存对应的监控部件13与内存的供电电源连接,用于获取供电电源的供电电压值,并将内存电压值以及供电电压值存储至对应的实时数据寄存器。基板管理控制器11,用于从功耗暂存寄存器中获取内存电压值以及供电电压值;将内存电压值转换为对应的内存电流值;基于内存电流值以及供电电压值,计算出内存功耗。
服务器中包含的CPU往往有多个,每个CPU有其对应的控制器。控制器可以用于检测CPU和内存的功耗。
针对内存的功耗,本发明实施例通过添加精密电阻和电流监控芯片,将内存的电流信息转成电压信息后和相关供电一起接去CPU的任一控制器,基板管理控制器11读取该控制器内的功耗暂存寄存器,便可获取内存功耗。
以中央处理器为例,在中央处理器前端的信息存储单元支持功耗读取功能的情况下,基板管理控制器11与信息存储单元连接,用于读取信息存储单元中记录的总功耗;将总功耗减去内存功耗,以得到中央处理器的功耗。
举例说明,在实际应用中,如果CPU前端的信息存储单元(EFUSE)支持功耗读取,BMC可以直接通过EFUSE获取当前该路CPU+内存的总功耗,减去内存功耗,即可得单CPU功耗。
在中央处理器前端的信息存储单元不支持功耗读取功能的情况下,中央处理器对应的监控部件13的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及中央处理器的供电电源引脚连接,用于根据获取的电流值和电压值,确定出总功耗;将总功耗存储至中央处理器对应的功耗暂存寄存器。基板管理控制器11,用于从中央处理器对应的功耗暂存寄存器中获取总功耗;将总功耗减去内存功耗,以得到中央处理器的功耗。
举例说明,如果CPU前端的EFUSE不支持功耗读取,便将EFUSE的电流侦测引脚,和相关供电接去任一CPU控制器的电流电压监控引脚,BMC访问该控制器的功耗暂存寄存器便可获得CPU+内存的功耗,减去内存功耗,即可得单CPU功耗。
由上述技术方案可以看出,服务器功耗检测系统包括基板管理控制器、多个电源供应器、各待检测部件各自对应的监控部件;其中,每个电源供应器以及每个监控部件有其对应的实时数据寄存器和功耗暂存寄存器。监控部件将采集的待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。电源供应器将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器。基板管理控制器分别与各电源供应器以及各监控部件连接,在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号;从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。本发明的有益效果在于,通过优化基板管理控制器读取部件功耗的方式,由基板管理控制器同时向各电源供应器以及各监控部件传输功耗读取信号,保证了功耗暂存寄存器记录了同一时刻下所有电源供应器和所有待检测部件对应的功耗数据,可以精确的展现出当前时刻对应的服务器整机功耗及部件功耗的分布情况,提高了读取整机功耗值的准确度,更好的满足了客户对于服务器整机功耗监控的需求。
图4为本发明实施例提供的一种服务器功耗检测方法的流程图,该方法包括:
S401:在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号,以便于各电源供应器将实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器,各监控部件将实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
S402:从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。
在一些实施例中,在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号包括:
在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件的告警信号引脚传输功耗读取信号。
在一些实施例中,还包括:
在接收到监控部件传输的告警信号的情况下,将自身切换为从属模式;其中,从属模式下基板管理控制器停止向监控部件传输功耗读取信号;告警信号为监控部件在检测到待检测部件出现异常的情况下,通过告警信号引脚向基板管理控制器传输的告警信号。
在一些实施例中,还包括:
在接收到监控部件传输的告警信号的情况下,根据告警信号的数据格式,确定出告警信号对应的目标待检测部件;
通过前面板展示目标待检测部件故障的提示信息。
在一些实施例中,还包括:
将读取的部件功耗数据和电源功耗数据转换为柱状图,并通过前面板展示柱状图;其中,柱状图以部件类型作为横轴,以功耗作为纵轴。
在一些实施例中,还包括:
按照设定的时间间隔从功耗暂存寄存器中读取部件功耗数据和电源功耗数据;依据当前读取的部件功耗数据和电源功耗数据,更新柱状图。
在一些实施例中,还包括:
对所有电源功耗数据进行求和,以得到电源总功耗;
对所有部件功耗数据进行求和,以得到部件总功耗;
判断电源总功耗与部件总功耗的偏差是否小于设定阈值;
在电源总功耗与部件总功耗的偏差大于或等于设定阈值的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号。
在一些实施例中,还包括:
每出现一次电源总功耗与部件总功耗的偏差大于或等于设定阈值的情况,则将误差次数加一;
判断误差次数是否大于或等于设定的误差限值;
在误差次数小于误差限值的情况下,执行同时向各电源供应器以及各监控部件传输功耗读取信号的步骤;
在误差次数大于或等于误差限值的情况下,通过前面板展示功耗异常的提示信息。
在一些实施例中,在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号包括:
在接收到读取整机功耗命令的情况下,判断是否接收到告警信号;
在未接收到告警信号的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号。
在一些实施例中,待检测部件包括内存;
相应的,从功耗暂存寄存器中读取部件功耗数据包括:
从功耗暂存寄存器中获取内存电压值以及供电电压值;其中,内存电压值为内存对应的监控部件通过精密电阻和电流监控芯片与内存连接,根据精密电阻的电阻值与电流监控芯片检测的电流值,确定出的内存电压值;供电电压值为内存对应的监控部件与内存的供电电源连接,获取的供电电源的供电电压值;
将内存电压值转换为对应的内存电流值;
基于内存电流值以及供电电压值,计算出内存功耗。
在一些实施例中,待检测部件包括中央处理器;
相应的,从功耗暂存寄存器中读取部件功耗数据包括:
在中央处理器前端的信息存储单元支持功耗读取功能的情况下,读取信息存储单元中记录的总功耗;将总功耗减去内存功耗,以得到中央处理器的功耗。
在一些实施例中,待检测部件包括中央处理器;
相应的,从功耗暂存寄存器中读取部件功耗数据包括:
从中央处理器对应的功耗暂存寄存器中获取总功耗;其中,总功耗为中央处理器对应的监控部件的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及中央处理器的供电电源引脚连接,根据获取的电流值和电压值,确定出的总功耗;
将总功耗减去内存功耗,以得到中央处理器的功耗。
图4所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,服务器功耗检测系统包括基板管理控制器、多个电源供应器、各待检测部件各自对应的监控部件;其中,每个电源供应器以及每个监控部件有其对应的实时数据寄存器和功耗暂存寄存器。监控部件将采集的待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。电源供应器将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器。基板管理控制器分别与各电源供应器以及各监控部件连接,在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号;从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。本发明的有益效果在于,通过优化基板管理控制器读取部件功耗的方式,由基板管理控制器同时向各电源供应器以及各监控部件传输功耗读取信号,保证了功耗暂存寄存器记录了同一时刻下所有电源供应器和所有待检测部件对应的功耗数据,可以精确的展现出当前时刻对应的服务器整机功耗及部件功耗的分布情况,提高了读取整机功耗值的准确度,更好的满足了客户对于服务器整机功耗监控的需求。
图5为本发明实施例还提供的一种服务器功耗检测装置的结构示意图,包括传输单元51和读取单元52;
传输单元51,用于在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号,以便于各电源供应器将实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器,各监控部件将实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
读取单元52,用于从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。
在一些实施例中,传输单元用于在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件的告警信号引脚传输功耗读取信号。
在一些实施例中,还包括切换单元;
切换单元,用于在接收到监控部件传输的告警信号的情况下,将自身切换为从属模式;其中,从属模式下基板管理控制器停止向监控部件传输功耗读取信号;告警信号为监控部件在检测到待检测部件出现异常的情况下,通过告警信号引脚向基板管理控制器传输的告警信号。
在一些实施例中,还包括确定单元和展示单元;
确定单元,用于在接收到监控部件传输的告警信号的情况下,根据告警信号的数据格式,确定出告警信号对应的目标待检测部件;
展示单元,用于通过前面板展示目标待检测部件故障的提示信息。
在一些实施例中,还包括转换单元;
转换单元,用于将读取的部件功耗数据和电源功耗数据转换为柱状图,并通过前面板展示柱状图;其中,柱状图以部件类型作为横轴,以功耗作为纵轴。
在一些实施例中,还包括更新单元;
更新单元,用于按照设定的时间间隔从功耗暂存寄存器中读取部件功耗数据和电源功耗数据;依据当前读取的部件功耗数据和电源功耗数据,更新柱状图。
在一些实施例中,还包括求和单元、判断单元;
求和单元,用于对所有电源功耗数据进行求和,以得到电源总功耗;对所有部件功耗数据进行求和,以得到部件总功耗;
判断单元,用于判断电源总功耗与部件总功耗的偏差是否小于设定阈值;在电源总功耗与部件总功耗的偏差大于或等于设定阈值的情况下,触发传输单元执行同时向各电源供应器以及各监控部件传输功耗读取信号的步骤。
在一些实施例中,还包括累加单元、次数判断单元和提示单元;
累加单元,用于每出现一次电源总功耗与部件总功耗的偏差大于或等于设定阈值的情况,则将误差次数加一;
次数判断单元,用于判断误差次数是否大于或等于设定的误差限值;在误差次数小于误差限值的情况下,触发传输单元执行同时向各电源供应器以及各监控部件传输功耗读取信号的步骤;
提示单元,用于在误差次数大于或等于误差限值的情况下,通过前面板展示功耗异常的提示信息。
在一些实施例中,传输单元用于在接收到读取整机功耗命令的情况下,判断是否接收到告警信号;在未接收到告警信号的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号。
在一些实施例中,待检测部件包括内存;
相应的,读取单元用于从功耗暂存寄存器中获取内存电压值以及供电电压值;其中,内存电压值为内存对应的监控部件通过精密电阻和电流监控芯片与内存连接,根据精密电阻的电阻值与电流监控芯片检测的电流值,确定出的内存电压值;供电电压值为内存对应的监控部件与内存的供电电源连接,获取的供电电源的供电电压值;将内存电压值转换为对应的内存电流值;基于内存电流值以及供电电压值,计算出内存功耗。
在一些实施例中,待检测部件包括中央处理器;
相应的,读取单元用于在中央处理器前端的信息存储单元支持功耗读取功能的情况下,读取信息存储单元中记录的总功耗;将总功耗减去内存功耗,以得到中央处理器的功耗。
在一些实施例中,待检测部件包括中央处理器;
相应的,读取单元用于从中央处理器对应的功耗暂存寄存器中获取总功耗;其中,总功耗为中央处理器对应的监控部件的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及中央处理器的供电电源引脚连接,根据获取的电流值和电压值,确定出的总功耗;将总功耗减去内存功耗,以得到中央处理器的功耗。
图5所对应实施例中特征的说明可以参见图1所对应实施例的相关说明,这里不再一一赘述。
由上述技术方案可以看出,服务器功耗检测系统包括基板管理控制器、多个电源供应器、各待检测部件各自对应的监控部件;其中,每个电源供应器以及每个监控部件有其对应的实时数据寄存器和功耗暂存寄存器。监控部件将采集的待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。电源供应器将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器。基板管理控制器分别与各电源供应器以及各监控部件连接,在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号;从功耗暂存寄存器中读取部件功耗数据和电源功耗数据。本发明的有益效果在于,通过优化基板管理控制器读取部件功耗的方式,由基板管理控制器同时向各电源供应器以及各监控部件传输功耗读取信号,保证了功耗暂存寄存器记录了同一时刻下所有电源供应器和所有待检测部件对应的功耗数据,可以精确的展现出当前时刻对应的服务器整机功耗及部件功耗的分布情况,提高了读取整机功耗值的准确度,更好的满足了客户对于服务器整机功耗监控的需求。
图6为本发明实施例提供的一种服务器功耗检测设备的结构图,如图6所示,服务器功耗检测设备包括:存储器60,用于存储计算机程序;
处理器61,用于执行计算机程序时实现如上述实施例服务器功耗检测方法的步骤。
本实施例提供的服务器功耗检测设备可以包括但不限于智能手机、平板电脑、笔记本电脑或台式电脑等。
其中,处理器61可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器61可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器61也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central ProcessingUnit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器61可以在集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器61还可以包括AI(Artificial Intelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器60可以包括一个或多个存储介质,该存储介质可以是非暂态的。存储器60还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器60至少用于存储以下计算机程序601,其中,该计算机程序被处理器61加载并执行之后,能够实现前述任一实施例公开的服务器功耗检测方法的相关步骤。另外,存储器60所存储的资源还可以包括操作系统602和数据603等,存储方式可以是短暂存储或者永久存储。其中,操作系统602可以包括Windows、Unix、Linux等。数据603可以包括但不限于部件功耗数据和电源功耗数据等。
在一些实施例中,服务器功耗检测设备还可包括有显示屏62、输入输出接口63、通信接口64、电源65以及通信总线66。
本领域技术人员可以理解,图6中示出的结构并不构成对服务器功耗检测设备的限定,可以包括比图示更多或更少的组件。
可以理解的是,如果上述实施例中的服务器功耗检测方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对目前技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。
基于此,本发明实施例还提供了一种存储介质,存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述服务器功耗检测方法的步骤。
以上对本发明实施例所提供的一种服务器功耗检测系统、方法、装置、设备和存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
以上对本发明所提供的一种服务器功耗检测系统、方法、装置、设备和存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (23)

1.一种服务器功耗检测系统,其特征在于,包括基板管理控制器、多个电源供应器、各待检测部件各自对应的监控部件;其中,每个所述电源供应器以及每个所述监控部件有其对应的实时数据寄存器和功耗暂存寄存器;
所述监控部件,用于将采集的所述待检测部件的部件功耗数据存储至对应的实时数据寄存器;在接收到所述基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
所述电源供应器,用于将采集的电源功耗数据存储至对应的实时数据寄存器;在接收到所述基板管理控制器传输的功耗读取信号的情况下,将其对应的实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器;
所述基板管理控制器分别与各所述电源供应器以及各所述监控部件连接,用于在接收到读取整机功耗命令的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号;从所述功耗暂存寄存器中读取所述部件功耗数据和所述电源功耗数据。
2.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述基板管理控制器的通用输入输出引脚与各所述电源供应器的告警信号引脚以及各所述监控部件的告警信号引脚串联连接;其中,各所述告警信号引脚为支持输入和输出的双向端口引脚;
所述基板管理控制器,用于在接收到读取整机功耗命令的情况下,同时向各所述电源供应器以及各所述监控部件的告警信号引脚传输功耗读取信号。
3.根据权利要求2所述的服务器功耗检测系统,其特征在于,所述监控部件,用于在检测到所述待检测部件出现异常的情况下,通过所述告警信号引脚向所述基板管理控制器传输告警信号;
所述基板管理控制器,用于在接收到所述监控部件传输的告警信号的情况下,将自身切换为从属模式;其中,从属模式下所述基板管理控制器停止向所述监控部件传输功耗读取信号。
4.根据权利要求3所述的服务器功耗检测系统,其特征在于,所述监控部件,用于获取其所监控的待检测部件的设备类型;按照所述设备类型匹配的数据格式生成告警信号。
5.根据权利要求4所述的服务器功耗检测系统,其特征在于,所述基板管理控制器,用于在接收到所述监控部件传输的告警信号的情况下,根据所述告警信号的数据格式,确定出所述告警信号对应的目标待检测部件;通过前面板展示所述目标待检测部件故障的提示信息。
6.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述监控部件,用于在将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器之后,按照设定的时间间隔将其对应的功耗暂存寄存器清空,并将其对应的实时数据寄存器中记录的所述当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
7.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述监控部件,用于在将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器之后,再次接收到所述基板管理控制器传输的功耗读取信号的情况下,将其对应的功耗暂存寄存器清空,并将其对应的实时数据寄存器中记录的所述当前时刻的部件功耗数据复制到对应的功耗暂存寄存器。
8.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述基板管理控制器,用于将读取的所述部件功耗数据和所述电源功耗数据转换为柱状图,并通过前面板展示所述柱状图;其中,所述柱状图以部件类型作为横轴,以功耗作为纵轴。
9.根据权利要求8所述的服务器功耗检测系统,其特征在于,所述基板管理控制器,用于按照设定的时间间隔从所述功耗暂存寄存器中读取所述部件功耗数据和所述电源功耗数据;依据当前读取的所述部件功耗数据和所述电源功耗数据,更新所述柱状图。
10.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述功耗暂存寄存器的个数为多个;各所述电源供应器以及各所述监控部件均有其各自对应的一个功耗暂存寄存器;所述功耗暂存寄存器为各所述电源供应器内嵌的空白寄存器以及各所述监控部件内嵌的空白寄存器自定义出的寄存器。
11.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述基板管理控制器通过串行总线分别与各所述监控部件内嵌的功耗暂存寄存器以及各所述电源供应器内嵌的功耗暂存寄存器连接,用于获取各所述功耗暂存寄存器记录的所述部件功耗数据和所述电源功耗数据。
12.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述功耗暂存寄存器的个数为一个;各所述电源供应器以及各所述监控部件均对应同一个功耗暂存寄存器;所述功耗暂存寄存器为独立设置的寄存器;各所述电源供应器各自内嵌的实时数据寄存器以及各所述监控部件各自内嵌的实时数据寄存器均与所述功耗暂存寄存器连接。
13.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述基板管理控制器,用于对所有所述电源功耗数据进行求和,以得到电源总功耗;对所有所述部件功耗数据进行求和,以得到部件总功耗;判断所述电源总功耗与所述部件总功耗的偏差是否小于设定阈值;在所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
14.根据权利要求13所述的服务器功耗检测系统,其特征在于,所述基板管理控制器,用于每出现一次所述电源总功耗与所述部件总功耗的偏差大于或等于设定阈值的情况,则将误差次数加一;判断所述误差次数是否大于或等于设定的误差限值;在所述误差次数小于所述误差限值的情况下,执行所述同时向各所述电源供应器以及各所述监控部件传输功耗读取信号的步骤;在所述误差次数大于或等于所述误差限值的情况下,通过前面板展示功耗异常的提示信息。
15.根据权利要求1所述的服务器功耗检测系统,其特征在于,所述基板管理控制器,用于在接收到读取整机功耗命令的情况下,判断是否接收到告警信号;在未接收到告警信号的情况下,同时向各所述电源供应器以及各所述监控部件传输功耗读取信号。
16.根据权利要求15所述的服务器功耗检测系统,其特征在于,所述监控部件,用于在接收到所述基板管理控制器传输的功耗读取信号的情况下,判断是否存在无法识别的数据格式;在存在无法识别的数据格式的情况下,向所述基板管理控制器传输告警信号;在不存在无法识别的数据格式的情况下,执行所述将其对应的实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器的步骤。
17.根据权利要求1至16任意一项所述的服务器功耗检测系统,其特征在于,所述待检测部件包括内存;
所述内存对应的监控部件通过精密电阻和电流监控芯片与内存连接,用于根据所述精密电阻的电阻值与所述电流监控芯片检测的电流值,确定出内存对应的内存电压值;
所述内存对应的监控部件与所述内存的供电电源连接,用于获取所述供电电源的供电电压值,并将所述内存电压值以及所述供电电压值存储至对应的实时数据寄存器;
所述基板管理控制器,用于从所述功耗暂存寄存器中获取所述内存电压值以及所述供电电压值;将所述内存电压值转换为对应的内存电流值;基于所述内存电流值以及所述供电电压值,计算出内存功耗。
18.根据权利要求17所述的服务器功耗检测系统,其特征在于,所述待检测部件包括中央处理器;
在所述中央处理器前端的信息存储单元支持功耗读取功能的情况下,所述基板管理控制器与所述信息存储单元连接,用于读取所述信息存储单元中记录的总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
19.根据权利要求17所述的服务器功耗检测系统,其特征在于,所述待检测部件包括中央处理器;
在所述中央处理器前端的信息存储单元不支持功耗读取功能的情况下,所述中央处理器对应的监控部件的电流电压监控引脚分别与信息存储单元的电流侦测引脚以及所述中央处理器的供电电源引脚连接,用于根据获取的电流值和电压值,确定出总功耗;将所述总功耗存储至所述中央处理器对应的功耗暂存寄存器;
所述基板管理控制器,用于从所述中央处理器对应的功耗暂存寄存器中获取所述总功耗;将所述总功耗减去所述内存功耗,以得到所述中央处理器的功耗。
20.一种服务器功耗检测方法,其特征在于,适用于基板管理控制器,所述方法包括:
在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号,以便于各所述电源供应器将实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器,各所述监控部件将实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
从所述功耗暂存寄存器中读取所述部件功耗数据和所述电源功耗数据。
21.一种服务器功耗检测装置,其特征在于,适用于基板管理控制器,所述装置包括传输单元和读取单元;
所述传输单元,用于在接收到读取整机功耗命令的情况下,同时向各电源供应器以及各监控部件传输功耗读取信号,以便于各所述电源供应器将实时数据寄存器中记录的当前时刻的电源功耗数据复制到对应的功耗暂存寄存器,各所述监控部件将实时数据寄存器中记录的当前时刻的部件功耗数据复制到对应的功耗暂存寄存器;
所述读取单元,用于从所述功耗暂存寄存器中读取所述部件功耗数据和所述电源功耗数据。
22.一种服务器功耗检测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求20所述服务器功耗检测方法的步骤。
23.一种存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求20所述服务器功耗检测方法的步骤。
CN202311309122.4A 2023-10-11 2023-10-11 一种服务器功耗检测系统、方法、装置、设备和存储介质 Active CN117055718B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311309122.4A CN117055718B (zh) 2023-10-11 2023-10-11 一种服务器功耗检测系统、方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311309122.4A CN117055718B (zh) 2023-10-11 2023-10-11 一种服务器功耗检测系统、方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN117055718A CN117055718A (zh) 2023-11-14
CN117055718B true CN117055718B (zh) 2024-02-09

Family

ID=88661222

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311309122.4A Active CN117055718B (zh) 2023-10-11 2023-10-11 一种服务器功耗检测系统、方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN117055718B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106886479A (zh) * 2017-02-22 2017-06-23 郑州云海信息技术有限公司 一种服务器总功耗实时监控装置及监控方法
CN108287780A (zh) * 2018-01-25 2018-07-17 郑州云海信息技术有限公司 一种监控服务器cpld状态的装置及方法
EP3467995A1 (en) * 2016-05-25 2019-04-10 Kabushiki Kaisha Toshiba Energy management device, management system, power consumption monitoring method, and program
CN111581043A (zh) * 2019-07-29 2020-08-25 新华三信息技术有限公司 服务器功耗的监控方法、装置和服务器

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3467995A1 (en) * 2016-05-25 2019-04-10 Kabushiki Kaisha Toshiba Energy management device, management system, power consumption monitoring method, and program
CN106886479A (zh) * 2017-02-22 2017-06-23 郑州云海信息技术有限公司 一种服务器总功耗实时监控装置及监控方法
CN108287780A (zh) * 2018-01-25 2018-07-17 郑州云海信息技术有限公司 一种监控服务器cpld状态的装置及方法
CN111581043A (zh) * 2019-07-29 2020-08-25 新华三信息技术有限公司 服务器功耗的监控方法、装置和服务器

Also Published As

Publication number Publication date
CN117055718A (zh) 2023-11-14

Similar Documents

Publication Publication Date Title
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN112131071B (zh) 一种内存评估的方法及装置
EP2472402A1 (en) Remote management systems and methods for mapping operating system and management controller located in a server
CN111459700A (zh) 设备故障的诊断方法、诊断装置、诊断设备及存储介质
CN114328102B (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN109933182A (zh) 一种服务器掉电诊断方法、装置和系统
CN101652738A (zh) 用于在数据处理系统中给系统功率损失通知定阈值的系统和方法
CN110377136A (zh) 一种psu原始值日志记录方法及装置
US9116804B2 (en) Transient detection for predictive health management of data processing systems
CN114978883B (zh) 网络唤醒的管理方法、装置、电子设备及存储介质
CN110018932B (zh) 一种容器磁盘的监控方法及装置
CN109884533B (zh) 电池故障的诊断方法及装置、设备及存储介质
CN110874311A (zh) 数据库检测方法、装置、计算机设备和存储介质
CN116560586B (zh) 属性值的确定方法及装置、存储介质及电子设备
CN117149491A (zh) 一种电源监测方法、系统、装置及存储介质
CN117055718B (zh) 一种服务器功耗检测系统、方法、装置、设备和存储介质
CN110399301A (zh) 一种代码测试方法、装置、设备及可读存储介质
CN108920337A (zh) 一种设备异常信息展示方法和计算机设备
CN110058979A (zh) 一种温度读取失败故障的监控方法、bmc及存储介质
CN114218001A (zh) 故障修复方法、装置、电子设备及可读存储介质
CN114328112A (zh) 一种异构芯片的监控方法、装置、设备和介质
CN113900872A (zh) 一种硬件故障检测系统、方法及介质
CN102822806B (zh) 检测应用的无进展状态
CN110399258A (zh) 一种服务器系统的稳定性测试方法、系统及装置
CN115695159B (zh) 一种设备诊断方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant