CN112912854A - 接收热数据并产生系统热等级 - Google Patents

接收热数据并产生系统热等级 Download PDF

Info

Publication number
CN112912854A
CN112912854A CN201880099315.2A CN201880099315A CN112912854A CN 112912854 A CN112912854 A CN 112912854A CN 201880099315 A CN201880099315 A CN 201880099315A CN 112912854 A CN112912854 A CN 112912854A
Authority
CN
China
Prior art keywords
data
anomaly
level
thermal
readable medium
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880099315.2A
Other languages
English (en)
Inventor
A·奎罗斯德梅西多
E·T·佩雷拉
G·C·巴博萨
I·R·D·M·林斯
R·O·桑托斯
T·萨图尔诺达西尔瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of CN112912854A publication Critical patent/CN112912854A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3058Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3024Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/16Constructional details or arrangements
    • G06F1/20Cooling means
    • G06F1/206Cooling means comprising thermal management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • Automation & Control Theory (AREA)

Abstract

存储机器可读指令的计算机可读介质的示例。所述指令可以使处理器接收针对设备的热数据,并将异常模型应用于热数据以产生等级。针对设备的等级可以被组合到系统热等级中,并且校正动作被标识以提高系统热等级。

Description

接收热数据并产生系统热等级
背景技术
电子设备可能在操作期间发热。设备可以包括风扇、散热器或其他散热元件。随着设备老化,其热特性可能变化。
附图说明
下面将参考以下附图描述各种示例:
图1示出了根据各种示例的机群(fleet)管理系统,该机群管理系统针对电子设备的机群收集热数据并标识校正动作;
图2示出了根据各种示例的将异常模型应用于关于设备收集的热数据的方法;
图3示出了根据各种示例的将异常模型应用于关于设备的组件的热数据的方法;以及
图4示出了将异常模型应用于热数据并基于趋势来标识校正动作的方法。
具体实施方式
关于电子设备的热问题可能导致设备损坏或甚至爆炸。不同的设备具有不同的热特性。设备的机群可能在不同的时间经历(experience)热问题。预测或诊断热问题可以允许采取校正动作。
机群管理系统可以从设备的机群收集热数据。基于异常模型,机群管理系统可以计算针对设备或者甚至针对设备的特定组件的热等级。可以在安排(schedule)设备的机群的维护和修理时使用所述等级。
在根据本公开的一个示例中,提供了一种装置。该装置包括一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:接收包括针对第一设备的热数据的第一组数据;将第一异常模型应用于第一组数据以产生第一异常等级;将第二异常模型应用于第一组数据以产生第二异常等级;基于第一异常等级和第二异常等级产生对应于第一设备的第一系统热等级;基于第一异常等级和第二异常等级中的一个来标识要应用于第一设备以提高第一系统热等级的校正动作;以及控制第一设备以执行校正动作。
在根据本公开的一个示例中,提供了一种装置。该装置包括一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:接收包括针对设备的第一组件的热数据的第一组数据;接收包括针对设备的第二组件的热数据的第二组数据;将第一异常模型应用于第一组数据以产生第一异常等级;将第二异常模型应用于第二组数据以产生第二异常等级;基于第一异常等级和第二异常等级产生对应于设备的第一系统热等级;基于第一异常等级和第二异常等级中的一个来标识要应用于设备以提高第一系统热等级的校正动作;以及控制设备以执行校正动作。
在根据本公开的一个示例中,提供了一种装置。该装置包括一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:接收包括对应于第一时间的针对设备的热数据的第一组数据;将异常模型应用于第一组数据以产生第一异常等级;接收包括对应于第二时间的针对设备的热数据的第二组数据;将异常模型应用于第二组数据以产生第二异常等级;基于第一和第二异常等级来标识趋势;基于趋势来标识要应用于设备的校正动作;以及控制设备以执行校正动作。
图1示出了根据各种示例的机群管理系统100,该机群管理系统100用于针对电子设备160、170、180的机群收集热数据并标识校正动作。机群管理系统100可以包括处理器110、计算机可读介质120和网络接口连接器130。计算机可读介质120可以包括用于由处理器110执行的机器可读指令125。当由处理器110执行时,机器可读指令125可以使处理器110执行方法,诸如结合本文中其他附图公开的方法。机器可读指令125可以是安装在机群管理系统100上的应用的部分。
机群管理系统100可以包括服务器、膝上型或台式计算机、平板计算机或其他电子设备。机群管理系统100可以是由多个电子设备组成的分布式计算机系统。处理器110可以包括微处理器、微计算机、微控制器、现场可编程门阵列(FPGA)或用于执行机器可读指令的分立逻辑。计算机可读介质120可以包括硬盘驱动器、固态驱动器(SSD)、闪存、电可擦除可编程只读存储器(EEPROM)或随机存取存储器(RAM)。网络接口连接器130可以经由有线连接(诸如以太网电缆或通用串行总线(USB))或者经由无线连接(诸如WiFi)将机群管理系统100耦合到电子设备160、170、180的机群。该连接可以是经由网络150的,网络150可以包括互联网。电子设备160、170、180的机群可以包括平板计算机160、膝上型计算机170、台式计算机180、服务器和蜂窝电话。
图2示出了根据各种示例的将异常模型应用于关于设备收集的热数据的方法200。方法200包括接收包括针对第一设备的热数据的第一组数据(210)。方法200包括将第一异常模型应用于第一组数据以产生第一异常等级(220)。方法200包括将第二异常模型应用于第一组数据以产生第二异常等级(230)。方法200包括基于第一异常等级和第二异常等级产生对应于第一设备的第一系统热等级(240)。方法200包括基于第一异常等级和第二异常等级中的一个来标识要应用于第一设备以提高第一系统热等级的校正动作(250)。方法200包括基于校正动作向第一设备发送消息(260)。
在各种示例中,机群管理系统可以接收关于各种设备的操作的数据。所述设备可以包括服务器、膝上型计算机、台式计算机、打印机、蜂窝电话、平板计算机、路由器或其他装备。接收的数据可以包括热数据,诸如关于发热或散热系统的热数据。例如,关于膝上型计算机的数据可以包括处理器温度、处理器功率、处理器速度、风扇速度、环境温度、图形处理器温度、图形处理器速度、监视器温度、键盘温度、存储装置温度、主板温度、电池温度、电池正在充电还是放电、应用的功耗以及计算机的能量状态。计算机的能量状态可以包括它是打开、关闭、休眠还是处于暂停或睡眠模式中。可以通过网络接口连接器接收数据。所述设备可以被配置成向服务器发送报告,该服务器可以是机群管理系统的部分。数据可以作为常规数据收集的部分来收集,并且包括除热数据之外的数据,诸如打印机墨粉水平、安装的应用的版本、产品ID、设备的序列号、设备的组件的序列号、硬件或固件版本、制造商和型号、存储容量、存储大小、存储错误、驱动程序崩溃、引导错误、用于引导设备的时间以及用于关闭设备的时间。数据可以经由公共或专用网络从设备被传输到机群管理系统。在各种示例中,可以在检测热问题时使用非热数据。例如,驱动程序崩溃、引导错误、引导时间和关机时间可以被认为是非热的,因为它们不与温度直接相关。然而,这些值可能指示热问题正在发生并干扰设备操作。
可以将异常模型应用于数据,以产生异常等级。可以通过机器学习以标识接收到的数据中的相关性来创建异常模型,或者通过人类专家执行数据的分析来创建异常模型。例如,处理器功率或处理器速度中的增加可能与处理器温度中的增加相关。处理器温度中的增加可能与增加的风扇速度相关,并且随着热量贯穿系统扩散,设备上的其他温度区域也可能增加。
异常模型的应用可以产生针对该异常模型的异常等级。可以对数据应用多个异常模型,从而产生不同的异常等级。异常模型可以是数值等级,诸如范围从0到100的整数。较低的数值等级可能指示数据与预期的异常模型不紧密匹配。例如,当处理器温度增加时,风扇速度可能没有增加或没有与预期那样多地增加。这可能是由于风扇的电机的变坏(deterioration)、风扇上灰尘的积聚、通风口的阻塞、关于风扇的控制系统的问题或关于处理器温度传感器的错误。
对应于设备的异常模型可以被组合以产生系统热等级。这可以通过计算异常等级的平均值来执行。在计算平均值时,可以对异常等级进行不同地加权。在各种示例中,可以通过对满足或不满足阈值等级水平的异常等级的数量进行计数来计算系统热等级。
机群管理系统可以向用户显示数据。数据可以被显示为网格或图表,该网格或图表示出机群中的设备或机群的设备类别中的设备。例如,设备类别可以包括膝上型和台式计算机,限于膝上型计算机,或者包括某些型号的计算机。在各种示例中,显示器可以是具有指示机群中的设备的正方形的网格。正方形可以被颜色编码,以指示哪些设备具有可接受的系统热等级,哪些设备具有临界(borderline)系统热等级并且可以受益于维护,以及哪些设备具有差的热等级并且应该被修理或更换。显示器可以允许针对附加信息选择个体设备。弹出对话框可以提供诸如设备的序列号、系统热等级和异常等级的信息。在大量的异常等级是可用的情况下,显示器可以限制所显示的异常等级,诸如显示最低等级。显示器可以允许用户调出(bring up)针对设备的显示器。该设备显示器可以示出异常等级的网格,根据异常等级是否指示问题进行的颜色编码。用户可能能够选择特定的异常等级,以调出提供关于相关组件的信息的弹出对话框。用户可能能够选择异常等级,并拉起(pull up)示出随时间推移的异常等级中的变化的图。当选择个体设备时,设备的各种组件可以在显示器上表示。组件可以根据与该组件相关的异常等级来颜色编码。选择组件可以调出关于该组件的序列号或其他标识信息的信息,以及与该组件相关的异常模型和对应的异常等级的列表。
基于针对设备的系统热等级和异常等级,可以针对设备标识校正动作。例如,针对设备的系统热等级可能足够低以至于被认为是差等级或临界等级。异常等级可能指示针对处理器的冷却风扇可能未恰当地操作。校正动作可以是更换冷却风扇。校正动作可以包括更换设备、修理或更换设备的组件、更新或卸载应用、更新操作系统或将操作系统重新映像(reimaging)、将设备分配给不同的用户、关于正确使用设备而指示用户、清洁设备、调节设备位于其中的环境温度以及重新定位设备以减少气流阻塞。
机群管理系统可以控制设备以执行校正动作。在各种示例中,控制可以包括向设备发送消息。发送消息可以包括进行远程程序调用,或者与设备对接以使执行校正动作的过程自动化。在各种示例中,发送消息可以包括发送指示用户安排维修(service)预约的电子邮件或系统消息。给用户的消息可以指示用户关于用户要采取以便执行校正动作的步骤。给用户的指令或消息可以是建议,或可以由系统实施。例如,在安排维修预约时,设备可能不允许用户继续使用设备,直到安排了预约,或者可能在要求安排维修预约之前允许设备在有限量的时间内使用。
在各种示例中,消息可以指示设备执行一些操作,所述操作可能不涉及用户交互。例如,该消息可以指示设备变更设备的系统设置,更新设备上的操作系统或应用,或者将设备或设备的组件置于安全模式中。该消息可以包括用于由设备在执行校正动作时执行的机器可读指令。
图3示出了根据各种示例的将异常模型应用于关于设备的组件的热数据的方法300。方法300包括接收包括针对设备的第一组件的热数据的第一组数据(310)。方法300包括接收包括针对设备的第二组件的热数据的第二组数据(320)。方法300包括将第一异常模型应用于第一组数据以产生第一异常等级(330)。方法300包括将第二异常模型应用于第二组数据以产生第二异常等级(340)。方法300包括基于第一异常等级和第二异常等级产生对应于设备的第一系统热等级(350)。方法300包括基于第一异常等级和第二异常等级中的一个来标识要应用于设备以提高第一系统热等级的校正动作(360)。方法300包括基于校正动作向设备发送消息(370)。
在各种示例中,设备的机群中的设备可以包括电池。例如,当膝上型计算机未插入到电源插座中时,膝上型计算机可以包括电池以为膝上型计算机供电。可以收集关于电池的热数据,诸如电池温度。也可以收集关于电池的标识的数据,诸如型号和唯一标识符。校正动作可以包括电池的更换。
图4示出了将异常模型应用于热数据并基于趋势来标识校正动作的方法400。方法400包括接收包括对应于第一时间的针对设备的热数据的第一组数据(410)。方法400包括将异常模型应用于第一组数据以产生第一异常等级(420)。方法400包括接收包括对应于第二时间的针对设备的热数据的第二组数据(430)。方法400包括将异常模型应用于第二组数据以产生第二异常等级(440)。方法400包括基于第一和第二异常等级来标识趋势(450)。方法400包括基于趋势来标识要应用于设备的校正动作(460)。方法400包括基于校正动作向设备发送消息(470)。
在各种示例中,可以随着时间的推移收集数据。例如,可以每天、每小时或以一些其他时间间隔针对设备收集一次数据。可以存储关于异常等级如何随时间推移而变化的数据。随时间推移的该数据变化可以标识趋势。例如,趋势可能示出组件的性能已经如何随着时间的推移而下降,或者指示灾难性事件可能已经发生。随着时间的推移的针对逐渐变坏的校正动作可能不同于针对灾难性事件的校正动作。随着时间的推移的针对逐渐变坏的校正动作可以包括修理或更换组件。针对灾难性事件的校正动作可以包括更换整个设备。
也可以在执行产品或子系统分析时使用收集的数据。计算机的机群可以包括相同型号的许多设备。数据的收集可能指示该型号的设备倾向于经历相同组件(诸如电池)的故障。这可能指示应该用不同型号的电池来更换电池。也可以通知制造商该问题,从而允许制造商标识电池中或该电池与该型号的设备的组合中的缺陷。
在各种示例中,不同型号的设备可以包括公共子系统。三台不同的膝上型计算机可以共享电池,但具有不同的处理器。数据集合可以包括标识子系统的数据。可以由制造商使用该数据来标识子系统的各种组合一起可能没有与子系统的其他组合执行得那样好。例如,由于被存储装置的支撑结构堵塞气流,因此一个型号的存储子系统在与特定型号的主板组合时可能有问题。制造商可能注意到该问题,并修改存储装置、主板的设计,或者确保在未来的设备型号中两个子系统不在相同的设备上使用。
热数据的收集和分析可以导致在问题导致灾难性故障之前更好地标识关于子组件或关于系统的问题。该分析可以被集成到针对设备的设计和制造流水线中,从而提供关于可能难以在设计期间充分测试的领域中的各种组件和子系统的交互的信息。虽然个体组件可能经历组件测试,并且可能执行一些系统测试,但是对于这样的测试,可能难以解决设备的现实世界或日常使用(real-world or everyday use)。收集和分析来自设备的使用中的数据可以改善新组件和设备的整体设计周期,因为可以标识个体组件问题以及集成问题。
在各种示例中,可以向组件制造商提供来自该数据收集和分析的反馈。这可能导致针对组件的修改的热设计或改进的系统集成测试。某些异常模型可以由组件的制造商(诸如SSD的制造商)创建。将异常模型应用于数据的结果可以被报告回到该制造商。这可以被用作β测试过程的部分,使得可以在完成(finalize)针对组件的制造设计之前收集使用中的数据。
在各种示例中,数据收集和分析可能能够改进根本原因问题的标识。例如,存储装置可能由于过热而经历错误。当图形处理器在高负载下操作时,跨设备的热数据的收集和设备的收集可能指示存储装置可能过热。因此,根本原因可能是图形处理器或图形处理器和存储装置之间的物理空间,而不是仅存储组件有问题。
在各种示例中,可能预料到热问题。例如,具有特定的组件的组合的某些型号的设备可能在一段时间后表现出热问题。对于具有类似的组件的组合的其他型号的设备,可以预测到相似的问题,并采取校正动作来防止组件降级(degradation)。在针对未来设备型号的设计过程期间,可以标记潜在的问题。
上述讨论旨在说明本公开的原理和各种示例。一旦充分理解了上述公开内容,许多变化和修改对于本领域技术人员而言将变得显而易见。以下权利要求旨在被解释为包含所有这样的变化和修改。

Claims (15)

1.一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:
接收包括针对第一设备的热数据的第一组数据;
将第一异常模型应用于第一组数据以产生第一异常等级;
将第二异常模型应用于第一组数据以产生第二异常等级;
基于第一异常等级和第二异常等级产生对应于第一设备的第一系统热等级;
基于第一异常等级和第二异常等级中的一个来标识要应用于第一设备以提高第一系统热等级的校正动作;以及
控制第一设备以执行校正动作。
2.根据权利要求1所述的计算机可读介质,其中,当由处理器执行时,所述机器可读指令使处理器:
接收包括针对第二设备的热数据的第二组数据;
将第一异常模型应用于第二组数据以产生第三异常等级;
将第二异常模型应用于第二组数据以产生第四异常等级;
基于第三异常等级和第四异常等级产生对应于第二设备的第二系统热等级;
显示机群图表,所述机群图表包括第一系统热等级的表示和第二系统热等级的表示;
接收用于显示关于第一设备的设备图表的命令;以及
响应于命令的接收,显示设备图表,所述设备图表包括第一异常等级和第二异常等级的表示。
3.根据权利要求1所述的计算机可读介质,其中,校正动作包括对第一设备上的应用的更新。
4.根据权利要求1所述的计算机可读介质,其中,第一设备被分配给用户,并且标识校正动作包括将第二设备分配给用户,所述分配基于第一异常等级和第二异常等级。
5.根据权利要求1所述的计算机可读介质,其中,第一组数据包括针对第一设备的处理器的温度数据。
6.一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:
接收包括针对设备的第一组件的热数据的第一组数据;
接收包括针对设备的第二组件的热数据的第二组数据;
将第一异常模型应用于第一组数据以产生第一异常等级;
将第二异常模型应用于第二组数据以产生第二异常等级;
基于第一异常等级和第二异常等级产生对应于设备的第一系统热等级;
基于第一异常等级和第二异常等级中的一个来标识要应用于设备以提高第一系统热等级的校正动作;以及
控制设备以执行校正动作。
7.根据权利要求6所述的计算机可读介质,其中,第一组件包括设备的处理器,并且第二组件包括设备的电池。
8.根据权利要求7所述的计算机可读介质,其中,第一组数据包括对应于设备的处理器的标识符。
9.根据权利要求6所述的计算机可读介质,其中,第一组数据包括在第一时间点处来自传感器的第一温度和在第二时间点处来自传感器的第二温度。
10.根据权利要求6所述的计算机可读介质,其中,校正动作包括更换设备中的第一组件。
11.一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:
接收包括对应于第一时间的针对设备的热数据的第一组数据;
将异常模型应用于第一组数据以产生第一异常等级;
接收包括对应于第二时间的针对设备的热数据的第二组数据;
将异常模型应用于第二组数据以产生第二异常等级;
基于第一和第二异常等级来标识趋势;
基于趋势来标识要应用于设备的校正动作;以及
控制设备以执行校正动作。
12.根据权利要求11所述的计算机可读介质,其中,标识校正动作包括标识要维修的设备的组件。
13.根据权利要求12所述的计算机可读介质,其中,校正动作包括由设备的用户安排维修预约。
14.根据权利要求13所述的计算机可读介质,其中,校正动作包括将设备置于安全模式中。
15.根据权利要求11所述的计算机可读介质,其中,校正动作包括对设备上的应用的更新。
CN201880099315.2A 2018-11-07 2018-11-07 接收热数据并产生系统热等级 Pending CN112912854A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US2018/059699 WO2020096595A1 (en) 2018-11-07 2018-11-07 Receiving thermal data and producing system thermal grades

Publications (1)

Publication Number Publication Date
CN112912854A true CN112912854A (zh) 2021-06-04

Family

ID=70612021

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880099315.2A Pending CN112912854A (zh) 2018-11-07 2018-11-07 接收热数据并产生系统热等级

Country Status (4)

Country Link
US (1) US11520390B2 (zh)
EP (1) EP3877857A4 (zh)
CN (1) CN112912854A (zh)
WO (1) WO2020096595A1 (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823290A (en) * 1987-07-21 1989-04-18 Honeywell Bull Inc. Method and apparatus for monitoring the operating environment of a computer system
US20040262409A1 (en) * 2003-06-30 2004-12-30 Crippen Martin Joseph Thermal analysis in a data processing system
CN103403463A (zh) * 2011-03-02 2013-11-20 开利公司 故障检测和诊断算法
US20150281015A1 (en) * 2014-03-26 2015-10-01 International Business Machines Corporation Predicting hardware failures in a server
US20170235598A1 (en) * 2014-08-14 2017-08-17 Beijing Kingsoft Internet Security Software Co., Ltd. Method for identifying application causing temperature rise of terminal, and terminal
US20180113773A1 (en) * 2016-10-21 2018-04-26 Accenture Global Solutions Limited Application monitoring and failure prediction
WO2018194565A1 (en) * 2017-04-18 2018-10-25 Hewlett-Packard Development Company, L.P. Monitoring the thermal health of an electronic device

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6950773B1 (en) 2004-02-10 2005-09-27 Sun Microsystems, Inc. Detecting thermal anomalies in computer systems based on correlations between instrumentation signals
US7925389B2 (en) * 2006-06-15 2011-04-12 International Business Machines Corporation Method of detecting recirculation of heated air within a rack enclosure
US7310590B1 (en) 2006-11-15 2007-12-18 Computer Associates Think, Inc. Time series anomaly detection using multiple statistical models
US7421368B2 (en) * 2006-12-19 2008-09-02 International Business Machines Corporation Detection of airflow anomalies in electronic equipment
CN100470416C (zh) 2006-12-28 2009-03-18 上海电力学院 一种电厂热工设备智能状态诊断分析系统
CA2718733C (en) * 2008-02-15 2015-05-26 The Pnc Financial Services Group, Inc. Systems and methods for computer equipment management
US20130090889A1 (en) 2011-10-05 2013-04-11 Oracle International Corporation Dynamic regulation of temperature changes using telemetry data analysis
US10095288B2 (en) * 2016-03-18 2018-10-09 Dell Products L.P. Systems and methods for thermal management of an information handling system including determination of optimum slot location for information handling resource
US20180096261A1 (en) 2016-10-01 2018-04-05 Intel Corporation Unsupervised machine learning ensemble for anomaly detection
EP4290412A3 (en) * 2018-09-05 2024-01-03 Sartorius Stedim Data Analytics AB Computer-implemented method, computer program product and system for data analysis

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823290A (en) * 1987-07-21 1989-04-18 Honeywell Bull Inc. Method and apparatus for monitoring the operating environment of a computer system
US20040262409A1 (en) * 2003-06-30 2004-12-30 Crippen Martin Joseph Thermal analysis in a data processing system
CN103403463A (zh) * 2011-03-02 2013-11-20 开利公司 故障检测和诊断算法
US20150281015A1 (en) * 2014-03-26 2015-10-01 International Business Machines Corporation Predicting hardware failures in a server
US20170235598A1 (en) * 2014-08-14 2017-08-17 Beijing Kingsoft Internet Security Software Co., Ltd. Method for identifying application causing temperature rise of terminal, and terminal
US20180113773A1 (en) * 2016-10-21 2018-04-26 Accenture Global Solutions Limited Application monitoring and failure prediction
WO2018194565A1 (en) * 2017-04-18 2018-10-25 Hewlett-Packard Development Company, L.P. Monitoring the thermal health of an electronic device

Also Published As

Publication number Publication date
EP3877857A4 (en) 2022-06-22
WO2020096595A1 (en) 2020-05-14
US11520390B2 (en) 2022-12-06
EP3877857A1 (en) 2021-09-15
US20210263502A1 (en) 2021-08-26

Similar Documents

Publication Publication Date Title
US10397076B2 (en) Predicting hardware failures in a server
US11269750B2 (en) System and method to assess information handling system health and resource utilization
US10069710B2 (en) System and method to identify resources used by applications in an information handling system
US11495116B2 (en) Home health optimization
CN101159169B (zh) 用于闪存的寿命终止预测的方法和电子设备
US9991727B2 (en) Smart battery charging to improve the lifespan of batteries
US20150370681A1 (en) Power profile diagnostic system
JP2007042091A (ja) プロセッサモジュールの電力監視
US20230239194A1 (en) Node health prediction based on failure issues experienced prior to deployment in a cloud computing system
US11657321B2 (en) Information processing device, non-transitory storage medium and information processing method
EP3336349A1 (en) Method and system for configuring wind turbines
US11520390B2 (en) Receiving thermal data and producing system thermal grades
US9262418B2 (en) Method and system for performing system maintenance in a computing device
US20140361978A1 (en) Portable computer monitoring
Hiraoka et al. Development of Part Agents for the Promotion of Reuse of Parts through Experiment and Simulation
Kwasnick et al. Telemetry for system reliability
JP6388335B2 (ja) 障害傾向判定装置、障害傾向判定方法及びプログラム
US20230008268A1 (en) Extrapolated usage data
US11809716B2 (en) Prediction and prioritization of solid-state drives replacement
CN117312094A (zh) 一种基于时间序列分析算法的服务器硬件监控采集方法
CN116954191A (zh) 基于故障码的i/o诊断方法、系统、设备及存储介质
CN113986142A (zh) 磁盘故障监控方法、装置、计算机设备及存储介质
JP2024033623A (ja) プラント機能管理支援方法及びプラント機能管理支援装置
US8745189B2 (en) Method and power-saving control device for controlling operations of computing units
CN116595452A (zh) 服务器故障预测方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination