CN112912854A - 接收热数据并产生系统热等级 - Google Patents
接收热数据并产生系统热等级 Download PDFInfo
- Publication number
- CN112912854A CN112912854A CN201880099315.2A CN201880099315A CN112912854A CN 112912854 A CN112912854 A CN 112912854A CN 201880099315 A CN201880099315 A CN 201880099315A CN 112912854 A CN112912854 A CN 112912854A
- Authority
- CN
- China
- Prior art keywords
- data
- anomaly
- level
- thermal
- readable medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000009471 action Effects 0.000 claims abstract description 44
- 238000012423 maintenance Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 description 31
- 230000000875 corresponding effect Effects 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 238000013461 design Methods 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 230000001276 controlling effect Effects 0.000 description 4
- 238000013480 data collection Methods 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012938 design process Methods 0.000 description 1
- 238000007599 discharging Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3058—Monitoring arrangements for monitoring environmental properties or parameters of the computing system or of the computing system component, e.g. monitoring of power, currents, temperature, humidity, position, vibrations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3024—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a central processing unit [CPU]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/16—Constructional details or arrangements
- G06F1/20—Cooling means
- G06F1/206—Cooling means comprising thermal management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2201/00—Indexing scheme relating to error detection, to error correction, and to monitoring
- G06F2201/81—Threshold
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Manufacturing & Machinery (AREA)
- Automation & Control Theory (AREA)
Abstract
存储机器可读指令的计算机可读介质的示例。所述指令可以使处理器接收针对设备的热数据,并将异常模型应用于热数据以产生等级。针对设备的等级可以被组合到系统热等级中,并且校正动作被标识以提高系统热等级。
Description
背景技术
电子设备可能在操作期间发热。设备可以包括风扇、散热器或其他散热元件。随着设备老化,其热特性可能变化。
附图说明
下面将参考以下附图描述各种示例:
图1示出了根据各种示例的机群(fleet)管理系统,该机群管理系统针对电子设备的机群收集热数据并标识校正动作;
图2示出了根据各种示例的将异常模型应用于关于设备收集的热数据的方法;
图3示出了根据各种示例的将异常模型应用于关于设备的组件的热数据的方法;以及
图4示出了将异常模型应用于热数据并基于趋势来标识校正动作的方法。
具体实施方式
关于电子设备的热问题可能导致设备损坏或甚至爆炸。不同的设备具有不同的热特性。设备的机群可能在不同的时间经历(experience)热问题。预测或诊断热问题可以允许采取校正动作。
机群管理系统可以从设备的机群收集热数据。基于异常模型,机群管理系统可以计算针对设备或者甚至针对设备的特定组件的热等级。可以在安排(schedule)设备的机群的维护和修理时使用所述等级。
在根据本公开的一个示例中,提供了一种装置。该装置包括一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:接收包括针对第一设备的热数据的第一组数据;将第一异常模型应用于第一组数据以产生第一异常等级;将第二异常模型应用于第一组数据以产生第二异常等级;基于第一异常等级和第二异常等级产生对应于第一设备的第一系统热等级;基于第一异常等级和第二异常等级中的一个来标识要应用于第一设备以提高第一系统热等级的校正动作;以及控制第一设备以执行校正动作。
在根据本公开的一个示例中,提供了一种装置。该装置包括一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:接收包括针对设备的第一组件的热数据的第一组数据;接收包括针对设备的第二组件的热数据的第二组数据;将第一异常模型应用于第一组数据以产生第一异常等级;将第二异常模型应用于第二组数据以产生第二异常等级;基于第一异常等级和第二异常等级产生对应于设备的第一系统热等级;基于第一异常等级和第二异常等级中的一个来标识要应用于设备以提高第一系统热等级的校正动作;以及控制设备以执行校正动作。
在根据本公开的一个示例中,提供了一种装置。该装置包括一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:接收包括对应于第一时间的针对设备的热数据的第一组数据;将异常模型应用于第一组数据以产生第一异常等级;接收包括对应于第二时间的针对设备的热数据的第二组数据;将异常模型应用于第二组数据以产生第二异常等级;基于第一和第二异常等级来标识趋势;基于趋势来标识要应用于设备的校正动作;以及控制设备以执行校正动作。
图1示出了根据各种示例的机群管理系统100,该机群管理系统100用于针对电子设备160、170、180的机群收集热数据并标识校正动作。机群管理系统100可以包括处理器110、计算机可读介质120和网络接口连接器130。计算机可读介质120可以包括用于由处理器110执行的机器可读指令125。当由处理器110执行时,机器可读指令125可以使处理器110执行方法,诸如结合本文中其他附图公开的方法。机器可读指令125可以是安装在机群管理系统100上的应用的部分。
机群管理系统100可以包括服务器、膝上型或台式计算机、平板计算机或其他电子设备。机群管理系统100可以是由多个电子设备组成的分布式计算机系统。处理器110可以包括微处理器、微计算机、微控制器、现场可编程门阵列(FPGA)或用于执行机器可读指令的分立逻辑。计算机可读介质120可以包括硬盘驱动器、固态驱动器(SSD)、闪存、电可擦除可编程只读存储器(EEPROM)或随机存取存储器(RAM)。网络接口连接器130可以经由有线连接(诸如以太网电缆或通用串行总线(USB))或者经由无线连接(诸如WiFi)将机群管理系统100耦合到电子设备160、170、180的机群。该连接可以是经由网络150的,网络150可以包括互联网。电子设备160、170、180的机群可以包括平板计算机160、膝上型计算机170、台式计算机180、服务器和蜂窝电话。
图2示出了根据各种示例的将异常模型应用于关于设备收集的热数据的方法200。方法200包括接收包括针对第一设备的热数据的第一组数据(210)。方法200包括将第一异常模型应用于第一组数据以产生第一异常等级(220)。方法200包括将第二异常模型应用于第一组数据以产生第二异常等级(230)。方法200包括基于第一异常等级和第二异常等级产生对应于第一设备的第一系统热等级(240)。方法200包括基于第一异常等级和第二异常等级中的一个来标识要应用于第一设备以提高第一系统热等级的校正动作(250)。方法200包括基于校正动作向第一设备发送消息(260)。
在各种示例中,机群管理系统可以接收关于各种设备的操作的数据。所述设备可以包括服务器、膝上型计算机、台式计算机、打印机、蜂窝电话、平板计算机、路由器或其他装备。接收的数据可以包括热数据,诸如关于发热或散热系统的热数据。例如,关于膝上型计算机的数据可以包括处理器温度、处理器功率、处理器速度、风扇速度、环境温度、图形处理器温度、图形处理器速度、监视器温度、键盘温度、存储装置温度、主板温度、电池温度、电池正在充电还是放电、应用的功耗以及计算机的能量状态。计算机的能量状态可以包括它是打开、关闭、休眠还是处于暂停或睡眠模式中。可以通过网络接口连接器接收数据。所述设备可以被配置成向服务器发送报告,该服务器可以是机群管理系统的部分。数据可以作为常规数据收集的部分来收集,并且包括除热数据之外的数据,诸如打印机墨粉水平、安装的应用的版本、产品ID、设备的序列号、设备的组件的序列号、硬件或固件版本、制造商和型号、存储容量、存储大小、存储错误、驱动程序崩溃、引导错误、用于引导设备的时间以及用于关闭设备的时间。数据可以经由公共或专用网络从设备被传输到机群管理系统。在各种示例中,可以在检测热问题时使用非热数据。例如,驱动程序崩溃、引导错误、引导时间和关机时间可以被认为是非热的,因为它们不与温度直接相关。然而,这些值可能指示热问题正在发生并干扰设备操作。
可以将异常模型应用于数据,以产生异常等级。可以通过机器学习以标识接收到的数据中的相关性来创建异常模型,或者通过人类专家执行数据的分析来创建异常模型。例如,处理器功率或处理器速度中的增加可能与处理器温度中的增加相关。处理器温度中的增加可能与增加的风扇速度相关,并且随着热量贯穿系统扩散,设备上的其他温度区域也可能增加。
异常模型的应用可以产生针对该异常模型的异常等级。可以对数据应用多个异常模型,从而产生不同的异常等级。异常模型可以是数值等级,诸如范围从0到100的整数。较低的数值等级可能指示数据与预期的异常模型不紧密匹配。例如,当处理器温度增加时,风扇速度可能没有增加或没有与预期那样多地增加。这可能是由于风扇的电机的变坏(deterioration)、风扇上灰尘的积聚、通风口的阻塞、关于风扇的控制系统的问题或关于处理器温度传感器的错误。
对应于设备的异常模型可以被组合以产生系统热等级。这可以通过计算异常等级的平均值来执行。在计算平均值时,可以对异常等级进行不同地加权。在各种示例中,可以通过对满足或不满足阈值等级水平的异常等级的数量进行计数来计算系统热等级。
机群管理系统可以向用户显示数据。数据可以被显示为网格或图表,该网格或图表示出机群中的设备或机群的设备类别中的设备。例如,设备类别可以包括膝上型和台式计算机,限于膝上型计算机,或者包括某些型号的计算机。在各种示例中,显示器可以是具有指示机群中的设备的正方形的网格。正方形可以被颜色编码,以指示哪些设备具有可接受的系统热等级,哪些设备具有临界(borderline)系统热等级并且可以受益于维护,以及哪些设备具有差的热等级并且应该被修理或更换。显示器可以允许针对附加信息选择个体设备。弹出对话框可以提供诸如设备的序列号、系统热等级和异常等级的信息。在大量的异常等级是可用的情况下,显示器可以限制所显示的异常等级,诸如显示最低等级。显示器可以允许用户调出(bring up)针对设备的显示器。该设备显示器可以示出异常等级的网格,根据异常等级是否指示问题进行的颜色编码。用户可能能够选择特定的异常等级,以调出提供关于相关组件的信息的弹出对话框。用户可能能够选择异常等级,并拉起(pull up)示出随时间推移的异常等级中的变化的图。当选择个体设备时,设备的各种组件可以在显示器上表示。组件可以根据与该组件相关的异常等级来颜色编码。选择组件可以调出关于该组件的序列号或其他标识信息的信息,以及与该组件相关的异常模型和对应的异常等级的列表。
基于针对设备的系统热等级和异常等级,可以针对设备标识校正动作。例如,针对设备的系统热等级可能足够低以至于被认为是差等级或临界等级。异常等级可能指示针对处理器的冷却风扇可能未恰当地操作。校正动作可以是更换冷却风扇。校正动作可以包括更换设备、修理或更换设备的组件、更新或卸载应用、更新操作系统或将操作系统重新映像(reimaging)、将设备分配给不同的用户、关于正确使用设备而指示用户、清洁设备、调节设备位于其中的环境温度以及重新定位设备以减少气流阻塞。
机群管理系统可以控制设备以执行校正动作。在各种示例中,控制可以包括向设备发送消息。发送消息可以包括进行远程程序调用,或者与设备对接以使执行校正动作的过程自动化。在各种示例中,发送消息可以包括发送指示用户安排维修(service)预约的电子邮件或系统消息。给用户的消息可以指示用户关于用户要采取以便执行校正动作的步骤。给用户的指令或消息可以是建议,或可以由系统实施。例如,在安排维修预约时,设备可能不允许用户继续使用设备,直到安排了预约,或者可能在要求安排维修预约之前允许设备在有限量的时间内使用。
在各种示例中,消息可以指示设备执行一些操作,所述操作可能不涉及用户交互。例如,该消息可以指示设备变更设备的系统设置,更新设备上的操作系统或应用,或者将设备或设备的组件置于安全模式中。该消息可以包括用于由设备在执行校正动作时执行的机器可读指令。
图3示出了根据各种示例的将异常模型应用于关于设备的组件的热数据的方法300。方法300包括接收包括针对设备的第一组件的热数据的第一组数据(310)。方法300包括接收包括针对设备的第二组件的热数据的第二组数据(320)。方法300包括将第一异常模型应用于第一组数据以产生第一异常等级(330)。方法300包括将第二异常模型应用于第二组数据以产生第二异常等级(340)。方法300包括基于第一异常等级和第二异常等级产生对应于设备的第一系统热等级(350)。方法300包括基于第一异常等级和第二异常等级中的一个来标识要应用于设备以提高第一系统热等级的校正动作(360)。方法300包括基于校正动作向设备发送消息(370)。
在各种示例中,设备的机群中的设备可以包括电池。例如,当膝上型计算机未插入到电源插座中时,膝上型计算机可以包括电池以为膝上型计算机供电。可以收集关于电池的热数据,诸如电池温度。也可以收集关于电池的标识的数据,诸如型号和唯一标识符。校正动作可以包括电池的更换。
图4示出了将异常模型应用于热数据并基于趋势来标识校正动作的方法400。方法400包括接收包括对应于第一时间的针对设备的热数据的第一组数据(410)。方法400包括将异常模型应用于第一组数据以产生第一异常等级(420)。方法400包括接收包括对应于第二时间的针对设备的热数据的第二组数据(430)。方法400包括将异常模型应用于第二组数据以产生第二异常等级(440)。方法400包括基于第一和第二异常等级来标识趋势(450)。方法400包括基于趋势来标识要应用于设备的校正动作(460)。方法400包括基于校正动作向设备发送消息(470)。
在各种示例中,可以随着时间的推移收集数据。例如,可以每天、每小时或以一些其他时间间隔针对设备收集一次数据。可以存储关于异常等级如何随时间推移而变化的数据。随时间推移的该数据变化可以标识趋势。例如,趋势可能示出组件的性能已经如何随着时间的推移而下降,或者指示灾难性事件可能已经发生。随着时间的推移的针对逐渐变坏的校正动作可能不同于针对灾难性事件的校正动作。随着时间的推移的针对逐渐变坏的校正动作可以包括修理或更换组件。针对灾难性事件的校正动作可以包括更换整个设备。
也可以在执行产品或子系统分析时使用收集的数据。计算机的机群可以包括相同型号的许多设备。数据的收集可能指示该型号的设备倾向于经历相同组件(诸如电池)的故障。这可能指示应该用不同型号的电池来更换电池。也可以通知制造商该问题,从而允许制造商标识电池中或该电池与该型号的设备的组合中的缺陷。
在各种示例中,不同型号的设备可以包括公共子系统。三台不同的膝上型计算机可以共享电池,但具有不同的处理器。数据集合可以包括标识子系统的数据。可以由制造商使用该数据来标识子系统的各种组合一起可能没有与子系统的其他组合执行得那样好。例如,由于被存储装置的支撑结构堵塞气流,因此一个型号的存储子系统在与特定型号的主板组合时可能有问题。制造商可能注意到该问题,并修改存储装置、主板的设计,或者确保在未来的设备型号中两个子系统不在相同的设备上使用。
热数据的收集和分析可以导致在问题导致灾难性故障之前更好地标识关于子组件或关于系统的问题。该分析可以被集成到针对设备的设计和制造流水线中,从而提供关于可能难以在设计期间充分测试的领域中的各种组件和子系统的交互的信息。虽然个体组件可能经历组件测试,并且可能执行一些系统测试,但是对于这样的测试,可能难以解决设备的现实世界或日常使用(real-world or everyday use)。收集和分析来自设备的使用中的数据可以改善新组件和设备的整体设计周期,因为可以标识个体组件问题以及集成问题。
在各种示例中,可以向组件制造商提供来自该数据收集和分析的反馈。这可能导致针对组件的修改的热设计或改进的系统集成测试。某些异常模型可以由组件的制造商(诸如SSD的制造商)创建。将异常模型应用于数据的结果可以被报告回到该制造商。这可以被用作β测试过程的部分,使得可以在完成(finalize)针对组件的制造设计之前收集使用中的数据。
在各种示例中,数据收集和分析可能能够改进根本原因问题的标识。例如,存储装置可能由于过热而经历错误。当图形处理器在高负载下操作时,跨设备的热数据的收集和设备的收集可能指示存储装置可能过热。因此,根本原因可能是图形处理器或图形处理器和存储装置之间的物理空间,而不是仅存储组件有问题。
在各种示例中,可能预料到热问题。例如,具有特定的组件的组合的某些型号的设备可能在一段时间后表现出热问题。对于具有类似的组件的组合的其他型号的设备,可以预测到相似的问题,并采取校正动作来防止组件降级(degradation)。在针对未来设备型号的设计过程期间,可以标记潜在的问题。
上述讨论旨在说明本公开的原理和各种示例。一旦充分理解了上述公开内容,许多变化和修改对于本领域技术人员而言将变得显而易见。以下权利要求旨在被解释为包含所有这样的变化和修改。
Claims (15)
1.一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:
接收包括针对第一设备的热数据的第一组数据;
将第一异常模型应用于第一组数据以产生第一异常等级;
将第二异常模型应用于第一组数据以产生第二异常等级;
基于第一异常等级和第二异常等级产生对应于第一设备的第一系统热等级;
基于第一异常等级和第二异常等级中的一个来标识要应用于第一设备以提高第一系统热等级的校正动作;以及
控制第一设备以执行校正动作。
2.根据权利要求1所述的计算机可读介质,其中,当由处理器执行时,所述机器可读指令使处理器:
接收包括针对第二设备的热数据的第二组数据;
将第一异常模型应用于第二组数据以产生第三异常等级;
将第二异常模型应用于第二组数据以产生第四异常等级;
基于第三异常等级和第四异常等级产生对应于第二设备的第二系统热等级;
显示机群图表,所述机群图表包括第一系统热等级的表示和第二系统热等级的表示;
接收用于显示关于第一设备的设备图表的命令;以及
响应于命令的接收,显示设备图表,所述设备图表包括第一异常等级和第二异常等级的表示。
3.根据权利要求1所述的计算机可读介质,其中,校正动作包括对第一设备上的应用的更新。
4.根据权利要求1所述的计算机可读介质,其中,第一设备被分配给用户,并且标识校正动作包括将第二设备分配给用户,所述分配基于第一异常等级和第二异常等级。
5.根据权利要求1所述的计算机可读介质,其中,第一组数据包括针对第一设备的处理器的温度数据。
6.一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:
接收包括针对设备的第一组件的热数据的第一组数据;
接收包括针对设备的第二组件的热数据的第二组数据;
将第一异常模型应用于第一组数据以产生第一异常等级;
将第二异常模型应用于第二组数据以产生第二异常等级;
基于第一异常等级和第二异常等级产生对应于设备的第一系统热等级;
基于第一异常等级和第二异常等级中的一个来标识要应用于设备以提高第一系统热等级的校正动作;以及
控制设备以执行校正动作。
7.根据权利要求6所述的计算机可读介质,其中,第一组件包括设备的处理器,并且第二组件包括设备的电池。
8.根据权利要求7所述的计算机可读介质,其中,第一组数据包括对应于设备的处理器的标识符。
9.根据权利要求6所述的计算机可读介质,其中,第一组数据包括在第一时间点处来自传感器的第一温度和在第二时间点处来自传感器的第二温度。
10.根据权利要求6所述的计算机可读介质,其中,校正动作包括更换设备中的第一组件。
11.一种用于存储机器可读指令的非暂时性计算机可读介质,当由处理器执行时,所述机器可读指令使处理器:
接收包括对应于第一时间的针对设备的热数据的第一组数据;
将异常模型应用于第一组数据以产生第一异常等级;
接收包括对应于第二时间的针对设备的热数据的第二组数据;
将异常模型应用于第二组数据以产生第二异常等级;
基于第一和第二异常等级来标识趋势;
基于趋势来标识要应用于设备的校正动作;以及
控制设备以执行校正动作。
12.根据权利要求11所述的计算机可读介质,其中,标识校正动作包括标识要维修的设备的组件。
13.根据权利要求12所述的计算机可读介质,其中,校正动作包括由设备的用户安排维修预约。
14.根据权利要求13所述的计算机可读介质,其中,校正动作包括将设备置于安全模式中。
15.根据权利要求11所述的计算机可读介质,其中,校正动作包括对设备上的应用的更新。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2018/059699 WO2020096595A1 (en) | 2018-11-07 | 2018-11-07 | Receiving thermal data and producing system thermal grades |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112912854A true CN112912854A (zh) | 2021-06-04 |
Family
ID=70612021
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880099315.2A Pending CN112912854A (zh) | 2018-11-07 | 2018-11-07 | 接收热数据并产生系统热等级 |
Country Status (4)
Country | Link |
---|---|
US (1) | US11520390B2 (zh) |
EP (1) | EP3877857A4 (zh) |
CN (1) | CN112912854A (zh) |
WO (1) | WO2020096595A1 (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4823290A (en) * | 1987-07-21 | 1989-04-18 | Honeywell Bull Inc. | Method and apparatus for monitoring the operating environment of a computer system |
US20040262409A1 (en) * | 2003-06-30 | 2004-12-30 | Crippen Martin Joseph | Thermal analysis in a data processing system |
CN103403463A (zh) * | 2011-03-02 | 2013-11-20 | 开利公司 | 故障检测和诊断算法 |
US20150281015A1 (en) * | 2014-03-26 | 2015-10-01 | International Business Machines Corporation | Predicting hardware failures in a server |
US20170235598A1 (en) * | 2014-08-14 | 2017-08-17 | Beijing Kingsoft Internet Security Software Co., Ltd. | Method for identifying application causing temperature rise of terminal, and terminal |
US20180113773A1 (en) * | 2016-10-21 | 2018-04-26 | Accenture Global Solutions Limited | Application monitoring and failure prediction |
WO2018194565A1 (en) * | 2017-04-18 | 2018-10-25 | Hewlett-Packard Development Company, L.P. | Monitoring the thermal health of an electronic device |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6950773B1 (en) | 2004-02-10 | 2005-09-27 | Sun Microsystems, Inc. | Detecting thermal anomalies in computer systems based on correlations between instrumentation signals |
US7925389B2 (en) * | 2006-06-15 | 2011-04-12 | International Business Machines Corporation | Method of detecting recirculation of heated air within a rack enclosure |
US7310590B1 (en) | 2006-11-15 | 2007-12-18 | Computer Associates Think, Inc. | Time series anomaly detection using multiple statistical models |
US7421368B2 (en) * | 2006-12-19 | 2008-09-02 | International Business Machines Corporation | Detection of airflow anomalies in electronic equipment |
CN100470416C (zh) | 2006-12-28 | 2009-03-18 | 上海电力学院 | 一种电厂热工设备智能状态诊断分析系统 |
CA2718733C (en) * | 2008-02-15 | 2015-05-26 | The Pnc Financial Services Group, Inc. | Systems and methods for computer equipment management |
US20130090889A1 (en) | 2011-10-05 | 2013-04-11 | Oracle International Corporation | Dynamic regulation of temperature changes using telemetry data analysis |
US10095288B2 (en) * | 2016-03-18 | 2018-10-09 | Dell Products L.P. | Systems and methods for thermal management of an information handling system including determination of optimum slot location for information handling resource |
US20180096261A1 (en) | 2016-10-01 | 2018-04-05 | Intel Corporation | Unsupervised machine learning ensemble for anomaly detection |
EP4290412A3 (en) * | 2018-09-05 | 2024-01-03 | Sartorius Stedim Data Analytics AB | Computer-implemented method, computer program product and system for data analysis |
-
2018
- 2018-11-07 CN CN201880099315.2A patent/CN112912854A/zh active Pending
- 2018-11-07 WO PCT/US2018/059699 patent/WO2020096595A1/en unknown
- 2018-11-07 US US17/262,282 patent/US11520390B2/en active Active
- 2018-11-07 EP EP18939208.7A patent/EP3877857A4/en not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4823290A (en) * | 1987-07-21 | 1989-04-18 | Honeywell Bull Inc. | Method and apparatus for monitoring the operating environment of a computer system |
US20040262409A1 (en) * | 2003-06-30 | 2004-12-30 | Crippen Martin Joseph | Thermal analysis in a data processing system |
CN103403463A (zh) * | 2011-03-02 | 2013-11-20 | 开利公司 | 故障检测和诊断算法 |
US20150281015A1 (en) * | 2014-03-26 | 2015-10-01 | International Business Machines Corporation | Predicting hardware failures in a server |
US20170235598A1 (en) * | 2014-08-14 | 2017-08-17 | Beijing Kingsoft Internet Security Software Co., Ltd. | Method for identifying application causing temperature rise of terminal, and terminal |
US20180113773A1 (en) * | 2016-10-21 | 2018-04-26 | Accenture Global Solutions Limited | Application monitoring and failure prediction |
WO2018194565A1 (en) * | 2017-04-18 | 2018-10-25 | Hewlett-Packard Development Company, L.P. | Monitoring the thermal health of an electronic device |
Also Published As
Publication number | Publication date |
---|---|
EP3877857A4 (en) | 2022-06-22 |
WO2020096595A1 (en) | 2020-05-14 |
US11520390B2 (en) | 2022-12-06 |
EP3877857A1 (en) | 2021-09-15 |
US20210263502A1 (en) | 2021-08-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10397076B2 (en) | Predicting hardware failures in a server | |
US11269750B2 (en) | System and method to assess information handling system health and resource utilization | |
US10069710B2 (en) | System and method to identify resources used by applications in an information handling system | |
US11495116B2 (en) | Home health optimization | |
CN101159169B (zh) | 用于闪存的寿命终止预测的方法和电子设备 | |
US9991727B2 (en) | Smart battery charging to improve the lifespan of batteries | |
US20150370681A1 (en) | Power profile diagnostic system | |
JP2007042091A (ja) | プロセッサモジュールの電力監視 | |
US20230239194A1 (en) | Node health prediction based on failure issues experienced prior to deployment in a cloud computing system | |
US11657321B2 (en) | Information processing device, non-transitory storage medium and information processing method | |
EP3336349A1 (en) | Method and system for configuring wind turbines | |
US11520390B2 (en) | Receiving thermal data and producing system thermal grades | |
US9262418B2 (en) | Method and system for performing system maintenance in a computing device | |
US20140361978A1 (en) | Portable computer monitoring | |
Hiraoka et al. | Development of Part Agents for the Promotion of Reuse of Parts through Experiment and Simulation | |
Kwasnick et al. | Telemetry for system reliability | |
JP6388335B2 (ja) | 障害傾向判定装置、障害傾向判定方法及びプログラム | |
US20230008268A1 (en) | Extrapolated usage data | |
US11809716B2 (en) | Prediction and prioritization of solid-state drives replacement | |
CN117312094A (zh) | 一种基于时间序列分析算法的服务器硬件监控采集方法 | |
CN116954191A (zh) | 基于故障码的i/o诊断方法、系统、设备及存储介质 | |
CN113986142A (zh) | 磁盘故障监控方法、装置、计算机设备及存储介质 | |
JP2024033623A (ja) | プラント機能管理支援方法及びプラント機能管理支援装置 | |
US8745189B2 (en) | Method and power-saving control device for controlling operations of computing units | |
CN116595452A (zh) | 服务器故障预测方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |