CN105630657A - 一种温度检测方法及装置 - Google Patents

一种温度检测方法及装置 Download PDF

Info

Publication number
CN105630657A
CN105630657A CN201410709844.3A CN201410709844A CN105630657A CN 105630657 A CN105630657 A CN 105630657A CN 201410709844 A CN201410709844 A CN 201410709844A CN 105630657 A CN105630657 A CN 105630657A
Authority
CN
China
Prior art keywords
sensor
temperature value
temperature
ssd
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410709844.3A
Other languages
English (en)
Other versions
CN105630657B (zh
Inventor
曹红强
吴黎明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CN201410709844.3A priority Critical patent/CN105630657B/zh
Publication of CN105630657A publication Critical patent/CN105630657A/zh
Application granted granted Critical
Publication of CN105630657B publication Critical patent/CN105630657B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Combined Controls Of Internal Combustion Engines (AREA)

Abstract

本发明实施例公开了一种温度检测方法及装置,可以准确检测各SSD的温度,识别哪些传感器出现了故障,避免造成系统执行不正确的处理策略。本发明实施例方法应用于存储阵列系统,包括:通过第一传感器获取硬盘框入风口的第一温度值;通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;在后续的温度检测过程中忽略被判断为出现故障的传感器。

Description

一种温度检测方法及装置
技术领域
本发明涉及检测技术,尤其涉及一种温度检测方法及装置。
背景技术
固态硬盘(SolidStateDrives,SSD)具有高性能、低时延等优点,被广泛应用于存储阵列系统。SSD作为存储阵列系统的关键组件,其可靠性成为审视存储阵列系统性能的重要因素。其中,SSD的数据保持能力与温度有很大关系,温度越高,数据保持能力越差;这时候需要依赖SSD内部的巡检机制来保证数据的准确性,通常温度越高,相应巡检的周期越短,搬迁数据越频繁,从而对SSD的寿命有一定的影响,因此,温度是影响SSD可靠性的一个重要因素。
在现有的存储阵列系统中,通常是通过温度传感器直接采集硬盘框中每个SSD的温度,当某个SSD的温度超过规定的范围时,对该SSD进行警告或故障处理。
然而,上述温度检测方案存在以下缺陷:硬盘框中各个SSD的温度检测都独立进行,判断SSD的温度是否超标仅依赖于其对应温度传感器,在这过程中,无法确定采集的温度是否准确,如果某个SSD的温度传感器本身出现故障,当前系统也无法识别,造成系统执行不正确的处理策略,如错误告警,错误调整SSD巡检频率等。
发明内容
本发明实施例提供了一种温度检测方法及装置,可以准确检测各SSD的温度,识别哪些传感器出现了故障,避免造成系统执行不正确的处理策略。
本发明实施例的第一方面提供一种温度检测方法,应用于存储阵列系统,包括:
通过第一传感器获取硬盘框入风口的第一温度值;
通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;
通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;
根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;
在后续的温度检测过程中忽略被判断为出现故障的传感器。
结合本发明实施例的第一方面,在本发明实施例的第一方面的第一种实现方式中,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
若T1大于和/或,T1小于与T1之间的差值大于第一预设值,则判断所述第一传感器故障;
其中,T1为第一温度值,为硬盘框中SSD入风口的第二温度值的平均值。
结合本发明实施例的第一方面,在本发明实施例的第一方面的第二种实现方式中,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
若T2小于T1,和/或,T2大于且T2之间的差值大于第二预设值,则判断T2对应的所述第二传感器故障;
其中,T1为第一温度值,T2为硬盘框中某个SSD入风口的第二温度值,为硬盘框中SSD入风口的第二温度值的平均值。
结合本发明实施例的第一方面,在本发明实施例的第一方面的第三种实现方式中,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
若T3小于与T3与之间的差值大于第三预设值,则判断T3对应的所述第三传感器故障;
和/或,
若T3大于且T3与之间的差值大于第四预设值,则获取T3对应的所述SSD处理器的业务压力数据,根据所述业务压力数据判断T3对应的所述第三传感器是否出现故障;
其中,T3为硬盘框中某个SSD处理器的第三温度值,为硬盘框中SSD处理器的第三温度值的平均值。
结合本发明实施例的第一方面,在本发明实施例的第一方面的第四种实现方式中,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
对每个SSD入风口在多个周期内的第二温度值进行比较,若某个SSD入风口的第二温度值没有变化且其他SSD入风口的第二温度值有明显变化,则判断没有变化的第二温度值对应的第二传感器故障;
和/或,
对每个SSD处理器在多个周期内的第三温度值进行比较,若某个SSD处理器的第三温度值没有变化且其他SSD入风口的第三温度值有明显变化,则判断没有变化的第三温度值对应的第三传感器故障。
结合本发明实施例的第一方面、本发明实施例的第一方面的第一种至第四种实现方式中的任意一种,在本发明实施例的第一方面的第五种实现方式中,所述方法还包括:
若在对SSD盘片施加不同的业务量情况下,传感器的温度值没有变化,则判断对应的传感器出现故障;所述传感器包括所述第一传感器、所述第二传感器以及所述第三传感器之中的任意一个或多个。
本发明实施例第二方面提供了一种温度检测装置,包括:
获取单元,用于通过第一传感器获取硬盘框入风口的第一温度值;通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;以及通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;
分析单元,用于根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;
执行单元,用于在后续的温度检测过程中忽略被判断为出现故障的传感器。
结合本发明实施例的第二方面,在本发明实施例的第二方面的第一种实现方式中,所述分析单元包括:
第一判断模块,用于若T1大于和/或,T1小于与T1之间的差值大于第一预设值,则判断所述第一传感器故障;其中,T1为第一温度值,为硬盘框中SSD入风口的第二温度值的平均值。
结合本发明实施例的第二方面,在本发明实施例的第二方面的第二种实现方式中,所述分析单元包括:
第二判断模块,用于若T2小于T1,和/或,T2大于且T2之间的差值大于第二预设值,则判断T2对应的所述第二传感器故障;其中,T1为第一温度值,T2为硬盘框中某个SSD入风口的第二温度值,T2为硬盘框中SSD入风口的第二温度值的平均值。
结合本发明实施例的第二方面,在本发明实施例的第二方面的第三种实现方式中,所述分析单元包括:
第三判断模块,用于若T3小于与T3与之间的差值大于第三预设值,则判断T3对应的所述第三传感器故障;和/或,若T3大于且T3与之间的差值大于第四预设值,则获取T3对应的所述SSD处理器的业务压力数据,根据所述业务压力数据判断T3对应的所述第三传感器是否出现故障;其中,T3为硬盘框中某个SSD处理器的第三温度值,为硬盘框中SSD处理器的第三温度值的平均值。
结合本发明实施例的第二方面,在本发明实施例的第二方面的第四种实现方式中,所述分析单元包括:
结合本发明实施例的第二方面、本发明实施例的第二方面的第一种至第四种实现方式中的任意一种,在本发明实施例的第二方面的第五种实现方式中,所述分析单元还包括:
第五判断模块,用于若在对SSD盘片施加不同的业务量情况下,传感器的温度值没有变化,则判断对应的传感器出现故障;所述传感器包括所述第一传感器、所述第二传感器以及所述第三传感器之中的任意一个或多个。
本发明实施例提供的技术方案中,在硬盘框入风口设置第一传感器以获取硬盘框入风口的第一温度值,在硬盘框中每个固态硬盘SSD设置第二传感器以获取每个固态硬盘SSD入风口的第二温度值,在硬盘框中每个SSD处理器设置第三传感器以获取每个SSD处理器的第三温度值,再根据获取的第一温度值、第二温度值和第三温度值进行分析,以综合评判采集的温度值是否准确,相应的传感器是否出现故障,并在后续的温度检测过程中忽略被判断为出现故障的传感器,以避免造成系统执行不正确的处理策略。因此相对于现有技术,本发明实施例可是提高SSD温度检测的准确性,避免数据丢失风险,并准确判断系统内的各个传感器是否出现异常,避免错误告警等不正确的处理策略,从而减少换盘,节约维护成本。
附图说明
图1为本发明实施例中温度检测方法的一个应用场景示意图;
图2为本发明实施例中温度检测方法一个实施例示意图;
图3为本发明实施例中温度检测装置一个实施例示意图。
具体实施方式
本发明实施例提供了一种温度检测方法及装置,可以准确检测各SSD的温度,识别哪些传感器出现了故障,避免造成系统执行不正确的处理策略,以下分别进行详细说明。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在存储阵列系统中,一个硬盘框中可以包含多个SSD,如图1所示,为本发明实施例中温度检测方法的一个应用场景示意图,其中,以一个硬盘框包含25个SSD为例进行说明,在硬盘框的入风口安装有第一传感器,该第一传感器用于采集硬盘框入风口的温度值,记为第一温度值T1;在硬盘框中每个SSD的入风口安装有第二传感器,该第二传感器用于采集每个SSD入风口的温度值,记为第二温度值T2;在硬盘框中的每个SSD处理器上安装有第三传感器,该第三传感器用于采集每个SSD处理器的温度值,记为第三温度值T3
请参阅图2,本发明实施例中温度检测方法一个实施例包括:
201、通过第一传感器获取硬盘框入风口的第一温度值T1
即获取第一传感器采集的第一温度值T1,其中,该第一温度值T1为硬盘框入风口的温度值。
202、通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值T2
即获取第二传感器采集的第二温度值T2,其中该第二温度值T2为硬盘框中每个固态硬盘SSD入风口的温度值。
203、通过第三传感器获取硬盘框中每个SSD处理器的第三温度值T3
即获取第三传感器采集的第三温度值T3,其中该第三温度值T3为每个SSD处理器的温度值。
需要说明的是,在本实施例中,上述步骤101至步骤103之间不存在时序限定,温度检测装置可以同时获取第一温度值T1、第二温度值T2和第三温度值T3。在本实施例中,为了保持数据同步的准确性,各个传感器可以采用相同的预设采集周期同步向温度检测装置发送温度数据,具体此处对上述获取各个温度值的方式不作限定。
204、根据预设规则对第一温度值T1、第二温度值T2和第三温度值T3进行分析,以判断对应的传感器是否出现故障;
在本实施例中,对获取的多个温度值进行分析,通过分析结果综合评判采集的温度值是否为异常温度值,以判断相应的传感器是否出现故障。下面分别对如何判断三类传感器(即第一传感器、第二传感器和第三传感器)是否出现故障进行详细说明:
首先,需要说明的是,作为优选,当获取到偏离常规值的温度,比如零下几十度或者零上几百度,可以直接判断该温度为异常温度,对应的传感器出现故障,从而节省判断程序。
(一)、第一传感器的故障判断
若T1大于,或者,T1小于与T1之间的差值大于第一预设值,则判断该第一传感器故障;
其中,为硬盘框中SSD入风口的第二温度值T2的平均值。
在本实施例中,的获取可以选用硬盘框中的所有的第二温度值T2作为样本,也有仅选用部分的第二温度值T2作为样本。以图1中的应用场景为例,将25个第二温度值T2作为样本,计算平均值得到也可以先去掉25个第二温度值T2中的一个最大值以及一个最小值,再将剩下的23个第二温度值T2作为样本,计算平均值得到具体此处对于的计算样本不作限定。
作为优选,上述第一预设值的取值可以为12℃,在实际应用过程中,第一预设值的具体取值也可以参考实际情况,具体此处不作限定。
需要说明的是,在实际应用过程中,对第一传感器的故障判断方式可以单独使用,也可以结合使用,具体此处不作限定。
(二)、第二传感器的故障判断
若T2小于T1,或者T2大于且T2之间的差值大于第二预设值,则判断T2对应的第二传感器故障;
其中,为硬盘框中SSD入风口的第二温度值的平均值。
作为优选,上述第二预设值的取值可以0℃~8℃之间,在实际应用过程中,第二预设值的具体取值也可以参考实际情况,具体此处不作限定。
在本实施例中,对第二传感器的故障判断还可以通过多个周期内的纵向比较,即:
对每个SSD入风口在多个周期内的第二温度值T2进行比较,若某个SSD入风口的第二温度值T2没有变化且其他SSD入风口的第二温度值T2有明显变化,则判断没有变化的第二温度值T2对应的第二传感器故障;
需要说明的是,在实际应用过程中,对第二传感器的故障判断方式可以单独使用,也可以结合使用,具体此处不作限定。
(三)、第三传感器的故障判断
若T3小于与T3与之间的差值大于第三预设值,则判断T3对应的第三传感器故障;
或者,
若T3大于且T3与之间的差值大于第四预设值,则获取T3对应的SSD处理器的业务压力数据,根据业务压力数据判断T3对应的第三传感器是否出现故障;
其中,为硬盘框中SSD处理器的第三温度值的平均值。
在本实施例中,的获取可以选用硬盘框中的所有的第二温度值T2作为样本,也有仅选用部分的第二温度值T2作为样本,具体此处不做限定。
作为优选,上述第三预设值的取值可以0℃~8℃之间,第四预设值的取值可以在8℃或者以上,在实际应用过程中,第二预设值的具体取值也可以参考实际情况,具体此处不作限定。
需要说明的是,当T3大于且T3与之间的差值大于第四预设值时,存在的情况包括以下两种:第三传感器故障或是SSD处理器因业务压力大而出现本身温度过高。因此,为准确判断是否是第三传感器出现了故障,需要先获取业务压力数据,根据该业务压力数据判断T3是否为异常温度,进而判断第三传感器是否出现了故障。
在本实施例中,对第三传感器的故障判断还可以通过多个周期内的纵向比较,即:
对每个SSD处理器在多个周期内的第三温度值进行比较,若某个SSD处理器的第三温度值没有变化且其他SSD入风口的第三温度值有明显变化,则判断没有变化的第三温度值对应的第三传感器故障。
需要说明的是,在实际应用过程中,对第三传感器的故障判断方式可以单独使用,也可以结合使用,具体此处不作限定。
上面分别对如何判断三类传感器是否出现故障进行了详细说明,需要说明的是,在实际应用过程中,可以是仅对其中的一类传感器进行故障判断,也可以同时对三类传感器均进行故障判断,具体可根据实际情况决定,此处不作限定。
可选地,在本实施例中,还可以结合其他的传感器故障判断方法对三类传感器进行故障判断,以提高温度检测的准确性,具体此处不作限定,例如:通过对SSD盘片施加不同的业务量进行故障判断,具体包括:若在对SSD盘片施加不同的业务量情况下,传感器的温度值没有变化,则判断对应的传感器出现故障;
其中,传感器包括第一传感器、第二传感器以及第三传感器之中的任意一个或多个。
105、在后续的温度检测过程中忽略被判断为出现故障的传感器;
在本实施例中,在经分析某个温度值为异常温度值,并判断对应的传感器出现故障后,在后续的温度检测过程中忽略被判断为出现故障的传感器,以避免造成系统执行不正确的处理策略,直至检测到的温度值恢复到正常水平。
可选地,在本实施例中,在步骤105之后,还可以进一步通过上下电操作判断之前被判断为出现故障的传感器是否已经恢复故障,具体包括:对SSD盘片进行上下电操作,若在上下电操作过程中,该被判断为出现故障的传感器的温度值没有变化,则判断该被判断为出现故障的传感器的没有恢复故障。
本发明实施例提供的技术方案中,在硬盘框入风口设置第一传感器以获取硬盘框入风口的第一温度值,在硬盘框中每个固态硬盘SSD设置第二传感器以获取每个固态硬盘SSD入风口的第二温度值,在硬盘框中每个SSD处理器设置第三传感器以获取每个SSD处理器的第三温度值,再根据获取的第一温度值、第二温度值和第三温度值进行分析,以综合评判采集的温度值是否准确,识别出相应的传感器是否出现故障,并在后续的温度检测过程中忽略被判断为出现故障的传感器,以避免造成系统执行不正确的处理策略。因此相对于现有技术,本发明实施例可是提高SSD温度检测的准确性,避免数据丢失风险,并准确判断系统内的各个传感器是否出现异常,避免错误告警等不正确的处理策略,从而减少换盘,节约维护成本。
上面对本发明实施例中的温度检测方法进行了描述,下面对本发明实施例中的温度检测装置进行描述,请参阅图3,本发明实施例中温度检测装置一个实施例包括:
获取单元301,用于通过第一传感器获取硬盘框入风口的第一温度值;通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;以及通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;
分析单元302,用于根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;
执行单元303,用于在后续的温度检测过程中忽略被判断为出现故障的传感器。
为便于理解,下面以一具体的应用场景对上述实施例中描述的温度检测装置进行详细描述,具体的:
获取单元301通过第一传感器获取硬盘框入风口的第一温度值;通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;以及通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;分析单元302根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;执行单元303在后续的温度检测过程中忽略被判断为出现故障的传感器。
可选地,在本实施例中,分析单元302具体可以包括:
第一判断模块3021,用于若T1大于和/或,T1小于与T1之间的差值大于第一预设值,则判断所述第一传感器故障;其中,T1为第一温度值,为硬盘框中SSD入风口的第二温度值的平均值。
可选地,在本实施例中,分析单元302具体可以包括:
第二判断模块3022,用于若T2小于T1,和/或,T2大于且T2之间的差值大于第二预设值,则判断T2对应的所述第二传感器故障;其中,T1为第一温度值,T2为硬盘框中某个SSD入风口的第二温度值,为硬盘框中SSD入风口的第二温度值的平均值。
可选地,在本实施例中,分析单元302具体可以包括:
第三判断模块3023,用于若T3小于与T3与之间的差值大于第三预设值,则判断T3对应的所述第三传感器故障;和/或,若T3大于且T3与之间的差值大于第四预设值,则获取T3对应的所述SSD处理器的业务压力数据,根据所述业务压力数据判断T3对应的所述第三传感器是否出现故障;其中,T3为硬盘框中某个SSD处理器的第三温度值,为硬盘框中SSD处理器的第三温度值的平均值。
可选地,在本实施例中,分析单元302具体可以包括:
第四判断模块3024,用于对每个SSD入风口在多个周期内的第二温度值进行比较,若某个SSD入风口的第二温度值没有变化且其他SSD入风口的第二温度值有明显变化,则判断没有变化的第二温度值对应的第二传感器故障;和/或,用于对每个SSD处理器在多个周期内的第三温度值进行比较,若某个SSD处理器的第三温度值没有变化且其他SSD入风口的第三温度值有明显变化,则判断没有变化的第三温度值对应的第三传感器故障。
可选地,在本实施例中,分析单元302还可以包括:
第五判断模块,用于若在对SSD盘片施加不同的业务量情况下,传感器的温度值没有变化,则判断对应的传感器出现故障;所述传感器包括所述第一传感器、所述第二传感器以及所述第三传感器之中的任意一个或多个。
本发明实施例提供的技术方案中,在硬盘框入风口设置第一传感器以获取硬盘框入风口的第一温度值,在硬盘框中每个固态硬盘SSD设置第二传感器以获取每个固态硬盘SSD入风口的第二温度值,在硬盘框中每个SSD处理器设置第三传感器以获取每个SSD处理器的第三温度值,分析单元302根据获取单元301获取的第一温度值、第二温度值和第三温度值进行分析,以综合评判采集的温度值是否准确,相应的传感器是否出现故障,执行单元303在后续的温度检测过程中忽略被判断为出现故障的传感器,以避免造成系统执行不正确的处理策略。因此相对于现有技术,本发明实施例可是提高SSD温度检测的准确性,避免数据丢失风险,并准确判断系统内的各个传感器是否出现异常,避免错误告警等不正确的处理策略,从而减少换盘,节约维护成本。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种温度检测方法,应用于存储阵列系统,其特征在于,包括:
通过第一传感器获取硬盘框入风口的第一温度值;
通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;
通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;
根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;
在后续的温度检测过程中忽略被判断为出现故障的传感器。
2.如权利要求1所述的温度检测方法,其特征在于,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
若T1大于和/或,T1小于与T1之间的差值大于第一预设值,则判断所述第一传感器故障;
其中,T1为第一温度值,为硬盘框中SSD入风口的第二温度值的平均值。
3.如权利要求1所述的温度检测方法,其特征在于,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
若T2小于T1,和/或,T2大于且T2之间的差值大于第二预设值,则判断T2对应的所述第二传感器故障;
其中,T1为第一温度值,T2为硬盘框中某个SSD入风口的第二温度值,为硬盘框中SSD入风口的第二温度值的平均值。
4.如权利要求1所述的温度检测方法,其特征在于,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
若T3小于与T3与之间的差值大于第三预设值,则判断T3对应的所述第三传感器故障;
和/或,
若T3大于且T3与之间的差值大于第四预设值,则获取T3对应的所述SSD处理器的业务压力数据,根据所述业务压力数据判断T3对应的所述第三传感器是否出现故障;
其中,T3为硬盘框中某个SSD处理器的第三温度值,为硬盘框中SSD处理器的第三温度值的平均值。
5.如权利要求1所述的温度检测方法,其特征在于,所述根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障包括:
对每个SSD入风口在多个周期内的第二温度值进行比较,若某个SSD入风口的第二温度值没有变化且其他SSD入风口的第二温度值有明显变化,则判断没有变化的第二温度值对应的第二传感器故障;
和/或,
对每个SSD处理器在多个周期内的第三温度值进行比较,若某个SSD处理器的第三温度值没有变化且其他SSD入风口的第三温度值有明显变化,则判断没有变化的第三温度值对应的第三传感器故障。
6.如权利要求1至5中任意一项所述的温度检测方法,其特征在于,所述方法还包括:
若在对SSD盘片施加不同的业务量情况下,传感器的温度值没有变化,则判断对应的传感器出现故障;所述传感器包括所述第一传感器、所述第二传感器以及所述第三传感器之中的任意一个或多个。
7.一种温度检测装置,应用于存储阵列系统,其特征在于,包括:
获取单元,用于通过第一传感器获取硬盘框入风口的第一温度值;通过第二传感器获取硬盘框中每个固态硬盘SSD入风口的第二温度值;以及通过第三传感器获取硬盘框中每个SSD处理器的第三温度值;
分析单元,用于根据预设规则对所述第一温度值、所述第二温度值和所述第三温度值进行分析,以判断对应的传感器是否出现故障;
执行单元,用于在后续的温度检测过程中忽略被判断为出现故障的传感器。
8.如权利要求7所述的温度检测装置,其特征在于,所述分析单元包括:
第一判断模块,用于若T1大于和/或,T1小于与T1之间的差值大于第一预设值,则判断所述第一传感器故障;其中,T1为第一温度值,为硬盘框中SSD入风口的第二温度值的平均值。
9.如权利要求7所述的温度检测装置,其特征在于,所述分析单元包括:
第二判断模块,用于若T2小于T1,和/或,T2大于且T2之间的差值大于第二预设值,则判断T2对应的所述第二传感器故障;其中,T1为第一温度值,T2为硬盘框中某个SSD入风口的第二温度值,为硬盘框中SSD入风口的第二温度值的平均值。
10.如权利要求7所述的温度检测装置,其特征在于,所述分析单元包括:
第三判断模块,用于若T3小于与T3与之间的差值大于第三预设值,则判断T3对应的所述第三传感器故障;和/或,若T3大于且T3与之间的差值大于第四预设值,则获取T3对应的所述SSD处理器的业务压力数据,根据所述业务压力数据判断T3对应的所述第三传感器是否出现故障;其中,T3为硬盘框中某个SSD处理器的第三温度值,为硬盘框中SSD处理器的第三温度值的平均值。
11.如权利要求7所述的温度检测装置,其特征在于,所述分析单元包括:
第四判断模块,用于对每个SSD入风口在多个周期内的第二温度值进行比较,若某个SSD入风口的第二温度值没有变化且其他SSD入风口的第二温度值有明显变化,则判断没有变化的第二温度值对应的第二传感器故障;和/或,用于对每个SSD处理器在多个周期内的第三温度值进行比较,若某个SSD处理器的第三温度值没有变化且其他SSD入风口的第三温度值有明显变化,则判断没有变化的第三温度值对应的第三传感器故障。
12.如权利要求7至11中任意一项所述的温度检测装置,其特征在于,所述分析单元还包括:
第五判断模块,用于若在对SSD盘片施加不同的业务量情况下,传感器的温度值没有变化,则判断对应的传感器出现故障;所述传感器包括所述第一传感器、所述第二传感器以及所述第三传感器之中的任意一个或多个。
CN201410709844.3A 2014-11-28 2014-11-28 一种温度检测方法及装置 Active CN105630657B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410709844.3A CN105630657B (zh) 2014-11-28 2014-11-28 一种温度检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410709844.3A CN105630657B (zh) 2014-11-28 2014-11-28 一种温度检测方法及装置

Publications (2)

Publication Number Publication Date
CN105630657A true CN105630657A (zh) 2016-06-01
CN105630657B CN105630657B (zh) 2018-09-28

Family

ID=56045630

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410709844.3A Active CN105630657B (zh) 2014-11-28 2014-11-28 一种温度检测方法及装置

Country Status (1)

Country Link
CN (1) CN105630657B (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959027A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种非易失性内存的预警方法及相关装置
CN109459654A (zh) * 2018-09-20 2019-03-12 华为技术有限公司 一种连接异常确定的方法、装置及系统
CN110823284A (zh) * 2019-10-15 2020-02-21 山东乐乐智能科技有限公司 一种智能环境监测设备及监测方法
CN111744341A (zh) * 2020-07-09 2020-10-09 四川轻化工大学 低温等离子体有机废气处理的防爆监测控制方法与系统
CN113628674A (zh) * 2021-07-09 2021-11-09 杭州电子科技大学 一种RAIM构架SSD中故障eMMC定位方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101153809A (zh) * 2006-09-29 2008-04-02 通用电气公司 用于评估传感器和/或用于控制包括传感器的装置的操作的方法和装置
CN101216356A (zh) * 2007-01-04 2008-07-09 海尔集团公司 一种温度传感器的故障检测方法及装置
CN101236231A (zh) * 2007-01-31 2008-08-06 通用汽车环球科技运作公司 用于监控温度传感装置的方法和设备
CN101476510A (zh) * 2008-01-02 2009-07-08 通用汽车环球科技运作公司 温度传感器诊断

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101153809A (zh) * 2006-09-29 2008-04-02 通用电气公司 用于评估传感器和/或用于控制包括传感器的装置的操作的方法和装置
CN101216356A (zh) * 2007-01-04 2008-07-09 海尔集团公司 一种温度传感器的故障检测方法及装置
CN101236231A (zh) * 2007-01-31 2008-08-06 通用汽车环球科技运作公司 用于监控温度传感装置的方法和设备
CN101476510A (zh) * 2008-01-02 2009-07-08 通用汽车环球科技运作公司 温度传感器诊断

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108959027A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种非易失性内存的预警方法及相关装置
CN109459654A (zh) * 2018-09-20 2019-03-12 华为技术有限公司 一种连接异常确定的方法、装置及系统
CN110823284A (zh) * 2019-10-15 2020-02-21 山东乐乐智能科技有限公司 一种智能环境监测设备及监测方法
CN111744341A (zh) * 2020-07-09 2020-10-09 四川轻化工大学 低温等离子体有机废气处理的防爆监测控制方法与系统
CN111744341B (zh) * 2020-07-09 2022-06-17 四川轻化工大学 低温等离子体有机废气处理的防爆监测控制方法与系统
CN113628674A (zh) * 2021-07-09 2021-11-09 杭州电子科技大学 一种RAIM构架SSD中故障eMMC定位方法
CN113628674B (zh) * 2021-07-09 2023-08-18 杭州电子科技大学 一种RAIM构架SSD中故障eMMC定位方法

Also Published As

Publication number Publication date
CN105630657B (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN105630657B (zh) 一种温度检测方法及装置
JP6585482B2 (ja) 機器診断装置及びシステム及び方法
US9245116B2 (en) Systems and methods for remote monitoring, security, diagnostics, and prognostics
US20100313072A1 (en) Failure Analysis Based on Time-Varying Failure Rates
WO2016103650A1 (ja) 運用管理装置、運用管理方法、及び、運用管理プログラムが記録された記録媒体
JP6219865B2 (ja) 制御装置の故障予測システム
CN112732477B (zh) 一种带外自检故障隔离的方法
EP3321807B1 (en) Disk detection method and device
US10157115B2 (en) Detection system and method for baseboard management controller
CN103455395A (zh) 一种硬盘故障的检测方法及装置
CN105068901A (zh) 一种磁盘检测的方法
US11115288B2 (en) Parameter setting method, data analysis device and data analysis system
CN102541679B (zh) 一种用于测试gpu卡的方法和系统
CN111637924A (zh) 一种挖掘机异常的检测方法、检测装置及可读存储介质
JP5933386B2 (ja) データ管理装置及びプログラム
CN105204968A (zh) 一种故障内存检测方法和装置
US20140058615A1 (en) Fleet anomaly detection system and method
CN104615519A (zh) 一种linux系统下检测服务器内存容量是否缺失的方法
JP2014021577A (ja) 故障予測装置、故障予測システム、故障予測方法、及び、故障予測プログラム
CN111858244A (zh) 一种硬盘的监控方法、系统、设备以及介质
CN102681928B (zh) 计算机系统的异常信息输出系统
JP2012058782A (ja) コンピュータ装置の異常検査方法及びそれを用いたコンピュータ装置
US9378082B1 (en) Diagnosis of storage system component issues via data analytics
CN107643877B (zh) 磁盘故障检测方法以及装置
US8060332B2 (en) Method for testing sensor function and computer program product thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant