CN109684140B - 一种慢盘检测方法、装置、设备及计算机可读存储介质 - Google Patents

一种慢盘检测方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109684140B
CN109684140B CN201811511647.5A CN201811511647A CN109684140B CN 109684140 B CN109684140 B CN 109684140B CN 201811511647 A CN201811511647 A CN 201811511647A CN 109684140 B CN109684140 B CN 109684140B
Authority
CN
China
Prior art keywords
disk
time delay
slow
command
queue
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811511647.5A
Other languages
English (en)
Other versions
CN109684140A (zh
Inventor
刘树亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Inspur Smart Computing Technology Co Ltd
Original Assignee
Guangdong Inspur Big Data Research Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Inspur Big Data Research Co Ltd filed Critical Guangdong Inspur Big Data Research Co Ltd
Priority to CN201811511647.5A priority Critical patent/CN109684140B/zh
Publication of CN109684140A publication Critical patent/CN109684140A/zh
Application granted granted Critical
Publication of CN109684140B publication Critical patent/CN109684140B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/81Threshold

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Abstract

本发明公开了一种慢盘检测方法,通过获取I/O时延;发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。本申请中首先获取I/O时延,然后将磁盘自检命令发送至磁盘,磁盘进行自检,只有在所述I/O时延满足预设慢盘条件的次数达到预设条件时,才会判定磁盘为慢盘,使慢盘判定结果更加准确。此外本申请还提供了一种具有上述优点的装置、设备及计算机可读存储介质。

Description

一种慢盘检测方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及计算机技术领域,特别是涉及一种慢盘检测方法、装置、设备及计算机可读存储介质。
背景技术
磁盘出现磁头退化、磁盘老化或者受到其他外界因素影响时,该磁盘与其他同型号的磁盘相比,会出现I/O响应慢、性能降低等问题,该磁盘即成为慢盘。
在磁盘存储阵列系统中,只要有一个慢盘就会对整个磁盘存储系统产生影响,延长磁盘存储阵列系统的I/O响应时间,使整个系统的性能降低。因此,需要对每一个磁盘进行检测,以及时发现是否存在慢盘。现有技术中,一般将I/O响应时间超过某一预设阈值作为判定条件,但是,对磁盘这样判定有时候并不能准确、有效地判定出该磁盘即为慢盘。
发明内容
本发明的目的是提供一种慢盘检测方法,以解决现有技术中慢盘判定不精确的问题。
为解决上述技术问题,本发明提供一种慢盘检测方法,包括:
获取I/O时延;
发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。
可选的,所述获取I/O时延包括:
在异常I/O队列中查找时延满足预设时间阈值的异常I/O,获取所述异常I/O的平均I/O时延;
或者,发送读测试命令和写测试命令,获取测试I/O时延。
可选的,所述预设条件包括:
预设时间内,满足所述预设慢盘条件达到预设次数。
可选的,还包括:
获取第一时延;
当所述第一时延满足第一预设条件时,获取所述I/O时延,在第一预设时间内获取所述I/O时延的次数达到预设次数阈值时,则判定所述磁盘为慢盘。
可选的,在所述判定所述磁盘为慢盘之后还包括:
发送慢盘确定信息,以便用户及时更换所述磁盘。
可选的,在所述获取第一时延之前还包括:
发送I/O命令至所述磁盘;
将所述I/O命令加入至正常I/O队列;
接收所述磁盘返回的SCSI的状态;
当所述状态为良好时,接收所述磁盘返回的数据和所述状态,并将所述I/O命令移除所述正常I/O队列;当所述状态为不佳时,将所述I/O命令加入异常I/O队列,并进行异常容错处理,若所述异常容错处理失败或者所述I/O命令无法恢复,接收所述磁盘返回的失败结果,并将所述I/O命令移除所述异常I/O队列;
统计所述正常I/O队列和所述异常I/O队列中所有I/O命令的平均时延,其中所述平均时延包括平均读时延、平均写时延、平均读写时延和最大时延。
可选的,对所述正常I/O队列进行多核多线程处理。
本发明还提供一种慢盘检测装置,包括:
获取模块,用于获取I/O时延;
发送模块,用于发送磁盘自检命令至磁盘,以便所述磁盘进行自检;
判断模块,用于判断所述I/O时延满足预设慢盘条件的次数是否达到预设条件。
本发明还提供一种慢盘检测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一种所述慢盘检测方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种所述慢盘检测方法的步骤。
本发明所提供的一种慢盘检测方法,通过获取I/O时延;发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。本申请中首先获取I/O时延,然后将磁盘自检命令发送至磁盘,磁盘进行自检,只有在所述I/O时延满足预设慢盘条件的次数达到预设条件时,才会判定磁盘为慢盘,使慢盘判定结果更加准确。此外本申请还提供了一种具有上述优点的装置、设备及计算机可读存储介质。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明所提供的一种慢盘检测方法的流程图;
图2为本发明所提供的另一种慢盘检测方法的流程图;
图3为本发明所提供的另一种慢盘检测方法的流程图;
图4为本发明所提供的另一种慢盘检测方法的流程图;
图5为本发明所提供的慢盘检测装置的一种结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例公开了一种慢盘检测方法,参照图1,该方法包括:
步骤S101:获取I/O时延。
需要说明的是,本实施例中并不对获取I/O时延的具体过程进行限定,用户可以自行设定。
作为一种具体实施方式,获取I/O时延可以具体包括在异常I/O队列中查找时延满足预设时间阈值的异常I/O,获取所述异常I/O的平均I/O时延,或者发送读测试命令和写测试命令,获取测试I/O时延。
步骤S102:发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。
需要指出的是,本实施例中对预设慢盘条件并不做具体限定,根据具体情况自行设定。例如,当获取I/O时延具体为在异常I/O队列中查找时延满足预设阈值的I/O,获取所述I/O的平均I/O时延时,预设慢盘条件可以设定为异常I/O队列中的平均I/O时延超过10倍的本磁盘的平均I/O时延,或者异常I/O队列中的平均I/O时延超过300ms;当获取I/O时延具体为发送读测试命令和写测试命令,获取测试I/O时延时,预设慢盘条件可以设定为测试I/O时延超过10倍的本磁盘的平均I/O时延,或者测试I/O时延超过300ms。
进一步的,本实施例中对预设条件也不做具体限定,用户可以自行设定。
作为一种具体实施方式,所述预设条件包括预设时间内,满足所述预设慢盘条件达到预设次数。例如,预设条件可以设置为24小时内,满足所述预设慢盘条件达到6次,或者连续7个24小时内,满足所述预设慢盘条件达到20次。
本实施例所提供的慢盘检测方法,通过获取I/O时延;发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。本实施例中首先获取I/O时延,然后将磁盘自检命令发送至磁盘,磁盘进行自检,只有在所述I/O时延满足预设慢盘条件的次数达到预设条件时,才会判定磁盘为慢盘,使慢盘判定结果更加准确。
在上述实施例的基础上,本发明所提供的慢盘检测方法的另一种具体实施方式的流程图如图2所示,该方法还包括:
步骤S201:获取第一时延。
需要指出的是,本实施例中对获取第一时延的具体方式并不做具体限定,用户可以根据需要自行设定。例如,可以为发送一种SCSI(Small Computer System Interface,小型计算机系统接口)命令至磁盘,如发送OTUR(Ordered Test Unit Ready,顺序的测试单元就绪)命令给磁盘,统计磁盘执行OTUR命令执行完成并返回的时间,该时间即为第一时延;或者在正常I/O队列和异常I/O队列中查询时延最长的I/O指令执行完成并返回的时间,该时间即为第一时延;或者发送长度为一个块大小的读命令,统计该命令执行完成并返回的时间,该时间即为第一时延。
步骤S202:当所述第一时延满足第一预设条件时,获取所述I/O时延,在第一预设时间内获取所述I/O时延的次数达到预设次数阈值时,则判定所述磁盘为慢盘。
需要说明的是,本实施例中并不对第一预设条件做具体限定,用户可以自行设定。例如,可以将第一预设条件设置为超过正常I/O队列和异常I/O队列中所有I/O命令的平均时延的2倍,或者将第一预设条件设置为超过0.5秒。进一步的,本实施例中对第一预设时间和预设次数阈值也不做具体限定。例如,可以将第一预设时间设置为24小时,预设次数阈值设置为20次,当然还可以设置成其他具体时间和具体次数,本实施例在此不再进行赘述。
本实施例中所提供的慢盘检测方法,通过获取第一时延,当第一时延满足第一预设条件时,获取所述I/O时延,当在第一预设时间内获取I/O时延的次数达到预设次数阈值时,则判定所述磁盘为慢盘,增加了慢盘的检测方式,增加将磁盘确定为慢盘的准确率。
在上述实施例的基础上,请参考图3,图3为本发明所提供的慢盘检测方法的另一种具体实施方式的流程图,在所述判定所述磁盘为慢盘之后,该方法还包括:
发送慢盘确定信息,以便用户及时更换所述磁盘。
具体的,当判断出磁盘为慢盘后,将该磁盘踢出RAID(Redundant Arrays ofIndependent Disks,独立磁盘冗余阵列),当RAID中没有热备盘时,则不会将该磁盘踢出,发送慢盘确定信息,及时通知用户磁盘状况,更换磁盘。
本实施例中提供的慢盘检测方法,可以及时将慢盘确定信息发送给用户,并记录时间戳等重要信息及时上报,一方面,对于存储产品用户来说,可以及时了解到磁盘故障问题,及时更换磁盘,保证用户数据安全性以及存储产品的稳定性和可靠性;另一方面,对于磁盘厂商用户来说,可以及时发现磁盘故障并触发磁盘故障备份信息,结合出现问题的时间戳信息高效地分析磁盘故障问题,提升磁盘产品的稳定性和竞争力。
在上述实施例的基础上,请参考图4,图4为本发明所提供的慢盘检测方法的另一种具体实施方式的流程图,在所述获取第一时延之前还包括:
步骤S401:发送I/O命令至所述磁盘。
步骤S402:将所述I/O命令加入至正常I/O队列。
步骤S403:接收所述磁盘返回的SCSI的状态。
步骤S404:当所述状态为良好时,接收所述磁盘返回的数据和所述状态,并将所述I/O命令移除所述正常I/O队列;当所述状态为不佳时,将所述I/O命令加入异常I/O队列,并进行异常容错处理,若所述异常容错处理失败或者所述I/O命令无法恢复,接收所述磁盘返回的失败结果,并将所述I/O命令移除所述异常I/O队列。
作为一种具体实施方式,对所述正常I/O队列进行多核多线程快速处理,以优化所述磁盘性能。
需要指出的是,本实施例中异常I/O队列与正常I/O队列进行区别处理,将异常I/O指令放入异常处理线程。
步骤S405:统计所述正常I/O队列和所述异常I/O队列中所有I/O命令的平均时延,其中所述平均时延包括平均读时延、平均写时延、平均读写时延和最大时延四项。
可以理解的是,正常I/O队列和所述异常I/O队列中所有I/O命令的平均时延即为本磁盘的平均I/O时延。
本实施例所提供的慢盘检测方法,首先对正常I/O队列和异常I/O队列中的I/O进行维护,当任何一个I/O命令执行完成的时间超过时间阈值后,就开始对磁盘进行慢盘检测,使慢盘检测的准确性提高。
下面以一具体情况对本发明所提供的慢盘检测方法进行进一步阐述。
SAS(Statistical Analysis System)驱动器或者上层发送I/O命令至磁盘,将I/O命令加入至正常I/O队列,并记录发送出I/O命令之后的时间,I/O命令执行完成后,接收磁盘返回的SCSI的状态,当返回的状态为良好时,接收磁盘返回的数据和状态,并将I/O命令移除所述正常I/O队列,其中,对正常I/O队列进行多核多线程快速处理;当返回的状态为不佳时,将I/O命令加入异常I/O队列,并进行异常容错处理,若异常容错处理仍然失败或者所述I/O命令无法恢复,接收磁盘返回的失败结果,并将I/O命令移除异常I/O队列,其中,对异常I/O队列做的处理区别于正常I/O队列,将异常I/O队列放入异常处理线程。统计正常I/O队列和异常I/O队列中所有I/O命令的平均时延,其中平均时延包括平均读时延、平均写时延、平均读写时延和最大时延四项。
一般RAID层具有自己的超时时限,正常I/O队列和异常I/O队列中任何一个I/O时延超过超时时限,便触发慢盘检测的过程,慢盘检测由上层触发。
发送OTUR命令给磁盘,统计磁盘执行OTUR命令执行完成并返回的时间,或者在正常I/O队列和异常I/O队列中查询时延最长的I/O指令执行完成并返回的时间,或者发送长度为一个块大小的读命令,统计该命令执行完成并返回的时间,当上述任意一个时间超过平均时延的2倍或者超过0.5秒,则在异常I/O队列中查找时延满足预设时间阈值的异常I/O,获取异常I/O队列中的平均I/O时延,或者发送读测试命令和写测试命令,获取测试I/O时延,然后发送磁盘自检命令至磁盘,使磁盘进行自检,当异常I/O队列中的平均I/O时延或者测试I/O时延满足预设慢盘条件时,记录一次慢盘,若在24小时内出现6次慢盘记录或者在连续的7个24小时内,出现20次慢盘记录,就判定该磁盘为慢盘,将该磁盘踢出RAID,但是,当RAID中没有热备盘时,不会踢出。
其中,在异常I/O队列中查找时延满足预设阈值的I/O,获取所述I/O的平均I/O时延时,预设慢盘条件设定为异常I/O队列中的平均I/O时延超过10倍的本磁盘的平均I/O时延,或者异常I/O队列中的平均I/O时延超过300ms;获取I/O时延具体为发送读测试命令和写测试命令,获取测试I/O时延时,预设慢盘条件设定为测试I/O时延超过10倍的本磁盘的平均I/O时延,或者测试I/O时延超过300ms。
如果在24小时内,在异常I/O队列中查找时延满足预设阈值的I/O,获取异常I/O队列中的平均I/O时延超过20次,或者发送读测试命令和写测试命令,获取测试I/O时延超过20次,同样判定该磁盘为慢盘。
最后,发送慢盘确定消息,通知用户及时更换该磁盘。
下面对本发明实施例提供的慢盘检测装置进行介绍,下文描述的慢盘检测装置与上文描述的慢盘检测方法可相互对应参照。
请参照图5,图5为本发明实施例提供的慢盘检测装置的结构框图,该装置可以包括:
获取模块100,用于获取I/O时延;
发送模块200,用于发送磁盘自检命令至磁盘,以便所述磁盘进行自检;
判断模块300,用于判断所述I/O时延满足预设慢盘条件的次数是否达到预设条件。
本发明所提供的一种慢盘检测装置,通过获取I/O时延;发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。本申请中首先获取I/O时延,然后将磁盘自检命令发送至磁盘,磁盘进行自检,只有在所述I/O时延满足预设慢盘条件的次数达到预设条件时,才会判定磁盘为慢盘,使慢盘判定结果更加准确。
作为一种具体实施方式,所述获取模块100具体用于在异常I/O队列中查找时延满足预设时间阈值的异常I/O,获取所述异常I/O的平均I/O时延;或者发送读测试命令和写测试命令,获取测试I/O时延。
下面对本发明实施例所提供的慢盘检测设备进行介绍,下文描述的慢盘检测设备与上文描述的慢盘检测方法可相互对应参照。
本发明还提供一种慢盘检测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一种所述慢盘检测方法的步骤。
本发明所提供的慢盘检测设备,通过获取I/O时延;发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。本申请中首先获取I/O时延,然后将磁盘自检命令发送至磁盘,磁盘进行自检,只有在所述I/O时延满足预设慢盘条件的次数达到预设条件时,才会判定磁盘为慢盘,使慢盘判定结果更加准确。
下面对本发明实施例所提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的慢盘检测方法可相互对应参照。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种所述慢盘检测方法的步骤。
本发明所提供的计算机可读存储介质,通过获取I/O时延;发送磁盘自检命令至磁盘,以便所述磁盘进行自检,当所述I/O时延满足预设慢盘条件的次数达到预设条件时,则判定所述磁盘为慢盘。本申请中首先获取I/O时延,然后将磁盘自检命令发送至磁盘,磁盘进行自检,只有在所述I/O时延满足预设慢盘条件的次数达到预设条件时,才会判定磁盘为慢盘,使慢盘判定结果更加准确。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本发明所提供的慢盘检测方法、装置、设备以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (8)

1.一种慢盘检测方法,其特征在于,包括:
发送I/O命令至所述磁盘;
将所述I/O命令加入至正常I/O队列;
接收所述磁盘返回的SCSI的状态;
当所述状态为良好时,接收所述磁盘返回的数据和状态,并将所述I/O命令移除所述正常I/O队列;当所述状态为不佳时,将所述I/O命令加入异常I/O队列,并进行异常容错处理;若异常容错处理失败或者所述I/O命令无法恢复,接收所述磁盘返回的失败结果,并将所述I/O命令移除所述异常I/O队列;
统计所述正常I/O队列和所述异常I/O队列中所有I/O命令的平均时延,其中所述平均时延包括平均读时延、平均写时延、平均读写时延和最大时延;
获取与所述平均时延对应的第一预设条件和第一时延;
当所述第一时延满足所述第一预设条件时,获取I/O时延,在第一预设时间内获取所述I/O时延的次数达到预设次数阈值时,则判定所述磁盘为慢盘。
2.如权利要求1所述的慢盘检测方法,其特征在于,所述获取I/O时延包括:
在异常I/O队列中查找时延满足预设时间阈值的异常I/O,获取异常I/O的平均I/O时延;
或者,发送读测试命令和写测试命令,获取测试I/O时延。
3.如权利要求2所述的慢盘检测方法,其特征在于,所述预设条件包括:
预设时间内满足所述预设慢盘条件达到预设次数。
4.如权利要求1所述的慢盘检测方法,其特征在于,在所述判定所述磁盘为慢盘之后还包括:
发送慢盘确定信息,以便用户及时更换所述磁盘。
5.如权利要求1所述的慢盘检测方法,其特征在于,对所述正常I/O队列进行多核多线程处理。
6.一种慢盘检测装置,其特征在于,包括:
获取模块,用于获取I/O时延;
发送模块,用于发送磁盘自检命令至磁盘,以便所述磁盘进行自检;
判断模块,用于判断所述I/O时延满足预设慢盘条件的次数是否达到预设条件;
发送模块,用于发送I/O命令至所述磁盘;
队列添加模块,用于将所述I/O命令加入至正常I/O队列;
接收模块,用于接收所述磁盘返回的SCSI的状态;
I/O命令处理模块,用于当所述状态为良好时,接收所述磁盘返回的数据和状态,并将所述I/O命令移除所述正常I/O队列;当所述状态为不佳时,将所述I/O命令加入异常I/O队列,并进行异常容错处理;若异常容错处理失败或者所述I/O命令无法恢复,接收所述磁盘返回的失败结果,并将所述I/O命令移除所述异常I/O队列;
统计模块,用于统计所述正常I/O队列和所述异常I/O队列中所有I/O命令的平均时延,其中所述平均时延包括平均读时延、平均写时延、平均读写时延和最大时延;
获取模块,用于获取与所述平均时延对应的第一预设条件和第一时延;
判断模块,用于当所述第一时延满足所述第一预设条件时,获取I/O时延,在第一预设时间内获取所述I/O时延的次数达到预设次数阈值时,则判定所述磁盘为慢盘。
7.一种慢盘检测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述慢盘检测方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述慢盘检测方法的步骤。
CN201811511647.5A 2018-12-11 2018-12-11 一种慢盘检测方法、装置、设备及计算机可读存储介质 Active CN109684140B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811511647.5A CN109684140B (zh) 2018-12-11 2018-12-11 一种慢盘检测方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811511647.5A CN109684140B (zh) 2018-12-11 2018-12-11 一种慢盘检测方法、装置、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109684140A CN109684140A (zh) 2019-04-26
CN109684140B true CN109684140B (zh) 2022-07-01

Family

ID=66187210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811511647.5A Active CN109684140B (zh) 2018-12-11 2018-12-11 一种慢盘检测方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109684140B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241343B (zh) * 2019-07-19 2024-02-23 深信服科技股份有限公司 一种慢盘检测方法、装置、电子设备及可读存储介质
CN111104239A (zh) * 2019-11-21 2020-05-05 北京浪潮数据技术有限公司 一种分布式存储集群的硬盘故障处理方法、系统及装置
CN112199046A (zh) * 2020-10-12 2021-01-08 苏州浪潮智能科技有限公司 一种分布式集群性能的优化方法、装置、终端及存储介质
CN112416639B (zh) * 2020-11-16 2022-08-23 新华三技术有限公司成都分公司 一种慢盘检测方法、装置、设备及存储介质
CN112579379B (zh) * 2020-12-24 2024-02-23 深信服科技股份有限公司 一种卡慢盘的识别处理方法、系统、装置及可读存储介质
CN115348157B (zh) * 2021-05-14 2023-09-05 中国移动通信集团浙江有限公司 分布式存储集群的故障定位方法、装置、设备及存储介质
CN113223598B (zh) * 2021-05-31 2024-02-23 济南浪潮数据技术有限公司 一种基于io劫持的磁盘测试方法、装置、设备及介质
CN113849123B (zh) * 2021-08-14 2023-08-25 苏州浪潮智能科技有限公司 一种慢盘的数据处理方法、系统、设备以及介质
CN114003477B (zh) * 2021-10-27 2023-08-22 苏州浪潮智能科技有限公司 慢盘诊断信息收集方法、系统、终端及存储介质
CN114706720B (zh) * 2022-06-06 2022-09-06 南京鹏云网络科技有限公司 分布式存储系统慢盘判断方法、系统、设备及存储介质
CN116149557B (zh) * 2023-02-21 2023-07-18 北京志凌海纳科技有限公司 一种面向制造业的慢盘检测策略系统及方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7130255B2 (en) * 2002-04-19 2006-10-31 Gateway Inc. Method of CD/DVD vibration detection by monitoring motor conditions
US20070011398A1 (en) * 2003-05-26 2007-01-11 Koninklijke Philips Electronics N.V. Method and device for transferring data between a main memory and a storage device
JP2011140376A (ja) * 2010-01-06 2011-07-21 Mitsubishi Electric Building Techno Service Co Ltd マンコンベアの制動装置
CN103019623B (zh) * 2012-12-10 2016-01-20 华为技术有限公司 存储盘处理方法及装置
CN106354590B (zh) * 2015-07-17 2020-04-24 中兴通讯股份有限公司 磁盘检测方法和装置
CN106407052B (zh) * 2015-07-31 2019-09-13 华为技术有限公司 一种检测磁盘的方法及装置
CN105630416B (zh) * 2015-12-24 2018-10-26 创新科存储技术(深圳)有限公司 一种云存储系统中的踢盘方法及装置
US10168942B2 (en) * 2016-09-01 2019-01-01 Vmware, Inc. Automatically removing dependency on slow disks in a distributed storage system
CN107577441B (zh) * 2017-10-17 2020-08-21 苏州浪潮智能科技有限公司 一种osd慢盘处理方法、系统、装置及计算机存储介质

Also Published As

Publication number Publication date
CN109684140A (zh) 2019-04-26

Similar Documents

Publication Publication Date Title
CN109684140B (zh) 一种慢盘检测方法、装置、设备及计算机可读存储介质
CN106354590B (zh) 磁盘检测方法和装置
US7506314B2 (en) Method for automatically collecting trace detail and history data
CN109614045B (zh) 一种元数据落盘方法、装置及相关设备
US10606490B2 (en) Storage control device and storage control method for detecting storage device in potential fault state
CN113672415A (zh) 一种磁盘故障处理方法、装置、设备及存储介质
CN110659147B (zh) 一种基于模块自检行为的自修复方法和系统
CN116775362A (zh) 独立冗余磁盘阵列的通路阻塞处理方法、系统
US20150286548A1 (en) Information processing device and method
CN109542341B (zh) 一种读写io监测方法、装置、终端及计算机可读存储介质
CN114758714A (zh) 一种硬盘故障预测方法、装置、电子设备及存储介质
CN107301109B (zh) 一种硬盘质量筛选方法及装置
CN114218037A (zh) 一种硬盘管理方法、装置、设备及机器可读存储介质
CN106648969B (zh) 一种磁盘中损坏数据巡检方法及系统
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
Li et al. From correctable memory errors to uncorrectable memory errors: What error bits tell
US20070277059A1 (en) Storage device, control device, and error reporting method
WO2021027271A1 (zh) 坏块信息保护方法、装置、计算机设备及存储介质
US8089712B2 (en) Abnormality determining apparatus
CN116578459A (zh) 一种慢盘监测及处理方法、装置及计算机可读存储介质
CN115470059A (zh) 一种磁盘检测方法、装置、设备及存储介质
CN114327266B (zh) 一种存储装置的卡慢识别方法、装置、介质
CN113849123B (zh) 一种慢盘的数据处理方法、系统、设备以及介质
CN113625957B (zh) 一种硬盘故障的检测方法、装置及设备
US20200264946A1 (en) Failure sign detection device, failure sign detection method, and recording medium in which failure sign detection program is stored

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant