CN102147708A - 一种磁盘检测方法及装置 - Google Patents

一种磁盘检测方法及装置 Download PDF

Info

Publication number
CN102147708A
CN102147708A CN201010116498.XA CN201010116498A CN102147708A CN 102147708 A CN102147708 A CN 102147708A CN 201010116498 A CN201010116498 A CN 201010116498A CN 102147708 A CN102147708 A CN 102147708A
Authority
CN
China
Prior art keywords
disk
data
read
write
lba
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201010116498.XA
Other languages
English (en)
Other versions
CN102147708B (zh
Inventor
李步蟾
晏大洪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu Huawei Technology Co Ltd
Original Assignee
Huawei Symantec Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Symantec Technologies Co Ltd filed Critical Huawei Symantec Technologies Co Ltd
Priority to CN201010116498.XA priority Critical patent/CN102147708B/zh
Publication of CN102147708A publication Critical patent/CN102147708A/zh
Application granted granted Critical
Publication of CN102147708B publication Critical patent/CN102147708B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例公开了一种磁盘检测方法,包括当磁盘完成数据读写操作时,计算所述磁盘执行所述数据读写操作的响应时间;当所述响应时间超过预设的时间阈值时,将所述磁盘离线;对所述离线的磁盘进行检测,以判断是否是故障磁盘。本发明实施例还公开了一种磁盘检测装置以及一种存储控制器。本发明实施例可以将虽出现短时故障但可继续使用的磁盘与真正出现故障的磁盘区分开来。

Description

一种磁盘检测方法及装置
技术领域
本发明涉及存储领域,尤其涉及一种磁盘检测方法及装置。
背景技术
磁盘阵列将大量的磁盘组合在一起,通过存储控制器对外提供存储服务。业务主机与磁盘阵列连接,将数据存入磁盘阵列中的磁盘中或者从磁盘阵列中的磁盘中读取数据。业务主机为每条IO请求设置了超时时间,执行该IO请求的时间超时,就会导致执行失败。当磁盘阵列中有磁盘故障时,IO响应缓慢,可能会出现业务主机下发十条IO请求命令,而磁盘只及时处理了一条,其他九条IO请求命令都执行失败的情况,那么这九条IO请求命令就可能会丢失。在某些业务场景下,如果对业务主机的实时性要求较高,还可能会造成业务中断。
在现有技术,通常将该执行IO请求超时的磁盘确定为故障磁盘,另外使用正常磁盘代替该磁盘继续工作,而该磁盘可能是由于外部环境的异常,导致短时间IO响应缓慢,一旦外部环境恢复正常,该磁盘也恢复正常,因此现有技术没有将这种磁盘与真正出现故障的磁盘区分开来,可能会使仅出现短时故障但可以继续使用的磁盘暂停使用,不利于阵列的正常运行,也会造成资源的浪费。
发明内容
本发明实施例提供了一种磁盘检测方法及装置,可以将虽出现短时故障但可继续使用的磁盘与真正出现故障的磁盘区分开来,保证了阵列的正常运行。
本发明实施例提供的磁盘检测方法,包括:
当磁盘完成数据读写操作时,计算所述磁盘执行所述数据读写操作的响应时间;
当所述响应时间超过预设的时间阈值时,将所述磁盘离线;
对所述离线的磁盘进行检测,以判断出故障磁盘。
本发明实施例提供的磁盘检测装置,包括:
计算模块,用于当磁盘完成数据读写操作时,计算所述磁盘执行所述数据读写操作的响应时间;
处理模块,用于当所述响应时间超过预设的时间阈值时,将所述磁盘离线;
检测模块,用于对所述离线的磁盘进行检测,以判断出故障磁盘。
本发明实施例提供的存储控制器,包括上述磁盘检测装置。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在磁盘完成数据读写操作时,计算该磁盘执行数据读写操作的响应时间,若响应磁盘超过预设的时间阈值,则将该磁盘判定为可疑故障磁盘,将该磁盘离线,再对该离线后的磁盘进行检测,以进一步确定是否是故障磁盘,从而能够快速、准确地检测出处理数据读写操作响应慢的磁盘,保证主机业务的正常运行,并且能够区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘,保证了阵列的正常运行。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的应用场景图;
图2为本发明实施例中磁盘检测方法一个实施例示意图;
图3为本发明实施例中磁盘检测方法另一实施例示意图;
图4为本发明实施例中磁盘检测方法另一实施例示意图;
图5为本发明实施例中磁盘检测装置实施例的结构示意图;
图6为本发明实施例中磁盘检测装置另一个实施例的结构示意图;
图7为本发明实施例中磁盘检测装置实施例检测模块的结构示意图;
图8为本发明实施例中存储控制器实施例的结构示意图。
具体实施方式
下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图2,本发明实施例中磁盘检测方法一个实施例包括:
100、当磁盘完成数据读写操作时,计算该磁盘执行该数据读写操作的响应时间;
具体的,如图1所示,存储控制器与大量磁盘一起构成存储阵列,共同对外提供数据存储服务,业务主机通过存储控制器对磁盘进行读写。
在本实施例中,存储控制器中的业务模块接收来自业务主机的IO请求,根据该IO请求确定所需读写的磁盘的逻辑块地址LBA(Logical BlockAddress)和读写长度,将该IO请求下发到磁盘阵列中所确定的磁盘以进行数据读写操作,LBA即读取或者写入该磁盘的地址,当磁盘完成数据读写操作时,会将该数据读写操作的响应请求发送给存储控制器中的业务模块。
存储控制器接收到该响应请求后,可以计算该磁盘执行该数据读写操作的响应时间,该响应时间可以是接收到该数据读写操作的响应请求的时间与下发该数据读写操作的时间的差值;
具体的,步骤100可以由存储控制器中的软件模块实施。
105、当响应时间超过预设的时间阈值时,将该磁盘离线;
具体的,将步骤100中计算获得的响应时间与预设的时间阈值进行比较,若该响应时间在预设的时间阈值的范围以内,则可以将执行该数据读写操作获得的操作结果反馈给存储控制器中的业务模块,由业务模块反馈给业务主机;
若该响应时间超过预设的时间阈值,则将该磁盘确定为可疑故障磁盘,对其进行离线操作,以保证业务主机可以正常运行;
在将该磁盘离线后,再将操作结果反馈给存储控制器中的业务模块,由业务模块反馈给业务主机,此后业务模块不再对该磁盘下发IO请求。
具体的,将对该磁盘离线操作可以是对业务模块隔离该磁盘或者其他操作,在此不作限定;
具体的,预设的时间阈值是预先设定的,可以根据业务需要进行调整。
110、对离线的磁盘进行检测,以判断是否是故障磁盘;
具体的,在将该可疑故障磁盘进行离线操作后,可以进一步对该磁盘进行检测,以区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在磁盘完成数据读写操作时,计算该磁盘执行数据读写操作的响应时间,若响应磁盘超过预设的时间阈值,则将该磁盘判定为可疑故障磁盘,将该磁盘离线,再对该离线后的磁盘进行检测,以进一步确定是否是故障磁盘,从而能够快速、准确地检测出处理数据读写操作响应慢的磁盘,保证主机业务的正常运行,并且能够区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘,保证了阵列的正常运行。
请参阅图3,本发明实施例中数据访问方法另一个实施例包括:
200、当磁盘完成数据读写操作时,计算该磁盘执行该数据读写操作的响应时间;
在本实施例中,存储控制器中的业务模块接收来自业务主机的IO请求,根据该IO请求确定所需读写的磁盘的逻辑块地址LBA,将该IO请求下发到磁盘阵列中所确定的磁盘以进行数据读写操作,LBA即读取或者写入该磁盘的地址,当磁盘完成数据读写操作时,会将该数据读写操作的响应请求发送给存储控制器中的业务模块。
存储控制器接收到该响应请求后,可以计算该磁盘执行该数据读写操作的响应时间,该响应时间可以是接收到该数据读写操作的响应请求的时间与下发该数据读写操作的时间的差值;
具体的,步骤200可以由存储控制器中的软件模块实施。
205、当响应时间超过预设的时间阈值时,将该磁盘离线;
具体的,将步骤200中计算获得的响应时间与预设的时间阈值进行比较,若该响应时间在预设的时间阈值的范围以内,则可以将执行该数据读写操作获得的操作结果反馈给存储控制器中的业务模块,由业务模块反馈给业务主机;
若该响应时间超过预设的时间阈值,则将该磁盘确定为可疑故障磁盘,对其进行离线操作,以保证业务主机可以正常运行;
在将该磁盘离线后,再将操作结果反馈给存储控制器中的业务模块,由业务模块反馈给业务主机,此后业务模块不再对该磁盘下发IO请求。
具体的,将对该磁盘离线操作可以是对业务模块隔离该磁盘或者其他操作,在此不作限定;
具体的,预设的时间阈值是预先设定的,可以根据业务需要进行调整。
210、记录发生超时的磁盘的逻辑块地址LBA以及该数据读写操作对应的数据的长度L;
具体的,当响应时间超过预设的时间阈值时,记录步骤200中业务模块确定的该磁盘的LBA以及该数据读写操作对应的数据的长度L;
在步骤200中业务模块根据IO请求确定所需读写的磁盘的LBA,若该磁盘在响应IO请求时超时,则说明该磁盘的LBA处可能出现故障,需要进行进一步的检测。
215、对离线的磁盘进行检测,以判断是否是故障磁盘;
具体的,在将该可疑故障磁盘进行离线操作后,可以进一步对该磁盘进行检测,具体的检测方式是读取该磁盘的LBA中的数据,并且将长度为L的数据写回到LBA中,根据响应时间确认是否出现故障。以区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在磁盘完成数据读写操作时,计算该磁盘执行数据读写操作的响应时间,若响应磁盘超过预设的时间阈值,则将该磁盘判定为可疑故障磁盘,将该磁盘离线,再对该离线后的磁盘进行检测,以进一步确定是否是故障磁盘,从而能够快速地检测出处理数据读写操作响应慢的磁盘,保证主机业务的正常运行,并且能够区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘,保证了阵列的正常运行。
进一步的,如图4所示,在上一实施例中,步骤215可以包括下列步骤:
步骤2150、读取从发生超时的磁盘的LBA开始,长度为L的数据;
具体的,将步骤210中记录的从发生超时的磁盘的LBA开始,长度为L的数据读取出来。
步骤2151、将该数据写回入该磁盘的LBA中;
具体的,将步骤2150中读取的数据写回入该磁盘的LBA。
步骤2152、判断写回步骤是否超时,若超时则执行步骤2153;
具体的,判断步骤2151的操作响应时间是否超过预设的时间阈值,此处所述的预设的时间阈值与前述的预设的时间阈值是指同一时间阈值;
需要说明的是,步骤2150、步骤2151可以重复执行多次,具体的执行次数可以预先设定,在此不作限定;
在重复执行中,如果有任意一次发生读写超时,则执行步骤2153。
步骤2153、判定该磁盘为故障磁盘。
进一步地,在上述实施例的基础上,当读写步骤没有超时时,还可以包括下列步骤:
步骤2154、下发ATA(AT Attachment)命令,采集该磁盘的相关信息;
具体的,如果该磁盘是串行高级技术附件(Serial Advanced TechnologyAttachment,SATA)盘,则下发ATA命令,采集该磁盘的相关信息;
在另一实施例中,如果该磁盘是串行连接SCSI接口(Serial Attached SCSI,SAS)盘FC盘,则下发SCSI命令采集该磁盘的相关信息;
这里的该磁盘的相关信息,可以是SMART(Self-Monitoring,Analysis andReporting Technology)信息或者LOG SENSE信息或者其他信息,在此不作限定。
步骤2155、判断采集是否失败或超时,若采集失败或超时,则执行步骤2156,否则执行步骤2157;
具体的,可以预先设定第二时间阈值,将采集磁盘的相关信息时的处理时间与该预设的第二时间阈值进行比较。
步骤2156、判定该磁盘为故障磁盘。
具体的,当采集该磁盘的相关信息时的处理时间超过该预设的第二时间阈值或者采集失败,则可以判定该磁盘为故障磁盘。
更进一步地,在上述实施例的基础上,当采集该磁盘的相关信息没有超时时,还可以包括下列步骤:
步骤2157、对该相关信息进行分析,若该信息异常则为故障磁盘,否则判定该磁盘正常;
具体的,可以对该磁盘的SMART信息或者LOG SENSE信息或者其他信息进行分析,若信息异常则可以判定该磁盘是故障磁盘,否则说明该磁盘正常;
举例来说,可以根据SMART信息中的Reallocated_Sector_Ct(扇区重映射数)或者Start_Stop_Count(上下电次数)或者Temperature_Celsius(摄氏温度)等信息判断是否异常,当Reallocated_Sector_Ct大于第一预设门限,或者Start_Stop_Count大于第二预设门限,或者Temperature_Celsius小于第三预设门限,或者Temperature_Celsius大于第四预设门限时,可以认为磁盘故障。
请参阅图5,本发明实施例中数据访问装置的一个实施例包括:
计算模块30,用于当磁盘完成数据读写操作时,计算该磁盘执行该数据读写操作的响应时间;
在本实施例中,存储控制器中的业务模块接收来自业务主机的IO请求,根据该IO请求确定所需读写的磁盘的逻辑块地址LBA(Logical BlockAddress),将该IO请求下发到磁盘阵列中所确定的磁盘以进行数据读写操作,LBA即读取或者写入该磁盘的地址,当磁盘完成数据读写操作时,会将该数据读写操作的响应请求发送给存储控制器中的业务模块;
存储控制器接收到该响应请求后,可以计算该磁盘执行该数据读写操作的响应时间,该响应时间可以是接收到该数据读写操作的响应请求的时间与下发该数据读写操作的时间的差值。
处理模块31,用于当响应时间超过预设的时间阈值时,将该磁盘离线;
具体的,将计算模块30中计算获得的响应时间与预设的时间阈值进行比较,若该响应时间在预设的时间阈值的范围以内,则可以将执行该数据读写操作获得的操作结果反馈给存储控制器中的业务模块,由业务模块反馈给业务主机;
若该响应时间超过预设的时间阈值,则将该磁盘确定为可疑故障磁盘,对其进行离线操作,以保证业务主机可以正常运行;
在将该磁盘离线后,再将操作结果反馈给存储控制器中的业务模块,由业务模块反馈给业务主机,此后业务模块不再对该磁盘下发IO请求。
具体的,将对该磁盘离线操作可以是对业务模块隔离该磁盘或者其他操作,在此不作限定;
具体的,预设的时间阈值是预先设定的,可以根据业务需要进行调整。
检测模块32,用于对离线的磁盘进行检测,以判断是否是故障磁盘;
具体的,在将该可疑故障磁盘进行离线操作后,可以进一步对该磁盘进行检测,以区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在磁盘完成数据读写操作时,计算该磁盘执行数据读写操作的响应时间,若响应磁盘超过预设的时间阈值,则将该磁盘判定为可疑故障磁盘,将该磁盘离线,再对该离线后的磁盘进行检测,以进一步确定是否是故障磁盘,从而能够快速地检测出处理数据读写操作响应慢的磁盘,保证主机业务的正常运行,并且能够区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘,保证了阵列的正常运行。
请参阅图6,本发明实施例中数据访问装置另一个实施例包括:
计算模块40,用于当磁盘完成数据读写操作时,计算该磁盘执行该数据读写操作的响应时间;
具体的执行步骤同上一实施例,这里不再赘述。
处理模块41,用于当响应时间超过预设的时间阈值时,将该磁盘离线;
具体的执行步骤同上一实施例,这里不再赘述。
记录模块42,用于记录发生超时的磁盘的逻辑块地址LBA以及该数据读写操作对应的数据的长度L;
具体的,当响应时间超过预设的时间阈值时,记录步骤200中业务模块确定的该磁盘的LBA以及该数据读写操作对应的数据的长度L;
计算模块40根据IO请求确定所需读写的磁盘的LBA,若该磁盘在响应IO请求时超时,则说明该磁盘的LBA处可能出现故障,需要进行进一步的检测,具体的检测方式是读取该磁盘的LBA中的数据,并且将长度为L的数据写回到LBA中,根据响应时间确认是否出现故障。
检测模块43,用于对离线的磁盘进行检测,以判断是否是故障磁盘;
具体的执行步骤同上一实施例,这里不再赘述。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在磁盘完成数据读写操作时,计算该磁盘执行数据读写操作的响应时间,若响应磁盘超过预设的时间阈值,则将该磁盘判定为可疑故障磁盘,将该磁盘离线,再对该离线后的磁盘进行检测,以进一步确定是否是故障磁盘,从而能够快速地检测出处理数据读写操作响应慢的磁盘,保证主机业务的正常运行,并且能够区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘,保证了阵列的正常运行。
在上述实施例中,检测模块43可以包括:
读数据单元430,用于读取从发生超时的磁盘的LBA开始,长度为L的数据;
具体的,将记录模块42中记录的从发生超时的磁盘的LBA开始,长度为L的数据读取出来。
写数据单元431,用于将该数据写回入该磁盘的LBA中;
具体的,将读数据单元430读取的数据写回入该磁盘的LBA。
判断单元432,用于判断读数据单元430读数据的操作或者写数据单元431写数据的操作是否超时,若超时启动故障确定单元433;
具体的,判断单元432具体用于判断操作响应时间是否超过预设的时间阈值,此处所述的预设的时间阈值与前述的预设的时间阈值是指同一时间阈值;
需要说明的是,读数据单元430以及写数据单元431中所执行的动作可以重复执行多次,具体的执行次数可以预先设定,在此不作限定;
在重复执行中,如果有任意一次发生读写超时,则启动故障确定单元433。
故障确定单元433,用于判定该磁盘为故障磁盘。
进一步地,在上述实施例的基础上,还可以包括:
命令下发单元434,用于当判断单元432判断出该写回步骤没有超时时下发ATA(AT Attachment)命令,采集该磁盘的相关信息;
在另一实施例中,还可以下发SCSI命令采集该磁盘的相关信息;
这里的该磁盘的相关信息,可以是SMART(Self-Monitoring,Analysis andReporting Technology)信息或者LOG SENSE信息或者其他信息,在此不作限定。
故障确定单元433,还用于若采集失败或超时,则判定该磁盘是故障磁盘。
更进一步地,在上述实施例的基础上,还可以包括:
分析单元435,用于当命令下发单元434成功采集到该磁盘的相关信息,并且未超时时,对该相关信息进行分析,若该信息异常则为故障磁盘,否则判定该磁盘正常;
具体的,可以对该磁盘的SMART信息或者LOG SENSE信息或者其他信息进行分析,若信息异常则可以判定该磁盘是故障磁盘,否则说明该磁盘正常;
举例来说,可以根据SMART信息中的Reallocated_Sector_Ct(扇区重映射数)或者Start_Stop_Count(上下电次数)或者Temperature_Celsius(摄氏温度)等信息判断是否异常,当Reallocated_Sector_Ct大于第一预设门限,或者Start_Stop_Count大于第二预设门限,或者Temperature_Celsius小于第三预设门限,或者Temperature_Celsius大于第四预设门限时,可以认为磁盘故障。
请参阅图8,本发明实施例中磁盘控制器一个实施例包括:
磁盘检测装置500,用于当磁盘完成数据读写操作时,计算该磁盘执行该数据读写操作的响应时间;当响应时间超过预设的时间阈值时,将该磁盘离线;对离线的磁盘进行检测,以判断是否是故障磁盘。
磁盘检测装置500的具体的结构及功能请参见上述磁盘检测装置实施例,这里不再赘述。
从以上技术方案可以看出,本发明实施例具有以下优点:
本发明实施例在磁盘完成数据读写操作时,计算该磁盘执行数据读写操作的响应时间,若响应磁盘超过预设的时间阈值,则将该磁盘判定为可疑故障磁盘,将该磁盘离线,再对该离线后的磁盘进行检测,以进一步确定是否是故障磁盘,从而能够快速地检测出处理数据读写操作响应慢的磁盘,保证主机业务的正常运行,并且能够区分真正故障的磁盘和虽出现短时故障但可继续使用的磁盘,保证了阵列的正常运行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上对本发明所提供的一种信息处理方法以及信息处理服务器进行了详细介绍,对于本领域的一般技术人员,依据本发明实施例的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (11)

1.一种磁盘检测方法,其特征在于,包括:
当磁盘完成数据读写操作时,计算所述磁盘执行所述数据读写操作的响应时间;
当所述响应时间超过预设的时间阈值时,将所述磁盘离线;
对所述离线的磁盘进行检测,以判断是否是故障磁盘。
2.如权利要求1所述的方法,其特征在于,还包括:
记录发生超时的磁盘的逻辑块地址LBA以及所述数据读写操作对应的数据的长度。
3.如权利要求2所述的方法,其特征在于,所述对所述离线的磁盘进行检测,以判断是否是故障磁盘,包括:
从所述LBA开始读取与所述数据读写操作对应的数据的长度相同长度的数据;
将所述读取的数据写回到所述磁盘的LBA中;
若所述将所述读取的数据写回到所述磁盘的LBA中的步骤的响应时间超过预设的时间阈值,则判定所述磁盘是故障磁盘。
4.如权利要求3所述的方法,其特征在于,还包括:
若所述将所述读取的数据写回到所述磁盘的LBA中的步骤的响应时间未超过预设的时间阈值,则下发AT附件ATA命令或小型计算机系统接口SCSI命令到所述磁盘,采集所述磁盘的相关信息;
若采集失败或超时,则判定所述磁盘是故障磁盘。
5.如权利要求4所述的方法,其特征在于,还包括:
若成功采集到所述磁盘的相关信息,并且采集未超时,则对所述采集到的所述磁盘的相关信息进行分析,若信息内容异常,则判定所述磁盘是故障磁盘;否则,判定所述磁盘正常。
6.一种磁盘检测装置,其特征在于,包括:
计算模块,用于当磁盘完成数据读写操作时,计算所述磁盘执行所述数据读写操作的响应时间;
处理模块,用于当所述响应时间超过预设的时间阈值时,将所述磁盘离线;
检测模块,用于对所述离线的磁盘进行检测,以判断是否是故障磁盘。
7.如权利要求6所述的装置,其特征在于,还包括:
记录模块,用于当所述响应时间超过预设的时间阈值时,记录发生超时的磁盘的逻辑块地址LBA以及所述数据读写操作对应的数据的长度。
8.如权利要求7所述的装置,其特征在于,所述检测模块包括:
读数据单元,用于从所述LBA开始读取与所述数据读写操作对应的数据的长度相同长度的数据;
写数据单元,用于将所述读取的数据写回到所述磁盘的LBA中;
判断单元,用于判断所述读数据单元读数据或者写数据单元写数据的响应时间超过预设的时间阈值;
故障确定单元,用于若判断单元判断出所述读数据单元读数据或者写数据单元写数据的响应时间超过预设的时间阈值,则判定所述磁盘是故障磁盘。
9.如权利要求8所述的装置,其特征在于,所述检测模块还包括:
命令下发单元,用于若判断单元判断出所述读数据单元读数据或者写数据单元写数据的响应时间未超过预设的时间阈值,则下发ATA或SCSI命令到所述磁盘,采集所述磁盘的相关信息;
所述故障确定单元,还用于若采集失败或超时,则判定所述磁盘是故障磁盘。
10.如权利要求8所述的装置,其特征在于,所述检测模块还包括:
分析单元,用于若成功采集到所述磁盘的相关信息,并且采集未超时,则对所述采集到的所述磁盘的相关信息进行分析,若信息内容异常,则判定所述磁盘是故障磁盘;否则,判定所述磁盘正常。
11.一种存储控制器,其特征在于,包括如权利要求6-10任一权利要求所述的磁盘检测装置。
CN201010116498.XA 2010-02-10 2010-02-10 一种磁盘检测方法及装置 Active CN102147708B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010116498.XA CN102147708B (zh) 2010-02-10 2010-02-10 一种磁盘检测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010116498.XA CN102147708B (zh) 2010-02-10 2010-02-10 一种磁盘检测方法及装置

Publications (2)

Publication Number Publication Date
CN102147708A true CN102147708A (zh) 2011-08-10
CN102147708B CN102147708B (zh) 2012-12-12

Family

ID=44421993

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010116498.XA Active CN102147708B (zh) 2010-02-10 2010-02-10 一种磁盘检测方法及装置

Country Status (1)

Country Link
CN (1) CN102147708B (zh)

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385537A (zh) * 2011-10-25 2012-03-21 曙光信息产业(北京)有限公司 一种多副本存储系统的磁盘故障处理方法
CN103761180A (zh) * 2014-01-11 2014-04-30 浪潮电子信息产业股份有限公司 一种集群存储中磁盘故障的预防及检测方法
CN103810062A (zh) * 2014-03-05 2014-05-21 华为技术有限公司 慢盘检测方法和装置
CN104572380A (zh) * 2015-01-30 2015-04-29 浪潮(北京)电子信息产业有限公司 一种检测磁盘的方法和装置
CN104679447A (zh) * 2014-12-31 2015-06-03 曙光信息产业股份有限公司 磁盘控制方法及装置
CN105045691A (zh) * 2015-07-16 2015-11-11 浪潮(北京)电子信息产业有限公司 一种故障检测方法和系统
CN105893231A (zh) * 2016-05-06 2016-08-24 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置
CN106201339A (zh) * 2016-06-27 2016-12-07 浪潮(北京)电子信息产业有限公司 一种定位延迟磁盘的方法及系统
CN106354590A (zh) * 2015-07-17 2017-01-25 中兴通讯股份有限公司 磁盘检测方法和装置
WO2017020614A1 (zh) * 2015-07-31 2017-02-09 华为技术有限公司 一种检测磁盘的方法及装置
CN106407051A (zh) * 2015-07-31 2017-02-15 华为技术有限公司 一种检测慢盘的方法及装置
CN106557389A (zh) * 2015-09-29 2017-04-05 成都华为技术有限公司 一种慢盘检测方法和装置
CN106980468A (zh) * 2017-03-03 2017-07-25 杭州宏杉科技股份有限公司 触发raid阵列重建的方法及装置
CN106990918A (zh) * 2017-03-03 2017-07-28 杭州宏杉科技股份有限公司 触发raid阵列重建的方法及装置
CN107301109A (zh) * 2017-06-23 2017-10-27 郑州云海信息技术有限公司 一种硬盘质量筛选方法及装置
CN107729199A (zh) * 2017-10-19 2018-02-23 郑州云海信息技术有限公司 一种存储设备的硬盘检测方法和系统
CN109101193A (zh) * 2018-07-18 2018-12-28 联想(北京)有限公司 一种存储设备状态控制方法及装置
CN110825542A (zh) * 2018-08-07 2020-02-21 网宿科技股份有限公司 一种分布式系统中故障盘的检测方法、装置及检测系统
CN114415973A (zh) * 2022-03-28 2022-04-29 阿里云计算有限公司 慢盘检测方法、装置、电子设备及存储介质
CN116680144A (zh) * 2023-05-06 2023-09-01 珠海妙存科技有限公司 一种基于eMMC的数据监控方法、装置及其存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060026347A1 (en) * 2004-07-29 2006-02-02 Ching-Hai Hung Method for improving data reading performance and storage system for performing the same
CN101008910A (zh) * 2006-01-23 2007-08-01 国际商业机器公司 预测存储设备故障的装置、系统和方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060026347A1 (en) * 2004-07-29 2006-02-02 Ching-Hai Hung Method for improving data reading performance and storage system for performing the same
CN101008910A (zh) * 2006-01-23 2007-08-01 国际商业机器公司 预测存储设备故障的装置、系统和方法

Cited By (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102385537B (zh) * 2011-10-25 2014-12-03 曙光信息产业(北京)有限公司 一种多副本存储系统的磁盘故障处理方法
CN102385537A (zh) * 2011-10-25 2012-03-21 曙光信息产业(北京)有限公司 一种多副本存储系统的磁盘故障处理方法
CN103761180A (zh) * 2014-01-11 2014-04-30 浪潮电子信息产业股份有限公司 一种集群存储中磁盘故障的预防及检测方法
CN103810062A (zh) * 2014-03-05 2014-05-21 华为技术有限公司 慢盘检测方法和装置
CN103810062B (zh) * 2014-03-05 2015-12-30 华为技术有限公司 慢盘检测方法和装置
CN104679447A (zh) * 2014-12-31 2015-06-03 曙光信息产业股份有限公司 磁盘控制方法及装置
CN104572380A (zh) * 2015-01-30 2015-04-29 浪潮(北京)电子信息产业有限公司 一种检测磁盘的方法和装置
CN104572380B (zh) * 2015-01-30 2017-11-10 浪潮(北京)电子信息产业有限公司 一种检测磁盘的方法和装置
CN105045691B (zh) * 2015-07-16 2018-06-22 浪潮(北京)电子信息产业有限公司 一种故障检测方法和系统
CN105045691A (zh) * 2015-07-16 2015-11-11 浪潮(北京)电子信息产业有限公司 一种故障检测方法和系统
CN106354590A (zh) * 2015-07-17 2017-01-25 中兴通讯股份有限公司 磁盘检测方法和装置
WO2017012392A1 (zh) * 2015-07-17 2017-01-26 中兴通讯股份有限公司 一种磁盘检测的方法和装置
WO2017020614A1 (zh) * 2015-07-31 2017-02-09 华为技术有限公司 一种检测磁盘的方法及装置
CN106407052A (zh) * 2015-07-31 2017-02-15 华为技术有限公司 一种检测磁盘的方法及装置
CN106407051A (zh) * 2015-07-31 2017-02-15 华为技术有限公司 一种检测慢盘的方法及装置
CN106407052B (zh) * 2015-07-31 2019-09-13 华为技术有限公司 一种检测磁盘的方法及装置
CN106407051B (zh) * 2015-07-31 2019-01-11 华为技术有限公司 一种检测慢盘的方法及装置
US10768826B2 (en) 2015-07-31 2020-09-08 Huawei Technologies Co., Ltd. Disk detection method and apparatus
CN106557389A (zh) * 2015-09-29 2017-04-05 成都华为技术有限公司 一种慢盘检测方法和装置
CN106557389B (zh) * 2015-09-29 2019-03-08 成都华为技术有限公司 一种慢盘检测方法和装置
CN105893231B (zh) * 2016-05-06 2019-02-05 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置
CN105893231A (zh) * 2016-05-06 2016-08-24 思创数码科技股份有限公司 一种基于smart的预测硬盘亚健康指标的方法及装置
CN106201339A (zh) * 2016-06-27 2016-12-07 浪潮(北京)电子信息产业有限公司 一种定位延迟磁盘的方法及系统
CN106201339B (zh) * 2016-06-27 2019-05-10 浪潮(北京)电子信息产业有限公司 一种定位延迟磁盘的方法及系统
CN106990918A (zh) * 2017-03-03 2017-07-28 杭州宏杉科技股份有限公司 触发raid阵列重建的方法及装置
CN106980468A (zh) * 2017-03-03 2017-07-25 杭州宏杉科技股份有限公司 触发raid阵列重建的方法及装置
CN107301109A (zh) * 2017-06-23 2017-10-27 郑州云海信息技术有限公司 一种硬盘质量筛选方法及装置
CN107301109B (zh) * 2017-06-23 2020-08-21 苏州浪潮智能科技有限公司 一种硬盘质量筛选方法及装置
CN107729199A (zh) * 2017-10-19 2018-02-23 郑州云海信息技术有限公司 一种存储设备的硬盘检测方法和系统
CN109101193A (zh) * 2018-07-18 2018-12-28 联想(北京)有限公司 一种存储设备状态控制方法及装置
CN110825542A (zh) * 2018-08-07 2020-02-21 网宿科技股份有限公司 一种分布式系统中故障盘的检测方法、装置及检测系统
CN114415973A (zh) * 2022-03-28 2022-04-29 阿里云计算有限公司 慢盘检测方法、装置、电子设备及存储介质
CN114415973B (zh) * 2022-03-28 2022-08-30 阿里云计算有限公司 慢盘检测方法、装置、电子设备及存储介质
CN116680144A (zh) * 2023-05-06 2023-09-01 珠海妙存科技有限公司 一种基于eMMC的数据监控方法、装置及其存储介质

Also Published As

Publication number Publication date
CN102147708B (zh) 2012-12-12

Similar Documents

Publication Publication Date Title
CN102147708B (zh) 一种磁盘检测方法及装置
US8793532B1 (en) Hard-disk drive work load profiling and capturing systems and methods
JP5078235B2 (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
CN101419842B (zh) 硬盘的损耗均衡方法、装置及系统
CN103218173B (zh) 存储控制方法及装置
CN103019885B (zh) 基于嵌入式Linux的硬盘坏道监测方法及系统
US20090164698A1 (en) Nonvolatile storage device with NCQ supported and writing method for a nonvolatile storage device
EP2778926A1 (en) Hard disk data recovery method, device and system
US20170242744A1 (en) Method and apparatus for performing data scrubbing management in storage system
US20060053251A1 (en) Controlling preemptive work balancing in data storage
CN101826367A (zh) 监测半导体存储设备可靠性的方法及其装置
CN101866271A (zh) 一种基于raid的安全预警系统和方法
CN111124758A (zh) 一种故障硬盘的数据恢复方法
CN103218274A (zh) 一种预防故障累加的方法和固态硬盘
US9529674B2 (en) Storage device management of unrecoverable logical block addresses for RAID data regeneration
CN103927126B (zh) 一种磁盘阵列设备的配置方法及组装及磁盘插入处理方法
WO2017161795A1 (zh) 处理流水文件的方法及系统
CN112631848A (zh) 一种机械硬盘故障智能诊断方法及系统
CN113284547A (zh) Ssd硬盘故障诊断与数据恢复工具
EP4078380A1 (en) Behavior-driven die management on solid-state drives
CN111984487A (zh) 一种离机记录故障硬件位置的方法及装置
JP4775843B2 (ja) ストレージシステム及び記憶制御方法
CN109741786A (zh) 一种固态硬盘监控方法、装置及设备
US8776232B2 (en) Controller capable of preventing spread of computer viruses and storage system and method thereof
JP5319985B2 (ja) ストレージ機器の使用限界予想方法又はその使用限界予想装置若しくはその使用限界予想時間解析用プログラム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: 611731 Chengdu high tech Zone, Sichuan, West Park, Qingshui River

Applicant after: HUAWEI DIGITAL TECHNOLOGIES (CHENG DU) Co.,Ltd.

Address before: 611731 Chengdu high tech Zone, Sichuan, West Park, Qingshui River

Applicant before: CHENGDU HUAWEI SYMANTEC TECHNOLOGIES Co.,Ltd.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: CHENGDU HUAWEI SYMANTEC TECHNOLOGIES CO., LTD. TO: HUAWEI DIGITAL TECHNOLOGY (CHENGDU) CO., LTD.

C14 Grant of patent or utility model
GR01 Patent grant
DD01 Delivery of document by public notice

Addressee: He Xinru

Document name: Notification of Passing Examination on Formalities

TR01 Transfer of patent right

Effective date of registration: 20220916

Address after: No. 1899 Xiyuan Avenue, high tech Zone (West District), Chengdu, Sichuan 610041

Patentee after: Chengdu Huawei Technologies Co.,Ltd.

Address before: 611731 Qingshui River District, Chengdu hi tech Zone, Sichuan, China

Patentee before: HUAWEI DIGITAL TECHNOLOGIES (CHENG DU) Co.,Ltd.

TR01 Transfer of patent right