CN113625957A - 一种硬盘故障的检测方法、装置及设备 - Google Patents

一种硬盘故障的检测方法、装置及设备 Download PDF

Info

Publication number
CN113625957A
CN113625957A CN202110744920.4A CN202110744920A CN113625957A CN 113625957 A CN113625957 A CN 113625957A CN 202110744920 A CN202110744920 A CN 202110744920A CN 113625957 A CN113625957 A CN 113625957A
Authority
CN
China
Prior art keywords
hard disk
read
write
target hard
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110744920.4A
Other languages
English (en)
Other versions
CN113625957B (zh
Inventor
张旭升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202110744920.4A priority Critical patent/CN113625957B/zh
Publication of CN113625957A publication Critical patent/CN113625957A/zh
Application granted granted Critical
Publication of CN113625957B publication Critical patent/CN113625957B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例公开了一种硬盘故障的检测方法、装置及设备,在获取到目标硬盘对存储数据的读写异常信息后,对预设数据进行读写操作。如果对预设数据的读写正常,则说明目标硬盘的读写功能正常,可能仅是单次读写故障。控制目标硬盘对存储数据进行重写操作,实现对存储数据的正常读写。如此,能够在硬盘发生读写故障时,再次确定硬盘是否发生读写故障,避免将发生单次读写故障的硬盘直接确定为故障硬盘,实现更为准确地对硬盘的故障检测。从而降低存储系统中硬盘的故障率,提高存储系统的稳定性以及运行性能。

Description

一种硬盘故障的检测方法、装置及设备
技术领域
本申请涉及数据处理领域,具体涉及一种硬盘故障的检测方法、装置及设备。
背景技术
在将数据储存至硬盘中时,可能会出现存储异常的情况。硬盘管理单元根据存储异常的情况确定是否是硬盘发生异常。如果是硬盘发生异常,则将该硬盘确定为故障硬盘,停止故障硬盘继续存储数据。
将出现异常的硬盘确定为故障硬盘,容易导致对硬盘运行状态的误判,影响存储系统的运行。
发明内容
有鉴于此,本申请实施例提供一种硬盘故障的检测方法、装置及设备,能够更为准确地确定硬盘是否发生故障。
为解决上述问题,本申请实施例提供的技术方案如下:
第一方面,本申请提供一种硬盘故障的检测方法,所述方法包括:
获取读写异常信息;所述读写异常信息根据对目标硬盘进行存储数据的读写操作时发生的读写异常生成;
根据所述读写异常信息确定所述目标硬盘以及所述存储数据;
将预设数据写入所述目标硬盘;
若所述预设数据写入成功,则从所述目标硬盘中读取所述预设数据;
若读取所述预设数据成功,则对所述存储数据进行重写操作。
在一种可能的实现方式中,所述对所述存储数据进行重写操作,包括:
根据所述读写异常信息确定所述目标硬盘中的故障存储区域;
将所述存储数据写入除所述故障存储区域外的其他存储区域。
在一种可能的实现方式中,所述方法还包括:
更新所述目标硬盘的读写异常次数。
在一种可能的实现方式中,所述方法还包括:
若所述目标硬盘的读写异常次数大于或者等于次数阈值,向所述目标硬盘的管理单元发送告警信息。
在一种可能的实现方式中,若所述预设数据写入不成功,或者,若读取所述预设数据不成功,所述方法还包括:
将所述目标硬盘确定为发生故障的硬盘。
在一种可能的实现方式中,所述预设数据为所述目标硬盘的标签。
第二方面,本申请提供一种硬盘故障的检测装置,所述装置包括:
获取单元,用于获取读写异常信息,所述读写异常信息根据对目标硬盘进行存储数据的读写操作时发生的读写异常生成;
第一确定单元,用于根据所述读写异常信息确定所述目标硬盘以及所述存储数据;
写入单元,用于将预设数据写入所述目标硬盘;
读取单元,用于若所述预设数据写入成功,则从所述目标硬盘中读取所述预设数据;
重写单元,用于若读取所述预设数据成功,则对所述存储数据进行重写操作。
在一种可能的实现方式中,所述重写单元,具体用于根据所述读写异常信息确定所述目标硬盘中的故障存储区域;
将所述存储数据写入除所述故障存储区域外的其他存储区域。
在一种可能的实现方式中,所述装置还包括:
更新单元,用于更新所述目标硬盘的读写异常次数。
在一种可能的实现方式中,所述装置还包括:
告警单元,用于若所述目标硬盘的读写异常次数大于或者等于次数阈值,向所述目标硬盘的管理单元发送告警信息。
在一种可能的实现方式中,所述装置还包括:
第二确定单元,用于若所述预设数据写入不成功,或者,若读取所述预设数据不成功,将所述目标硬盘确定为发生故障的硬盘。
在一种可能的实现方式中,所述预设数据为所述目标硬盘的标签。
第三方面,本申请提供一种硬盘故障的检测设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述任一项实施例所述的方法。
第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一项实施例所述的方法。
由此可见,本申请实施例具有如下有益效果:
本申请实施例提供的一种硬盘故障的检测方法、装置及设备,在获取到目标硬盘对存储数据的读写异常信息后,对预设数据进行读写操作。如果对预设数据的读写正常,则说明目标硬盘的读写功能正常,可能仅是单次读写故障。控制目标硬盘对存储数据进行重写操作,实现对存储数据的正常读写。如此,能够在硬盘发生读写故障时,再次确定硬盘是否发生读写故障,避免将发生单次读写故障的硬盘直接确定为故障硬盘,实现更为准确地对硬盘进行故障检测。从而降低存储系统中硬盘的故障率,提高存储系统的稳定性以及运行性能。
附图说明
图1为本申请实施例提供的示例性应用场景的框架示意图;
图2为本申请实施例提供的一种硬盘故障的检测方法的流程图;
图3为本申请实施例提供的一种硬盘故障的检测方法的流程图;
图4为本申请实施例提供的一种硬盘故障的检测装置的结构示意图。
具体实施方式
为了便于理解和解释本申请实施例提供的技术方案,下面将先对本申请的背景技术进行说明。
在对传统的硬盘故障的检测过程进行研究后发现,在目前的存储系统中,当硬盘发生读写异常时,就将该硬盘确定为故障硬盘,停止故障硬盘对存储数据的存储,并将存储硬盘从存储系统中剔除。但是,部分故障硬盘并没有完全故障,可能仅是某个硬盘扇区发生故障,或者是磁头飘起等其他原因导致的短时间故障。而现有的故障检测方法无法对硬盘的短时间故障和硬盘的完全故障进行区分,容易导致对硬盘运行状态的误判,增加硬盘的故障率。并且,对故障硬盘进行剔除操作也会影响到存储系统的正常运行。
基于此,本申请实施例提供一种硬盘故障的检测方法、装置及设备,在获取到目标硬盘对存储数据的读写异常信息后,对预设数据进行读写操作。如果对预设数据的读写正常,则说明目标硬盘的读写功能正常,可能仅是单次读写故障。控制目标硬盘对存储数据进行重写操作,实现对存储数据的正常读写。如此,能够在硬盘发生读写故障时,再次确定硬盘是否发生读写故障,避免将发生单次读写故障的硬盘直接确定为故障硬盘,实现更为准确地对硬盘的故障检测。从而降低存储系统中硬盘的故障率,提高存储系统的稳定性以及运行性能。
为了便于理解本申请实施例提供的硬盘故障的检测方法,下面结合图1所示的场景示例进行说明。参见图1,该图为本申请实施例提供的示例性应用场景的框架示意图。
在实际应用中,存储系统101,例如可以为Bluestore(一种分布式文件系统),存储系统101中包括多个硬盘102。在对硬盘102进行存储数据的读写操作时,如果发生读写异常信息,则将预设数据写入到目标硬盘102中,并在写入成功后进行从目标硬盘102中读取预设数据。如果目标硬盘102对预设数据的读写正常,则说明目标硬盘102仅是单次读写异常,并未完全故障。再将存储数据重写入目标硬盘102中,实现对存储数据的存储。
为了便于理解本申请实施例提供的技术方案,下面结合附图对本申请实施例提供的一种硬盘故障的检测方法进行说明。
首先需要说明的是,本申请实施例提供的硬盘故障的检测方法,可以应用于存储系统中。具体的,存储系统可以是分布式存储系统中,例如Bluestore。
参见图2所示,该图为本申请实施例提供的一种硬盘故障的检测方法的流程图,该方法包括步骤S201-S205。
S201:获取读写异常信息,所述读写异常信息根据对目标硬盘进行存储数据的读写操作时发生的读写异常生成。
存储系统中包括多个用于读写存储数据的硬盘。硬盘具体可以为机械硬盘。在对硬盘进行存储数据的读写操作时,容易发生读写异常。读写异常具体是指硬盘写入存储数据发生异常,或者是从硬盘中读取存储数据发生异常。在发生读写异常后,会生成读写异常信息。读写异常信息中包括发生读写异常的目标硬盘的相关信息,以及与读写异常相关的信息。
在一种可能的实现方式中,发送至存储系统的异常信息包括多种异常情况。可以先获取异常信息,判断异常信息是否是读写异常信息。若是,执行后续S202的步骤。若否,则执行对应的异常处理流程。
S202:根据所述读写异常信息确定所述目标硬盘以及所述存储数据。
存储系统在接收到读写异常信息后,能够基于读写异常信息确定发生读写异常的目标硬盘、读写异常所对应的储存数据以及具体的读写异常情况。
S203:将预设数据写入所述目标硬盘。
在确定目标硬盘发生读写异常之后,将预设数据写入目标硬盘中。其中,预设数据是预先设置的用于测试硬盘的读写功能的数据。预设数据可以是设置的固定数据。在一种可能的实现方式中,预设数据可以是目标硬盘的标签。目标硬盘的标签为固定的数据,并且存储在目标硬盘的固定存储区域中。利用目标硬盘的标签测试目标硬盘的读写功能,能够对目标硬盘的运行状态进行准确的测试。此外,本申请实施例不限定预设数据写入的目标硬盘中的存储区域。预设数据所写入的存储区域可以是设置的用于进行读写功能测试的存储区域。
S204:若所述预设数据写入成功,则从所述目标硬盘中读取所述预设数据。
如果预设数据成功写入目标硬盘,则说明目标硬盘的写入功能正常。进一步的,对目标硬盘的读取功能进行测试。从目标硬盘中读取预设数据。读取预设数据的存储区域,是写入预设数据的存储区域。
S205:若读取所述预设数据成功,则对所述存储数据进行重写操作。
如果能够成功从目标硬盘中读取预设区域,则说明目标硬盘的读取功能正常。目标硬盘并未出现读写故障,可以继续对存储数据进行读写操作。
将进行读写操作时发生读写异常的存储数据,重新写入目标硬盘中。如此,能够实现后续从目标硬盘中正常读取存储数据。
在一种可能的实现方式中,本申请实施例提供一种对所述存储数据进行重写操作的具体实施方式,请参见下文。
基于上述S201-S205的相关内容可知,通过在发生读写异常后,对读写异常信息所对应的目标硬盘进行预设数据的读写操作,能够确定目标硬盘是否发生读写故障。如此可以实现对目标硬盘的读写故障的准确检测,避免将短时间出现读写异常的硬盘确定为故障硬盘,降低硬盘的故障率,提升了硬盘的使用寿命,并且使得存储系统更为稳定、性能更佳。
在一种可能的实现方式中,目标硬盘出现读写异常可能是部分储存区域出现故障。为此,本申请实施例提供一种对所述存储数据进行重写操作的具体实施方式,包括以下两个步骤:
A1:根据所述读写异常信息确定所述目标硬盘中的故障存储区域。
读写异常信息中包括存储数据所要写入目标硬盘中的存储区域。根据读写异常信息,将存储数据所要写入目标硬盘中的存储区域确定为目标硬盘中的故障存储区域。
需要说明的是,存储区域具体可以包括目标硬盘中的一个或者多个扇区。故障存储区域可以根据存储数据所对应的存储区域确定。
A2:将所述存储数据写入除所述故障存储区域外的其他存储区域。
为了防止存储数据原有的存储区域出现故障,再次影响到对存储数据的读写,将存储数据写入除故障存储区域外的其他存储区域。
本申请实施例不限定确定其他存储区域的方式,可以根据目标硬盘中储存区域的存储情况确定存储数据对应的重新写入的存储区域。
在将存储数据存储至硬盘的过程中,生成读写异常信息的次数能够反映硬盘的状态。在一种可能的实现方式中,还可以对硬盘的读写异常的次数进行统计。
本申请实施例提供一种硬盘故障的检测方法,除上述步骤以外,还包括:更新所述目标硬盘的读写异常次数。
在确定目标硬盘未发生读写故障后,可以对目标硬盘的读写异常次数进行更新。具体可以将目标硬盘的读写异常次数的数值加1。目标硬盘的读写异常次数的初始值可以为0。
读写异常次数是用于统计正常的硬盘发生读写异常的总次数。读写异常次数能够用于衡量硬盘的性能。
在本申请实施例中,通过在确定目标硬盘未发生读写故障后,对目标硬盘的读写异常次数进行更新,能够统计目标硬盘发生读写异常次数,便于基于目标硬盘的读写异常次数对目标硬盘的运行状态进行监控。
进一步的,可以基于硬盘的读写异常次数对硬盘的运行状态进行监控。本申请实施例提供一种硬盘故障的检测方法,除上述步骤以外,所述方法还包括:
若所述目标硬盘的读写异常次数大于或者等于次数阈值,向所述目标硬盘的管理单元发送告警信息。
次数阈值是预先设置用于监控硬盘状态的阈值。在目标硬盘的读写异常次数更新后,对目标硬盘的读写异常次数和次数阈值进行比较。如果目标硬盘的读写异常次数大于或者等于次数阈值,则能够确定目标硬盘出现读写异常的次数较多,向目标硬盘的管理单元发送告警信息。其中,目标硬盘的管理单元是用于管理控制目标硬盘的单元。告警信息是用于提醒目标硬盘的异常状态。
参见图3所示,该图为本申请实施例提供的一种硬盘故障的检测方法的流程图。
S301:更新目标硬盘的读写异常次数。
S302:判断目标硬盘的读写异常次数是否大于等于次数阈值。
在目标硬盘的读写异常次数更新后,判断目标硬盘的读写异常次数是否大于等于次数阈值。若大于等于,则执行S303;若小于,则执行S304。
S303:发送告警信息。
S304:结束本次判断。
在本申请实施例中,通过在目标硬盘的读写异常次数大于或者等于次数阈值时,发送告警信息,能够在硬盘发生真正故障前发起故障预警,进一步提升存储系统的稳定性。
在一种可能的实现方式中,预设数据可能不能成功写入,或者成功写入后不能正常读取。对于此类情况,本申请实施例提供一种硬盘故障的检测方法,若所述预设数据写入不成功,或者,若读取所述预设数据不成功,所述方法还包括:
将所述目标硬盘确定为发生故障的硬盘。
如果不能成功将预设数据写入目标硬盘,或者是不能成功从目标硬盘中读取预设数据,则说明目标硬盘存在着读写故障。将目标硬盘确定为发生故障的硬盘。
基于上述内容可知,在不能正常读写预设数据时,将目标硬盘确定为发生故障的硬盘,实现对故障硬盘的准确检测。
下面以存储系统为Bluestore为例,具体说明本申请实施例提供的硬盘故障的检测方法。
当硬盘在读写存储数据时,出现数据输入输出错误。Bluestore确定出现数据输入输出错误的硬盘为目标硬盘。将目标硬盘标签重新读写一次,进一步判断目标硬盘是否故障。
若读写目标硬盘标签依然存在读写故障,则认为目标硬盘的确为故障硬盘。
若读写目标硬盘标签成功,则表明目标硬盘仍然可用,仅为单个扇区故障或其他原因引起的单次读写故障。触发目标硬盘对存储数据进行重写。在对存储数据进行重写操作时,选取故障存储区域以外的存储区域。
同时记录目标硬盘的读写异常次数,当目标硬盘的读写异常次数超过次数阈值时,向Bluestore所对应的运维平台发送告警信息。
基于上述方法实施例提供的一种硬盘故障的检测方法,本申请实施例还提供了一种硬盘故障的检测装置,下面将结合附图对该硬盘故障的检测装置进行说明。
参见图4,该图为本申请实施例提供的一种硬盘故障的检测装置的结构示意图。如图4所示,该硬盘故障的检测装置包括:
获取单元401,用于获取读写异常信息,所述读写异常信息根据对目标硬盘进行存储数据的读写操作时发生的读写异常生成;
第一确定单元402,用于根据所述读写异常信息确定所述目标硬盘以及所述存储数据;
写入单元403,用于将预设数据写入所述目标硬盘;
读取单元404,用于若所述预设数据写入成功,则从所述目标硬盘中读取所述预设数据;
重写单元405,用于若读取所述预设数据成功,则对所述存储数据进行重写操作。
在一种可能的实现方式中,所述重写单元405,具体用于根据所述读写异常信息确定所述目标硬盘中的故障存储区域;
将所述存储数据写入除所述故障存储区域外的其他存储区域。
在一种可能的实现方式中,所述装置还包括:
更新单元,用于更新所述目标硬盘的读写异常次数。
在一种可能的实现方式中,所述装置还包括:
告警单元,用于若所述目标硬盘的读写异常次数大于或者等于次数阈值,向所述目标硬盘的管理单元发送告警信息。
在一种可能的实现方式中,所述装置还包括:
第二确定单元,用于若所述预设数据写入不成功,或者,若读取所述预设数据不成功,将所述目标硬盘确定为发生故障的硬盘。
在一种可能的实现方式中,所述预设数据为所述目标硬盘的标签。
基于上述方法实施例提供的一种硬盘故障的检测方法,本申请实施例还提供了一种硬盘故障的检测设备,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述任一项实施例所述的方法。
基于上述方法实施例提供的一种硬盘故障的检测方法,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一项实施例所述的方法。
需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不检测在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种硬盘故障的检测方法,其特征在于,所述方法包括:
获取读写异常信息,所述读写异常信息根据对目标硬盘进行存储数据的读写操作时发生的读写异常生成;
根据所述读写异常信息确定所述目标硬盘以及所述存储数据;
将预设数据写入所述目标硬盘;
若所述预设数据写入成功,则从所述目标硬盘中读取所述预设数据;
若读取所述预设数据成功,则对所述存储数据进行重写操作。
2.根据权利要求1所述的方法,其特征在于,所述对所述存储数据进行重写操作,包括:
根据所述读写异常信息确定所述目标硬盘中的故障存储区域;
将所述存储数据写入除所述故障存储区域外的其他存储区域。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
更新所述目标硬盘的读写异常次数。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若所述目标硬盘的读写异常次数大于或者等于次数阈值,向所述目标硬盘的管理单元发送告警信息。
5.根据权利要求1所述的方法,其特征在于,若所述预设数据写入不成功,或者,若读取所述预设数据不成功,所述方法还包括:
将所述目标硬盘确定为发生故障的硬盘。
6.根据权利要求1所述的方法,其特征在于,所述预设数据为所述目标硬盘的标签。
7.一种硬盘故障的检测装置,其特征在于,所述装置包括:
获取单元,用于获取读写异常信息,所述读写异常信息根据对目标硬盘进行存储数据的读写操作时发生的读写异常生成;
第一确定单元,用于根据所述读写异常信息确定所述目标硬盘以及所述存储数据;
写入单元,用于将预设数据写入所述目标硬盘;
读取单元,用于若所述预设数据写入成功,则从所述目标硬盘中读取所述预设数据;
重写单元,用于若读取所述预设数据成功,则对所述存储数据进行重写操作。
8.根据权利要求7所述的装置,其特征在于,所述重写单元,具体用于根据所述读写异常信息确定所述目标硬盘中的故障存储区域;
将所述存储数据写入除所述故障存储区域外的其他存储区域。
9.一种硬盘故障的检测设备,其特征在于,包括:处理器、存储器、系统总线;
所述处理器以及所述存储器通过所述系统总线相连;
所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行权利要求1-6任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行权利要求1-6任一项所述的方法。
CN202110744920.4A 2021-06-30 2021-06-30 一种硬盘故障的检测方法、装置及设备 Active CN113625957B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110744920.4A CN113625957B (zh) 2021-06-30 2021-06-30 一种硬盘故障的检测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110744920.4A CN113625957B (zh) 2021-06-30 2021-06-30 一种硬盘故障的检测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN113625957A true CN113625957A (zh) 2021-11-09
CN113625957B CN113625957B (zh) 2024-02-13

Family

ID=78378857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110744920.4A Active CN113625957B (zh) 2021-06-30 2021-06-30 一种硬盘故障的检测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN113625957B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114035994A (zh) * 2021-11-17 2022-02-11 北京极光星通科技有限公司 数据存储系统、故障处理方法、电子设备及存储介质

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003140839A (ja) * 2001-10-30 2003-05-16 Fujitsu Ltd ハードディスク多重制御装置およびハードディスク多重制御プログラム
CN101377748A (zh) * 2007-08-29 2009-03-04 英业达股份有限公司 校验储存装置的读写功能的方法
CN103700387A (zh) * 2013-09-18 2014-04-02 福建鼎恩协创电子科技有限公司 硬盘坏道监测修复装置及方法
CN106610788A (zh) * 2015-10-26 2017-05-03 华为技术有限公司 硬盘阵列控制方法及装置
WO2017071563A1 (zh) * 2015-10-31 2017-05-04 华为技术有限公司 一种存储数据的方法及集群管理节点
CN109976674A (zh) * 2019-03-29 2019-07-05 苏州浪潮智能科技有限公司 一种硬盘管理方法、系统、设备及计算机可读存储介质
CN110515756A (zh) * 2019-07-26 2019-11-29 济南浪潮数据技术有限公司 一种存储系统的故障预防方法、装置、设备和存储介质
JP6760619B1 (ja) * 2019-07-26 2020-09-23 広東叡江云計算股▲分▼有限公司Guangdong Eflycloud Computing Co., Ltd ハードディスクの耐用年数の最適化方法及びそのシステム
CN112379834A (zh) * 2020-11-11 2021-02-19 深圳市豪恩汽车电子装备股份有限公司 存储卡管理装置及方法
CN112506744A (zh) * 2020-12-11 2021-03-16 浪潮电子信息产业股份有限公司 一种NVMe硬盘的运行状态监测方法、装置及设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003140839A (ja) * 2001-10-30 2003-05-16 Fujitsu Ltd ハードディスク多重制御装置およびハードディスク多重制御プログラム
CN101377748A (zh) * 2007-08-29 2009-03-04 英业达股份有限公司 校验储存装置的读写功能的方法
CN103700387A (zh) * 2013-09-18 2014-04-02 福建鼎恩协创电子科技有限公司 硬盘坏道监测修复装置及方法
CN106610788A (zh) * 2015-10-26 2017-05-03 华为技术有限公司 硬盘阵列控制方法及装置
WO2017071563A1 (zh) * 2015-10-31 2017-05-04 华为技术有限公司 一种存储数据的方法及集群管理节点
CN109976674A (zh) * 2019-03-29 2019-07-05 苏州浪潮智能科技有限公司 一种硬盘管理方法、系统、设备及计算机可读存储介质
CN110515756A (zh) * 2019-07-26 2019-11-29 济南浪潮数据技术有限公司 一种存储系统的故障预防方法、装置、设备和存储介质
JP6760619B1 (ja) * 2019-07-26 2020-09-23 広東叡江云計算股▲分▼有限公司Guangdong Eflycloud Computing Co., Ltd ハードディスクの耐用年数の最適化方法及びそのシステム
CN112379834A (zh) * 2020-11-11 2021-02-19 深圳市豪恩汽车电子装备股份有限公司 存储卡管理装置及方法
CN112506744A (zh) * 2020-12-11 2021-03-16 浪潮电子信息产业股份有限公司 一种NVMe硬盘的运行状态监测方法、装置及设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
付长冬, 舒继武, 沈美明, 郑纬民: "基于RAM/Disk混合设备模型的FC-SAN存储系统", 计算机研究与发展, no. 03 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114035994A (zh) * 2021-11-17 2022-02-11 北京极光星通科技有限公司 数据存储系统、故障处理方法、电子设备及存储介质
CN114035994B (zh) * 2021-11-17 2022-06-07 北京极光星通科技有限公司 数据存储系统、故障处理方法、电子设备及存储介质

Also Published As

Publication number Publication date
CN113625957B (zh) 2024-02-13

Similar Documents

Publication Publication Date Title
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
KR101805234B1 (ko) 데이터 메모리의 모니터링 방법, 비일시적 컴퓨터 판독가능 저장 매체 및 보조 메모리
EP0806726A1 (en) On-line memory monitoring system and methods
CN110164501B (zh) 一种硬盘检测方法、装置、存储介质及设备
CN102135925B (zh) 用于检测错误检查和纠正内存的方法和装置
US9335183B2 (en) Method for reliably operating a sensor
CN112732477B (zh) 一种带外自检故障隔离的方法
US10915388B2 (en) Data storage device and associated operating method capable of detecting errors and effectively protecting data
CN113625957B (zh) 一种硬盘故障的检测方法、装置及设备
CN116775362A (zh) 独立冗余磁盘阵列的通路阻塞处理方法、系统
CN102959521B (zh) 计算机系统的管理方法以及管理系统
CN114416140B (zh) 一种基于ecu的升级方法及装置
JP4627327B2 (ja) 異常判定装置
US5768494A (en) Method of correcting read error in digital data processing system by implementing a predetermind number of data read retrials
US11914703B2 (en) Method and data processing system for detecting a malicious component on an integrated circuit
CN111813748B (zh) 一种文件系统的挂载方法、装置、电子设备及存储介质
CN110083470B (zh) 磁盘分析方法、装置及计算机可读存储介质
CN107346256B (zh) 一种固件刷新对io影响时间的检测方法和装置
CN106940666B (zh) 内存数据检测方法
CN110703083A (zh) 一种开关模块开关寿命监测记录方法及系统
CN111188782A (zh) 一种风扇冗余测试方法、装置和计算机可读存储介质
US20170308469A1 (en) Resource Processing Method and Device for Multi-controller System
US20070179635A1 (en) Method and article of manufacure to persistently deconfigure connected elements
CN115333970B (zh) 设备连接稳定性评价方法、装置和计算机设备和存储介质
CN112685424B (zh) 发动机故障存储的处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant