CN108536548B - 一种磁盘坏道的处理方法、装置及计算机存储介质 - Google Patents

一种磁盘坏道的处理方法、装置及计算机存储介质 Download PDF

Info

Publication number
CN108536548B
CN108536548B CN201810317786.8A CN201810317786A CN108536548B CN 108536548 B CN108536548 B CN 108536548B CN 201810317786 A CN201810317786 A CN 201810317786A CN 108536548 B CN108536548 B CN 108536548B
Authority
CN
China
Prior art keywords
target disk
bad track
disk
target
storage space
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201810317786.8A
Other languages
English (en)
Other versions
CN108536548A (zh
Inventor
谢佳祥
张旭
郑雅娟
潘志淮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wangsu Science and Technology Co Ltd
Original Assignee
Wangsu Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wangsu Science and Technology Co Ltd filed Critical Wangsu Science and Technology Co Ltd
Priority to CN201810317786.8A priority Critical patent/CN108536548B/zh
Priority to EP18889973.6A priority patent/EP3745270A4/en
Priority to PCT/CN2018/091579 priority patent/WO2019196199A1/zh
Publication of CN108536548A publication Critical patent/CN108536548A/zh
Priority to US16/506,349 priority patent/US11073998B2/en
Application granted granted Critical
Publication of CN108536548B publication Critical patent/CN108536548B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • G06F3/0644Management of space entities, e.g. partitions, extents, pools
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1076Parity data used in redundant arrays of independent storages, e.g. in RAID systems
    • G06F11/1088Reconstruction on already foreseen single or plurality of spare disks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/2221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test input/output devices or peripheral units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • G06F3/0619Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1883Methods for assignment of alternate areas for defective areas
    • G11B20/1889Methods for assignment of alternate areas for defective areas with discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1816Testing
    • G11B2020/1826Testing wherein a defect list or error map is generated
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/18Error detection or correction; Testing, e.g. of drop-outs
    • G11B20/1816Testing
    • G11B2020/183Testing wherein at least one additional attempt is made to read or write the data when a first attempt is unsuccessful

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种磁盘坏道的处理方法、装置及计算机存储介质,其中,所述方法包括:获取待处理的目标磁盘,并检测所述目标磁盘中的坏道数据;合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域;根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。本申请提供的技术方案,能够在节省磁盘资源的情况下,提高故障磁盘的处理效率。

Description

一种磁盘坏道的处理方法、装置及计算机存储介质
技术领域
本发明涉及硬件设备检测技术领域,特别涉及一种磁盘坏道的处理方法、装置及计算机存储介质。
背景技术
目前,在一些大规模分布式应用环境中,磁盘数量巨大并且磁盘比较分散,对磁盘的维护比较困难。例如,在内容分发网络中,当磁盘出现故障时,通常是等到磁盘掉线或严重影响业务/服务质量后,才会安排人员替换出现故障的磁盘。这样处理的弊端在于:磁盘出现故障时处理效率较低,此外,磁盘坏道是磁盘常见的故障,如果用新的磁盘替换只有少量坏道的磁盘,会造成较大的资源浪费。
发明内容
本申请的目的在于提供一种磁盘坏道的处理方法、装置及计算机存储介质,能够在节省磁盘资源的情况下,提高故障磁盘的处理效率。
为实现上述目的,本申请一方面提供一种磁盘坏道的处理方法,所述方法包括:获取待处理的目标磁盘,并检测所述目标磁盘中的坏道数据;合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域;根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。
为实现上述目的,本申请另一方面还提供一种磁盘坏道的处理装置,所述装置包括:磁盘检测单元,用于获取待处理的目标磁盘,并检测所述目标磁盘中的坏道数据;坏道隔离单元,用于合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域;空间重构单元,用于根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。
为实现上述目的,本申请另一方面还提供一种磁盘坏道的处理装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,执行上述的方法。
为实现上述目的,本申请另一方面还提供一种计算机存储介质,所述计算机存储介质用于存储计算机程序,所述计算机程序被处理器执行时,执行上述的方法。
由上可见,本申请提供的技术方案中,可以自动识别目标磁盘是否需要进行坏道测试。具体地,可以定期获取目标磁盘的健康状态信息,并针对健康状态信息进行分析,从而确定目标磁盘是否需要进行坏道测试。当需要进行坏道测试时,可以将坏道数据表征的坏道区域进行合并,合并后的坏道区域在目标磁盘中可以被隔离,从而得到剔除坏道区域的可用区域。由于坏道区域的存在,可用区域在目标磁盘中可能会呈现离散的分布情况,此时,为了正常使用目标磁盘中的可用区域,可以基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。具体地,可以按照所述可用区域,将所述目标磁盘划分为多个分区,并将所述多个分区合并为一个卷。在对合并后的卷进行格式化之后,可以将格式化后的卷的卷标和挂载点沿用目标磁盘原先的卷标和挂载点,从而完成对故障磁盘的处理过程。处理之后的磁盘,由于坏道区域被隔离开,从而不会影响正常区域的使用。由此可见,本申请提供的技术方案,在出现少量坏道时,不需要将磁盘整体替换,而是可以采用坏道隔离的方式,充分利用可用区域,因此能够在节省磁盘资源的情况下,提高故障磁盘的处理效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中磁盘坏道的处理方法步骤图;
图2是本发明实施例中磁盘坏道的处理方法流程图;
图3是本发明实施例中坏道隔离示意图;
图4是本发明实施例中磁盘坏道的处理装置的结构示意图;
图5是本发明实施例中计算机终端的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一
本申请提供一种磁盘坏道的处理方法,请参阅图1和图2,所述方法可以包括以下步骤。
S1:获取待处理的目标磁盘,并检测所述目标磁盘中的坏道数据。
在本实施方式中,可以定期执行磁盘状态监控脚本,该脚本在执行时,可以获取目标磁盘的健康状态信息。在实际应用中,所述目标磁盘的健康状态信息可以包括所述目标磁盘的自检信息、所述目标磁盘所处操作系统的日志信息以及所述目标磁盘的输入输出负载信息中的至少一种。其中,所述自检信息可以是目标磁盘的S.M.A.R.T(Self-MonitoringAnalysis and Reporting Technology,自我监测、分析及报告技术)信息,S.M.A.R.T信息可以保留在硬盘的系统保留区(service area)内。S.M.A.R.T标准中可以采用二进制代码作为S.M.A.R.T的基本指令,并规定写入标准的寄存器中,形成特定的S.M.A.R.T信息表,以供正常检测和运行。S.M.A.R.T指令可以分为主指令(Command)和次指令(Subcommands)。主指令主要提供设备是否支持S.M.A.R.T或忽略某一次指令特征的信息。而次指令则提供支持S.M.A.R.T设备的检测信息。在S.M.A.R.T信息中,可以显示目标硬盘是否失败(FAIL),还可以显示目标磁盘在运行时是否出现了错误,并且可以根据出现错误的数量,判断该目标磁盘是否出现了大量错误(错误数量在200以上)。所述日志信息可以指操作系统的message信息,该信息可以表明目标磁盘是否有读写错误,以及是否有文件系统错误。所述输入输出负载信息则可以表征目标磁盘是否处于高负载的运行状态下。
在本实施方式中,可以预先设定目标磁盘可能存在的运行状态,然后基于所述目标磁盘的健康状态信息,可以分别确定各个所述运行状态对应的判定结果,以得到所述目标磁盘的判定结果组合。例如,请参阅表1,表1中列出了多个运行状态,并且在各个运行状态下,例举了可能的判定结果,每一行均可以作为一个判定结果组合。
表1硬盘故障判断分析表
Figure BDA0001624360970000041
在本实施方式中,在得到目标磁盘实际的判定结果组合时,可以调用所述判定结果组合对应的预设处理策略,所述预设处理策略可以用于表征所述目标磁盘是否需要进行坏道测试。如表1所示,所述预设处理策略可以是“处理动作”这一栏的信息,根据不同的判定结果组合,可以对应不同的处理动作。
S3:合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域。
在本实施方式中,当判断结果表示需要对目标磁盘进行坏道测试时,可以中止所述目标磁盘中的业务或者中止所述目标磁盘所处服务器中的业务。例如,可以将该目标磁盘从服务器中暂时剔除,或者直接将该目标磁盘所处的服务器停机。这样,可以在对目标磁盘进行坏道测试时,不妨碍正常的业务执行过程。
在本实施方式中,在对目标磁盘进行坏道测试时,首先可以对所述目标磁盘中的逻辑坏道进行修复,最终,可以将无法修复的坏道对应的坏道数据保存至指定文件中。所述指定文件可以是在操作系统中预先设置的文件,后续对坏道数据进行分析时,可以通过该指定文件的访问路径,读取其中的坏道数据。
在本实施方式中,当完成坏道测试的过程后,可以针对所述指定文件中的坏道数据进行分析。在实际应用中,所述坏道数据可以是一个一维的非负整数的数组。该数组中可以包含多个元素,其中,每个元素可以代表一个容量为4KB的坏道,同时,该元素的元素值可以表征坏道在目标磁盘上所处的位置。例如,元素值N(从0开始的整数)可以代表所述目标磁盘中的第N+1个容量为4KB的区域。
在本实施方式中,可以采用尽可能小的区域将坏道所在的区域覆盖,并将覆盖坏道的区域从目标磁盘中隔离,从而得到目标磁盘中可以正常使用的可用区域。具体地,可以预先将所述目标磁盘的存储空间划分为指定数量的子区域。例如,可以将目标磁盘等分为100个子区域,这100个子区域可以通过0-99的数字来表示。其中,0可以表示0-1%的存储空间,1可以表示1-2%的存储空间,以此类推。然后,可以在所述指定数量的子区域中确定所述坏道数据中各个元素值对应的目标子区域。具体地,首先以4KB为单位,确定目标磁盘的总容量(目标磁盘的实际容量中包含的4KB的数量)。然后可以用元素值除以该目标磁盘的总容量,然后将得到的结果取整,从而可以确定该元素值具体对应哪一个子区域。这样,确定出的目标子区域均可以作为存在坏道的子区域。请参阅图3,图3中填充阴影的子区域便可以作为存在坏道的目标子区域。
在本实施方式中,在确定出各个坏道所处的目标子区域之后,为了避免坏道的区域过于离散,可以将间隔满足指定条件的两个相邻的目标子区域进行合并,从而得到多个合并区域。具体地,在对目标子区域进行合并时,可以采用适配的区域来覆盖间隔满足指定条件的多个目标子区域。所述间隔满足指定条件可以指相邻两个目标子区域之间间隔的子区域的数量小于或者等于指定数量阈值。例如,所述指定数量阈值为2(目标磁盘总容量的2%),那么只要相邻两个目标子区域之间的间隔不超过2个子区域,就可以将这两个相邻的目标子区域进行合并。请参阅图3,第一个和第二个目标子区域之间,相隔了1个子区域,因此可以将这两个目标子区域进行合并,在对这两个目标子区域进行合并时,需要将这两个目标子区域之间包含的子区域也一起合并,因此,初步合并后的该合并区域中,可以包括三个子区域。同理,由于第二个目标子区域与第三个目标子区域之间间隔了4个子区域,不满足合并条件,因此不会将第二个目标子区域与第三个目标子区域进行合并。而第三、第四以及第五个目标子区域均满足合并条件,因此可以将这三个目标子区域连同它们之间间隔的子区域一同合并,合并后的合并区域中可以包括四个子区域。
在本实施方式中,在将目标子区域合并为合并区域之后,可以在各个所述合并区域的头部和/或尾部确定隔离区域,例如,该隔离区域可以是1个子区域(目标磁盘总容量的1%),并将所述合并区域与所述隔离区域的组合作为合并后的坏道区域。例如在图3中,第一个合并区域由于在目标磁盘的头部,因此仅在合并区域的尾部将一个子区域作为隔离区域,这样,最终可以将虚线框中的4个子区域作为坏道区域。同理,第二个合并区域由于处于目标磁盘的中间,因此头部和尾部均可以确定1个子区域作为隔离区域,这样,虚线框中的6个子区域可以作为坏道区域。
在本实施方式中,在对坏道进行隔离,得到坏道区域之后,目标磁盘中剔除坏道区域以外的区域,便可以作为可用区域。
在一个实施方式中,若在指定时长内无法完成坏道测试的过程,则可以发送报警信息,从而通知管理人员直接更换磁盘。例如,超过48小时还未完成坏道测试过程,则表明磁盘中坏道过多或者磁盘出现严重的读写错误,从而可以放弃坏道隔离的过程,直接更换磁盘。
S5:根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。
在本实施方式中,在对坏道进行检测以及隔离之后,可以根据检测结果,判断该目标磁盘是否可以继续使用。具体地,可以通过对坏道数量、可用区域的空间容量以及可用区域的分区数量这三个方面进行综合考量。若检测到的坏道的数量大于指定坏道数量阈值,或者得到的可用区域的空间容量小于指定容量阈值,或者按照所述可用区域进行分区后的分区数量大于指定分区数量阈值,可以判定所述目标磁盘不可用。例如,若坏道数量超过200个,或者可用区域的空间容量低于目标磁盘总容量的90%,或者可用区域的分区数量超过4个,均判定目标磁盘不可用。相反,若检测到的坏道的数量小于或者等于所述指定坏道数量阈值,并且得到的可用区域的空间容量大于或者等于所述指定容量阈值,并且按照所述可用区域进行分区后的分区数量小于或者等于指定分区数量阈值,可以判定所述目标磁盘可用。例如,若坏道数量不超过200个,并且可用区域的空间容量不低于目标磁盘总容量的90%,并且可用区域的分区数量不超过4个,可以判定目标磁盘可用。
在本实施方式中,针对不可用的目标磁盘,可以发出告警信息,通知管理人员更换磁盘。而对于可用的目标磁盘,可以按照所述可用区域,将所述目标磁盘划分为多个分区。具体地,可以将连续的多个可用区域划分为一个分区。例如,在图3中,虚线框以外的空白子区域均为可用区域,那么可以将剩余的可用区域划分为两个分区,第一分区中包含2个子区域,第二个分区中仅包含1个子区域。在将可用区域划分为多个分区之后,可以通过LVM(Logical Volume Manager,逻辑卷管理)功能,将所述多个分区合并为一个卷,并将合并后的所述卷作为重新构建的存储空间。
在本实施方式中,在检测所述目标磁盘中的坏道数据之前,可以记录所述目标磁盘的卷标和挂载点,这样,在得到重新构建的存储空间之后,可以格式化重新构建的所述存储空间,并将记录的所述目标磁盘的卷标和挂载点分别设置为格式化后的存储空间的卷标和挂载点,从而完成接入参数的设置过程。
在本实施方式中,完成坏道隔离以及合并卷处理后的目标磁盘可以继续使用,因此,可以恢复所述目标磁盘中的业务或者恢复所述目标磁盘所处服务器中的业务。
实施例二
本申请还提供一种磁盘坏道的处理装置,所述装置包括:
磁盘检测单元,用于获取待处理的目标磁盘,并检测所述目标磁盘中的坏道数据;
坏道隔离单元,用于合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域;
空间重构单元,用于根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。
在一个实施方式中,所述坏道数据中包括至少一个用于表征坏道在所述目标磁盘中所处位置的元素值;相应地,所述坏道隔离单元包括:
子区域划分模块,用于预先将所述目标磁盘的存储空间划分为指定数量的子区域;
目标子区域确定模块,用于在所述指定数量的子区域中确定所述坏道数据中各个元素值对应的目标子区域;
区域合并模块,用于将间隔满足指定条件的两个相邻的目标子区域进行合并,得到多个合并区域;
隔离区域设置模块,用于在各个所述合并区域的头部和/或尾部确定隔离区域,并将所述合并区域与所述隔离区域的组合作为合并后的坏道区域。
在一个实施方式中,所述空间重构单元包括:
分区划分模块,用于按照所述可用区域,将所述目标磁盘划分为多个分区;
卷合并模块,用于将所述多个分区合并为一个卷,并将合并后的所述卷作为重新构建的存储空间。
在一个实施方式中,所述装置还包括:
参数记录单元,用于记录所述目标磁盘的卷标和挂载点;
相应地,所述空间重构单元还包括:
参数重置模块,用于格式化重新构建的所述存储空间,并将记录的所述目标磁盘的卷标和挂载点分别设置为格式化后的存储空间的卷标和挂载点
实施例三
请参阅图4,本申请还提供一种磁盘坏道的处理装置,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,可以执行上述磁盘坏道的处理方法。
在本实施方式中,所述存储器可以包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方法的媒体加以存储。本实施方式所述的存储器又可以包括:利用电能方式存储信息的装置,如RAM、ROM等;利用磁能方式存储信息的装置,如硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的装置,如CD或DVD。当然,还有其他方式的计算机存储介质,例如量子存储器、石墨烯存储器等等。
在本实施方式中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。
本申请还提供一种计算机存储介质,所述计算机存储介质用于存储计算机程序,所述计算机程序被处理器执行时,可以执行上述磁盘坏道的处理方法。
本说明书实施方式提供的磁盘坏道的处理装置和计算机存储介质,其本身所实现的具体功能,可以与本说明书中的前述方法实施方式相对照解释,并能够达到前述方法实施方式的技术效果,这里便不再赘述。
请参阅图5,在本申请中,上述实施例中的技术方案可以应用于如图5所示的计算机终端10上。计算机终端10可以包括一个或多个(图中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输模块106。本领域普通技术人员可以理解,图5所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算机终端10还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。
存储器104可用于存储应用软件的软件程序以及模块,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
上述实施例中的计算机程序可以存储于存储器104中,并且存储器104可以与处理器102耦合,处理器102从而可以读取存储器104中的计算机程序并执行该计算机程序,从而可以实现本申请上述的技术方案。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
由上可见,本申请提供的技术方案中,可以自动识别目标磁盘是否需要进行坏道测试。具体地,可以定期获取目标磁盘的健康状态信息,并针对健康状态信息进行分析,从而确定目标磁盘是否需要进行坏道测试。当需要进行坏道测试时,可以将坏道数据表征的坏道区域进行合并,合并后的坏道区域在目标磁盘中可以被隔离,从而得到剔除坏道区域的可用区域。由于坏道区域的存在,可用区域在目标磁盘中可能会呈现离散的分布情况,此时,为了正常使用目标磁盘中的可用区域,可以基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。具体地,可以按照所述可用区域,将所述目标磁盘划分为多个分区,并将所述多个分区合并为一个卷。在对合并后的卷进行格式化之后,可以将格式化后的卷的卷标和挂载点沿用目标磁盘原先的卷标和挂载点,从而完成对故障磁盘的处理过程。处理之后的磁盘,由于坏道区域被隔离开,从而不会影响正常区域的使用。由此可见,本申请提供的技术方案,在出现少量坏道时,不需要将磁盘整体替换,而是可以采用坏道隔离的方式,充分利用可用区域,因此能够在节省磁盘资源的情况下,提高故障磁盘的处理效率。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.一种磁盘坏道的处理方法,其特征在于,所述方法包括:
获取目标磁盘的健康状态信息,并基于所述健康状态信息,确定所述目标磁盘的判定结果组合;
调用所述判定结果组合对应的预设处理策略,所述预设处理策略用于表征所述目标磁盘是否需要进行坏道测试;
在所述预设处理策略表征所述目标磁盘需要进行坏道测试时,检测所述目标磁盘中的坏道数据;
合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域;其中,针对坏道数据对应的目标子区域,将间隔满足指定条件的两个相邻的目标子区域进行合并,得到多个合并区域;以及在各个所述合并区域的头部和/或尾部确定隔离区域,并将所述合并区域与所述隔离区域的组合作为合并后的坏道区域;
根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。
2.根据权利要求1所述的方法,其特征在于,所述目标磁盘的健康状态信息包括所述目标磁盘的自检信息、所述目标磁盘所处操作系统的日志信息以及所述目标磁盘的输入输出负载信息中的至少一种;
相应地,确定所述目标磁盘的判定结果组合包括:
预先设定所述目标磁盘对应的多个运行状态,并基于所述目标磁盘的健康状态信息,分别确定各个所述运行状态对应的判定结果,以得到所述目标磁盘的判定结果组合。
3.根据权利要求1所述的方法,其特征在于,在检测所述目标磁盘中的坏道数据时,所述方法还包括:
对所述目标磁盘中的逻辑坏道进行修复,并将无法修复的坏道对应的坏道数据保存至指定文件中。
4.根据权利要求1或3所述的方法,其特征在于,所述坏道数据中包括至少一个用于表征坏道在所述目标磁盘中所处位置的元素值;相应地,坏道数据对应的目标子区域按照以下方式确定:
预先将所述目标磁盘的存储空间划分为指定数量的子区域;
在所述指定数量的子区域中确定所述坏道数据中各个元素值对应的目标子区域。
5.根据权利要求1所述的方法,其特征在于,所述间隔满足指定条件包括:
相邻两个目标子区域之间间隔的子区域的数量小于或者等于指定数量阈值。
6.根据权利要求1所述的方法,其特征在于,基于所述可用区域重新构建所述目标磁盘的存储空间包括:
按照所述可用区域,将所述目标磁盘划分为多个分区;
将所述多个分区合并为一个卷,并将合并后的所述卷作为重新构建的存储空间。
7.根据权利要求1或6所述的方法,其特征在于,在检测所述目标磁盘中的坏道数据之前,所述方法还包括:
记录所述目标磁盘的卷标和挂载点;
相应地,为重新构建的所述存储空间设置接入参数包括:
格式化重新构建的所述存储空间,并将记录的所述目标磁盘的卷标和挂载点分别设置为格式化后的存储空间的卷标和挂载点。
8.根据权利要求1所述的方法,其特征在于,根据检测结果,判断所述目标磁盘是否可用包括:
若检测到的坏道的数量大于指定坏道数量阈值,或者得到的可用区域的空间容量小于指定容量阈值,或者按照所述可用区域进行分区后的分区数量大于指定分区数量阈值,判定所述目标磁盘不可用;
若检测到的坏道的数量小于或者等于所述指定坏道数量阈值,并且得到的可用区域的空间容量大于或者等于所述指定容量阈值,并且按照所述可用区域进行分区后的分区数量小于或者等于指定分区数量阈值,判定所述目标磁盘可用。
9.根据权利要求1所述的方法,其特征在于,在检测所述目标磁盘中的坏道数据之前,所述方法还包括:
中止所述目标磁盘中的业务或者中止所述目标磁盘所处服务器中的业务;
相应地,在为重新构建的所述存储空间设置接入参数之后,所述方法还包括:
恢复所述目标磁盘中的业务或者恢复所述目标磁盘所处服务器中的业务。
10.一种磁盘坏道的处理装置,其特征在于,所述装置包括:
磁盘检测单元,用于获取目标磁盘的健康状态信息,并基于所述健康状态信息,确定所述目标磁盘的判定结果组合;调用所述判定结果组合对应的预设处理策略,所述预设处理策略用于表征所述目标磁盘是否需要进行坏道测试;在所述预设处理策略表征所述目标磁盘需要进行坏道测试时,检测所述目标磁盘中的坏道数据;
坏道隔离单元,用于合并所述坏道数据表征的坏道区域,以得到所述目标磁盘中除所述坏道区域以外的可用区域;其中,针对坏道数据对应的目标子区域,将间隔满足指定条件的两个相邻的目标子区域进行合并,得到多个合并区域;以及在各个所述合并区域的头部和/或尾部确定隔离区域,并将所述合并区域与所述隔离区域的组合作为合并后的坏道区域;
空间重构单元,用于根据检测结果,判断所述目标磁盘是否可用,若可用,基于所述可用区域重新构建所述目标磁盘的存储空间,并为重新构建的所述存储空间设置接入参数。
11.根据权利要求10所述的装置,其特征在于,所述坏道数据中包括至少一个用于表征坏道在所述目标磁盘中所处位置的元素值;相应地,所述坏道隔离单元包括:
子区域划分模块,用于预先将所述目标磁盘的存储空间划分为指定数量的子区域;
目标子区域确定模块,用于在所述指定数量的子区域中确定所述坏道数据中各个元素值对应的目标子区域。
12.根据权利要求10所述的装置,其特征在于,所述空间重构单元包括:
分区划分模块,用于按照所述可用区域,将所述目标磁盘划分为多个分区;
卷合并模块,用于将所述多个分区合并为一个卷,并将合并后的所述卷作为重新构建的存储空间。
13.根据权利要求10或12所述的装置,其特征在于,所述装置还包括:
参数记录单元,用于记录所述目标磁盘的卷标和挂载点;
相应地,所述空间重构单元还包括:
参数重置模块,用于格式化重新构建的所述存储空间,并将记录的所述目标磁盘的卷标和挂载点分别设置为格式化后的存储空间的卷标和挂载点。
14.一种磁盘坏道的处理装置,其特征在于,所述装置包括存储器和处理器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,执行权利要求1至9中任一所述的方法。
15.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储计算机程序,所述计算机程序被处理器执行时,执行权利要求1至9中任一所述的方法。
CN201810317786.8A 2018-04-10 2018-04-10 一种磁盘坏道的处理方法、装置及计算机存储介质 Expired - Fee Related CN108536548B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201810317786.8A CN108536548B (zh) 2018-04-10 2018-04-10 一种磁盘坏道的处理方法、装置及计算机存储介质
EP18889973.6A EP3745270A4 (en) 2018-04-10 2018-06-15 METHOD AND DEVICE FOR PROCESSING DEFECTIVE TRACES FROM DATA CARRIERS AND COMPUTER STORAGE MEDIUM
PCT/CN2018/091579 WO2019196199A1 (zh) 2018-04-10 2018-06-15 一种磁盘坏道的处理方法、装置及计算机存储介质
US16/506,349 US11073998B2 (en) 2018-04-10 2019-07-09 Method, apparatus for processing disk bad sector,and computer storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810317786.8A CN108536548B (zh) 2018-04-10 2018-04-10 一种磁盘坏道的处理方法、装置及计算机存储介质

Publications (2)

Publication Number Publication Date
CN108536548A CN108536548A (zh) 2018-09-14
CN108536548B true CN108536548B (zh) 2020-12-29

Family

ID=63479841

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810317786.8A Expired - Fee Related CN108536548B (zh) 2018-04-10 2018-04-10 一种磁盘坏道的处理方法、装置及计算机存储介质

Country Status (4)

Country Link
US (1) US11073998B2 (zh)
EP (1) EP3745270A4 (zh)
CN (1) CN108536548B (zh)
WO (1) WO2019196199A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110209550A (zh) * 2019-05-24 2019-09-06 新华三技术有限公司成都分公司 存储介质的故障处理方法、装置、电子设备及存储介质
CN112558859A (zh) * 2019-09-26 2021-03-26 杭州海康威视数字技术股份有限公司 硬盘、存储系统及硬盘容量标记方法
CN110931072B (zh) * 2019-11-28 2022-03-22 深信服科技股份有限公司 一种坏道扫描方法、装置、设备及存储介质
CN111007992B (zh) * 2020-03-04 2020-08-04 广东电网有限责任公司佛山供电局 一种磁盘数据存储表示方法、系统、存储介质
CN113778657B (zh) * 2020-09-24 2024-04-16 北京沃东天骏信息技术有限公司 一种数据处理方法和装置
CN112732517B (zh) * 2020-12-29 2023-12-22 北京浪潮数据技术有限公司 一种磁盘故障告警方法、装置、设备及可读存储介质
CN113032201B (zh) * 2021-05-24 2021-09-21 广东睿江云计算股份有限公司 一种硬盘坏道检测方法
CN113672415A (zh) * 2021-07-09 2021-11-19 济南浪潮数据技术有限公司 一种磁盘故障处理方法、装置、设备及存储介质
CN116380149B (zh) * 2023-04-07 2024-02-02 深圳市兴源智能仪表股份有限公司 一种仪表码盘转动测试方法、系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6058462A (en) * 1998-01-23 2000-05-02 International Business Machines Corporation Method and apparatus for enabling transfer of compressed data record tracks with CRC checking
CN101527142A (zh) * 2009-04-17 2009-09-09 杭州华三通信技术有限公司 一种磁盘冗余阵列中数据的读写方法和设备
CN104484251A (zh) * 2014-12-11 2015-04-01 华为技术有限公司 一种硬盘故障的处理方法及装置
CN107015877A (zh) * 2017-03-14 2017-08-04 唐山钢铁集团有限责任公司 一种带有物理坏道的raid磁盘的重新利用方法
CN107807862A (zh) * 2017-09-29 2018-03-16 曙光信息产业(北京)有限公司 检测硬盘故障点的方法、装置及服务器

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005024825A1 (ja) * 2003-09-05 2005-03-17 Fujitsu Limited 光磁気ディスク装置および光磁気ディスクに対するデータ書き込み方法
US7890796B2 (en) * 2006-10-04 2011-02-15 Emc Corporation Automatic media error correction in a file server
US7653840B1 (en) * 2007-04-27 2010-01-26 Net App, Inc. Evaluating and repairing errors during servicing of storage devices
US8385014B2 (en) * 2010-10-11 2013-02-26 Lsi Corporation Systems and methods for identifying potential media failure
CN103593275B (zh) * 2013-10-31 2017-06-27 华为技术有限公司 磁盘信息显示方法及装置
CN105279057A (zh) * 2015-11-10 2016-01-27 浪潮(北京)电子信息产业有限公司 一种磁盘坏道检测方法与系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6058462A (en) * 1998-01-23 2000-05-02 International Business Machines Corporation Method and apparatus for enabling transfer of compressed data record tracks with CRC checking
CN101527142A (zh) * 2009-04-17 2009-09-09 杭州华三通信技术有限公司 一种磁盘冗余阵列中数据的读写方法和设备
CN104484251A (zh) * 2014-12-11 2015-04-01 华为技术有限公司 一种硬盘故障的处理方法及装置
CN107015877A (zh) * 2017-03-14 2017-08-04 唐山钢铁集团有限责任公司 一种带有物理坏道的raid磁盘的重新利用方法
CN107807862A (zh) * 2017-09-29 2018-03-16 曙光信息产业(北京)有限公司 检测硬盘故障点的方法、装置及服务器

Also Published As

Publication number Publication date
EP3745270A1 (en) 2020-12-02
WO2019196199A1 (zh) 2019-10-17
EP3745270A4 (en) 2021-05-19
US20190332305A1 (en) 2019-10-31
US11073998B2 (en) 2021-07-27
CN108536548A (zh) 2018-09-14

Similar Documents

Publication Publication Date Title
CN108536548B (zh) 一种磁盘坏道的处理方法、装置及计算机存储介质
US20160232450A1 (en) Storage device lifetime monitoring system and storage device lifetime monitoring method thereof
CN112002370B (zh) 一种识别磁盘异常的方法、装置及分布式存储系统
CN109726036B (zh) 一种存储系统中的数据重构方法和装置
CN103559124A (zh) 故障快速检测方法及装置
CN110597655A (zh) 一种迁移与基于纠删码的重构相耦合的快速预知修复方法和实现
CN111796959A (zh) 宿主机容器自愈方法、装置及系统
CN112466382A (zh) 一种raid阵列的巡检方法和装置
CN103049345B (zh) 基于异步通信机制的磁盘状态变迁检测方法及装置
CN110737924A (zh) 一种数据保护的方法和设备
CN106844166B (zh) 一种数据处理方法及装置
CN115640174A (zh) 内存故障预测方法、系统、中央处理单元及计算设备
CN114860487A (zh) 一种内存故障识别方法及一种内存故障隔离方法
CN105183583A (zh) 一种磁盘阵列的数据重建的方法及一种磁盘阵列系统
CN105573872A (zh) 数据存储系统的硬盘维护方法和装置
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
US8977892B2 (en) Disk control apparatus, method of detecting failure of disk apparatus, and recording medium for disk diagnosis program
CN116705129B (zh) 固态硬盘的测试方法
CN116501705A (zh) 基于ras的内存信息收集解析方法、系统、设备及介质
US20230025081A1 (en) Model training method, failure determining method, electronic device, and program product
CN112799896A (zh) 分布式存储硬盘故障处理方法及装置
CN112084097A (zh) 一种磁盘告警方法及装置
US11892920B2 (en) Method, electronic device, and program product for failure handling
CN114003477B (zh) 慢盘诊断信息收集方法、系统、终端及存储介质
US10481828B2 (en) Slow drive detection

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20201229

CF01 Termination of patent right due to non-payment of annual fee