CN103019885A - 基于嵌入式Linux的硬盘坏道监测方法及系统 - Google Patents

基于嵌入式Linux的硬盘坏道监测方法及系统 Download PDF

Info

Publication number
CN103019885A
CN103019885A CN2012104887617A CN201210488761A CN103019885A CN 103019885 A CN103019885 A CN 103019885A CN 2012104887617 A CN2012104887617 A CN 2012104887617A CN 201210488761 A CN201210488761 A CN 201210488761A CN 103019885 A CN103019885 A CN 103019885A
Authority
CN
China
Prior art keywords
hard disk
data
bad track
linux
built
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012104887617A
Other languages
English (en)
Other versions
CN103019885B (zh
Inventor
谭鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Datang Mobile Communications Equipment Co Ltd
Original Assignee
Datang Mobile Communications Equipment Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Datang Mobile Communications Equipment Co Ltd filed Critical Datang Mobile Communications Equipment Co Ltd
Priority to CN201210488761.7A priority Critical patent/CN103019885B/zh
Publication of CN103019885A publication Critical patent/CN103019885A/zh
Application granted granted Critical
Publication of CN103019885B publication Critical patent/CN103019885B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明涉及计算机存储介质技术领域,公开了一种基于嵌入式Linux的硬盘坏道监测方法,所述硬盘被划分为数据存储分区、备份分区及原始数据集区,所述原始数据集区中的原始数据集在开机启动时加载至内存,该方法包括步骤:采集硬盘运行过程中的健康状态数据;将采集到的健康状态数据与原始数据集中的标准数据进行数据校验,以判断硬盘是否产生坏道;若产生坏道,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送坏道信息报告。本发明还公开了一种基于嵌入式Linux的硬盘坏道监测系统。本发明实现了在非RAID模式下硬盘坏道进行监测、预警及修复,同时降低了成本。

Description

基于嵌入式Linux的硬盘坏道监测方法及系统
技术领域
本发明涉及计算机存储介质技术领域,特别涉及一种基于嵌入式Linux的硬盘坏道监测方法及系统。
背景技术
硬盘坏道可以说是硬盘致命性故障,出现硬盘坏道以后硬盘往往也就代表着硬盘生命结束,硬盘在出现坏道以后不但是某些坏扇区不可用,还会直接殃及到其它可用磁盘扇区,造成整块硬盘损坏。当硬盘出现坏道时,意味着存储数据会不安全。因此,及时的发现坏道可以将损失降到最低。
硬盘产生坏道的原因有多种,如:灰尘、震动、静电、高温等。但在实际使用中更加常见的原因主要是以下两个方面:非法关机(即异常断电)导致;内存太少以致应用软件对硬盘频繁访问导致。
一般情况下,开机硬盘检测往往耗时较多,会在一定程度上增加操作系统的启动时间。因此,只有在适当的情况下(例如:非法断电之后、看门狗复位之后等等)对硬盘进行全面的检测,才不会对用户产生较大的影响。
现有的硬盘监测技术主要包括:AUTOFSCK、自我监测分析及报告技术(Self-Monitoring Analysis and Reporting Technology,S.M.A.R.T)和磁盘阵列(Redundant Arrays of Inexpensive Disks,RAID)
AUTOFSCK是Linux提供一种非正常关机的自动磁盘修复功能,即AUTOFSCK。意外断电后,再启动时,磁盘自检。该方式类似于Windows下的硬盘自检功能,Linux操作系统认为除通过Reboot、halt、shutdown等系统命令进行的关机或者复位外,所有的重启状态均判定为非正常关机。但对于嵌入式Linux,尤其是在自研单板上执行的系统而言,往往会有逻辑复位等复位方式。对于特定的场景而言,这类复位操作被认为是正常复位,不希望由于文件系统自修复而增加启动时间。更重要的是,AUTOFSCK只能对文件系统进行修复,并不能对硬盘是否出现坏道等严重问题进行检测。
S.M.A.R.T服务是目前检测硬盘最为全面的工具。支持S.M.A.R.T技术的硬盘可以通过硬盘上的监测指令和主机上的监测软件对磁头、盘片、马达、电路的运行情况、历史记录及预设的安全值进行分析和比较。当出现安全值范围以外的情况时,就会自动向用户发出警告。它包括检测硬盘的坏道、温度、硬盘关闭次数等,但却缺少对硬盘IO状态的监测。当系统可用内存过少,会出现应用软件频繁访问磁盘的状况,这也是导致硬盘出现坏道的重要因素。因此对硬盘IO状态的监测是十分必要的。
RAID原理是利用数组方式做磁盘组,配合数据分散排列的设计,提升数据的安全性。磁盘阵列是由很多便宜、容量较小、稳定性较高、速度较慢磁盘,组合成一个大型的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。同时利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。磁盘阵列还能利用同位检查(Parity Check)的观念,在数组中任一颗硬盘故障时,仍可读出数据,在数据重构时,将数据经计算后重新置入新硬盘中。但RAID成本较高,组成磁盘阵列需要两块以上的硬盘,对于ATCA(AdvancedTelecom Computing Architecture)架构下的刀片式板卡而言,将配置硬盘的板卡都替换为磁盘阵列,无疑会增加产品成本。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:如何实现一种低成本的、能够对硬盘坏道进行监测的方法。
(二)技术方案
为解决上述技术问题,本发明提供了一种基于嵌入式Linux的硬盘坏道监测方法,所述硬盘被划分为数据存储分区、备份分区及原始数据集区,所述原始数据集区中的原始数据集在开机启动时加载至内存,该方法包括步骤:
采集硬盘运行过程中的健康状态数据;
将采集到的健康状态数据与原始数据集中的标准数据进行数据校验,以判断硬盘是否产生坏道;
若产生坏道,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送坏道信息报告。
其中,所述方法在开机启动时进行,所述采集硬盘中数据存储分区运行过程中的健康状态数据之前还包括:
在操作系统启动时检测上一次复位是否为正常复位/下电,若为正常复位/下电,则直接启动操作系统;否则执行所述采集硬盘中数据存储分区运行过程中的健康状态数据及后续数据校验。
其中,所述方法还包括:
若数据校验后,硬盘未产生坏道,则对硬盘文件系统主动修复,并发送上一次非正常复位/下电的报告。
其中,所述操作系统启动时检测上一次复位是否为正常复位/下电的方式为:检测根文件系统目录下是否有预设的正常复位/下电方式记录文件,若无该文件,则表明之前复位/下电正常;反之,则表示为非法复位/下电。
其中,所述方法还包括:
在操作系统启动后创建并配置所述正常复位/下电方式记录文件,定义正常复位/下电方式;
若按定义的正常复位/下电关闭,则在关闭前自动删除所述正常复位/下电方式记录文件。
其中,所述方法在开机后进行,并定时采集硬盘中数据存储分区运行过程中的健康状态数据。
其中,所述方法还包括:
定时获取硬盘的IO状态,判断IO等待时间比是否大于等于原始数据集中的预设阈值,若是,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送IO故障报告。
其中,所述预设阈值为60%~100%。
其中,所述IO故障报告包括:当前硬盘的IO状态及生成镜像文件的名称、路径和大小。
其中,所述坏道信息报告包括:坏道个数、所在硬盘上的位置及生成镜像文件的名称、路径和大小。
本发明还提供了一种基于嵌入式Linux的硬盘坏道监测系统,所述硬盘被划分为数据存储分区、备份分区及原始数据集区,所述原始数据集区中的原始数据集在开机启动时加载至内存,该系统包括:
数据采集模块,用于采集硬盘运行过程中的健康状态数据;
数据校验模块,用于将采集到的健康状态数据与原始数据集中的标准数据进行数据校验,以判断硬盘是否产生坏道;
数据备份模块,用于产生坏道时挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份,并发送坏道信息报告。
其中,所述系统还包括:
复位检测模块,用于在操作系统启动时检测上一次复位是否为正常复位/下电,若为正常复位/下电,则直接启动操作系统;否则执行所述采集硬盘中数据存储分区运行过程中的健康状态数据及后续数据校验。
其中,所述系统还包括:
文件修复模块,用于在非正常复位/下电,且数据校验后硬盘未产生坏道时对硬盘文件系统主动修复,并发送上一次非正常复位/下电的报告。
其中,所述复位检测模块包括:
复位文件检测模块,用于检测根文件系统目录下是否有预设的正常复位/下电方式记录文件,若无该文件,则表明之前复位/下电正常;反之,则表示为非法复位/下电。
其中,所述复位检测模块还包括:
复位文件配置模块,用于在操作系统启动后创建并配置所述正常复位/下电方式记录文件,定义正常复位/下电方式;
复位文件删除模块,用于在按定义的正常复位/下电关闭,在关闭前自动删除所述正常复位/下电方式记录文件。
其中,所述数据采集模块还用于定时采集硬盘中数据存储分区运行过程中的健康状态数据。
其中,所述系统还包括:
IO状态检测模块,用于定时获取硬盘的IO状态,判断IO等待时间比是否大于等于原始数据集中的预设阈值,若是,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送IO故障报告。
其中,所述预设阈值为60%~100%。
其中,所述IO故障报告包括:当前硬盘的IO状态及生成镜像文件的名称、路径和大小。
其中,所述坏道信息报告包括:坏道个数、所在硬盘上的位置及生成镜像文件的名称、路径和大小。
(三)有益效果
本发明通过将硬盘划分为三个分区,检测到硬盘坏道时将数据存储分区的数据复制到备份分区生成镜像文件,实现了在非RAID模式下硬盘坏道进行监测、预警及修复,同时降低了成本。
附图说明
图1是本发明实施例的一种基于嵌入式Linux的硬盘坏道监测方法中硬盘划分示意图;
图2是本发明实施例的基于嵌入式Linux的硬盘坏道监测方法流程图;
图3是本发明实施例的基于嵌入式Linux的硬盘坏道监测方法在操作系统启动时的具体流程图;
图4是本发明实施例的基于嵌入式Linux的硬盘坏道监测方法在操作系统启动后的具体流程图;
图5是本发明实施例的基于嵌入式Linux的硬盘坏道监测系统结构示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,在本发明的基于嵌入式Linux的硬盘坏道监测方法中,将硬盘分为3个分区:数据存储分区、备份分区和原始数据集分区。
数据存储分区为正常使用的硬盘分区,备份分区作为备用,不存放任何文件,除非发现数据存储分区出现坏道,否则不会对该分区进行任何读写操作。为了在后续转存数据时不用压缩数据而是更高效地直接存储,分区时使数据存储分区与备份分区大小相同。
原始数据集分区用来存放原始数据集,原始数据集中定义了硬盘正常运行时的标准数据,即标识硬盘在安全状态下的指标参数的阈值范围,该指标可由用户进行自定义设置。当开机启动时会将原始数据集分区的原始数据集拷贝至内存中,提供给数据校验使用。
本实施例的硬盘坏道监测方法具体流程如图2所示,包括:
步骤S210,采集硬盘运行过程中的健康状态数据。通常由操作系统调用硬盘自身的S.M.A.R.T服务来采集硬盘运行过程中的健康状态数据(健康状态可以通过硬盘属性数据结构、自检数据结构获取,异常状态可以通过错误日志得到)。由于数据存储分区是硬盘上经常被读写的区域,容易产生坏道,因此,健康状态数据反映了硬盘中数据存储分区的健康状态。
步骤S220,将采集到的健康状态数据与原始数据集中的标准数据进行数据校验。将采集到的数据与原始数据集中规定的指标参数的阈值范围比较,以判断硬盘是否产生坏道,若不在阈值范围内则表示硬盘出现坏道。
步骤S230,若产生坏道,则挂载备份分区,将数据存储分区的数据在备份分区中备份生成镜像文件,并发送坏道信息报告。坏道信息报告包括:坏道个数、所在硬盘上的位置及生成镜像文件的名称、路径和大小等。镜像文件可以作为硬盘恢复数据使用。
本实施例的硬盘坏道监测方法通过将硬盘划分为三个分区,检测到硬盘坏道时将数据存储分区的数据复制到备份分区生成镜像文件,相对与现有的RAID模式,降低了成本,且实现了硬盘坏道监测、预警及修复。
该方法可以在操作系统开机时进行,也可以在操作系统运行过程中定时进行监测。当计算机非法关闭时,容易造成硬盘坏道,因此,当计算机再次启动时BIOS通常都会执行硬盘坏道检测。但BIOS默认的开机检测条件并不能满足特定的应用场景,对于嵌入式Linux,尤其是在自研单板上执行的系统而言,往往会有逻辑复位等复位方式。对于特定的场景而言,这类复位操作被认为是正常复位,不希望由于文件系统自修复而增加启动时间。
为了适应特定场景,本实施例的硬盘坏道监测方法中通过预设的正常复位/下电方式记录文件来判断是否需要在开机时进行硬盘坏道检测。如:在嵌入式Linux系统中,开机时通过预设在根文件系统的/root目录下的隐藏文件.auto_fsck来判断是否需要开机硬盘坏道检测。可以在.auto_fsck文件中自行定义某一种复位/下电方式为合法。本实施例的硬盘坏道监测方法在开机时的流程如图3所示。
开机启动后,由引导程序加载操作系统内核和文件系统(若根文件系统/root目录下存在隐藏文件.auto_fsck,那么.auto_fsck文件也一并被加载到内存中)。
判断/root目录下是否存在.auto_fsck文件,若不存在,则不需要在开机时进行硬盘坏道检测,直接启动操作系统,开机启动结束。操作系统启动后还包括在/root目录创建并配置.auto_fsck文件,即在该文件中自定义某些复位/下电方式为合法。
若/root目录下存在.auto_fsck文件,则表明上一次复位为非正常复位/下电,需要进行如下硬盘坏道检测:
启动S.M.A.R.T服务采集硬盘运行过程中的健康状态数据并将采集的数据与原始数据集作比较,判断硬盘是否有坏道。若有坏道,则挂载备份分区,通过Linux的dd命令将数据存储区的数据向备份区中做整盘备份,生成镜像文件,并通过E-MAIL或短信方式将坏道信息报告上报,坏道信息报告包括坏道个数、所在位置及生成镜像文件的名称、路径和大小。
若硬盘没有坏道,则Linux执行fsck命令对硬盘文件系统进行主动修复,并通过E-MAIL或短信方式将上次非法关机/复位操作作为告警上报。
关机时,若按定义的正常复位/下电关闭,则在关闭前自动删除.auto_fsck文件,下次启动时/root目录下就不会存在.auto_fsck文件,开机时不会的进行硬盘坏道检测,节省了开机时间。
由于开机启动后硬盘在运行过程中也可能产生坏道,如图4所示,开机启动后的硬盘坏道监测过程如下:
启动S.M.A.R.T服务,定时采集硬盘运行过程中的健康状态数据并将采集的数据与原始数据集作比较,判断硬盘是否有坏道。若有坏道,则挂载备份分区,通过Linux的dd命令将数据存储区的数据向备份区中做整盘备份,生成镜像文件,并通过E-MAIL或短信方式将坏道信息报告上报,坏道信息报告包括坏道个数、所在位置及生成镜像文件的名称、路径和大小。
若硬盘没有坏道,则间隔一段时间后再采集硬盘运行过程中的健康状态数据并进行后续的判断。
当系统可用内存过少,会出现应用软件频繁访问磁盘的状况,这也是导致硬盘出现坏道的重要因素,但S.M.A.R.T服务缺少对硬盘IO状态的监测。进一步地,本实施例还包括:定时获取硬盘的IO状态,如:在嵌入式Linux系统中通过iostat命令读取硬盘的IO状态。判断IO等待时间比(iowait)是否大于等于原始数据集中的预设阈值,若是,则挂载备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送IO故障报告。IO故障报告包括:当前硬盘的IO状态及生成镜像文件的名称、路径和大小。其中,预设阈值为60%~100%。即当IO等待时间比在60%以上通常认为磁盘访问非常频繁,预设阈值可以根据硬软件系统的配置可在60%~100%之间设定。
上述方法通过将硬盘划分为三个分区:数据存储分区、备份分区和原始数据集分区。由于备份分区通常不进行读写操作,因此不会产生坏道,检测到硬盘数据存储分区的坏道时将数据存储分区的数据复制到备份分区生成镜像文件,实现了在非RAID模式下硬盘坏道进行监测、预警及修复,而且降低了成本。
本发明还提供了一种基于嵌入式Linux的硬盘坏道监测系统,其结构示意如图5所示,硬盘被划分为数据存储分区、备份分区及原始数据集区,原始数据集区中的原始数据集在开机启动时加载至内存,该系统包括:
数据采集模块510,用于采集硬盘运行过程中的健康状态数据;
数据校验模块520,用于将采集到的健康状态数据与原始数据集中的标准数据进行数据校验,以判断硬盘是否产生坏道;
数据备份模块530,用于产生坏道时挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份,并发送坏道信息报告。坏道信息报告包括:坏道个数、所在硬盘上的位置及生成镜像文件的名称、路径和大小。
其中,该系统还包括:复位检测模块,用于在操作系统启动时检测上一次复位是否为正常复位/下电,若为正常复位/下电,则直接启动操作系统;否则执行所述采集硬盘中数据存储分区运行过程中的健康状态数据及后续数据校验。该复位检测模块包括:
复位文件检测模块,用于检测根文件系统目录下是否有预设的正常复位/下电方式记录文件,若无该文件,则表明之前复位/下电正常;反之,则表示为非法复位/下电。
其中,该系统还包括:文件修复模块,用于在非正常复位/下电,且数据校验后硬盘未产生坏道时对硬盘文件系统主动修复,并发送上一次非正常复位/下电的报告。
其中,复位检测模块还包括:
复位文件配置模块,用于在操作系统启动后创建并配置所述正常复位/下电方式记录文件,定义正常复位/下电方式;
复位文件删除模块,用于在按定义的正常复位/下电关闭,在关闭前自动删除所述正常复位/下电方式记录文件。
其中,所述数据采集模块还用于定时采集硬盘中数据存储分区运行过程中的健康状态数据。
其中,所述系统还包括:IO状态检测模块,用于定时获取硬盘的IO状态,判断IO等待时间比是否大于等于原始数据集中的预设阈值,若是,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送IO故障报告。该预设阈值为60%~100%。IO故障报告包括:当前硬盘的IO状态及生成镜像文件的名称、路径和大小。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (20)

1.一种基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述硬盘被划分为数据存储分区、备份分区及原始数据集区,所述原始数据集区中的原始数据集在开机启动时加载至内存,该方法包括步骤:
采集硬盘运行过程中的健康状态数据;
将采集到的健康状态数据与原始数据集中的标准数据进行数据校验,以判断硬盘是否产生坏道;
若产生坏道,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送坏道信息报告。
2.如权利要求1所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述方法在开机启动时进行,所述采集硬盘中数据存储分区运行过程中的健康状态数据之前还包括:
在操作系统启动时检测上一次复位是否为正常复位/下电,若为正常复位/下电,则直接启动操作系统;否则执行所述采集硬盘中数据存储分区运行过程中的健康状态数据及后续数据校验。
3.如权利要求2所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述方法还包括:
若数据校验后,硬盘未产生坏道,则对硬盘文件系统主动修复,并发送上一次非正常复位/下电的报告。
4.如权利要求2所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述操作系统启动时检测上一次复位是否为正常复位/下电的方式为:检测根文件系统目录下是否有预设的正常复位/下电方式记录文件,若无该文件,则表明之前复位/下电正常;反之,则表示为非法复位/下电。
5.如权利要求4所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述方法还包括:
在操作系统启动后创建并配置所述正常复位/下电方式记录文件,定义正常复位/下电方式;
若按定义的正常复位/下电关闭,则在关闭前自动删除所述正常复位/下电方式记录文件。
6.如权利要求1所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述方法在开机后进行,并定时采集硬盘中数据存储分区运行过程中的健康状态数据。
7.如权利要求1所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述方法还包括:
定时获取硬盘的IO状态,判断IO等待时间比是否大于等于原始数据集中的预设阈值,若是,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送IO故障报告。
8.如权利要求7所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述预设阈值为60%~100%。
9.如权利要求7所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述IO故障报告包括:当前硬盘的IO状态及生成镜像文件的名称、路径和大小。
10.如权利要求1~8中任一项所述的基于嵌入式Linux的硬盘坏道监测方法,其特征在于,所述坏道信息报告包括:坏道个数、所在硬盘上的位置及生成镜像文件的名称、路径和大小。
11.一种基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述硬盘被划分为数据存储分区、备份分区及原始数据集区,所述原始数据集区中的原始数据集在开机启动时加载至内存,该系统包括:
数据采集模块,用于采集硬盘运行过程中的健康状态数据;
数据校验模块,用于将采集到的健康状态数据与原始数据集中的标准数据进行数据校验,以判断硬盘是否产生坏道;
数据备份模块,用于产生坏道时挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份,并发送坏道信息报告。
12.如权利要求11所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述系统还包括:
复位检测模块,用于在操作系统启动时检测上一次复位是否为正常复位/下电,若为正常复位/下电,则直接启动操作系统;否则执行所述采集硬盘中数据存储分区运行过程中的健康状态数据及后续数据校验。
13.如权利要求12所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述系统还包括:
文件修复模块,用于在非正常复位/下电,且数据校验后硬盘未产生坏道时对硬盘文件系统主动修复,并发送上一次非正常复位/下电的报告。
14.如权利要求12所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述复位检测模块包括:
复位文件检测模块,用于检测根文件系统目录下是否有预设的正常复位/下电方式记录文件,若无该文件,则表明之前复位/下电正常;反之,则表示为非法复位/下电。
15.如权利要求14所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述复位检测模块还包括:
复位文件配置模块,用于在操作系统启动后创建并配置所述正常复位/下电方式记录文件,定义正常复位/下电方式;
复位文件删除模块,用于在按定义的正常复位/下电关闭,在关闭前自动删除所述正常复位/下电方式记录文件。
16.如权利要求11所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述数据采集模块还用于定时采集硬盘中数据存储分区运行过程中的健康状态数据。
17.如权利要求11所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述系统还包括:
IO状态检测模块,用于定时获取硬盘的IO状态,判断IO等待时间比是否大于等于原始数据集中的预设阈值,若是,则挂载所述备份分区,将所述数据存储分区的数据在所述备份分区中备份生成镜像文件,并发送IO故障报告。
18.如权利要求17所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述预设阈值为60%~100%。
19.如权利要求17所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述IO故障报告包括:当前硬盘的IO状态及生成镜像文件的名称、路径和大小。
20.如权利要求11~18中任一项所述的基于嵌入式Linux的硬盘坏道监测系统,其特征在于,所述坏道信息报告包括:坏道个数、所在硬盘上的位置及生成镜像文件的名称、路径和大小。
CN201210488761.7A 2012-11-26 2012-11-26 基于嵌入式Linux的硬盘坏道监测方法及系统 Active CN103019885B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210488761.7A CN103019885B (zh) 2012-11-26 2012-11-26 基于嵌入式Linux的硬盘坏道监测方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210488761.7A CN103019885B (zh) 2012-11-26 2012-11-26 基于嵌入式Linux的硬盘坏道监测方法及系统

Publications (2)

Publication Number Publication Date
CN103019885A true CN103019885A (zh) 2013-04-03
CN103019885B CN103019885B (zh) 2015-05-27

Family

ID=47968515

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210488761.7A Active CN103019885B (zh) 2012-11-26 2012-11-26 基于嵌入式Linux的硬盘坏道监测方法及系统

Country Status (1)

Country Link
CN (1) CN103019885B (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268147A (zh) * 2013-06-04 2013-08-28 北京百度网讯科技有限公司 硬盘功耗管理方法和装置
CN103400602A (zh) * 2013-07-24 2013-11-20 大唐移动通信设备有限公司 一种硬盘坏道自动修复方法和设备
CN103593275A (zh) * 2013-10-31 2014-02-19 华为技术有限公司 磁盘信息显示方法及装置
CN103700387A (zh) * 2013-09-18 2014-04-02 福建鼎恩协创电子科技有限公司 硬盘坏道监测修复装置及方法
CN104020965A (zh) * 2014-06-27 2014-09-03 浪潮(北京)电子信息产业有限公司 一种实现软raid多冗余的方法及其小型机系统
CN104598345A (zh) * 2015-02-09 2015-05-06 浪潮电子信息产业股份有限公司 一种利用ORION预测试Oracle系统IO性能的方法
CN104750436A (zh) * 2015-04-15 2015-07-01 苏州中晟宏芯信息科技有限公司 一种磁盘管理方法及系统
CN105279057A (zh) * 2015-11-10 2016-01-27 浪潮(北京)电子信息产业有限公司 一种磁盘坏道检测方法与系统
CN106354590A (zh) * 2015-07-17 2017-01-25 中兴通讯股份有限公司 磁盘检测方法和装置
CN107886992A (zh) * 2017-11-06 2018-04-06 郑州云海信息技术有限公司 一种raid健康状态检测方法、系统及相关装置
CN109298979A (zh) * 2018-08-17 2019-02-01 新华三技术有限公司成都分公司 硬盘故障处理方法及装置
CN110457278A (zh) * 2018-05-07 2019-11-15 百度在线网络技术(北京)有限公司 一种文件拷贝方法、装置、设备和存储介质
CN111045871A (zh) * 2018-10-15 2020-04-21 深信服科技股份有限公司 一种硬盘坏道检测方法及系统
CN111241039A (zh) * 2020-01-07 2020-06-05 天津麒麟信息技术有限公司 一种文件系统断电保护方法、模组、可读存储介质及电子设备
CN113032201A (zh) * 2021-05-24 2021-06-25 广东睿江云计算股份有限公司 一种硬盘坏道检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1460210A (zh) * 2001-04-25 2003-12-03 成津C&C株式会社 防止计算机操作系统损坏的装置和方法
CN1889053A (zh) * 2005-06-29 2007-01-03 英业达股份有限公司 系统信息的自动诊断方法
CN1987834A (zh) * 2005-12-19 2007-06-27 纬创资通股份有限公司 保护计算机数据的方法
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1460210A (zh) * 2001-04-25 2003-12-03 成津C&C株式会社 防止计算机操作系统损坏的装置和方法
CN1889053A (zh) * 2005-06-29 2007-01-03 英业达股份有限公司 系统信息的自动诊断方法
CN1987834A (zh) * 2005-12-19 2007-06-27 纬创资通股份有限公司 保护计算机数据的方法
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法

Cited By (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103268147A (zh) * 2013-06-04 2013-08-28 北京百度网讯科技有限公司 硬盘功耗管理方法和装置
CN103400602A (zh) * 2013-07-24 2013-11-20 大唐移动通信设备有限公司 一种硬盘坏道自动修复方法和设备
CN103400602B (zh) * 2013-07-24 2016-04-06 大唐移动通信设备有限公司 一种硬盘坏道自动修复方法和设备
CN103700387A (zh) * 2013-09-18 2014-04-02 福建鼎恩协创电子科技有限公司 硬盘坏道监测修复装置及方法
CN103700387B (zh) * 2013-09-18 2016-07-27 福建鼎恩协创电子科技有限公司 硬盘坏道监测修复装置及方法
CN103593275B (zh) * 2013-10-31 2017-06-27 华为技术有限公司 磁盘信息显示方法及装置
CN103593275A (zh) * 2013-10-31 2014-02-19 华为技术有限公司 磁盘信息显示方法及装置
CN104020965A (zh) * 2014-06-27 2014-09-03 浪潮(北京)电子信息产业有限公司 一种实现软raid多冗余的方法及其小型机系统
CN104598345A (zh) * 2015-02-09 2015-05-06 浪潮电子信息产业股份有限公司 一种利用ORION预测试Oracle系统IO性能的方法
CN104598345B (zh) * 2015-02-09 2017-12-19 浪潮电子信息产业股份有限公司 一种利用ORION预测试Oracle系统IO性能的方法
CN104750436A (zh) * 2015-04-15 2015-07-01 苏州中晟宏芯信息科技有限公司 一种磁盘管理方法及系统
CN106354590A (zh) * 2015-07-17 2017-01-25 中兴通讯股份有限公司 磁盘检测方法和装置
CN105279057A (zh) * 2015-11-10 2016-01-27 浪潮(北京)电子信息产业有限公司 一种磁盘坏道检测方法与系统
CN107886992A (zh) * 2017-11-06 2018-04-06 郑州云海信息技术有限公司 一种raid健康状态检测方法、系统及相关装置
CN110457278A (zh) * 2018-05-07 2019-11-15 百度在线网络技术(北京)有限公司 一种文件拷贝方法、装置、设备和存储介质
CN109298979A (zh) * 2018-08-17 2019-02-01 新华三技术有限公司成都分公司 硬盘故障处理方法及装置
CN111045871A (zh) * 2018-10-15 2020-04-21 深信服科技股份有限公司 一种硬盘坏道检测方法及系统
CN111241039A (zh) * 2020-01-07 2020-06-05 天津麒麟信息技术有限公司 一种文件系统断电保护方法、模组、可读存储介质及电子设备
CN113032201A (zh) * 2021-05-24 2021-06-25 广东睿江云计算股份有限公司 一种硬盘坏道检测方法
CN113032201B (zh) * 2021-05-24 2021-09-21 广东睿江云计算股份有限公司 一种硬盘坏道检测方法

Also Published As

Publication number Publication date
CN103019885B (zh) 2015-05-27

Similar Documents

Publication Publication Date Title
CN103019885B (zh) 基于嵌入式Linux的硬盘坏道监测方法及系统
CN102279775B (zh) 一种Linux系统下的硬盘故障处理方法
US7409594B2 (en) System and method to detect errors and predict potential failures
US7409582B2 (en) Low cost raid with seamless disk failure recovery
Allen Monitoring hard disks with smart
CN100504795C (zh) 一种计算机raid阵列预警系统及方法
CN103455395B (zh) 一种硬盘故障的检测方法及装置
US8219748B2 (en) Storage system comprising both power saving and diagnostic functions
CN100426247C (zh) 数据恢复方法
CN102880522A (zh) 面向硬件故障的系统关键文件故障纠正方法及装置
EP2667305B1 (en) Information processing apparatus, and control method
JP4852118B2 (ja) ストレージ装置及び論理ディスク管理方法
US20190056875A1 (en) Storage control device and storage control method
CN106708646A (zh) 硬盘异常自动复位方法及其装置
CN105607973B (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统
CN111143132A (zh) 一种bios恢复方法、装置、设备及可读存储介质
US20060215456A1 (en) Disk array data protective system and method
US8234235B2 (en) Security and remote support apparatus, system and method
EP2912555B1 (en) Hard drive backup
CN102662787A (zh) 一种保护系统盘raid的方法
JP6124644B2 (ja) 情報処理装置および情報処理システム
CN111240903A (zh) 数据恢复方法及相关设备
CN115061641B (zh) 一种磁盘故障处理方法、装置、设备以及存储介质
CN109104314B (zh) 一种修改日志配置文件的方法及装置
CN111427721B (zh) 异常恢复方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant