CN101866271A - 一种基于raid的安全预警系统和方法 - Google Patents

一种基于raid的安全预警系统和方法 Download PDF

Info

Publication number
CN101866271A
CN101866271A CN 201010194226 CN201010194226A CN101866271A CN 101866271 A CN101866271 A CN 101866271A CN 201010194226 CN201010194226 CN 201010194226 CN 201010194226 A CN201010194226 A CN 201010194226A CN 101866271 A CN101866271 A CN 101866271A
Authority
CN
China
Prior art keywords
fault
storage system
unit
early warning
health
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201010194226
Other languages
English (en)
Inventor
谭志虎
谢长生
万继光
杨寅
王继彬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huazhong University of Science and Technology
Original Assignee
Huazhong University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huazhong University of Science and Technology filed Critical Huazhong University of Science and Technology
Priority to CN 201010194226 priority Critical patent/CN101866271A/zh
Publication of CN101866271A publication Critical patent/CN101866271A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种基于RAID的安全预警系统,属于计算机系统结构存储领域。该系统包括故障决策单元,负责实时采集存储系统健康信息,能根据事先设定的健康阈值或其他预警策略发出预警信息,还包括故障检测单元,对磁盘的运行状态检测、对磁盘阵列的运行状态检测,以及运行环境的状态检测;还包括故障决策单元,用于磁盘故障模拟、磁盘阵列故障模拟以及外部环境模拟,触发故障决策单元实施预警。本发明还提供一种基于RAID的安全预警方法,利用上述系统对存储系统进行安全预警。该系统和方法可以对RAID出现的故障提前预警,用户可以采取较佳的维护管理,保证数据的安全,保证系统的健壮性。

Description

一种基于RAID的安全预警系统和方法
技术领域
本发明属于计算机系统结构存储领域,特别是涉及一种基于RAID的安全预警系统和方法。
背景技术
RAID是“Redundant Array of Independent Disk”的缩写,中文意思是独立冗余磁盘阵列。冗余磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。简单地解释,就是将N台磁盘通过RAID控制器结合成虚拟单台大容量的磁盘使用。RAID的采用为存储系统带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。
传统的存储系统均是采用冗余技术保证数据的可靠性,当存储系统发生数据损坏时通过数据重建或者数据恢复的方式修复数据,这种方式存在较长的数据维护时间窗口,而且在数据维护期间对系统正常数据服务质量影响较大,而且极易发生数据的二次毁损。如果能够事前根据存储设备的运行状态有效地预测系统故障发生概率,在事故发生前对数据进行保护,一方面可以降低不必要的长期备份开销,缩小备份窗口;另一方面可以极大的减少数据丢失的风险。
传统磁盘阵列多采用可靠性高的光纤磁盘或者SCSI磁盘,这些磁盘也称为企业级磁盘,设计目标是每天80%-90%的时间连续工作,具有较高的可靠性,但同时价格也非常昂贵,通常是普通硬盘的5~10倍左右,但由于中小企业对存储容量以及存储可靠性的需求逐日增加,采用廉价SATA、SAS磁盘的磁盘阵列正逐渐普及,然而SATA/SAS磁盘设计目标是桌面应用,目标工作时间约为每天持续工作30%左右的时间,采用这类磁盘的磁盘阵列一旦工作时间过长,负载过重,硬盘寿命将大大缩短,其潜在故障率将变高,发生数据损毁的概率将进一步加大,数据是宝贵的,其价值往往超过硬盘本身,然而当数据发生损坏时,即使付出高昂的费用也不一定能恢复所需数据,单一磁盘容量、可靠性、性能均存在较大缺陷。
为提升磁盘性能、扩充存储容量、提高存储可靠性、目前采用的较多的存储设备就是磁盘阵列、磁盘阵列采用冗余技术提高存储系统可靠性,当磁盘产生故障时,系统进入降级状态,随后利用校验技术重建数据,保证数据可靠性,然而根据实际应用经验,由于使用时间相当,同批次磁盘中某一个磁盘一旦出现故障,其它磁盘也可能即将出现故障,在数据重建过程中,极有可能由于其它成员盘再次产生故障导致重建失败,阵列数据损毁的事故,数据重建过程相对而言是比较危险的操作。如果能够事前根据存储设备的运行状态有效地预测系统故障发生概率,在磁盘产生故障之前产生预警信息,提示用户进行数据保护。
存储设备安全预警系统和方法旨在对存储系统进行有效的健康状况监控,提供早期故障预警、性能预测、避免故障传播、进一步提高存储系统可靠性、可维性,可以极大的减少数据丢失的风险,能够为数据存储提供最为基础的可用性保证。
安全预警是存储系统中的关键技术,它决定着存储系统数据的可靠性,并且直接影响着整个系统的性能。文献[1]讨论了存储系统相关可靠性技术。
早在上个世纪九十年代,人们就意识到数据的宝贵性胜于磁盘自身价值,渴望有种技术能对磁盘故障进行预测并实现相对安全的数据保护,因此SMART技术应运而生。文献[2]-[4]提出使用磁盘SMART参数对磁盘和存储系统进行故障预测的相关研究。
一般地,RAID用户都会提供操作系统下的RAID管理软件,但对于用户来说,每天或定期的日志检查工作量非常大,同时日常维护还要求用户具有非常强的RIAD背景知识,能对不同厂家提供的日志文件进行分析,给用户造成很大的工作负担。因此,RAID系统出现问题,用户一般只能通知厂家维修,然而现有方法无法对RAID可能出现的故障提前预警,告知用户,导致数据损坏,损失则相当严重。
文献[1]Berenji,H.,Ametha,J.,and Vengerov,D.Inductive learning for fault diagnosis.InIEEE Proceedings of 12th International Conference on Fuzzy Systems(FUZZ’03).Vol.1.2003.
文献[2]Gordon F.Hughes,Joseph F.Murray,Kenneth Kreutz-Delgado,and Charles Elkan.Improved disk-drive failure warnings.IEEE Transactions on Reliability,51(3):350-357,September2002.
文献[3]Joseph F.Murray,Gordon F.Hughes,and Kenneth Kreutz-Delgado.Hard drivefailure prediction using non-parametric statistical methods.Proceedings of ICANN/ICONIP,June2003.
文献[4]Greg Hamerly and Charles Elkan.Bayesian approaches to failure prediction for diskdrives.In Proceedings of the Eighteenth International Conference on Machine Learning(ICML’01),June 2001.
发明内容
本发明的目的是在于提供一种基于RAID的安全预警系统和方法,其解决了磁盘、阵列和系统环境可能出现故障时无法提前预警,造成数据丢失的问题。
为实现本发明目的采用的具体技术方案如下:
一种基于RAID的安全预警系统,用于对由磁盘阵列组成的存储系统进行故障预警,该安全预警系统包括故障检测单元和故障决策单元,其中,所述故障检测单元提供对存储系统运行状态的检测,包括对单盘的运行状态检测、对阵列的运行状态检测,以及对存储系统运行环境的状态检测,从而获得存储系统的健康信息;所述故障决策单元实时采集上述健康信息,同时接收来自磁盘阵列的主动错误报告和/或统计信息,从而能够根据事先设定的预警策略判断是否发出预警信息,实现对存储系统的安全预警。
作为本发明的进一步改进,所述的故障决策单元包括统一管理平台单元,策略库单元,阵列健康收集单元,故障分析单元和预警单元,其中,
所述策略库单元用于实现事先设定的预警策略,包括各种策略级别,以及对应的健康阈值和策略说明;
所述阵列健康收集单元用于采集并存储故障检测单元检测获得的存储系统的健康信息;
所述故障分析单元根据策略库单元提供的预警策略对上述健康信息进行分析,判断存储系统是否存在故障,若存在故障则产生故障信息;
所述预警单元根据上述故障信息发出预警信息,提示用户系统发生故障;
所述统一管理平台单元用于对上述各单元进行统一控制,协调各单元功能的实现。
作为本发明的进一步改进,该安全预警系统还包括故障模拟单元,能够模拟所述存储系统的故障,并触发故障决策单元实施预警,以方便对预警系统进行功能测试。
作为本发明的进一步改进,所述存储系统的健康信息包括:存储系统中的任一块磁盘SMART的单一属性实际值或所有属性实际值加权总健康度;阵列内的阵列状态、环境温度和风扇转速;和存储系统运行环境中的CPU温度,风扇转速。
作为本发明的进一步改进,该安全预警系统还包括定时器,用于定时触发所述故障检测单元采集存储系统健康信息。
一种上述的安全预警系统对存储系统进行安全预警的方法,包括如下步骤:
步骤A):利用所述故障检测单元对存储系统的单盘状态、阵列状态和存储系统运行环境进行检测,获得存储系统健康信息;
步骤B):利用所述故障决策单元中的阵列健康收集单元采集并存储上述健康信息;
步骤C):所述故障决策单元中的故障分析单元根据策略库单元提供的预警策略对上述健康信息进行分析,判断存储系统是否存在故障,若存在故障则产生故障信息;
步骤D):所述故障决策单元中的预警单元根据上述故障信息发出预警信息,提示用户系统发生故障,即完成存储系统的安全预警。
作为本发明的进一步改进,在上述步骤A)和B)之间还可以加入步骤A’):通过该安全预警系统中的故障模拟单元模拟所述存储系统的故障,获得存储系统模拟的健康信息;
作为本发明的进一步改进,所述存储系统的健康信息包括:存储系统中的任一块磁盘SMART的单一属性实际值或所有属性实际值加权总健康度;阵列内的阵列状态、环境温度和风扇转速;和存储系统运行环境中的CPU温度,风扇转速。
作为本发明的进一步改进,所述触发故障检测单元定时采集存储系统健康信息。
本发明的有益效果是:本发明的基于RAID的安全预警系统和方法,通过获取单个磁盘、阵列和系统环境健康信息,并通过故障决策的分析和管理,根据分析和管理的结果给出预警信息和建议,提高RIAD系统的健壮性,保护用户数据的安全。同时,该系统和方法通过故障模拟可以人为的修改参数设置,通过采集和处理数据,触发故障决策实施预警,方便对整个系统进行功能测试;该系统和方法不仅对单个磁盘进行故障预警,还可以对阵列和系统环境进行故障预警;该系统和方法编程灵活,可以获取任何有用的数据;本发明方法简单,执行效率高,适合于所有具有磁盘的存储系统,可有效的保护存储系统的数据。
附图说明
图1为本发明基于RAID的安全预警系统结构图;
图2为本发明基于RAID的安全预警方法流程图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚的明白,以下结合附图1~2及实施例,对本发明的基于RAID的安全预警系统和方法进行进一步的详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明的基于RIAD的安全预警系统和方法的核心在于通过RAID系统上采集相关健康信息,包括磁盘阵列中磁盘的健康信息,阵列内的阵列状态、环境温度和风扇转速;存储系统运行环境中的CPU温度,风扇转速,以及模拟磁盘故障、阵列故障和存储系统运行环境获得系统模拟健康信息,并对采集的健康信息进行分析,通过分析发现系统中的潜在问题,根据问题发出预警信息,实现对系统的日常维护,将RIAD系统可能出现的故障提前告知,提前进行维护和处理,从而避免不必要的损失。
下面先详细描述本发明基于RAID的安全预警系统:如图1所示,本发明的基于RAID的安全预警系统,包括故障决策单元,负责实时采集系统健康信息,除定时例测外,同时接收来自磁盘阵列的主动错误报告和/或统计信息,从而根据事先设定的预警策略判断是否发出预警信息。还包括故障检测单元提供对存储系统运行状态的检测,包括对单盘的运行状态检测、对阵列的运行状态检测,以及对存储系统运行环境的状态检测,从而获得存储系统的健康信息。还包括故障模拟单元,用于磁盘故障模拟、阵列故障模拟以及存储系统运行环境模拟,主要模拟一些故障,触发故障决策单元实施预警。
所述故障决策单元包括统一管理平台单元,策略库单元,阵列健康收集单元;故障分析单元和预警单元,其中:
策略库单元,用于实现事先设定的预警策略,包括各种策略级别(分为高、中、低),以及对应的健康阈值和策略说明;
阵列健康收集单元,用于采集并存储故障检测单元检测获得的存储系统的健康信息,健康信息以存储结构体文件的格式进行存储,可以更好的进行读取和分析,同时能够获取故障模拟单元的健康信息;
故障分析单元根据策略库单元提供的预警策略对上述健康信息进行分析,判断存储系统是否存在故障,若存在故障则产生故障信息;
预警单元,用于在接收到故障分析单元的预警信息后,向计算机发出报警信息,提示用户。较佳地,预警调度单元和系统级预警单元接收到预警信息后,可以采用各种友好的方式报告用户,甚至可以通过计算机网络通讯接口。如TCP/IP接口,通知远程的用户,这样,用户就可以根据预警信息,在磁盘或者阵列可能出现故障时,采用较佳的维护管理,保证数据的完全,保证系统的健壮性。
统一管理平台单元,用于对上述各单元进行统一控制,协调各单元功能的实现。对磁盘阵列进行全局健康信息监控,另外可以对故障决策单元进行配置,设定预警策略。
所述故障可以是磁盘SMART参数实际值达到了设定的范围;或者磁盘SMART所有参数实际值的加权达到了设定的范围;或者阵列内部的阵列状态、环境温度和风扇转速等健康信息达到了设定的范围;或者存储系统运行时CPU温度、风扇转速等健康信息达到了设定的范围,其中所述的设定范围是由用户根据实际工作的需要而设定的数量。
所述的RAID安全预警系统还包括故障检测单元,用于对存储系统运行状态的检测,包括对单盘的运行状态检测、对阵列的运行状态检测,以及对存储系统运行环境的状态检测,充分利用各种传感技术、SMART技术,从而获得存储系统的健康信息。
较佳地,本发明的基于RAID的安全预警系统还包括定时器,用于定时触发故障检测单元采集系统健康信息。这时,故障分析单元还可以根据不同时间段采集的健康信息进行比较分析,发现系统健康信息中的潜在故障。
所述的RAID安全预警系统还可以包括故障模拟单元,用于磁盘故障模拟、阵列故障模拟以及外部环境模拟,主要模拟一些故障,触发故障决策单元实施预警。
如图2所示,下面结合基于RAID的安全预警系统进一步详细说明本发明的基于RAID的安全预警方法:
步骤1:故障检测单元对存储系统的单盘状态,阵列状态和存储系统运行环境进行检测,获得存储系统健康信息;;
步骤2:计算机启动后,定时器进行计时,触发故障决策单元采集故障检测单元收集的健康信息。
步骤3:故障决策单元中的阵列健康收集单元采集并存储上述健康信息。
故障决策单元采集系统健康信息包括:存储系统中的任一块磁盘SMART的单一属性实际值或所有属性实际值加权总健康度;阵列内的阵列状态、环境温度和风扇转速;存储系统运行环境中的CPU温度,风扇转速。
具体而言,该步骤包括下列过程:
步骤31:故障决策单元的阵列健康收集单元向磁盘阵列中的磁盘发出读取磁盘SMART指令,磁盘返回SMART信息,阵列健康收集单元从返回信息中获取SMART属性实际值数据,并保存这些数据。
磁盘SMART属性值是出厂时预设的最大正常值,阈值为厂商设置的故障极限值,用户时刻对SMART属性的实际值进行检测,在正常情况下,实际值介于属性值和阈值之间,并且越接近属性值说明磁盘健康度越高。通过某一属性的实际值、阈值和属性值可以得出该属性的健康度,该健康度是介于0-100的百分数,健康度低于用户设置的阈值,则表明磁盘故障比较严重。
步骤32:同时,阵列运行时产生配置文件,对阵列运行状态进行判断,如阵列是否降级、磁盘温度过高、风扇转速过快、电压过高等,如果出现这些情况,则设定该阵列健康度为一个低的值,则表明阵列故障比较严重。
步骤33:同时,通过LINUX自带的功能来获得存储系统运行环境温度,风扇转速等健康信息,如果存储系统环境温度过高,风扇转速过快,则表明存储系系统环境故障比较严重。
故障检测单元每隔一段时间发送磁盘、阵列和存储系统环境健康信息,故障决策单元对这些健康信息以结构体的形式进行存储。以便故障分析单元可以根据该信息对磁盘、阵列和存储系统环境可能产生的故障进行分析。
步骤4:故障决策单元中的故障分析单元根据策略库单元提供的预警策略对上述健康信息进行分析,判断存储系统是否存在故障,若存在故障则产生故障信息。
故障决策单元的故障分析单元从阵列健康收集单元中读取磁盘、阵列和存储系统运行环境健康信息,包括:磁盘SMART属性数据,阵列内的阵列状态、环境温度和风扇转速等数据,存储系统运行环境中的CPU温度,风扇转速等环境数据。
在进行分析处理时,包括下列四种过程:
步骤41:当其中一块磁盘SMART参数实际值达到设定的范围时,则发出预警信息;
步骤42:当其中一块磁盘SMART所有参数实际值的加权达到了设定的范围时,则发出预警信息;
步骤43:当在一个时间段内,阵列内的阵列状态、环境温度和风扇转速等健康信息达到了设定的范围时,则发出预警信息;
步骤44:当在某一时间,存储系统运行环境CPU温度,风扇转速等健康信息达到了设定的范围时,则发出预警信息。
所述的达到设定的范围是由用户根据实际工作中的需要而设定的数量。
步骤5:故障决策单元的预警单元在接收到故障分析单元的故障信息后,向计算机发出预警信息,提示用户终端。
根据上述的方法,在上述步骤2和3之间还可以加入如下步骤:
步骤2’:通过故障模拟单元模拟所述存储系统的故障,获得存储系统模拟的健康信息;
本发明的基于RAID的安全预警系统和方法,通过故障检测单元对单盘状态,阵列状态和存储系统运行环境进行检测,并通过故障决策单元的阵列健康收集单元收集健康信息,通过故障决策单元的故障分析单元对健康信息分析和管理,通过策略库单元的预警策略给出预警信息和建议,提高RAID的健壮性,保护用户的数据安全;其将统一管理平台单元、策略库单元、阵列健康收集单元、故障分析单元、预警单元集成为故障决策单元,提高效率,并且编程灵活,可以获取系统预警的各种数据;通过定时器的时间设定,可以对数据进行实时监控,并且可能采用网络方式,扩大用户友好界面,可以通知远程用户,用户就可以根据预警信息,在系统可能出现故障时,采取较佳的维护管理,保证数据的安全,保证系统的健壮性。
本实施例只是为了更好地理解本发明进行详细的描述,并不是对本发明所保护的范围的限定,因此,本领域普通技术人员不脱离本发明的主旨,未经创造性劳动而本发明所做的改变在本发明的保护范围内。

Claims (9)

1.一种基于RAID的安全预警系统,用于对由磁盘阵列组成的存储系统进行故障预警,该安全预警系统包括故障检测单元和故障决策单元,其中,所述故障检测单元提供对存储系统运行状态的检测,包括对单盘的运行状态检测、对阵列的运行状态检测,以及对存储系统运行环境的状态检测,从而获得存储系统的健康信息;所述故障决策单元实时采集上述健康信息,同时接收来自磁盘阵列的主动错误报告和/或统计信息,从而能够根据事先设定的预警策略判断是否发出预警信息,实现对存储系统的安全预警。
2.根据权利要求1所述的系统,其特征在于,所述的故障决策单元包括统一管理平台单元,策略库单元,阵列健康收集单元,故障分析单元和预警单元,其中,
所述策略库单元用于实现事先设定的预警策略,包括各种策略级别,以及对应的健康阈值和策略说明;
所述阵列健康收集单元用于采集并存储故障检测单元检测获得的存储系统的健康信息;
所述故障分析单元根据策略库单元提供的预警策略对上述健康信息进行分析,判断存储系统是否存在故障,若存在故障则产生故障信息;
所述预警单元根据上述故障信息发出预警信息,提示用户系统发生故障;
所述统一管理平台单元用于对上述各单元进行统一控制,协调各单元功能的实现。
3.根据权利要求1或2所述的RAID安全预警系统,其特征在于,该安全预警系统还包括故障模拟单元,其能够模拟所述存储系统的故障,并触发故障决策单元实施预警,以方便对所述安全预警系统进行功能测试。
4.根据权利要求1-3之一所述的系统,其特征在于,所述存储系统的健康信息包括:存储系统中的任一块磁盘SMART的单一属性实际值或所有属性实际值加权总健康度;阵列内的阵列状态、环境温度和风扇转速;和存储系统运行环境中的CPU温度,风扇转速。
5.根据权利要求1-4之一所述的RAID安全预警系统,其特征在于,该安全预警系统还包括定时器,用于定时触发所述故障检测单元采集存储系统健康信息。
6.一种应用权利要求1-5之一所述的安全预警系统对存储系统进行安全预警的方法,包括如下步骤:
步骤A):利用所述故障检测单元对存储系统的单盘状态、阵列状态和存储系统运行环境进行检测,获得存储系统健康信息;
步骤B):利用所述故障决策单元中的阵列健康收集单元采集并存储上述健康信息;
步骤C):所述故障决策单元中的故障分析单元根据策略库单元提供的预警策略对上述健康信息进行分析,判断存储系统是否存在故障,若存在故障则产生故障信息;
步骤D):所述故障决策单元中的预警单元根据上述故障信息发出预警信息,提示用户系统发生故障,即完成存储系统的安全预警。
7.根据权利要求6所述的方法,其特征在于,在上述步骤A)和B)之间还可以加入步骤A’):通过该安全预警系统中的故障模拟单元模拟所述存储系统的故障,获得存储系统模拟的健康信息。
8.根据权利要求6或7所述的方法,其特征在于,所述存储系统的健康信息包括:存储系统中的任一块磁盘SMART的单一属性实际值或所有属性实际值加权总健康度;阵列内的阵列状态、环境温度和风扇转速;和存储系统运行环境中的CPU温度,风扇转速。
9.根据权利要求6所述的方法,其特征在于,所述触发故障检测单元定时采集存储系统健康信息。
CN 201010194226 2010-06-08 2010-06-08 一种基于raid的安全预警系统和方法 Pending CN101866271A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201010194226 CN101866271A (zh) 2010-06-08 2010-06-08 一种基于raid的安全预警系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201010194226 CN101866271A (zh) 2010-06-08 2010-06-08 一种基于raid的安全预警系统和方法

Publications (1)

Publication Number Publication Date
CN101866271A true CN101866271A (zh) 2010-10-20

Family

ID=42958010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201010194226 Pending CN101866271A (zh) 2010-06-08 2010-06-08 一种基于raid的安全预警系统和方法

Country Status (1)

Country Link
CN (1) CN101866271A (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102508760A (zh) * 2011-11-17 2012-06-20 浪潮(北京)电子信息产业有限公司 独立磁盘冗余阵列预警方法和系统
CN102521058A (zh) * 2011-12-01 2012-06-27 北京威视数据系统有限公司 Raid组磁盘数据预迁移方法
CN102591591A (zh) * 2011-12-19 2012-07-18 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统
CN102662788A (zh) * 2012-04-28 2012-09-12 浪潮电子信息产业股份有限公司 一种计算机系统故障诊断决策及处理方法
CN102819480A (zh) * 2011-06-08 2012-12-12 联想(北京)有限公司 一种监控计算机存储器的方法和计算机
CN103248505A (zh) * 2012-02-08 2013-08-14 迈普通信技术股份有限公司 基于视图的网络监控方法及装置
CN103473020A (zh) * 2013-09-22 2013-12-25 浪潮(北京)电子信息产业有限公司 一种Raid配置方法和装置
CN104094236A (zh) * 2012-04-02 2014-10-08 国际商业机器公司 防止数据丢失的系统和方法
CN104461824A (zh) * 2014-12-01 2015-03-25 北京同有飞骥科技股份有限公司 一种磁盘健康信息优化管理方法和装置
CN105224888A (zh) * 2015-09-29 2016-01-06 上海爱数软件有限公司 一种基于安全预警技术的磁盘阵列数据保护系统
CN105511979A (zh) * 2015-12-11 2016-04-20 浪潮电子信息产业股份有限公司 一种Windows下监控Intel SATA HostRaid硬盘变化的工具
CN105712140A (zh) * 2014-12-05 2016-06-29 华夏视清数字技术(北京)有限公司 一种监控预警装置及方法
CN105893109A (zh) * 2015-01-26 2016-08-24 奇点新源国际技术开发(北京)有限公司 车载终端操作系统的加载方法及装置
CN106648470A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 一种监控数据服务系统中磁盘阵列的方法和装置
WO2017129030A1 (zh) * 2016-01-29 2017-08-03 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN108763048A (zh) * 2018-06-05 2018-11-06 西安交通大学 一种基于粒子滤波的硬盘故障预警与可靠性评估方法
CN109462490A (zh) * 2017-09-06 2019-03-12 杭州海康威视系统技术有限公司 视频监控系统及故障分析方法
CN110083470A (zh) * 2018-01-26 2019-08-02 浙江宇视科技有限公司 磁盘分析方法、装置及计算机可读存储介质
CN111625185A (zh) * 2020-05-07 2020-09-04 苏州浪潮智能科技有限公司 一种磁盘故障监控的方法、系统及相关组件
CN111857555A (zh) * 2019-04-30 2020-10-30 伊姆西Ip控股有限责任公司 避免磁盘阵列的故障事件的方法、设备和程序产品
US10929037B2 (en) 2019-06-15 2021-02-23 International Business Machines Corporation Converting a RAID to a more robust RAID level
US11074118B2 (en) 2019-06-15 2021-07-27 International Business Machines Corporation Reporting incidents of data loss in RAID arrays
CN113900593A (zh) * 2021-10-12 2022-01-07 天津津航计算技术研究所 一种s.m.a.r.t.信息自动预警的raid控制卡架构
US11442826B2 (en) 2019-06-15 2022-09-13 International Business Machines Corporation Reducing incidents of data loss in raid arrays having the same raid level
CN116027991A (zh) * 2023-03-29 2023-04-28 苏州浪潮智能科技有限公司 Raid阵列管理方法、装置、raid卡及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5917724A (en) * 1997-12-20 1999-06-29 Ncr Corporation Method for predicting disk drive failure by monitoring the rate of growth of defects within a disk drive
CN101097531A (zh) * 2006-06-28 2008-01-02 联想(北京)有限公司 一种计算机raid阵列预警系统及方法
CN101140501A (zh) * 2006-09-07 2008-03-12 国际商业机器公司 数据存储系统、raid存储系统及其管理方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5917724A (en) * 1997-12-20 1999-06-29 Ncr Corporation Method for predicting disk drive failure by monitoring the rate of growth of defects within a disk drive
CN101097531A (zh) * 2006-06-28 2008-01-02 联想(北京)有限公司 一种计算机raid阵列预警系统及方法
CN101140501A (zh) * 2006-09-07 2008-03-12 国际商业机器公司 数据存储系统、raid存储系统及其管理方法

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819480A (zh) * 2011-06-08 2012-12-12 联想(北京)有限公司 一种监控计算机存储器的方法和计算机
CN102508760A (zh) * 2011-11-17 2012-06-20 浪潮(北京)电子信息产业有限公司 独立磁盘冗余阵列预警方法和系统
CN102521058A (zh) * 2011-12-01 2012-06-27 北京威视数据系统有限公司 Raid组磁盘数据预迁移方法
CN102591591B (zh) * 2011-12-19 2015-10-21 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统
CN102591591A (zh) * 2011-12-19 2012-07-18 杭州瑞网广通信息技术有限公司 磁盘检测系统、磁盘检测方法以及网络存储系统
CN103248505A (zh) * 2012-02-08 2013-08-14 迈普通信技术股份有限公司 基于视图的网络监控方法及装置
CN103248505B (zh) * 2012-02-08 2016-01-20 迈普通信技术股份有限公司 基于视图的网络监控方法及装置
CN104094236A (zh) * 2012-04-02 2014-10-08 国际商业机器公司 防止数据丢失的系统和方法
CN104094236B (zh) * 2012-04-02 2017-07-21 国际商业机器公司 防止数据丢失的系统和方法
CN102662788A (zh) * 2012-04-28 2012-09-12 浪潮电子信息产业股份有限公司 一种计算机系统故障诊断决策及处理方法
CN103473020A (zh) * 2013-09-22 2013-12-25 浪潮(北京)电子信息产业有限公司 一种Raid配置方法和装置
CN104461824A (zh) * 2014-12-01 2015-03-25 北京同有飞骥科技股份有限公司 一种磁盘健康信息优化管理方法和装置
CN105712140A (zh) * 2014-12-05 2016-06-29 华夏视清数字技术(北京)有限公司 一种监控预警装置及方法
CN105893109A (zh) * 2015-01-26 2016-08-24 奇点新源国际技术开发(北京)有限公司 车载终端操作系统的加载方法及装置
CN105893109B (zh) * 2015-01-26 2019-05-31 奇点新源国际技术开发(北京)有限公司 车载终端操作系统的加载方法及装置
CN105224888A (zh) * 2015-09-29 2016-01-06 上海爱数软件有限公司 一种基于安全预警技术的磁盘阵列数据保护系统
CN105511979A (zh) * 2015-12-11 2016-04-20 浪潮电子信息产业股份有限公司 一种Windows下监控Intel SATA HostRaid硬盘变化的工具
WO2017129030A1 (zh) * 2016-01-29 2017-08-03 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN106648470A (zh) * 2016-12-29 2017-05-10 北京奇虎科技有限公司 一种监控数据服务系统中磁盘阵列的方法和装置
CN109462490A (zh) * 2017-09-06 2019-03-12 杭州海康威视系统技术有限公司 视频监控系统及故障分析方法
CN109462490B (zh) * 2017-09-06 2022-08-05 杭州海康威视系统技术有限公司 视频监控系统及故障分析方法
CN110083470A (zh) * 2018-01-26 2019-08-02 浙江宇视科技有限公司 磁盘分析方法、装置及计算机可读存储介质
CN108763048A (zh) * 2018-06-05 2018-11-06 西安交通大学 一种基于粒子滤波的硬盘故障预警与可靠性评估方法
CN111857555A (zh) * 2019-04-30 2020-10-30 伊姆西Ip控股有限责任公司 避免磁盘阵列的故障事件的方法、设备和程序产品
US10929037B2 (en) 2019-06-15 2021-02-23 International Business Machines Corporation Converting a RAID to a more robust RAID level
US11074118B2 (en) 2019-06-15 2021-07-27 International Business Machines Corporation Reporting incidents of data loss in RAID arrays
US11442826B2 (en) 2019-06-15 2022-09-13 International Business Machines Corporation Reducing incidents of data loss in raid arrays having the same raid level
CN111625185A (zh) * 2020-05-07 2020-09-04 苏州浪潮智能科技有限公司 一种磁盘故障监控的方法、系统及相关组件
CN113900593A (zh) * 2021-10-12 2022-01-07 天津津航计算技术研究所 一种s.m.a.r.t.信息自动预警的raid控制卡架构
CN116027991A (zh) * 2023-03-29 2023-04-28 苏州浪潮智能科技有限公司 Raid阵列管理方法、装置、raid卡及存储介质
CN116027991B (zh) * 2023-03-29 2023-09-19 苏州浪潮智能科技有限公司 Raid阵列管理方法、装置、raid卡及存储介质

Similar Documents

Publication Publication Date Title
CN101866271A (zh) 一种基于raid的安全预警系统和方法
CN100504795C (zh) 一种计算机raid阵列预警系统及方法
CN110413227B (zh) 一种硬盘设备的剩余使用寿命在线预测方法和系统
CN105224888B (zh) 一种基于安全预警技术的磁盘阵列数据保护系统
CN102147708B (zh) 一种磁盘检测方法及装置
CN102279775B (zh) 一种Linux系统下的硬盘故障处理方法
CN102591591B (zh) 磁盘检测系统、磁盘检测方法以及网络存储系统
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
CN101582046B (zh) 一种高可用的系统状态监控、预测以及智能管理方法
CN103019885A (zh) 基于嵌入式Linux的硬盘坏道监测方法及系统
CN102413186B (zh) 基于私有云计算的资源调度方法、装置和云管理服务器
CN104122508B (zh) 一种智能配电终端后备电源系统的在线监测方法
CN109684141A (zh) 一种磁盘故障诊断方法、装置、终端及可读存储介质
CN109884475A (zh) 一种电网故障检测方法、装置、系统及存储介质
CN110704287B (zh) Linux系统下RAID卡异常日志收集方法、系统及存储介质
CN114487856A (zh) 换电站电池的热失控预警方法及系统
CN106708646A (zh) 硬盘异常自动复位方法及其装置
US20140059390A1 (en) Use of service processor to retrieve hardware information
CN102508760A (zh) 独立磁盘冗余阵列预警方法和系统
CN102662787A (zh) 一种保护系统盘raid的方法
CN110175100B (zh) 一种存储盘故障预测方法及预测系统
CN117453137A (zh) 云化智能运维系统数据管理系统
CN102981939A (zh) 磁盘监控方法
CN106021065A (zh) 一种在linux下自动检测raid下磁盘坏道信息的方法
CN107807862A (zh) 检测硬盘故障点的方法、装置及服务器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101020