CN111611117B - 硬盘故障的预测方法、装置、设备及计算机可读存储介质 - Google Patents
硬盘故障的预测方法、装置、设备及计算机可读存储介质 Download PDFInfo
- Publication number
- CN111611117B CN111611117B CN202010442551.9A CN202010442551A CN111611117B CN 111611117 B CN111611117 B CN 111611117B CN 202010442551 A CN202010442551 A CN 202010442551A CN 111611117 B CN111611117 B CN 111611117B
- Authority
- CN
- China
- Prior art keywords
- hard disk
- parameter
- detection value
- parameter detection
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000001514 detection method Methods 0.000 claims abstract description 136
- 238000006243 chemical reaction Methods 0.000 claims abstract description 59
- 238000012549 training Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 claims description 23
- 238000004590 computer program Methods 0.000 claims description 9
- 238000010606 normalization Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000007781 pre-processing Methods 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims 1
- 230000008569 process Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000000546 chi-square test Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/22—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
- G06F11/2205—Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
Landscapes
- Engineering & Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种硬盘故障的预测方法、装置、设备及计算机可读存储介质,在建立针对多种硬盘型号的硬盘故障预测模型时,先建立各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系,再根据该转换关系将硬盘的参数检测值进行转换,消除了不同硬盘型号之间的差异;利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型,由此建立了适用于多种硬盘型号的硬盘故障预测模型,相较于针对每种型号的硬盘单独训练硬盘故障预测模型要省时省力,而利用该硬盘故障预测模型进行硬盘故障预测,由于建立了各硬盘型号的参数与基准硬盘型号之间的关联,相较于现有技术中仅通过型号来区分不同的硬盘故障的预测模型能够得到更为准确的预测结果。
Description
技术领域
本发明涉及硬盘监控技术领域,特别是涉及一种硬盘故障的预测方法、装置、设备及计算机可读存储介质。
背景技术
在大规模数据中心中,硬盘使用规模已经达到百万级别。硬盘故障问题频发,会导致服务器甚至整个IT基础设施稳定性、可靠性的下降,最终对业务服务级别SLA带来负面影响。近年来,工业界和学术界开展了很多关于硬盘故障预测相关的工作。在大规模硬盘故障预测中,最关键的输入数据为硬盘的参数S.M.A.R.T(Self-Monitoring Analysis andReporting Technology,自我监测、分析及报告技术)信息。
不同厂家生产的硬盘S.M.A.R.T特征的分布差异很多,即使同一个厂家生产的两个型号的硬盘的S.M.A.R.T特征,有时也会有很大差异。举例来说,表示硬盘坏块数量的smart_5_raw参数,有的硬盘型号对应的最大值只有几千,而有的硬盘型号对应的最大值会达到几万,差异很大。为此,常见的解决办法有两种,要么对每个型号的硬盘单独训练故障预测模型,众多的硬盘型号导致建模工作较为繁琐;要么将硬盘型号也作为训练特征进行学习,但得到的硬盘故障模型的训练准确性不高。
提出一种便于对多种硬盘型号进行故障预测的方法,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种硬盘故障的预测方法、装置、设备及计算机可读存储介质,用于准确便捷地对多种硬盘型号进行故障预测。
为解决上述技术问题,本发明提供一种硬盘故障的预测方法,包括:
获取多个硬盘型号下的硬盘的参数检测值和所述硬盘的运行状态;
在各所述硬盘型号中选定基准硬盘型号;
计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系;
根据所述转换关系对相应的参数检测值进行转换,得到转换后的参数检测值;
利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型;
在接收到待监测硬盘的参数检测值时,调用所述硬盘故障预测模型以根据所述待监测硬盘的参数检测值进行故障预测,得到所述待监测硬盘故障的预测结果。
可选的,所述计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系,具体通过以下公式计算得到:
F′n=s·(Fn-Mxmin)+Mymin
其中,s为待转换参数与所述基准硬盘型号的对应参数的转换系数,Mymax为所述待转换参数的最大值,Mymin为所述待转换参数的最小值,Mxmax为所述基准硬盘型号的对应参数的最大值,Mxmin为所述基准硬盘型号的对应参数的最小值,Fn为所述待转换参数的参数检测值,Fn'为所述待转换参数转换后的参数检测值。
可选的,所述调用所述硬盘故障预测模型以根据所述待监测硬盘的参数检测值进行故障预测,得到所述待监测硬盘故障的预测结果,具体包括:
将所述待监测硬盘的实时参数检测值按对应的转换关系进行转换得到所述待监测硬盘转换后的实时参数检测值;
将所述待监测硬盘转换后的实时参数检测值输入所述硬盘故障预测模型,得到所述待监测硬盘故障的预测结果。
可选的,在所述根据所述转换关系对相应的参数检测值进行转换,得到转换后的参数检测值之前,还包括:
按预设规则对所述硬盘的参数检测值进行预处理,得到预处理后的参数检测值;
相应的,所述根据所述转换关系对相应的参数检测值进行转换,得到转换后的参数检测值,具体为:
根据所述转换关系对相应的预处理后的参数检测值进行转换,得到所述转换后的参数检测值。
可选的,所述按预设规则对所述硬盘的参数检测值进行预处理,得到预处理后的参数检测值,具体为:
对所述硬盘的参数检测值进行缺失值处理和文字特征转换后,得到所述预处理后的参数检测值。
可选的,在所述利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型之前,还包括:
对所述转换后的参数检测值进行归一化处理,得到归一化处理后的参数检测值;
相应的,所述利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型,具体为:
利用所述归一化处理后的参数检测值和所述硬盘的运行状态训练所述硬盘故障预测模型。
可选的,在所述利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型之后,还包括:
利用所述待监测硬盘的实时参数检测值、对所述待监测硬盘故障的预测结果以及所述待监测硬盘的真实故障结果对所述硬盘故障预测模型进行优化。
为解决上述技术问题,本发明还提供一种硬盘故障的预测装置,包括:
获取单元,用于获取多个硬盘型号下的硬盘的参数检测值和所述硬盘的运行状态;
选择单元,用于在各所述硬盘型号中选定基准硬盘型号;
计算单元,用于计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系;
转换单元,用于根据所述转换关系对相应的参数检测值进行转换,得到转换后的参数检测值;
训练单元,用于利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型;
预测单元,用于在接收到待监测硬盘的参数检测值时,调用所述硬盘故障预测模型以根据所述待监测硬盘的参数检测值进行故障预测,得到所述待监测硬盘故障的预测结果。
为解决上述技术问题,本发明还提供一种硬盘故障的预测设备,包括:
存储器,用于存储指令,所述指令包括上述任意一项所述硬盘故障的预测方法的步骤;
处理器,用于执行所述指令。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述硬盘故障的预测方法的步骤。
本发明所提供的硬盘故障的预测方法,在建立针对多种硬盘型号的硬盘故障预测模型时,先建立各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系,再根据该转换关系将硬盘的参数检测值进行转换,消除了不同硬盘型号之间的差异;利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型,由此建立了适用于多种硬盘型号的硬盘故障预测模型,相较于针对每种型号的硬盘单独训练硬盘故障预测模型要省时省力,而利用该硬盘故障预测模型进行硬盘故障预测,由于建立了各硬盘型号的参数与基准硬盘型号之间的关联,相较于现有技术中仅通过型号来区分不同的硬盘的针对多种硬盘型号的故障预测模型能够更加准确的描述硬盘故障与硬盘参数检测值之间的关系,故能得到更为准确的预测结果。因此,本发明提供的硬盘故障的预测方法能够准确便捷地对多种硬盘型号进行故障预测。
本发明还提供一种硬盘故障的预测装置、设备及计算机可读存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种硬盘故障的预测方法的流程图;
图2为本发明实施例提供的另一种硬盘故障的预测方法的流程图;
图3为本发明实施例提供的一种硬盘故障的预测装置的结构示意图;
图4为本发明实施例提供的一种硬盘故障的预测设备的结构示意图。
具体实施方式
本发明的核心是提供一种硬盘故障的预测方法、装置、设备及计算机可读存储介质,用于准确便捷地对多种硬盘型号进行故障预测。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种硬盘故障的预测方法的流程图。
如图1所示,本发明实施例提供的硬盘故障的预测方法包括:
S101:获取多个硬盘型号下的硬盘的参数检测值和硬盘的运行状态。
在具体实施中,首先获取大量硬盘的参数检测数据和经过检修后得知的硬盘的运行状态。其中,参数检测数据包括一个硬盘的各参数对应的参数检测值。通常情况下,各硬盘型号对应的待监测的参数类型是一样的。
S102:在各硬盘型号中选定基准硬盘型号。
S103:计算硬盘中各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系。
对于步骤S102和步骤S103,这些获取到的参数检测数据中包含多个硬盘型号的参数检测数据,在其中任选一个硬盘型号作为基准硬盘型号,对于各个参数,计算其他硬盘型号与基准硬盘型号的转换关系,基准硬盘型号与自身的转换关系就是1:1。
如共有10个硬盘型号,待监测的参数有7个,假设以1号硬盘型号为基准硬盘型号,在建立2号硬盘型号与1号硬盘型号的转换关系时,对2号硬盘型号的7个参数与1号硬盘型号的7个参数分别建立转换关系,以此类推,最后每个硬盘型号均对应7个转换关系。
通常情况下,各硬盘型号的参数的差异在于其取值上限和下限不同,而不同硬盘型号的同一参数之间的关系通常为正比例关系,则步骤S103中:计算硬盘中各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系,具体可以通过以下公式计算得到:
F′n=s(Fn-Mxmin)+Mymin (2)
其中,s为待转换参数与基准硬盘型号的对应参数的转换系数,Mymax为待转换参数的最大值,Mymin为待转换参数的最小值,Mxmax为基准硬盘型号的对应参数的最大值,Mxmin为基准硬盘型号的对应参数的最小值,Fn为待转换参数的参数检测值,Fn'为待转换参数转换后的参数检测值。
此外,若数据量充足,也可以对不同硬盘型号的同一参数进行更为复杂的关系拟合,得到各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系。
S104:根据转换关系对相应的参数检测值进行转换,得到转换后的参数检测值。
在进行步骤S104:根据转换关系对相应的参数检测值进行转换,得到转换后的参数检测值之前,本发明实施例提供的硬盘故障的预测方法还可以包括:
按预设规则对硬盘的参数检测值进行预处理,得到预处理后的参数检测值;
相应的,步骤S104具体为:
根据转换关系对相应的预处理后的参数检测值进行转换,得到转换后的参数检测值。
其中,按预设规则对硬盘的参数检测值进行预处理,得到预处理后的参数检测值,具体可以为:
对硬盘的参数检测值进行缺失值处理和文字特征转换后,得到预处理后的参数检测值。
缺失值处理具体可以包括:去掉有缺失的特征,去掉有缺失的记录,对缺失值进行填充(0、均值、中位数等)。
文字特征转换具体可以包括:对于文本类的特征,一般要转为数值特征。如果文本标签之间没有大小关系,要处理为独热(one hot)编码的格式。
特征缩放。数据要做的最重要的转换之一是特征缩放。除了个别情况,当输入的数值属性量度不同时,机器学习算法的性能都不会好。特征缩放,常用的两种方法是:最小-最大缩放和标准化。
除此以外,还可以对硬盘的参数检测值进行标准化处理和特征工程处理。
标准化处理具体包括:对于一个硬盘型号下不同硬盘同一参数的参数检测值,将各参数检测值减去平均值后除以方差,从而使得结果的分布具备单位方差。
由于某些特征表面的静态数值没有明显的规律,但是随时间变化的特征或者多个特征组合运算后的特征对目标结果的预测会有很大帮助。因此,很多时候,需要进行特征工程处理,具体包括:对原始的特征进行提取,筛选出显著特征、摒弃非显著特征,需要运用特征有效性分析的相关技术,如相关系数、卡方检验、平均互信息、条件熵、后验概率、逻辑回归权重等方法。
S105:利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型。
在训练硬盘故障预测模型之前,本发明实施例提供的硬盘故障的预测方法还可以包括:
对转换后的参数检测值进行归一化处理,得到归一化处理后的参数检测值。
相应的,步骤S105:利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型,具体为:
利用归一化处理后的参数检测值和硬盘的运行状态训练硬盘故障预测模型。
在具体实施中,对转换后的参数检测值进行归一化处理具体包括:将值重新缩放使其最终范围归于0到1之间,实现方法是将值减去最小值并除以最大值和最小值的差。对此,Scikit-Learn提供了一个名为MinMaxScaler的转换器。如果希望范围不是0~1,可以通过调整转换器的超参数feature_range进行更改。
根据转换关系对相应的参数检测值进行转换,得到转换后的参数检测值后,这些参数数据可以视作基准硬盘型号的参数数据,利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型,得到了符合各硬盘型号的硬盘故障与硬盘参数检测值之间的关系的模型。
具体地,根据所需硬盘故障预测结果的不同,选择不同的模型类型。如想要得到待监测硬盘故障与否的结果与待监测硬盘的寿命,可以选用决策树算法训练硬盘故障预测模型;如想要得到更为详细的硬盘故障原因,则需要更多的参数数据进行训练,同时可以选用神经网络模型等计算更为复杂的模型。
另外,各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系可以独立于硬盘故障检测模型,也可以将硬盘型号与转换关系的对应关系加入硬盘故障检测模型。
S106:在接收到待监测硬盘的参数检测值时,调用硬盘故障预测模型以根据待监测硬盘的参数检测值进行故障预测,得到待监测硬盘故障的预测结果。
若采用转换关系独立于硬盘故障检测模型的训练方式,则步骤S106:利用硬盘故障预测模型对待监测硬盘进行故障预测,得到待监测硬盘故障的预测结果,具体包括:
将待监测硬盘的实时参数检测值按对应的转换关系进行转换得到待监测硬盘转换后的实时参数检测值;
将待监测硬盘转换后的实时参数检测值输入硬盘故障预测模型,得到待监测硬盘故障的预测结果。
若采用将硬盘型号与转换关系的对应关系加入硬盘故障检测模型的训练方式,则将待监测硬盘的实时参数检测值及硬盘型号输入硬盘故障预测模型,即可得到待监测硬盘故障的预测结果。
本发明实施例提供的硬盘故障的预测方法,在建立针对多种硬盘型号的硬盘故障预测模型时,先建立各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系,再根据该转换关系将硬盘的参数检测值进行转换,消除了不同硬盘型号之间的差异;利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型,由此建立了适用于多种硬盘型号的硬盘故障预测模型,相较于针对每种型号的硬盘单独训练硬盘故障预测模型要省时省力,而利用该硬盘故障预测模型进行硬盘故障预测,由于建立了各硬盘型号的参数与基准硬盘型号之间的关联,相较于现有技术中仅通过型号来区分不同的硬盘的针对多种硬盘型号的故障预测模型能够更加准确的描述硬盘故障与硬盘参数检测值之间的关系,故能得到更为准确的预测结果。因此,本发明实施例提供的硬盘故障的预测方法能够准确便捷地对多种硬盘型号进行故障预测。
图2为本发明实施例提供的另一种硬盘故障的预测方法的流程图。
在训练得到硬盘故障预测模型后,需要对硬盘故障预测模型的参数进行调优,判断是否存在过拟合问题或欠拟合问题,常见的方法是绘制学习曲线,交叉验证。通过增加训练的参数数据量、降低模型复杂度来降低过拟合的风险,通过提高特征的数量和质量、增加模型复杂来防止欠拟合。
诊断后的硬盘故障预测模型需要进行进一步调优,调优后的硬盘故障预测模型需要重新诊断,这是一个反复迭代不断逼近的过程,需要不断的尝试,进而达到更优的状态。
而随着新的参数检测数据和新的硬盘型号的加入,硬盘故障预测模型势必需要更新优化。
如图2所示,在上述实施例的基础上,在步骤S106:利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型之后,本发明实施例提供的硬盘故障的预测方法还包括:
S201:利用待监测硬盘的实时参数检测值、对待监测硬盘故障的预测结果以及待监测硬盘的真实故障结果对硬盘故障预测模型进行优化。
在具体实施中,对经过硬盘故障预测模型预测的待监测硬盘进行检测,得到真实故障结果,包括故障、正常运行、专业人士诊断硬盘寿命(和故障类型)等,利用待监测硬盘的实时参数检测值、对待监测硬盘故障的预测结果以及待监测硬盘的真实故障结果对硬盘故障预测模型进行优化,使得硬盘故障预测模型进一步完善。
上文详述了硬盘故障的预测方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的硬盘故障的预测装置、设备及计算机可读存储介质。
图3为本发明实施例提供的一种硬盘故障的预测装置的结构示意图。
如图3所示,本发明实施例提供的硬盘故障的预测装置包括:
获取单元301,用于获取多个硬盘型号下的硬盘的参数检测值和硬盘的运行状态;
选择单元302,用于在各硬盘型号中选定基准硬盘型号;
计算单元303,用于计算硬盘中各硬盘型号的各项参数与基准硬盘型号的对应参数的转换关系;
转换单元304,用于根据转换关系对相应的参数检测值进行转换,得到转换后的参数检测值;
训练单元305,用于利用转换后的参数检测值和硬盘的运行状态训练硬盘故障预测模型;
预测单元306,用于在接收到待监测硬盘的参数检测值时,调用硬盘故障预测模型以根据待监测硬盘的参数检测值进行故障预测,得到待监测硬盘故障的预测结果。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图4为本发明实施例提供的一种硬盘故障的预测设备的结构示意图。
如图4所示,本发明实施例提供的硬盘故障的预测设备包括:
存储器410,用于存储指令,所述指令包括上述任意一项实施例所述的硬盘故障的预测方法的步骤;
处理器420,用于执行所述指令。
其中,处理器420可以包括一个或多个处理核心,比如3核心处理器、8核心处理器等。处理器420可以采用数字信号处理DSP(Digital Signal Processing)、现场可编程门阵列FPGA(Field-Programmable Gate Array)、可编程逻辑阵列PLA(Programmable LogicArray)中的至少一种硬件形式来实现。处理器420也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器CPU(CentralProcessing Unit);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器420可以集成有图像处理器GPU(Graphics Processing Unit),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器420还可以包括人工智能AI(Artificial Intelligence)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器410可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器410还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器410至少用于存储以下计算机程序411,其中,该计算机程序411被处理器420加载并执行之后,能够实现前述任一实施例公开的硬盘故障的预测方法中的相关步骤。另外,存储器410所存储的资源还可以包括操作系统412和数据413等,存储方式可以是短暂存储或者永久存储。其中,操作系统412可以为Windows。数据413可以包括但不限于上述方法所涉及到的数据。
在一些实施例中,硬盘故障的预测设备还可包括有显示屏430、电源440、通信接口450、输入输出接口460、传感器470以及通信总线480。
本领域技术人员可以理解,图4中示出的结构并不构成对硬盘故障的预测设备的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的硬盘故障的预测设备,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如上所述的硬盘故障的预测方法,效果同上。
需要说明的是,以上所描述的装置、设备实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。
为此,本发明实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如硬盘故障的预测方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器ROM(Read-OnlyMemory)、随机存取存储器RAM(Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例中提供的计算机可读存储介质所包含的计算机程序能够在被处理器执行时实现如上所述的硬盘故障的预测方法的步骤,效果同上。
以上对本发明所提供的一种硬盘故障的预测方法、装置、设备及计算机可读存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (6)
1.一种硬盘故障的预测方法,其特征在于,包括:
获取多个硬盘型号下的硬盘的参数检测值和所述硬盘的运行状态;
在各所述硬盘型号中选定基准硬盘型号;
计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系;
按预设规则对所述硬盘的参数检测值进行预处理,得到预处理后的参数检测值;具体为对所述硬盘的参数检测值进行缺失值处理和文字特征转换后,得到所述预处理后的参数检测值;
根据所述转换关系对相应的参数检测值进行转换,得到转换后的参数检测值;具体为根据所述转换关系对相应的所述预处理后的参数检测值进行转换,得到所述转换后的参数检测值;
对所述转换后的参数检测值进行归一化处理,得到归一化处理后的参数检测值;
利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型;具体为利用所述归一化处理后的参数检测值和所述硬盘的运行状态训练所述硬盘故障预测模型;
在接收到待监测硬盘的参数检测值时,调用所述硬盘故障预测模型以根据所述待监测硬盘的参数检测值进行故障预测,得到所述待监测硬盘故障的预测结果;
其中,所述计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系,具体通过以下公式计算得到:
2.根据权利要求1所述的故障预测方法,其特征在于,所述调用所述硬盘故障预测模型以根据所述待监测硬盘的参数检测值进行故障预测,得到所述待监测硬盘故障的预测结果,具体包括:
将所述待监测硬盘的实时参数检测值按对应的转换关系进行转换得到所述待监测硬盘转换后的实时参数检测值;
调用所述硬盘故障预测模型,将所述待监测硬盘转换后的实时参数检测值输入所述硬盘故障预测模型,得到所述待监测硬盘故障的预测结果。
3.根据权利要求1所述的故障预测方法,其特征在于,在所述利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型之后,还包括:
利用所述待监测硬盘的实时参数检测值、对所述待监测硬盘故障的预测结果以及所述待监测硬盘的真实故障结果对所述硬盘故障预测模型进行优化。
4.一种硬盘故障的预测装置,其特征在于,包括:
获取单元,用于获取多个硬盘型号下的硬盘的参数检测值和所述硬盘的运行状态;
选择单元,用于在各所述硬盘型号中选定基准硬盘型号;
计算单元,用于计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系;
按预设规则对所述硬盘的参数检测值进行预处理,得到预处理后的参数检测值;具体为对所述硬盘的参数检测值进行缺失值处理和文字特征转换后,得到所述预处理后的参数检测值;
转换单元,用于根据所述转换关系对相应的参数检测值进行转换,得到转换后的参数检测值;具体用于根据所述转换关系对相应的所述预处理后的参数检测值进行转换,得到所述转换后的参数检测值;
对所述转换后的参数检测值进行归一化处理,得到归一化处理后的参数检测值;
训练单元,用于利用所述转换后的参数检测值和所述硬盘的运行状态训练硬盘故障预测模型;具体用于利用所述归一化处理后的参数检测值和所述硬盘的运行状态训练所述硬盘故障预测模型;
预测单元,用于在接收到待监测硬盘的参数检测值时,调用所述硬盘故障预测模型以根据所述待监测硬盘的参数检测值进行故障预测,得到所述待监测硬盘故障的预测结果;
其中,所述计算所述硬盘中各硬盘型号的各项参数与所述基准硬盘型号的对应参数的转换关系,具体通过以下公式计算得到
5.一种硬盘故障的预测设备,其特征在于,包括:
存储器,用于存储指令,所述指令包括权利要求1至3任意一项所述硬盘故障的预测方法的步骤;
处理器,用于执行所述指令。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至3任意一项所述硬盘故障的预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010442551.9A CN111611117B (zh) | 2020-05-22 | 2020-05-22 | 硬盘故障的预测方法、装置、设备及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010442551.9A CN111611117B (zh) | 2020-05-22 | 2020-05-22 | 硬盘故障的预测方法、装置、设备及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111611117A CN111611117A (zh) | 2020-09-01 |
CN111611117B true CN111611117B (zh) | 2022-06-10 |
Family
ID=72196198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010442551.9A Active CN111611117B (zh) | 2020-05-22 | 2020-05-22 | 硬盘故障的预测方法、装置、设备及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111611117B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI794041B (zh) * | 2022-03-09 | 2023-02-21 | 英業達股份有限公司 | 硬碟效能問題分類模型的建立方法、硬碟效能問題分析方法及硬碟效能問題分類模型建立系統 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011215664A (ja) * | 2010-03-31 | 2011-10-27 | Hitachi Ltd | ハードディスク装置の障害予兆診断方式 |
CN103646114A (zh) * | 2013-12-26 | 2014-03-19 | 北京百度网讯科技有限公司 | 硬盘smart数据中特征数据提取方法和装置 |
CN107392320A (zh) * | 2017-07-28 | 2017-11-24 | 郑州云海信息技术有限公司 | 一种使用机器学习预测硬盘故障的方法 |
CN110119344A (zh) * | 2019-04-10 | 2019-08-13 | 河南文正电子数据处理有限公司 | 基于s.m.a.r.t参数的硬盘健康状态分析方法 |
CN110164501A (zh) * | 2018-06-29 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种硬盘检测方法、装置、存储介质及设备 |
-
2020
- 2020-05-22 CN CN202010442551.9A patent/CN111611117B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011215664A (ja) * | 2010-03-31 | 2011-10-27 | Hitachi Ltd | ハードディスク装置の障害予兆診断方式 |
CN103646114A (zh) * | 2013-12-26 | 2014-03-19 | 北京百度网讯科技有限公司 | 硬盘smart数据中特征数据提取方法和装置 |
CN107392320A (zh) * | 2017-07-28 | 2017-11-24 | 郑州云海信息技术有限公司 | 一种使用机器学习预测硬盘故障的方法 |
CN110164501A (zh) * | 2018-06-29 | 2019-08-23 | 腾讯科技(深圳)有限公司 | 一种硬盘检测方法、装置、存储介质及设备 |
CN110119344A (zh) * | 2019-04-10 | 2019-08-13 | 河南文正电子数据处理有限公司 | 基于s.m.a.r.t参数的硬盘健康状态分析方法 |
Non-Patent Citations (2)
Title |
---|
"Real-time big data analytics for hard disk drive predictive maintenance";Chuan-Jun Su等;《Computers & Electrical Engineering》;20181031;第71卷;第93-101页 * |
"基于Adaboost和遗传算法的硬盘故障预测模型优化及选择";贾润莹等;《计算机研究与发展》;20141231;第51卷;第148-154页 * |
Also Published As
Publication number | Publication date |
---|---|
CN111611117A (zh) | 2020-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111459700B (zh) | 设备故障的诊断方法、诊断装置、诊断设备及存储介质 | |
US11650968B2 (en) | Systems and methods for predictive early stopping in neural network training | |
CN109858548B (zh) | 异常耗电的判断方法及装置、存储介质、通信终端 | |
CN115358155A (zh) | 一种电力大数据异常预警方法、装置、设备及可读存储介质 | |
CN113268403A (zh) | 时间序列的分析预测方法、装置、设备及存储介质 | |
CN113269359A (zh) | 用户财务状况预测方法、设备、介质及计算机程序产品 | |
CN111611117B (zh) | 硬盘故障的预测方法、装置、设备及计算机可读存储介质 | |
CN111612149A (zh) | 一种基于决策树的主网线路状态检测方法、系统及介质 | |
CN116028315A (zh) | 作业运行预警方法、装置、介质及电子设备 | |
CN112182056A (zh) | 一种数据检测方法、装置、设备及存储介质 | |
CN113313304A (zh) | 一种基于大数据决策树的电网事故异常分析方法及系统 | |
CN112801315A (zh) | 电力二次设备的状态诊断方法、装置及终端 | |
CN117194163A (zh) | 一种计算机设备、故障检测系统、方法及可读存储介质 | |
JP7062505B2 (ja) | 設備管理支援システム | |
CN116249186A (zh) | 无线网设备的数据处理方法、装置、存储介质及电子设备 | |
CN116384223A (zh) | 基于退化状态智能辨识的核设备可靠性评估方法及系统 | |
CN115841343A (zh) | 一种销售额度的确定方法及装置 | |
CN115271277A (zh) | 电力设备画像构建方法、系统、计算机设备及存储介质 | |
CN111368837A (zh) | 一种图像质量评价方法、装置、电子设备及存储介质 | |
CN115392715A (zh) | 一种用电数据风险评估方法、装置、设备及存储介质 | |
CN115293735A (zh) | 一种无人工厂工业互联网平台监测管理方法及系统 | |
CN113593694A (zh) | 一种重症患者预后的预测方法 | |
CN113151842A (zh) | 风光互补电解水制氢的转化效率的确定方法和确定装置 | |
CN112395167A (zh) | 一种作业故障预测方法、装置及电子设备 | |
CN117239743B (zh) | 一种电能表用电负荷获取方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |