CN113778791B - 一种分布式存储磁盘的故障预警方法及系统 - Google Patents

一种分布式存储磁盘的故障预警方法及系统 Download PDF

Info

Publication number
CN113778791B
CN113778791B CN202110952899.7A CN202110952899A CN113778791B CN 113778791 B CN113778791 B CN 113778791B CN 202110952899 A CN202110952899 A CN 202110952899A CN 113778791 B CN113778791 B CN 113778791B
Authority
CN
China
Prior art keywords
time
disk
load
set value
loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110952899.7A
Other languages
English (en)
Other versions
CN113778791A (zh
Inventor
秦楠楠
赵万里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110952899.7A priority Critical patent/CN113778791B/zh
Publication of CN113778791A publication Critical patent/CN113778791A/zh
Application granted granted Critical
Publication of CN113778791B publication Critical patent/CN113778791B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种分布式存储磁盘的故障预警方法及系统,属于计算机安全技术领域,方法包括获取磁盘的负载以及对应的负载时间;基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警。本发明通过对硬盘剩余时间的计算,预估硬盘故障,其中考虑了硬盘的负载及状态对硬盘剩余时间的影响,计算数据的获取只需从现有的信息采集工具中取得即可,且无需长时间的等待,能够对即将故障的磁盘进行实时预警,且整个计算过程简单、易实现,且预估结果准确可靠。

Description

一种分布式存储磁盘的故障预警方法及系统
技术领域
本发明涉及计算机安全技术领域,尤其是一种分布式存储磁盘的故障预警方法及系统。
背景技术
分布式存储系统通常包括多个节点,系统中每一个节点都具有计算和存储能力。每个节点都是可机架安装的企业应用装置,以对象为数据存储的基础单位,采用全对称、去中心化分布式架构,提供全局统一命名空间。分布式存储可提供高性能,高可靠,高容量的存储特性,但是大规模集群下磁盘故障损坏带来的数据风险仍不容忽视。
现有磁盘预测功能不同厂家具有不同的实现方法,现有对磁盘寿命的预估方法通常通过机器学习方法,收集大量的磁盘寿命数据进行机器学习,得到预估模型,从而对现有运行的磁盘进行寿命或故障的预估,需要大量的计算工作,需要专业人员进行建模训练,成本高。
发明内容
本发明提供了一种分布式存储磁盘的故障预警方法及系统,用于解决现有预估方法繁琐、成本高的问题。
为实现上述目的,本发明采用下述技术方案:
本发明第一方面提供了一种分布式存储磁盘的故障预警方法,所述方法包括以下步骤:
获取磁盘的负载以及对应的负载时间;
基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;
基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警。
进一步地,所述基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余时间具体为:
所述预估磁盘的剩余时间t=f(t)-f(d)-F(c);式中,f(t)为所述理想寿命,f(d)为磁盘的使用时间,F(c)为所述若干个磁盘损耗时间的和。
进一步地,所述基于负载的不同取值,为其对应的负载时间分配不同的系数具体为:
若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;
若所述负载大于第一设定值,对应的负载时间为c2,则磁盘损耗时间f(c2)=Ac2,A为取值大于1的系数。
进一步地,所述基于负载的不同取值,为其对应的负载时间分配不同的系数具体为:
若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;
若所述负载大于第一设定值且不大于第二设定值,对应的负载时间为c3,则磁盘损耗时间f(c3)=Bc3
若所述负载大于第二设定值且不大于第三设定值,对应的负载时间为c4,则磁盘损耗时间f(c4)=Cc4
若所述负载大于第三设定值,对应的负载时间为c5,则磁盘损耗时间f(c5)=Dc5
系数B<C<D,且B的取值大于1。
进一步地,所述方法在获取磁盘的负载后,还包括步骤:
在当前磁盘的负载超过第四设定值时,获取磁盘所在集群的负载状态;
若所述负载状态为空闲,所述负载超过第四设定值的时间为c6,则所述理想寿命f(t)=Ec6,系数E的取值小于1;
若所述负载状态为非空闲,所述负载超过第四设定值的时间为c7,则所述磁盘损耗时间f(c7)=Fc7,系数F的取值大于1。
进一步地,所述剩余时间为零时,进行故障预警。
进一步地,所述方法还包括:
当所述磁盘出现介质错误时,则将所述剩余时间置零。
本发明第二方面提供了一种分布式存储磁盘的故障预警系统,所述系统包括:
信息采集单元,用于获取磁盘的负载以及对应的负载时间;
数据分析单元,基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;
故障预警单元,基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警。
进一步地,所述系统还包括磁盘状态检测单元,所述磁盘出现介质错误时,通过故障预警单元进行故障报警。
本发明第三方面提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令,所述计算机指令在所述系统上运行时,使所述系统执行所述方法的步骤。
本发明第二方面的所述分布式磁盘的故障预警系统能够实现第一方面及第一方面的各实现方式中的方法,并取得相同的效果。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
1、本发明实施例通过对硬盘剩余时间的计算,预估硬盘故障,其中考虑了硬盘的负载及状态对硬盘剩余时间的影响,计算数据的获取只需从现有的信息采集工具中取得即可,且无需长时间的等待,能够对即将故障的磁盘进行实时预警,且整个计算过程简单、易实现。
2、本发明实施例中负载对硬盘剩余时间的考量,进行了多个区间的划分,使预测结果更加精准。且本发明实施例中考虑了慢盘和介质错误对磁盘故障的影响,进一步完善了预测方法。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明所述方法的流程示意图;
图2是本发明所述系统的结构示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
如图1所示,本发明提供了一种分布式存储磁盘的故障预警方法,包括以下步骤:
S1,获取磁盘的负载以及对应的负载时间;
S2,基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;
S3,基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警。具体在所述剩余时间为零时,进行故障预警。
步骤S1中,通过设置定时函数任务收集各个磁盘的负载状态,可间隔60s统计一次各个磁盘负载压力,写入数据库中,收集完毕后每天0点计算出不同负载对应的损耗时间,负载时间的获取通过iostat接口进行。
步骤S2中,所述基于负载的不同取值,为其对应的负载时间分配不同的系数其一实现方式:若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;若所述负载大于第一设定值,对应的负载时间为c2,则磁盘损耗时间f(c2)=Ac2,A为取值大于1的系数。
第一设定值区50%,即负载不大于50%时,不计算负载对磁盘的损耗;在负载大于50%时,系数A的取值为1.5,即计算负载对磁盘损耗的影响为1.5倍的负载时间。
基于负载的不同取值,为其对应的负载时间分配不同的系数,另一实现方式:对于负载大于50%的情况可进一步的细化,使预估的磁盘剩余时间更加准确,具体为:若所述负载大于第一设定值且不大于第二设定值,对应的负载时间为c3,则磁盘损耗时间f(c3)=Bc3;若所述负载大于第二设定值且不大于第三设定值,对应的负载时间为c4,则磁盘损耗时间f(c4)=Cc4;若所述负载大于第三设定值,对应的负载时间为c5,则磁盘损耗时间f(c5)=Dc5;系数B<C<D,且B的取值大于1。第二设定值为80%,第三设定值为90%,系数B、C和D的取值依次为1.3、1.5和1.8。
步骤S3中,所述基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余时间具体为:所述预估磁盘的剩余时间t=f(t)-f(d)-F(c);式中,f(t)为所述理想寿命,f(d)为磁盘的使用时间,F(c)为所述若干个磁盘损耗时间的和。
其中,理想寿命为磁盘出厂时,厂家提供的使用寿命的参考值,如SATA(SerialATA,磁盘) SSD(Solid State Disk,固态磁盘)使用寿命在2-3年左右,即为1000天;使用时间即当前磁盘开机运行的时间;F(c)为上述步骤S2中计算的各磁盘损耗时间的和。
本发明在上述实施例的基础上,还包括在获取磁盘的负载后,包括步骤:在当前磁盘的负载超过第四设定值时,获取磁盘所在集群的负载状态;若所述负载状态为空闲,所述负载超过第四设定值的时间为c6,则所述理想寿命f(t)=Ec6,系数E的取值小于1;若所述负载状态为非空闲,所述负载超过第四设定值的时间为c7,则所述磁盘损耗时间f(c7)=Fc7,系数F的取值大于1。
磁盘寿命有一个固定使用时间,在业务负载压力运行会有部分损耗,压力越大损耗越大。长时间压力损耗下磁盘出现介质坏块或者碎片过多就会变成慢盘,慢盘下虽仍可使用但是其性能会大大降低。本实施例中考虑了慢盘的情况对磁盘故障的影响:通过集群接口perf查看集群压力,通常在集群压力低于20%,认为是空闲状态,此时基于iostat查看磁盘负载仍在第四设置值以上,则认为当前磁盘为慢盘。在集群处于非空闲状态时,磁盘的负载通常很高,在90% 以上,此时对磁盘使用寿命的影响很大,因此系数F的取值增大。具体为第四设定值的取值在95%以上,如取98%,系数E的取值为0.2,F的取值为2。
本发明的另一实施例,磁盘使用达到期限或者出现异常会出现介质错误mediaerror时,此时磁盘基本不可用,则直接将所述剩余时间置零,尽快发出磁盘预警,更换磁盘。
以上实施例中第一设定值、第二设定值、第三设定值、第四设定值及系数A、B、C、D、E、F的取值,仅仅是提供了示例,不造成对方案的限定。
如图2所示,本发明还提供了一种分布式存储磁盘的故障预警系统,所述系统包括信息采集单元1、数据分析单元2、故障预警单元3和磁盘状态检测单元4。
信息采集单元1用于获取磁盘的负载以及对应的负载时间;数据分析单元2基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;故障预警单元3基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警。
信息采集单元1通过设置定时函数任务收集各个磁盘的负载状态,可间隔60s统计一次各个磁盘负载压力,写入数据库中,收集完毕后每天0点计算出不同负载对应的损耗时间,负载时间的获取通过iostat接口进行。
数据分析单元2基于负载的不同取值,为其对应的负载时间分配不同的系数,其一实现方式:若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;若所述负载大于第一设定值,对应的负载时间为c2,则磁盘损耗时间f(c2)=Ac2,A为取值大于1的系数。
第一设定值区50%,即负载不大于50%时,不计算负载对磁盘的损耗;在负载大于50%时,系数A的取值为1.5,即计算负载对磁盘损耗的影响为1.5倍的负载时间。
基于负载的不同取值,为其对应的负载时间分配不同的系数,另一实现方式:对于负载大于50%的情况可进一步的细化,使预估的磁盘剩余时间更加准确,具体为:若所述负载大于第一设定值且不大于第二设定值,对应的负载时间为c3,则磁盘损耗时间f(c3)=Bc3;若所述负载大于第二设定值且不大于第三设定值,对应的负载时间为c4,则磁盘损耗时间f(c4)=Cc4;若所述负载大于第三设定值,对应的负载时间为c5,则磁盘损耗时间f(c5)=Dc5;系数B<C<D,且B的取值大于1。第二设定值为80%,第三设定值为90%,系数B、C和D的取值依次为1.3、1.5和1.8。
故障预警单元3基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余时间具体为:所述预估磁盘的剩余时间t=f(t)-f(d)-F(c);式中,f(t)为所述理想寿命,f(d)为磁盘的使用时间,F(c)为所述若干个磁盘损耗时间的和。故障预警单元3在所述剩余时间为0时,发出故障预警提示。
其中,理想寿命为磁盘出厂时,厂家提供的使用寿命的参考值,使用时间即当前磁盘开机运行的时间,F(c)为上述数据分析单元2中计算的各磁盘损耗时间的和。
本发明系统实施例中,同时也考虑了慢盘对磁盘故障的影响,数据分析单元2在当前磁盘的负载超过第四设定值时,获取磁盘所在集群的负载状态;若所述负载状态为空闲,所述负载超过第四设定值的时间为c6,则所述理想寿命f(t)=Ec6,系数E的取值小于1;若所述负载状态为非空闲,所述负载超过第四设定值的时间为c7,则所述磁盘损耗时间f(c7)=Fc7,系数F的取值大于1。本实施例中计算的损耗时间f(c7)也加入到F(c)中。
本发明在上述实施例的基础上,还包括在获取磁盘的负载后,包括步骤:在当前磁盘的负载超过第四设定值时,获取磁盘所在集群的负载状态;若所述负载状态为空闲,所述负载超过第四设定值的时间为c6,则所述理想寿命f(t)=Ec6,系数E的取值小于1;若所述负载状态为非空闲,所述负载超过第四设定值的时间为c7,则所述磁盘损耗时间f(c7)=Fc7,系数F的取值大于1。
磁盘状态检测单元4在所述磁盘出现介质错误时,通过故障预警单元进行故障报警。
本发明的故障预警系统能够实现上述故障预警方法中各实施例的步骤,并达到相同的技术效果。
本发明还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机指令,所述计算机指令在上述系统上运行时,使所述系统执行上述方法的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (7)

1.一种分布式存储磁盘的故障预警方法,其特征是,所述方法包括以下步骤:
获取磁盘的负载以及对应的负载时间;
基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;
基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警;
所述基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余时间具体为:
所述预估磁盘的剩余时间t=f(t)-f(d)-F(c);式中,f(t)为所述理想寿命,f(d)为磁盘的使用时间,F(c)为所述若干个磁盘损耗时间的和;
所述方法在获取磁盘的负载后,还包括步骤:
在当前磁盘的负载超过第四设定值时,获取磁盘所在集群的负载状态;
若所述负载状态为空闲,所述负载超过第四设定值的时间为c6,则所述理想寿命f(t)=Ec6,系数E的取值小于1;
若所述负载状态为非空闲,所述负载超过第四设定值的时间为c7,则所述磁盘损耗时间f(c7)=Fc7,系数F的取值大于1;
所述基于负载的不同取值,为其对应的负载时间分配不同的系数具体为:
若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;
若所述负载大于第一设定值,对应的负载时间为c2,则磁盘损耗时间f(c2)=Ac2,A为取值大于1的系数。
2.根据权利要求1所述分布式存储磁盘的故障预警方法,其特征是,所述基于负载的不同取值,为其对应的负载时间分配不同的系数具体为:
若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;
若所述负载大于第一设定值且不大于第二设定值,对应的负载时间为c3,则磁盘损耗时间f(c3)=Bc3
若所述负载大于第二设定值且不大于第三设定值,对应的负载时间为c4,则磁盘损耗时间f(c4)=Cc4
若所述负载大于第三设定值,对应的负载时间为c5,则磁盘损耗时间f(c5)=Dc5
系数B<C<D,且B的取值大于1。
3.根据权利要求1或2所述分布式存储磁盘的故障预警方法,其特征是,所述剩余时间为零时,进行故障预警。
4.根据权利要求3所述分布式存储磁盘的故障预警方法,其特征是,所述方法还包括:
当所述磁盘出现介质错误时,则将所述剩余时间置零。
5.一种分布式存储磁盘的故障预警系统,其特征是,所述系统包括:
信息采集单元,用于获取磁盘的负载以及对应的负载时间;
数据分析单元,基于负载的不同取值,为其对应的负载时间分配不同的系数,得到若干个磁盘损耗时间;
故障预警单元,基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余使用时间,根据所述剩余使用时间,进行故障预警;
所述基于磁盘的理想寿命和所述磁盘损耗时间,预估磁盘的剩余时间具体为:
所述预估磁盘的剩余时间t=f(t)-f(d)-F(c);式中,f(t)为所述理想寿命,f(d)为磁盘的使用时间,F(c)为所述若干个磁盘损耗时间的和;
所述系统在获取磁盘的负载后,还包括:
在当前磁盘的负载超过第四设定值时,获取磁盘所在集群的负载状态;
若所述负载状态为空闲,所述负载超过第四设定值的时间为c6,则所述理想寿命f(t)=Ec6,系数E的取值小于1;
若所述负载状态为非空闲,所述负载超过第四设定值的时间为c7,则所述磁盘损耗时间f(c7)=Fc7,系数F的取值大于1;
所述基于负载的不同取值,为其对应的负载时间分配不同的系数具体为:
若所述负载不大于第一设定值,对应的负载时间为c1,则磁盘损耗时间f(c1)=0;
若所述负载大于第一设定值,对应的负载时间为c2,则磁盘损耗时间f(c2)=Ac2,A为取值大于1的系数。
6.根据权利要求5所述分布式存储磁盘的故障预警系统,其特征是,所述系统还包括磁盘状态检测单元,所述磁盘出现介质错误时,通过故障预警单元进行故障报警。
7.一种计算机存储介质,所述计算机存储介质中存储有计算机指令,其特征是,所述计算机指令在权利要求5或6所述系统上运行时,使所述系统执行如权利要求1-2任一项所述方法的步骤。
CN202110952899.7A 2021-08-19 2021-08-19 一种分布式存储磁盘的故障预警方法及系统 Active CN113778791B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110952899.7A CN113778791B (zh) 2021-08-19 2021-08-19 一种分布式存储磁盘的故障预警方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110952899.7A CN113778791B (zh) 2021-08-19 2021-08-19 一种分布式存储磁盘的故障预警方法及系统

Publications (2)

Publication Number Publication Date
CN113778791A CN113778791A (zh) 2021-12-10
CN113778791B true CN113778791B (zh) 2023-07-18

Family

ID=78838293

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110952899.7A Active CN113778791B (zh) 2021-08-19 2021-08-19 一种分布式存储磁盘的故障预警方法及系统

Country Status (1)

Country Link
CN (1) CN113778791B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017129032A1 (zh) * 2016-01-29 2017-08-03 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN108446734A (zh) * 2018-03-20 2018-08-24 中科边缘智慧信息科技(苏州)有限公司 基于人工智能的磁盘故障自动预测方法
CN109491850A (zh) * 2018-11-21 2019-03-19 北京北信源软件股份有限公司 一种磁盘故障预测方法及装置
CN111984511A (zh) * 2020-07-28 2020-11-24 苏州浪潮智能科技有限公司 一种基于二分类的多模型磁盘故障预测方法和系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10248332B2 (en) * 2016-10-07 2019-04-02 Prophetstor Data Services, Inc. Method for extending life expectancy of disks in cloud-based service system and system using the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017129032A1 (zh) * 2016-01-29 2017-08-03 阿里巴巴集团控股有限公司 磁盘的故障预测方法和装置
CN108446734A (zh) * 2018-03-20 2018-08-24 中科边缘智慧信息科技(苏州)有限公司 基于人工智能的磁盘故障自动预测方法
CN109491850A (zh) * 2018-11-21 2019-03-19 北京北信源软件股份有限公司 一种磁盘故障预测方法及装置
CN111984511A (zh) * 2020-07-28 2020-11-24 苏州浪潮智能科技有限公司 一种基于二分类的多模型磁盘故障预测方法和系统

Also Published As

Publication number Publication date
CN113778791A (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
CN110413227B (zh) 一种硬盘设备的剩余使用寿命在线预测方法和系统
CN102693177B (zh) 虚拟机故障诊断方法、处理方法及其装置和系统
WO2016107402A1 (zh) 基于预测模型的磁盘故障预测方法及装置
US20170147425A1 (en) System and method for monitoring and detecting faulty storage devices
CN108536548B (zh) 一种磁盘坏道的处理方法、装置及计算机存储介质
CN103092746A (zh) 线程异常的定位方法及系统
Yang et al. Hard drive failure prediction using big data
JP5827426B1 (ja) 予兆診断システム及び予兆診断方法
JP5827425B1 (ja) 予兆診断システム及び予兆診断方法
US20110126055A1 (en) Information processing apparatus, and method of diagnosis
CN104461771A (zh) 数据备份处理方法和装置
CN109684320B (zh) 监测数据在线清洗的方法和设备
CN114758714A (zh) 一种硬盘故障预测方法、装置、电子设备及存储介质
CN113778791B (zh) 一种分布式存储磁盘的故障预警方法及系统
CN116400249A (zh) 储能电池的检测方法及装置
CN111414289A (zh) 一种基于迁移学习的磁盘故障预测方法及装置
CN111611048A (zh) 云计算环境中虚拟机的迁移方法、装置和计算机设备
CN100435105C (zh) 集群环境下的应用服务器的系统再生方法
CN113656228A (zh) 一种磁盘的故障检测方法、装置、计算机设备及存储介质
CN117573444A (zh) 一种存储系统的数据处理方法、装置、设备及介质
CN107122254A (zh) 一种计算机修复控制方法及系统、修复方法及系统
JP2011180673A (ja) ディスク劣化診断装置
CN113900897A (zh) 一种分布式应用系统的全链路监控解决方案
CN110287066B (zh) 一种服务器分区迁移方法及相关装置
CN113971003B (zh) 一种磁盘smart数据的在线采样装置与方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant