CN113986142A - 磁盘故障监控方法、装置、计算机设备及存储介质 - Google Patents

磁盘故障监控方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113986142A
CN113986142A CN202111320854.4A CN202111320854A CN113986142A CN 113986142 A CN113986142 A CN 113986142A CN 202111320854 A CN202111320854 A CN 202111320854A CN 113986142 A CN113986142 A CN 113986142A
Authority
CN
China
Prior art keywords
disk
determining
failure
link
operating system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111320854.4A
Other languages
English (en)
Other versions
CN113986142B (zh
Inventor
王跃
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111320854.4A priority Critical patent/CN113986142B/zh
Publication of CN113986142A publication Critical patent/CN113986142A/zh
Application granted granted Critical
Publication of CN113986142B publication Critical patent/CN113986142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0673Single storage device
    • G06F3/0674Disk device
    • G06F3/0676Magnetic disk device
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种磁盘故障监控方法、装置、计算机设备及存储介质,涉及存储设备技术领域。该方法包括:当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;对运行参数进行检测;根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。采用该方法可以提高磁盘故障监控的准确性,且不需要人为对磁盘链路中的每个硬件进行替换检测,从而可以提高磁盘故障检测的效率,节省了大量的时间成本和人力成本。

Description

磁盘故障监控方法、装置、计算机设备及存储介质
技术领域
本发明涉及存储设备技术领域,具体涉及一种磁盘故障监控方法、装置、计算机设备及存储介质。
背景技术
在一些计算机设备中,通常使用一块SATA接口的固态硬盘作为系统盘;一块或多块机械盘作为数据盘使用。其中,计算机设备中的日志分区也是写到固态硬盘中,因此,可能造成当固态硬磁盘发生链路异常信息,从而可能引起操作系统根分区变成只读状态。然而,引起操作系统根分区只读状态的因素有多种,例如文件系统不稳定,挂载程序不稳定等。因此,当操作系统中的一个分区为发生异常时,无法确定磁盘链路故障还是操作系统故障。
现有技术中,通常时需要对磁盘链路和操作系统均进行全面检测,然后才能确定故障点位于磁盘链路或者操作系统。
上述方法中,需要对磁盘链路和操作系统均进行全面检测,才能确定故障点的是发生在操作系统,还是在磁盘链路,因此,浪费了大量的时间成本和人力成本,效率较低。
发明内容
有鉴于此,本发明实施例提供了一种磁盘故障监控方法、装置、计算机设备及存储介质,以解决在对磁盘故障进行监控时,效率较低的问题。
根据第一方面,本发明实施例提供了一种一种磁盘故障监控方法,该方法包括:当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;对运行参数进行检测;根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。
在本申请实施例中,当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;对运行参数进行检测;根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。上述方法中,计算机设备通过对磁盘在预设周期内的运行参数进行检测,从而根据检测结果确定磁盘故障,提高了磁盘故障监控的准确性。此外,不需要人为对磁盘链路中的每个硬件进行替换检测,从而可以提高磁盘故障检测的效率,节省了大量的时间成本和人力成本。
结合第一方面,在第一方面第一实施方式中,运行参数包括磁盘的上电次数和磁盘的报错次数。
结合第一方面,在第一方面第二实施方式中,根据检测结果,确定磁盘的故障点,包括:若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路。若检测结果为运行参数在预设周期内未发生变化,则确定磁盘的故障点在于磁盘操作系统。
在本申请实施例中,若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路;若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路。通过检测运行参数是否发生变化,确定磁盘的故障点,保证了确定的磁盘故障点的准确性。
结合第一方面第二实施方式,在第一方面第三实施方式中,若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路,包括:若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路。
在本申请实施例中,当磁盘链路发生故障之后,可能会影响磁盘的上电次数和系统的报错次数随着时间的推移而增长,因此,当检测结果为运行参数在预设周期内呈递增趋势时,计算机设备确定磁盘的故障点在于磁盘链路。保证了确定的磁盘的故障点的准确性。
结合第一方面第二实施方式,在第一方面第四实施方式中,确定磁盘的故障点在于磁盘链路之后,方法还包括:获取磁盘链路的各硬件对应的数据;对硬件对应的数据进行检测;根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
在本申请实施例中,在确定磁盘的故障点在于磁盘链路的情况下,计算机设备获取磁盘链路的各硬件对应的数据,并对硬件对应的数据进行检测,根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。从而可以快速确定磁盘链路中发生故障的硬件,并及时通知用户对发生故障的硬件进行更换,避免了因为硬件故障,最终导致系统瘫痪。
结合第一方面第二实施方式,在第一方面第五实施方式中,确定磁盘的故障点在于磁盘操作系统之后,方法还包括:获取操作系统输出的日志;根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
在本申请实施例中,获取操作系统输出的日志。根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。从而使得计算机设备可以快速确定磁盘操作系统中的故障点,不需要人为对磁盘系统对应的程序进行一行一行的检测,从而节省了人力和时间。
结合第一方面第五实施方式,在第一方面第六实施方式中,确定故障点在磁盘操作系统对应的程序中的位置之后,方法还包括:接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
在本申请实施例中,接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。从而可以保证对磁盘故障进行快速修复,并在磁盘故障未解决的情况下,继续对磁盘故障进行修复。
根据第二方面,本发明实施例提供了一种磁盘故障监控装置,其特征在于,装置包括:
第一获取模块,用于当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;
第一检测模块,用于对运行参数进行检测;
第一确定模块,用于根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。
结合第二方面,在第二方面第一实施方式中,运行参数包括磁盘的上电次数和磁盘的报错次数。
结合第二方面,在第二方面第二实施方式中,上述第一检测模块,具体用于在检测结果为运行参数在预设周期内发生变化时,确定磁盘的故障点在于磁盘链路;在检测结果为运行参数在预设周期内未发生变化时,确定磁盘的故障点在于磁盘操作系统。
结合第二方面第二实施方式,在第二方面第三实施方式中,上述第一检测模块,具体用于若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路。
结合第二方面第二实施方式,在第二方面第四实施方式中,上述磁盘故障监控装置还包括:
第二获取模块,用于获取磁盘链路的各硬件对应的数据;
第二检测模块,用于对硬件对应的数据进行检测;
第二确定模块,用于根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
结合第二方面第二实施方式,在第二方面第五实施方式中,上述磁盘故障监控装置还包括:
第三获取模块,用于获取操作系统输出的日志;
第三确定模块,根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
结合第二方面第五实施方式,在第二方面第六实施方式中,上述磁盘故障监控装置还包括:
修复模块,用于接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
根据第三方面,本发明实施例提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中的磁盘故障监控方法。
根据第四方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第一方面或者第一方面的任意一种实施方式中的磁盘故障监控方法。
根据第五方面,本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行第一方面或者第一方面的任意一种实施方式中的磁盘故障监控方法。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了一个实施例中磁盘故障监控方法的步骤流程图
图2示出了另一个实施例中磁盘故障监控方法的步骤流程图;
图3示出了另一个实施例中磁盘故障监控方法的步骤流程图;
图4示出了另一个实施例中磁盘故障监控方法的步骤流程图;
图5示出了另一个实施例中磁盘故障监控装置的结构框图;
图6示出了一个实施例中磁盘故障监控装置的结构框图;
图7示出了一个实施例中磁盘故障监控装置的结构框图;
图8示出了一个实施例中磁盘故障监控装置的结构框图;
图9示出了一个实施例计算机设备为服务器时的内部结构图;
图10示出了一个实施例计算机设备为终端时的内部结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例提供的磁盘故障监控的方法,其执行主体可以是磁盘故障监控的装置,该磁盘故障监控的装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。下述方法实施例中,均以执行主体是计算机设备为例来进行说明。
在本申请一个实施例中,提供了一种磁盘故障监控方法,如图1所示,以该方法应用于计算机设备为例进行说明,包括以下步骤:
101,当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数。
具体地,当计算机设备对磁盘进行读写时,磁盘只能进行读不能进行写,计算机设备确定磁盘发生故障。当磁盘发生故障之后,计算机设备可以调用smartctl命令工具获取磁盘在运行过程中预设周期内的运行参数。其中,预设周期可以是10分钟,也可以是15分钟,还可以是半个小时,本申请实施例对预设周期不做具体限定。其中,计算机设备在预设周期内可以每隔1分钟获取一次磁盘的运行参数,也可以每隔2分钟获取一次磁盘的运行参数,本申请实施例对计算机设备获取磁盘的运行参数的周期不做具体限定。
102,对运行参数进行检测。
在一种可选的实施方式中,计算机设备可以将获取到的预设周期内的运行参数分别与故障点发生在磁盘链路是对应的故障参数以及故障点发生在磁盘操作系统对应的故障参数进行对比。
在另一种可选的实施方式中,计算机设备可以将获取到的预设周期内的运行参数输入至预设深度学习模型中,通过预设深度学习模型对运行参数进行特征提取,从而实现对运行参数的检测。
其中,预设深度学习模型可以DNN(Deep Neural Networks,深度神经网络)、CNN(Convolutional Neural Networks,卷积神经网络)、RNN(Recurrent Neural Network,循环神经网络)等,在分类模型是CNN时,其可以是V-Net模型、U-Net模型、生成式对抗网络Generative Adversarial Nets模型等。
103,根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。
在一种可选的实施方式中,若获取到的预设周期内的运行参数与故障点发生在磁盘链路是对应的故障参数一致,则计算机设备确定故障点在于磁盘链路;若获取到的预设周期内的运行参数与故障点发生在磁盘操作系统是对应的故障参数一致,则计算机设备确定故障点在于磁盘操作系统。
在另一种可选的实施方式中,计算机设备可以将获取到的预设周期内的运行参数输入至预设深度学习模型中,通过预设深度学习模型对运行参数进行特征提取,若预设深度学习模型输出故障点在于磁盘链路,则计算机设备确定故障点在于磁盘链路;若预设深度学习模型输出故障点在于磁盘操作系统,则计算机设备确定故障点在于磁盘操作系统。
在本申请实施例中,当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;对运行参数进行检测;根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。上述方法中,计算机设备通过对磁盘在预设周期内的运行参数进行检测,从而根据检测结果确定磁盘故障,提高了磁盘故障检测准确率。此外,不需要人为对磁盘链路中的每个硬件进行替换检测,从而可以提高磁盘故障检测的效率,节省了大量的时间成本和人力成本。
在本申请一个实施方式中,上述103中的“根据检测结果,确定磁盘的故障点”,可以包括如下内容:
其中一种情况,若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路。
其中,运行参数包括磁盘的上电次数和磁盘的报错次数。
其中,运行参数还可以包括磁盘上电时长、磁盘擦写的次数、磁盘寿命信息等信息。
具体地,计算机设备可以在预设周期内可以获取到多个运行参数,计算机设备将获取到的多个运行参数进行对比,在确定多个运行参数在预设周期内发生变化的情况下,计算机设备确定磁盘的故障点在于磁盘链路。
其中另一种情况,若检测结果为运行参数在预设周期内未发生变化,则确定磁盘的故障点在于磁盘操作系统。
具体地,计算机设备可以在预设周期内可以获取到多个运行参数,计算机设备将获取到的多个运行参数进行对比,在确定多个运行参数在预设周期内未发生变化的情况下,计算机设备确定磁盘的故障点在于磁盘链路。
在本申请实施例中,若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路;若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路。通过检测运行参数是否发生变化,确定磁盘的故障点,保证了确定的磁盘故障点的准确性。
在本申请一个可选的实施方式中,若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路。
具体地,计算机设备在预设周期内多次获取运行参数,并将获取到的运行参数进行对比,并确定预设周期内的运行参数呈递增趋势。
示例性的,以运行参数中包括的上电次数为例,假设预设周期为30分钟,计算机设备每隔1分钟获取一次磁盘的上电次数,在预设周期内获取了30次磁盘的上电次数,如获取到的30次上电次数呈现递增区域,则计算机设备确定磁盘的故障点在于磁盘链路。
在本申请实施例中,当磁盘链路发生故障之后,可能会影响磁盘的上电次数和系统的报错次数随着时间的推移而增长,因此,当检测结果为运行参数在预设周期内呈递增趋势时,计算机设备确定磁盘的故障点在于磁盘链路。保证了确定的磁盘的故障点的准确性。
在本申请一个实施方式中,确定磁盘的故障点在于磁盘链路之后,如图2所示,上述磁盘故障监控方法还可以包括如下步骤:
201,获取磁盘链路的各硬件对应的数据。
在一种可选的实施方式中,计算机设备可以通过安装在磁盘链路的信号分仪获取到磁盘链路的各硬件对应的数据。其中,各硬件对应的数据可以包括电流、电压、温度、传输速率等数据。
在另一种可选的实施方式中,计算机设备可以接收到磁盘链路传输的各硬件对应的数据。
202,对硬件对应的数据进行检测。
具体地,计算机设备将各硬件对应的数据与各硬件在正常情况下对应的数据进行对比,从而对各硬件对应的数据进行检测。
203,根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
具体地,若各硬件中至少有一个硬件对应的数据与该硬件在正常情况下的数据不同,则计算机设备确定该硬件发生故障,计算机设备输出第一提示信息,提示用户硬件出现故障,请及时更换。
在本申请实施例中,在确定磁盘的故障点在于磁盘链路的情况下,计算机设备获取磁盘链路的各硬件对应的数据,并对硬件对应的数据进行检测,根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。从而可以快速确定磁盘链路中发生故障的硬件,并及时通知用户对发生故障的硬件进行更换,避免了因为硬件故障,最终导致系统瘫痪。
在本申请一个实施方式中,确定磁盘的故障点在于磁盘操作系统之后,如图3所示,上述磁盘故障监控方法还可以包括如下步骤:
301,获取操作系统输出的日志。
具体地,在确定故障点在于磁盘操作系统之后,计算机设备可以执行操作系统对应的程序,从而获取到操作系统输出的日志。
302,根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
具体地,计算机设备对操作系统输出的日志进行研究,根据日志中记录的报错信息,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息,第二提示信息中包括故障点在磁盘操作系统对应的程序中的位置。
303,接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
具体地,在输出第二信息之后,计算机设备接收用户输入的修复指令,根据用户输入的修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
在本申请实施例中,获取操作系统输出的日志。根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。从而使得计算机设备可以快速确定磁盘操作系统中的故障点,不需要人为对磁盘系统对应的程序进行一行一行的检测,从而节省了人力和时间。此外,接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。从而可以保证对磁盘故障进行快速修复,并在磁盘故障未解决的情况下,继续对磁盘故障进行修复。
为了更好的解释本申请实施例提供的磁盘故障监控方法,如图4所示,本申请实施例提供了一种磁盘故障监控方法的整体流程图,可以包括如下步骤:
401,当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数。
402,对运行参数进行检测。
403,若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路,执行步骤405。
404,若检测结果为运行参数在预设周期内未发生变化,则确定磁盘的故障点在于磁盘操作系统,执行步骤408。
405,获取磁盘链路的各硬件对应的数据。
406,对硬件对应的数据进行检测。
407,根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
408,获取操作系统输出的日志。
409,根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
410,接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
在本申请一个实施例中,上述磁盘故障监控方法还可以适用于磁盘设备上电之后,对在磁盘正常运行过程中,对磁盘进行监控。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
相应地,请参考图5,本发明实施例提供一种磁盘故障监控装置500,上述磁盘故障监控装置500,包括:
第一获取模块510,用于当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数。
第一检测模块520,用于对运行参数进行检测。
第一确定模块530,用于根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。
在本申请一个实施方式中,运行参数包括磁盘的上电次数和磁盘的报错次数。
在本申请一个实施方式中,上述第一检测模块520,具体用于在检测结果为运行参数在预设周期内发生变化时,确定磁盘的故障点在于磁盘链路;在检测结果为运行参数在预设周期内未发生变化时,确定磁盘的故障点在于磁盘操作系统。
在本申请一个实施方式中,上述第一检测模块520,具体用于若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路。
在本申请一个实施方式中,如图6所示,上述磁盘故障监控装置500还包括:
第二获取模块540,用于获取磁盘链路的各硬件对应的数据。
第二检测模块550,用于对硬件对应的数据进行检测。
第二确定模块560,用于根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
在本申请一个实施方式中,如图7所示,上述磁盘故障监控装置500还包括:
第三获取模块570,用于获取操作系统输出的日志。
第三确定模块580,根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
在本申请一个实施方式中,如图8所示,上述磁盘故障监控装置500还包括:
修复模块590,用于接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种磁盘故障监控方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储磁盘故障监控数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种磁盘故障监控方法。
本领域技术人员可以理解,图9和10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;对运行参数进行检测;根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:运行参数包括磁盘的上电次数和磁盘的报错次数。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路。若检测结果为运行参数在预设周期内未发生变化,则确定磁盘的故障点在于磁盘操作系统。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:获取磁盘链路的各硬件对应的数据;对硬件对应的数据进行检测;根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:获取操作系统输出的日志;根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
在本申请一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:当磁盘发生故障时,获取磁盘在运行过程中预设周期内的运行参数;对运行参数进行检测;根据检测结果,确定磁盘的故障点,故障点包括磁盘链路以及磁盘操作系统。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:运行参数包括磁盘的上电次数和磁盘的报错次数。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:若检测结果为运行参数在预设周期内发生变化,则确定磁盘的故障点在于磁盘链路。若检测结果为运行参数在预设周期内未发生变化,则确定磁盘的故障点在于磁盘操作系统。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:若检测结果为运行参数在预设周期内呈递增趋势,则确定磁盘的故障点在于磁盘链路。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取磁盘链路的各硬件对应的数据;对硬件对应的数据进行检测;根据检测结果,确定磁盘链路中发生故障的硬件,并输出第一提示信息。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取操作系统输出的日志;根据日志,确定故障点在磁盘操作系统对应的程序中的位置,并输出第二提示信息。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:接收用户输入的修复指令,根据修复指令对故障点进行修复,并在修复之后检测磁盘的故障是否解决。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种磁盘故障监控方法,其特征在于,所述方法包括:
当磁盘发生故障时,获取所述磁盘在运行过程中预设周期内的运行参数;
对所述运行参数进行检测;
根据检测结果,确定所述磁盘的故障点,所述故障点包括磁盘链路以及磁盘操作系统。
2.根据权利要求1所述的方法,其特征在,所述运行参数包括所述磁盘的上电次数和所述磁盘的报错次数。
3.根据权利要求1所述的方法,其特征在于,所述根据检测结果,确定所述磁盘的故障点,包括:
若所述检测结果为所述运行参数在所述预设周期内发生变化,则确定所述磁盘的故障点在于所述磁盘链路;
若所述检测结果为所述运行参数在所述预设周期内未发生变化,则确定所述磁盘的故障点在于所述磁盘操作系统。
4.根据权利要求3所述的方法,其特征在于,若所述检测结果为所述运行参数在所述预设周期内发生变化,则确定所述磁盘的故障点在于所述磁盘链路,包括:
若所述检测结果为所述运行参数在所述预设周期内呈递增趋势,则确定所述磁盘的故障点在于所述磁盘链路。
5.根据权利要求3所述的方法,其特征在于,所述确定所述磁盘的故障点在于所述磁盘链路之后,所述方法还包括:
获取所述磁盘链路的各硬件对应的数据;
对所述硬件对应的数据进行检测;
根据检测结果,确定所述磁盘链路中发生故障的硬件,并输出第一提示信息。
6.根据权利要求3所述的方法,其特征在于,所述确定所述磁盘的故障点在于所述磁盘操作系统之后,所述方法还包括:
获取操作系统输出的日志;
根据所述日志,确定所述故障点在所述磁盘操作系统对应的程序中的位置,并输出第二提示信息。
7.根据权利要求6所述的方法,其特征在于,所述确定所述故障点在所述磁盘操作系统对应的程序中的位置之后,所述方法还包括:
接收用户输入的修复指令,根据所述修复指令对所述故障点进行修复,并在修复之后检测所述磁盘的故障是否解决。
8.一种磁盘故障监控装置,其特征在于,所述装置包括:
第一获取模块,用于当磁盘发生故障时,获取所述磁盘在运行过程中预设周期内的运行参数;
第一检测模块,用于对所述运行参数进行检测;
第一确定模块,用于根据检测结果,确定所述磁盘的故障点,所述故障点包括磁盘链路以及磁盘操作系统。
9.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-7中任一项所述的磁盘故障监控方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-7中任一项所述的磁盘故障监控方法。
CN202111320854.4A 2021-11-09 2021-11-09 磁盘故障监控方法、装置、计算机设备及存储介质 Active CN113986142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111320854.4A CN113986142B (zh) 2021-11-09 2021-11-09 磁盘故障监控方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111320854.4A CN113986142B (zh) 2021-11-09 2021-11-09 磁盘故障监控方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113986142A true CN113986142A (zh) 2022-01-28
CN113986142B CN113986142B (zh) 2023-08-08

Family

ID=79747428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111320854.4A Active CN113986142B (zh) 2021-11-09 2021-11-09 磁盘故障监控方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113986142B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080028264A1 (en) * 2006-07-27 2008-01-31 Microsoft Corporation Detection and mitigation of disk failures
CN102360327A (zh) * 2011-10-13 2012-02-22 记忆科技(深圳)有限公司 硬盘状态信息收集方法与装置
CN103197995A (zh) * 2012-01-04 2013-07-10 百度在线网络技术(北京)有限公司 硬盘故障检测方法及装置
CN109308238A (zh) * 2018-12-03 2019-02-05 郑州云海信息技术有限公司 一种存储系统磁盘阵列坏盘调节的方法、装置及设备
CN109933478A (zh) * 2017-12-19 2019-06-25 杭州华为数字技术有限公司 一种存储系统的故障处理方法和存储系统
CN110399238A (zh) * 2019-06-27 2019-11-01 浪潮电子信息产业股份有限公司 一种磁盘故障预警方法、装置、设备及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080028264A1 (en) * 2006-07-27 2008-01-31 Microsoft Corporation Detection and mitigation of disk failures
CN102360327A (zh) * 2011-10-13 2012-02-22 记忆科技(深圳)有限公司 硬盘状态信息收集方法与装置
CN103197995A (zh) * 2012-01-04 2013-07-10 百度在线网络技术(北京)有限公司 硬盘故障检测方法及装置
CN109933478A (zh) * 2017-12-19 2019-06-25 杭州华为数字技术有限公司 一种存储系统的故障处理方法和存储系统
CN109308238A (zh) * 2018-12-03 2019-02-05 郑州云海信息技术有限公司 一种存储系统磁盘阵列坏盘调节的方法、装置及设备
CN110399238A (zh) * 2019-06-27 2019-11-01 浪潮电子信息产业股份有限公司 一种磁盘故障预警方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN113986142B (zh) 2023-08-08

Similar Documents

Publication Publication Date Title
US10147048B2 (en) Storage device lifetime monitoring system and storage device lifetime monitoring method thereof
Kadekodi et al. Cluster storage systems gotta have {HeART}: improving storage efficiency by exploiting disk-reliability heterogeneity
US20180060148A1 (en) Bad block detection and predictive analytics in nand flash storage devices
US9396061B1 (en) Automated repair of storage system components via data analytics
CN110928719A (zh) Ssd低功耗模式异常处理方法、装置、计算机设备及存储介质
CN111949488A (zh) 一种硬盘故障预测方法、系统及电子设备和存储介质
US11977754B2 (en) External indicators for adaptive in-field recalibration
CN113487182B (zh) 设备健康状态评估方法、装置、计算机设备和介质
CN114758714A (zh) 一种硬盘故障预测方法、装置、电子设备及存储介质
US8161324B2 (en) Analysis result stored on a field replaceable unit
JP5849491B2 (ja) ディスク制御装置、ディスク装置異常検出方法、及びプログラム
CN115658373B (zh) 基于服务器的内存处理方法和装置、处理器及电子设备
CN113986142B (zh) 磁盘故障监控方法、装置、计算机设备及存储介质
US10956038B2 (en) Non-volatile memory drive partitions within microcontrollers
CN110781043B (zh) 存储产品的品质检测方法、装置、存储介质及设备
CN110879757B (zh) 客户端异常运行时的重启方法、装置和计算机设备
US9990382B1 (en) Secure erasure and repair of non-mechanical storage media
CN112230939A (zh) 硬件模块修复方法、装置、计算机设备和存储介质
US20230008268A1 (en) Extrapolated usage data
CN115695159B (zh) 一种设备诊断方法、装置、设备和存储介质
CN117407207B (zh) 一种内存故障处理方法、装置、电子设备及存储介质
CN117312094A (zh) 一种基于时间序列分析算法的服务器硬件监控采集方法
CN116841819A (zh) 服务器外插网卡故障诊断方法、装置、设备和存储介质
CN115934395A (zh) 固态硬盘的故障注入方法、装置、计算机设备及存储介质
CN115442214A (zh) 业务异常排障方法、装置、设备、存储介质和程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant