CN109684141A - 一种磁盘故障诊断方法、装置、终端及可读存储介质 - Google Patents

一种磁盘故障诊断方法、装置、终端及可读存储介质 Download PDF

Info

Publication number
CN109684141A
CN109684141A CN201811556214.1A CN201811556214A CN109684141A CN 109684141 A CN109684141 A CN 109684141A CN 201811556214 A CN201811556214 A CN 201811556214A CN 109684141 A CN109684141 A CN 109684141A
Authority
CN
China
Prior art keywords
disk
operating status
grade
status grade
disk operating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811556214.1A
Other languages
English (en)
Inventor
贺计文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201811556214.1A priority Critical patent/CN109684141A/zh
Publication of CN109684141A publication Critical patent/CN109684141A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种磁盘故障诊断方法,包括:按照预设周期获取系统日志以及磁盘状态信息;根据系统日志以及磁盘状态信息,确定磁盘运行状态等级;执行磁盘运行状态等级对应的告警操作;该方法能够自动对磁盘故障进行诊断,并且能够根据故障严重程度对磁盘运行状态进行等级区分,即确定磁盘运行状态等级,最终根据不同的磁盘运行状态等级执行不同的告警操作,进而可以根据磁盘运行状态等级不同,选取对应的告警形式,避免了运维人员等相关人员遗漏严重故障信息,影响上层应用,可以提高磁盘故障诊断的可靠性和效率;本发明还公开了一种磁盘故障诊断装置、终端及计算机可读存储介质,具有上述有效效果。

Description

一种磁盘故障诊断方法、装置、终端及可读存储介质
技术领域
本发明涉及分布式存储技术领域,特别涉及一种磁盘故障诊断方法、装置、终端及计算机可读存储介质。
背景技术
随着大数据、云计算、高性能应用大量兴起,需要使用稳定可靠的分布式存储系统作为后盾,其中,分布式存储系统即指通过计算机网络与节点相连而组成的存储系统。确保分布式存储系统的稳定运行是保证上层应用稳定运行的基础。而分布式存储系统经常出现的故障一般都是磁盘故障,即磁盘出现介质错误,导致不能进行读写。磁盘故障会导致集群踢盘、重构;而更换磁盘需要集群扩容、重构,因此在一些场景下会影响上层业务。同时磁盘故障也增加了运维成本。因此,如何高效、可靠的确定磁盘故障,是本领域技术人员需要解决的技术问题。
发明内容
本发明的目的是提供一种磁盘故障诊断方法、装置、终端及计算机可读存储介质,通过对磁盘运行状态等级的划分,提高磁盘故障诊断的可靠性和效率;避免了运维人员等相关人员遗漏严重故障信息,影响上层应用。
为解决上述技术问题,本发明提供一种磁盘故障诊断方法,包括:
按照预设周期获取系统日志以及磁盘状态信息;
根据所述系统日志以及所述磁盘状态信息,确定磁盘运行状态等级;
执行所述磁盘运行状态等级对应的告警操作。
可选地,所述根据所述系统日志以及所述磁盘状态信息,确定磁盘运行状态等级,包括:
根据所述系统日志,判断所述磁盘是否属于第三磁盘运行状态等级;
若否,则根据所述磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;其中,所述磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级。
可选地,所述根据所述磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级,包括:
确定磁盘的类型,并确定所述类型对应的预设等级判定规则;
根据所述磁盘状态信息以及所述类型对应的预设等级判定规则,确定磁盘运行状态等级。
可选地,所述执行所述磁盘运行状态等级对应的告警操作,包括:
当所述磁盘运行状态等级为第一磁盘运行状态等级,则不执行告警操作;
当所述磁盘运行状态等级为第二磁盘运行状态等级,则按照第一预设路径输出所述磁盘运行状态等级;
当所述磁盘运行状态等级为第三磁盘运行状态等级,则按照第二预设路径输出所述磁盘运行状态等级,并开启对应的磁盘告警灯。
本发明还提供一种磁盘故障诊断装置,包括:
获取模块,用于按照预设周期获取系统日志以及磁盘状态信息;
等级确定模块,用于根据所述系统日志以及所述磁盘状态信息,确定磁盘运行状态等级;
告警模块,用于执行所述磁盘运行状态等级对应的告警操作。
可选地,所述等级确定模块,包括:
第一等级确定单元,用于根据所述系统日志,判断所述磁盘是否属于第三磁盘运行状态等级;
第二等级确定单元,用于若所述磁盘不属于第三磁盘运行状态等级,则根据所述磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;其中,所述磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级。
可选地,所述第二等级确定单元,包括:
第二等级确定子单元,用于确定磁盘的类型,并确定所述类型对应的预设等级判定规则;根据所述磁盘状态信息以及所述类型对应的预设等级判定规则,确定磁盘运行状态等级。
可选地,所述告警模块,包括:
第一告警单元,用于当所述磁盘运行状态等级为第一磁盘运行状态等级,则不执行告警操作;
第二告警单元,用于当所述磁盘运行状态等级为第二磁盘运行状态等级,则按照第一预设路径输出所述磁盘运行状态等级;
第三告警单元,用于当所述磁盘运行状态等级为第三磁盘运行状态等级,则按照第二预设路径输出所述磁盘运行状态等级,并开启对应的磁盘告警灯。
本发明还提供一种终端,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述所述磁盘故障诊断方法的步骤。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述所述磁盘故障诊断方法的步骤。
本发明所提供的磁盘故障诊断方法,包括:按照预设周期获取系统日志以及磁盘状态信息;根据系统日志以及磁盘状态信息,确定磁盘运行状态等级;执行磁盘运行状态等级对应的告警操作。
可见,该方法能够自动对磁盘故障进行诊断,并且能够根据故障严重程度对磁盘运行状态进行等级区分,即确定磁盘运行状态等级,最终根据不同的磁盘运行状态等级执行不同的告警操作,进而可以根据磁盘运行状态等级不同,选取对应的告警形式,避免了运维人员等相关人员遗漏严重故障信息,影响上层应用,可以提高磁盘故障诊断的可靠性和效率;本发明还提供了一种磁盘故障诊断装置、终端及计算机可读存储介质,具有上述有效效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例所提供的磁盘故障诊断方法的流程图;
图2为本发明实施例所提供的磁盘故障诊断装置的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,图1为本发明实施例所提供的磁盘故障诊断方法的流程图;该方法可以包括:
S101:按照预设周期获取系统日志以及磁盘状态信息。
本实施例并不限定预设周期的具体数值,用户可以根据实际应用场景进行确定。例如预设周期为一天。当然本实施例中也不限定预设周期的个数。即用户可以设置大于一个的预设周期。可以理解为预设周期的设置规则由用户确定。例如当用户设置多个预设周期时,可以根据系统繁忙程度确定对应的预设周期。例如系统繁忙时,对应的预设周期数值较大,系统空闲时,对应的预设周期数值较小。
需要说明的是,本实施例中并不限定系统日志以及磁盘状态信息的获取方式。只要可以获取到对应的系统日志以及磁盘状态信息即可。例如通过扫描获取系统日志,通过smartctl技术获取磁盘状态信息,即定时扫描磁盘状态信息及系统日志。其中,Smartctl也就是SMART是一种磁盘自我分析检测技术。每一块硬盘(包括IDE、SCSI)在运行的时候,都会将自身的若干参数记录下来。这些参数可以包括型号、容量、温度、密度、扇区、寻道时间、传输、误码率等。硬盘运行了几千小时后,很多内在的物理参数都会发生变化,某一参数超过报警阈值,则说明硬盘接近损坏,若此时该硬盘依然处于工作状态,那么该硬盘将变得非常不可靠,随时可能故障。即通过smartctl技术确定磁盘状态信息。可以理解的是,本实施例中并不限定系统日志以及磁盘状态信息的获取方式,相应的,本实施例中也就不会对系统日志以及磁盘状态信息的具体内容进行限定。例如当采用smartctl技术采集磁盘状态信息时,对应的磁盘状态信息可以包括:重映射扇区数、无法校正的错误计数、命令超时次数、待映射扇区数、脱机无法校正的扇区计数等。
S102:根据系统日志以及磁盘状态信息,确定磁盘运行状态等级。
本实施例中根据系统日志以及磁盘状态信息(如smartctl信息)分析出磁盘运行状态情况,对硬盘状态进行评价,可以确定磁盘运行状态等级。进而可以执行磁盘运行状态等级对应的告警操作。
本实施例中并不限定磁盘运行状态等级的划分形式以及对应的等级数量。用户可以根据实际应用场景以及告警操作的具体形式进行确定。例如用户仅区分两种告警操作,那么对应的磁盘运行状态等级可以为三个等级。具体如磁盘运行状态等级为优秀,则对应不需要告警操作,磁盘运行状态等级为良好,则对应告警操作可以仅为信息提示,磁盘运行状态等级为差,则对应告警操作不仅需要信息提示,还需要开启对应的磁盘告警灯。或者是用户确定其所需要的磁盘运行状态等级的数量,并为每种磁盘运行状态等级设置一种对应的告警操作。本实施例并不限定磁盘运行状态等级的划分的规则(如用户可以根据磁盘各种状态对上层应用的影响程度来划分磁盘运行状态等级),对应的本实施例并不限定每种磁盘运行状态等级对应的告警操作的具体内容,其与磁盘运行状态等级划分的具体方式相关。当然,本实施例中也不对磁盘运行状态等级的命名进行限定,例如可以通过数值来区分(如磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级);也可以是通过字母来区分(如磁盘运行状态等级包括A等级、B等级及C等级);当然也可以是通过文字来区分(如磁盘运行状态等级包括优秀、良好及差)。
本实施例可以分别通过系统日志确定磁盘运行状态等级以及磁盘状态信息确定磁盘运行状态等级。将两者得到的磁盘运行状态等级作为最终的磁盘运行状态等级。其中,当两者得到的磁盘运行状态等级一致时,直接将磁盘运行状态等级该作为最终的磁盘运行状态等级;当两者得到的磁盘运行状态等级不一致时,可以将两者中磁盘运行状态等级更为严重的等级该作为最终的磁盘运行状态等级。本实施例中也可以是先通过系统日志(或者是磁盘状态信息)确定磁盘运行状态等级,当其确定的磁盘运行状态等级不是目标磁盘运行状态等级(可以理解为不是最严重的磁盘运行状态等级)时,在通过另一个磁盘状态信息(或者是系统日志)确定磁盘运行状态等级。本实施例并不对根据系统日志以及磁盘状态信息确定磁盘运行状态等级的具体过程进行限定。当然为了提高磁盘运行状态等级的确定效率,本实施例中根据系统日志以及磁盘状态信息,确定磁盘运行状态等级可以包括:
根据系统日志,判断磁盘是否属于第三磁盘运行状态等级;
若否,则根据磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;其中,磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级。
需要说明的是本实施例中具体提高效率的技术手段是先通过系统日志进行判断,在磁盘不属于目标磁盘运行状态等级(本实施例中具体指第三磁盘运行状态等级)时,再根据磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;在磁盘属于目标磁盘运行状态等级(本实施例中具体指第三磁盘运行状态等级)时,可以直接确定磁盘运行状态等级,不需要再执行根据磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级的步骤。因此可以提高磁盘运行状态等级的确定效率。
本实施例并不是对磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级这个特征进行限定,当然磁盘运行状态等级包括更多的等级也是可以的。本实施例中只是限定当磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级时,既能够实现根据磁盘运行状态等级不同,选取对应的告警形式,避免了运维人员等相关人员遗漏严重故障信息,影响上层应用,又可以提高磁盘故障诊断的可靠性和效率,不至于出现等级划分过细,造成的程序复杂的问题。即本实施例中认为磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级是一种优选方案。此时第一磁盘运行状态等级可以表征磁盘状态优秀、第二磁盘运行状态等级可以表征磁盘状态良好及第三磁盘运行状态等级可以表征磁盘状态较差。
具体的,本实施例中不限定具体系统日志与磁盘各运行状态等级的对应关系,用户可以自行设定,即本实施例并不限定系统日志对应的预设等级判定规则。例如系统日志/var/log/messages检测的状态信息可以包括:当出现Medium error及Hardware error时,则为磁盘物理损坏,判定磁盘为第三磁盘运行状态等级,当出现task abort时,则为慢盘,会影响集群整体的性能,判定磁盘为第三磁盘运行状态等级。即此时本实施例中系统日志对应的预设等级判定规则可以仅限定第三磁盘运行状态等级对应的具体的系统日志。其他的磁盘运行状态等级判定可以交由磁盘状态信息以及对应的预设等级判定规则来确定。即本实施例中不限定具体磁盘状态信息与磁盘各运行状态等级的对应关系,用户可以自行设定,即本实施例并不限定磁盘状态信息对应的预设等级判定规则。且本实施例中并限定磁盘状态信息对应的预设等级判定规则的数量。为了更好适应各个系统以及各中磁盘,本实施例中根据磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级可以包括:确定磁盘的类型,并确定类型对应的预设等级判定规则;根据磁盘状态信息以及类型对应的预设等级判定规则,确定磁盘运行状态等级。
具体的,本实施例中为每种磁盘类型确定一种具体的预设等级判定规则。例如当磁盘为SAS盘时,对应的预设等级判定规则可以是:出现G-List,则为第三磁盘运行状态等级,出现Read/Write/Verify Total uncorrected errors,则为第二磁盘运行状态等级。当磁盘为SATA盘时,对应的预设等级判定规则可以是:出现ID 5(重映射扇区数),则为第三磁盘运行状态等级,出现ID 187(无法校正的错误计数),则为第二磁盘运行状态等级,出现ID188(命令超时次数),则为第二磁盘运行状态等级,出现ID 197(待映射扇区数),则为第三磁盘运行状态等级,出现ID 198(脱机无法校正的扇区计数),则为第三磁盘运行状态等级,出现ID 199(CRC错误数),则为第二磁盘运行状态等级,出现错误日志,则为第二磁盘运行状态等级。当然没有出现上述情况的就可以认为是磁盘处于第一磁盘运行状态等级。
S103:执行磁盘运行状态等级对应的告警操作。
通过上述论述,本实施例中不限定磁盘运行状态等级对应的告警操作的具体内容。例如当磁盘运行状态等级为第三磁盘运行状态等级,则点亮第三磁盘运行状态等级对应的磁盘告警灯,并把相关信息上报到管理界面,方便运维人员及时采取措施(考虑尽快更换第三磁盘运行状态等级对应的磁盘),避免带来不必要的运维成本。
下面以磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级来说明执行磁盘运行状态等级对应的告警操作的具体过程。即
当磁盘运行状态等级为第一磁盘运行状态等级,则不执行告警操作;
当磁盘运行状态等级为第二磁盘运行状态等级,则按照第一预设路径输出磁盘运行状态等级;
当磁盘运行状态等级为第三磁盘运行状态等级,则按照第二预设路径输出磁盘运行状态等级,并开启对应的磁盘告警灯。
需要说明的是,本实施例中第一预设路径和第二预设路径可以一致,也可以不一致。本实施例中不限定第一预设路径和第二预设路径所包含的具体路径数量,例如可以是既在指定管理页面输出磁盘运行状态等级以及对应的诊断内容,又可以以邮件以及短信形式通知给预设联系人。当然,用户仅需要在管理界面提前配置好短信及邮件地址,管理界面把故障信息通过短信及邮件的方式通知到运维人员,以便运维人员及时处理。本实施例中并不对输出的信息的具体内容进行限定,例如可以仅是磁盘运行状态等级对应的信息;也可以是在输出磁盘运行状态等级对应的信息的基础上增加对应的诊断内容(例如磁盘对应这个等级的原因等)。也可以将该输出内容作为诊断报告。其中,第一磁盘运行状态等级,则不执行告警操作。当然也可以是输出磁盘状态较好的状态信息。本实施例并不对该输出路径进行限定。
下面通过一个具体例子说明上述过程:以在集群所有存储节点部署检测方法,其按照预设周期做如下处理,将第二磁盘运行状态等级及第三磁盘运行状态等级对应的磁盘汇报给管理界面。预设周期为半个小时,则各个存储节点每半小时对本节点的每块磁盘进行在线检测,所有磁盘默认均为A等级,具体检测过程如下:
步骤1:首先获取系统日志,分析系统日志/var/log/messages,如出现Mediumerror、Hardware error或者task abort,则判定盘为第三磁盘运行状态等级,然后结束本次诊断;如未出现,进入步骤2。
步骤2:使用sg_sat_identiy判定磁盘是SAS盘还是SATA盘,如果是SAS盘,进入步骤3;如果是SATA盘,进入步骤4。
步骤3:获取磁盘状态信息(即SAS盘smartctl信息检测),提取smartctl信息,如果G-List大于0,则为第三磁盘运行状态等级;否则检测Read/Write/Verify Totaluncorrected errors,如果大于0,则为第二磁盘运行状态等级;进入步骤5。
步骤4:获取磁盘状态信息(即SATA盘smartctl信息检测),提取smartctl信息,如果ID 5、197、198如果任一项大于0,则为第三磁盘运行状态等级;否则检测ID 187、188、199,如果任一项大于0,则为第二磁盘运行状态等级;进入步骤5。
步骤5:若为第三磁盘运行状态等级,则开启对应的磁盘告警灯,按照第二预设路径输出磁盘运行状态等级;若为第二磁盘运行状态等级,按照第一预设路径输出磁盘运行状态等级;其他均为第一磁盘运行状态等级,则不执行告警操作,不需要上报给管理界面。
该例子中实现了对集群所有节点的磁盘故障诊断,并根据严重级别对磁盘运行状态进行评分,点亮第三磁盘运行状态等级对应的磁盘报警灯,并生成诊断报告,上报给管理界面,管理界面负责把相应诊断信息通过短信及邮件等方式通知到运维人员,以便运维人员及时处理。
基于上述技术方案,本发明实施例提供的磁盘故障诊断方法,该方法能够自动对磁盘故障进行诊断,并且能够根据故障严重程度对磁盘运行状态进行等级区分,即确定磁盘运行状态等级,最终根据不同的磁盘运行状态等级执行不同的告警操作,进而可以根据磁盘运行状态等级不同,选取对应的告警形式,避免了运维人员等相关人员遗漏严重故障信息,影响上层应用,可以提高磁盘故障诊断的可靠性和效率。
下面对本发明实施例提供的磁盘故障诊断装置、终端及计算机可读存储介质进行介绍,下文描述的磁盘故障诊断装置、终端及计算机可读存储介质与上文描述的磁盘故障诊断方法可相互对应参照。
请参考图2,图2为本发明实施例所提供的磁盘故障诊断装置的结构框图;该装置可以包括:
获取模块100,用于按照预设周期获取系统日志以及磁盘状态信息;
等级确定模块200,用于根据系统日志以及磁盘状态信息,确定磁盘运行状态等级;
告警模块300,用于执行磁盘运行状态等级对应的告警操作。
基于上述实施例,等级确定模块200可以包括:
第一等级确定单元,用于根据系统日志,判断磁盘是否属于第三磁盘运行状态等级;
第二等级确定单元,用于若磁盘不属于第三磁盘运行状态等级,则根据磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;其中,磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级。
基于上述实施例,第二等级确定单元可以包括:
第二等级确定子单元,用于确定磁盘的类型,并确定类型对应的预设等级判定规则;根据磁盘状态信息以及类型对应的预设等级判定规则,确定磁盘运行状态等级。
基于上述任意实施例,告警模块300可以包括:
第一告警单元,用于当磁盘运行状态等级为第一磁盘运行状态等级,则不执行告警操作;
第二告警单元,用于当磁盘运行状态等级为第二磁盘运行状态等级,则按照第一预设路径输出磁盘运行状态等级;
第三告警单元,用于当磁盘运行状态等级为第三磁盘运行状态等级,则按照第二预设路径输出磁盘运行状态等级,并开启对应的磁盘告警灯。
需要说明的是,基于上述任意实施例,所述装置可以是基于可编程逻辑器件实现的,可编程逻辑器件包括FPGA,CPLD,单片机等。该可编程逻辑器件可以是在终端(如存储设备或者服务器)中。
基于上述技术方案,本发明实施例提供的磁盘故障诊断装置,从多个维度对磁盘进行检测及评估,并据此给出磁盘的磁盘运行状态等级,根据磁盘运行状态等级决策磁盘是否需要更换,能够及时发现潜在的有问题的磁盘并及时进行处理,有效降低了运维成本,尽可能减少磁盘故障对上层业务的影响。
本发明实施例还提供一种终端,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序时实现上述任意实施例所述的磁盘故障诊断方法的步骤。如处理器用于执行计算机程序时实现按照预设周期获取系统日志以及磁盘状态信息;根据系统日志以及磁盘状态信息,确定磁盘运行状态等级;执行磁盘运行状态等级对应的告警操作。
本实施例并不对终端进行限定,例如可以是服务器,或者是存储设备。
本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述任意实施例所述的磁盘故障诊断方法的步骤。如计算机程序被处理器执行时实现按照预设周期获取系统日志以及磁盘状态信息;根据系统日志以及磁盘状态信息,确定磁盘运行状态等级;执行磁盘运行状态等级对应的告警操作。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
以上对本发明所提供的一种磁盘故障诊断方法、装置、终端及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种磁盘故障诊断方法,其特征在于,包括:
按照预设周期获取系统日志以及磁盘状态信息;
根据所述系统日志以及所述磁盘状态信息,确定磁盘运行状态等级;
执行所述磁盘运行状态等级对应的告警操作。
2.根据权利要求1所述的磁盘故障诊断方法,其特征在于,所述根据所述系统日志以及所述磁盘状态信息,确定磁盘运行状态等级,包括:
根据所述系统日志,判断所述磁盘是否属于第三磁盘运行状态等级;
若否,则根据所述磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;其中,所述磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级。
3.根据权利要求2所述的磁盘故障诊断方法,其特征在于,所述根据所述磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级,包括:
确定磁盘的类型,并确定所述类型对应的预设等级判定规则;
根据所述磁盘状态信息以及所述类型对应的预设等级判定规则,确定磁盘运行状态等级。
4.根据权利要求1至3任一项所述的磁盘故障诊断方法,其特征在于,所述执行所述磁盘运行状态等级对应的告警操作,包括:
当所述磁盘运行状态等级为第一磁盘运行状态等级,则不执行告警操作;
当所述磁盘运行状态等级为第二磁盘运行状态等级,则按照第一预设路径输出所述磁盘运行状态等级;
当所述磁盘运行状态等级为第三磁盘运行状态等级,则按照第二预设路径输出所述磁盘运行状态等级,并开启对应的磁盘告警灯。
5.一种磁盘故障诊断装置,其特征在于,包括:
获取模块,用于按照预设周期获取系统日志以及磁盘状态信息;
等级确定模块,用于根据所述系统日志以及所述磁盘状态信息,确定磁盘运行状态等级;
告警模块,用于执行所述磁盘运行状态等级对应的告警操作。
6.根据权利要求5所述的磁盘故障诊断装置,其特征在于,所述等级确定模块,包括:
第一等级确定单元,用于根据所述系统日志,判断所述磁盘是否属于第三磁盘运行状态等级;
第二等级确定单元,用于若所述磁盘不属于第三磁盘运行状态等级,则根据所述磁盘状态信息以及预设等级判定规则,确定磁盘运行状态等级;其中,所述磁盘运行状态等级包括第一磁盘运行状态等级、第二磁盘运行状态等级及第三磁盘运行状态等级。
7.根据权利要求6所述的磁盘故障诊断装置,其特征在于,所述第二等级确定单元,包括:
第二等级确定子单元,用于确定磁盘的类型,并确定所述类型对应的预设等级判定规则;根据所述磁盘状态信息以及所述类型对应的预设等级判定规则,确定磁盘运行状态等级。
8.根据权利要求5至7任一项所述的磁盘故障诊断装置,其特征在于,所述告警模块,包括:
第一告警单元,用于当所述磁盘运行状态等级为第一磁盘运行状态等级,则不执告警进操作;
第二告警单元,用于当所述磁盘运行状态等级为第二磁盘运行状态等级,则按照第一预设路径输出所述磁盘运行状态等级;
第三告警单元,用于当所述磁盘运行状态等级为第三磁盘运行状态等级,则按照第二预设路径输出所述磁盘运行状态等级,并开启对应的磁盘告警灯。
9.一种终端,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至4任一项所述磁盘故障诊断方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至4任一项所述磁盘故障诊断方法的步骤。
CN201811556214.1A 2018-12-19 2018-12-19 一种磁盘故障诊断方法、装置、终端及可读存储介质 Pending CN109684141A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811556214.1A CN109684141A (zh) 2018-12-19 2018-12-19 一种磁盘故障诊断方法、装置、终端及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811556214.1A CN109684141A (zh) 2018-12-19 2018-12-19 一种磁盘故障诊断方法、装置、终端及可读存储介质

Publications (1)

Publication Number Publication Date
CN109684141A true CN109684141A (zh) 2019-04-26

Family

ID=66186883

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811556214.1A Pending CN109684141A (zh) 2018-12-19 2018-12-19 一种磁盘故障诊断方法、装置、终端及可读存储介质

Country Status (1)

Country Link
CN (1) CN109684141A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110187997A (zh) * 2019-06-06 2019-08-30 深信服科技股份有限公司 一种磁盘异常监测方法、装置、设备及介质
CN111026591A (zh) * 2019-11-29 2020-04-17 北京浪潮数据技术有限公司 一种后端sas的故障定位方法、系统及相关装置
CN112084097A (zh) * 2020-09-25 2020-12-15 中国建设银行股份有限公司 一种磁盘告警方法及装置
CN112732494A (zh) * 2020-12-29 2021-04-30 北京浪潮数据技术有限公司 一种存储系统的坏盘更换方法、装置、设备及介质
CN113127304A (zh) * 2021-04-16 2021-07-16 山东英信计算机技术有限公司 一种检测磁盘损坏的方法、系统及存储介质
CN113810477A (zh) * 2021-08-30 2021-12-17 深圳壹账通智能科技有限公司 一种文件上传方法、装置、设备及存储介质
CN116610540A (zh) * 2023-05-18 2023-08-18 合芯科技(苏州)有限公司 一种服务器硬盘预警方法、系统、计算机设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080165789A1 (en) * 2006-12-29 2008-07-10 Prodea Systems, Inc. Billing, Alarm, Statistics and Log Information Handling in Multi-Services Gateway Device at User Premises
CN101872641A (zh) * 2009-12-28 2010-10-27 杭州海康威视数字技术股份有限公司 硬盘录像机中的硬盘失效预警方法及装置
CN103197995A (zh) * 2012-01-04 2013-07-10 百度在线网络技术(北京)有限公司 硬盘故障检测方法及装置
CN106250258A (zh) * 2016-07-29 2016-12-21 北京云集智造科技有限公司 一种磁盘故障定位方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080165789A1 (en) * 2006-12-29 2008-07-10 Prodea Systems, Inc. Billing, Alarm, Statistics and Log Information Handling in Multi-Services Gateway Device at User Premises
CN101872641A (zh) * 2009-12-28 2010-10-27 杭州海康威视数字技术股份有限公司 硬盘录像机中的硬盘失效预警方法及装置
CN103197995A (zh) * 2012-01-04 2013-07-10 百度在线网络技术(北京)有限公司 硬盘故障检测方法及装置
CN106250258A (zh) * 2016-07-29 2016-12-21 北京云集智造科技有限公司 一种磁盘故障定位方法及装置

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110187997A (zh) * 2019-06-06 2019-08-30 深信服科技股份有限公司 一种磁盘异常监测方法、装置、设备及介质
CN111026591A (zh) * 2019-11-29 2020-04-17 北京浪潮数据技术有限公司 一种后端sas的故障定位方法、系统及相关装置
CN112084097A (zh) * 2020-09-25 2020-12-15 中国建设银行股份有限公司 一种磁盘告警方法及装置
CN112084097B (zh) * 2020-09-25 2024-05-14 中国建设银行股份有限公司 一种磁盘告警方法及装置
CN112732494A (zh) * 2020-12-29 2021-04-30 北京浪潮数据技术有限公司 一种存储系统的坏盘更换方法、装置、设备及介质
CN112732494B (zh) * 2020-12-29 2024-02-13 北京浪潮数据技术有限公司 一种存储系统的坏盘更换方法、装置、设备及介质
CN113127304A (zh) * 2021-04-16 2021-07-16 山东英信计算机技术有限公司 一种检测磁盘损坏的方法、系统及存储介质
CN113810477A (zh) * 2021-08-30 2021-12-17 深圳壹账通智能科技有限公司 一种文件上传方法、装置、设备及存储介质
CN116610540A (zh) * 2023-05-18 2023-08-18 合芯科技(苏州)有限公司 一种服务器硬盘预警方法、系统、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN109684141A (zh) 一种磁盘故障诊断方法、装置、终端及可读存储介质
US10198196B2 (en) Monitoring health condition of a hard disk
CN105224888B (zh) 一种基于安全预警技术的磁盘阵列数据保护系统
US11073998B2 (en) Method, apparatus for processing disk bad sector,and computer storage medium
CN103558574B (zh) 基于eeprom数据读写的智能电能表软件容错能力测试方法
CN110164501B (zh) 一种硬盘检测方法、装置、存储介质及设备
CN102591591A (zh) 磁盘检测系统、磁盘检测方法以及网络存储系统
CN102135925B (zh) 用于检测错误检查和纠正内存的方法和装置
CN109726036B (zh) 一种存储系统中的数据重构方法和装置
CN110888763A (zh) 磁盘故障诊断方法、装置、终端设备及计算机存储介质
CN102222033B (zh) 一种保存小型计算机系统接口访问错误的方法及装置
CN100501686C (zh) 在差错处理程序执行期间处理差错的方法、处理器及系统
CN116775362A (zh) 独立冗余磁盘阵列的通路阻塞处理方法、系统
CN113239007B (zh) 多层次异构日志事务分析方法、系统、设备和存储介质
CN106648969B (zh) 一种磁盘中损坏数据巡检方法及系统
CN111045858A (zh) 一种坏道处理方法及系统
CN104407806B (zh) 独立磁盘冗余阵列组硬盘信息的修改方法和装置
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN109522184A (zh) 一种服务器系统安全监控方法、装置及终端
CN103605600B (zh) 一种移动终端存储卡存储单元读写次数记录的方法及系统
CN107301109A (zh) 一种硬盘质量筛选方法及装置
CN107807862A (zh) 检测硬盘故障点的方法、装置及服务器
CN106886471A (zh) 一种基于linux中磁盘的读写故障检测方法及系统
CN116820821A (zh) 磁盘故障检测方法、装置、电子设备及计算机可读存储介质
CN110532139A (zh) 预警方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190426