CN112346932A - 隐性坏盘的定位方法、装置、电子设备及计算机存储介质 - Google Patents
隐性坏盘的定位方法、装置、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN112346932A CN112346932A CN202011223432.0A CN202011223432A CN112346932A CN 112346932 A CN112346932 A CN 112346932A CN 202011223432 A CN202011223432 A CN 202011223432A CN 112346932 A CN112346932 A CN 112346932A
- Authority
- CN
- China
- Prior art keywords
- hard disk
- index information
- disk index
- information
- system log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 238000012544 monitoring process Methods 0.000 claims abstract description 26
- 238000004590 computer program Methods 0.000 claims description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/3037—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
- G08B21/182—Level alarms, e.g. alarms responsive to variables exceeding a threshold
-
- G—PHYSICS
- G08—SIGNALLING
- G08B—SIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
- G08B21/00—Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
- G08B21/18—Status alarms
- G08B21/187—Machine fault alarms
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Emergency Management (AREA)
- Business, Economics & Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Debugging And Monitoring (AREA)
Abstract
本申请提供了一种隐性坏盘的定位方法、装置、电子设备及计算机存储介质,该方法包括:通过实时监控每一个节点服务器的系统日志;然后,若系统日志中包括与预设信息一致的报错信息,确定报错信息所在的逻辑卷所对应的阵列卡;再获取阵列卡对应的阵列卡日志中的硬盘指标信息;针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件;若判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息;其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。以达到对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理的目的。
Description
技术领域
本申请涉及计算机技术领域,特别涉及一种隐性坏盘的定位方法、装置、电子设备及计算机存储介质。
背景技术
随着现代信息技术的不断发展,世界已经跨入了大数据时代。目前,在大数据的场景下,对硬盘的输入/输出的吞吐量有了更高的要求。
但是,随着应用系统对硬盘的访问量呈几何级别速度的增长,超过了硬盘本身的承受能力,使得硬盘的使用寿命大大缩短,故障率增高。如果,硬盘在处于繁忙的工作状态时发生数据块损坏,就会影响到应用系统的正常运行。在现有技术中,却无法对隐性坏盘进行预测,即无法对可能出现数据块损坏的硬盘进行预测。从而导致在出现坏盘时,无法及时的进行处理。
发明内容
有鉴于此,本申请提供一种隐性坏盘的定位方法、装置、电子设备及计算机存储介质,用于对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理。
本申请第一方面提供了一种隐性坏盘的定位方法,包括:
实时监控每一个节点服务器的系统日志;
若所述系统日志中包括与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡;
获取所述阵列卡对应的阵列卡日志中的硬盘指标信息;其中,所述硬盘指标信息包括多个硬盘的多项硬盘指标信息;
针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件;
若判断出所述硬盘指标信息满足所述硬盘指标信息对应的报警条件,则发送报警信息;其中,所述报警信息包括所述硬盘指标信息以及所述硬盘指标信息所在的硬盘的序列号和槽位。
可选的,所述实时监控每一个节点服务器的系统日志,包括:
实时监控每一个节点服务器的系统日志中的所有关键字;
其中,所述若所述系统日志出现与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡,包括:
判断所述系统日志中的所有关键字中,是否有预设的关键字;
若判断出所述系统日志中的所有关键字中有所述预设的关键字,则确定所述关键字所在的逻辑卷所对应的阵列卡。
可选的,所述针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件,包括:
针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否与所述硬盘指标信息对应的标准信息一致;
其中,若判断出所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致,则说明所述硬盘指标信息满足所述硬盘指标信息对应的报警条件。
可选的,所述针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否与所述硬盘指标信息对应的标准信息一致之后,还包括:
针对每一个所述硬盘的硬盘指标信息,保存所述硬盘指标信息以及所述硬盘指标信息对应的标准信息。
可选的,所述针对每一个所述硬盘的硬盘指标信息,保存所述硬盘指标信息以及所述硬盘指标信息对应的标准信息之后,还包括:
将所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致的硬盘指标信息按照预设的类别进行分类。
本申请第二方面提供了一种隐性坏盘的定位装置,包括:
监控单元,用于实时监控每一个节点服务器的系统日志;
确定单元,用于若所述系统日志中包括与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡;
获取单元,用于获取所述阵列卡对应的阵列卡日志中的硬盘指标信息;其中,所述硬盘指标信息包括多个硬盘的多项硬盘指标信息;
判断单元,用于针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件;
报警单元,用于若所述判断单元判断出,所述硬盘指标信息满足所述硬盘指标信息对应的报警条件,则发送报警信息;其中,所述报警信息包括所述硬盘指标信息以及所述硬盘指标信息所在的硬盘的序列号和槽位。
可选的,所述监控单元,包括:
监控子单元,用于实时监控每一个节点服务器的系统日志中的所有关键字;
其中,所述确定单元,包括:
关键字判断单元,用于判断所述系统日志中的所有关键字中,是否有预设的关键字;
确定子单元,用于若关键字判断单元判断出,所述系统日志中的所有关键字中有所述预设的关键字,则确定所述关键字所在的逻辑卷所对应的阵列卡。
可选的,所述判断单元,包括:
判断子单元,针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否与所述硬盘指标信息对应的标准信息一致;
其中,若判断出所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致,则说明所述硬盘指标信息满足所述硬盘指标信息对应的报警条件。
可选的,所述隐性坏盘的定位装置,还包括:
保存单元,用于针对每一个所述硬盘的硬盘指标信息,保存所述硬盘指标信息以及所述硬盘指标信息对应的标准信息。
可选的,所述隐性坏盘的定位装置,还包括:
分类单元,用于将所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致的硬盘指标信息按照预设的类别进行分类。
本申请第三方面提供了一种电子设备,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如第一方面任意一项所述的方法。
本申请第四方面提供了一种计算机存储介质,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如第一方面任意一项所述的方法。
由以上方案可知,本申请提供的一种隐性坏盘的定位方法、装置、电子设备及计算机存储介质中,该方法包括:通过实时监控每一个节点服务器的系统日志;然后,若所述系统日志中包括与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡;再获取所述阵列卡对应的阵列卡日志中的硬盘指标信息;其中,所述硬盘指标信息包括多个硬盘的多项硬盘指标信息;之后,针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件;若判断出所述硬盘指标信息满足所述硬盘指标信息对应的报警条件,则发送报警信息;其中,所述报警信息包括所述硬盘指标信息以及所述硬盘指标信息所在的硬盘的序列号和槽位。以达到对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理的目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种隐性坏盘的定位方法的具体流程图;
图2为本申请另一实施例提供的一种隐性坏盘的定位方法的具体流程图;
图3为本申请另一实施例提供的一种隐性坏盘的定位装置的示意图;
图4为本申请另一实施例提供的一种隐性坏盘的定位装置的示意图;
图5为本申请另一实施例提供的一种实现隐性坏盘的定位方法的电子设备的示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要注意,本申请中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系,而术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本申请实施例提供了一种隐性坏盘的定位方法,如图1所示,具体包括以下步骤:
S101、实时监控每一个节点服务器的系统日志。
其中,节点服务器可以是在GP大数据集群中的节点服务器,也可以是在其他集群中的节点服务器,此处不做限定。其中,GP作为一种在虚拟化X86服务器上运行无分享的大规模并行处理架构,由于并行处理架构的“木桶原理”,所以GP大数据集群对硬盘性能很敏感,对节点服务器的硬盘读写的要求极高。
具体的,实时监控在GP大数据集群中的每一个节点服务器的系统日志。
S102、若系统日志中包括与预设信息一致的报错信息,确定报错信息所在的逻辑卷所对应的阵列卡。
具体的,在系统日志中查询是否有与预设信息一致的报错信息,如果,在系统日志中查询到有与预设信息一致的报错信息,那么就确定报错信息所在的逻辑卷所对应的阵列卡。
S103、获取阵列卡对应的阵列卡日志中的硬盘指标信息。
其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息。
S104、针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件。
可选的,在本申请的另一实施例中,步骤S104的一种实施方式,包括:
针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否与硬盘指标信息对应的标准信息一致。
其中,若判断出硬盘指标信息与硬盘指标信息对应的标准信息不一致,则说明硬盘指标信息满足硬盘指标信息对应的报警条件。
参见表1,为硬盘指标信息以及硬盘指标信息对应的标准信息。以每一种硬盘指标信息对应的标准信息都为0为例,例如:获取得到的硬盘指标信息Read Errors Hard为0,即硬盘指标信息Read Errors Hard与硬盘指标信息Read Errors Hard对应的标准信息一致,则不满足硬盘指标信息Read Errors Hard对应的报警条件,也就是说硬盘指标信息ReadErrors Hard为正常状态;获取得到的硬盘指标信息Read Errors Hard为1,即硬盘指标信息Read Errors Hard与硬盘指标信息Read Errors Hard对应的标准信息不一致,则满足硬盘指标信息Read Errors Hard对应的报警条件,也就是说硬盘指标信息Read Errors Hard为非正常状态。
可以理解的是,在实际的应用过程中,硬盘指标信息对应的标准信息可以不为0,且相互之间可以不同,此处不做限定。
表1
可选的,在本申请的另一实施例中,在针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否与硬盘指标信息对应的标准信息一致之后,还可以包括:
针对每一个硬盘的硬盘指标信息,保存硬盘指标信息以及硬盘指标信息对应的标准信息。
通过对每一个硬盘指标信息,以及每一个硬盘指标信息对应的标准信息进行保存,以方便后续对隐性坏盘的处理,以及分析。
可选的,在本申请的另一实施例中,针对每一个硬盘的硬盘指标信息,保存硬盘指标信息以及硬盘指标信息对应的标准信息之后,还可以包括:
将硬盘指标信息与硬盘指标信息对应的标准信息不一致的硬盘指标信息按照预设的类别进行分类。
需要说明的是,预设的类别可以是如表1所述的故障类型,如:硬盘故障、硬盘或链路故障、链路故障、硬盘性能下降等,同样也可以按照其他类别进行分类,此处不做限定。
通过将硬盘指标信息与硬盘指标信息对应的标准信息不一致的硬盘指标信息按照预设的类别进行分类,以方便后续对隐性坏盘的处理,以及分析。
S105、若判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息。
其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。
需要说明的是,当判断出任意一个硬盘指标信息满足硬盘指标信息对应的报警条件时,发送报警信息,并继续判断对其他硬盘指标信息是否满足硬盘指标信息对应的报警条件,若还有其他硬盘指标信息满足硬盘指标信息对应的报警条件,那么同样发送报警信息。
由以上方案可知,本申请提供的一种隐性坏盘的定位方法中,该方法包括:通过实时监控每一个节点服务器的系统日志;然后,若系统日志中包括与预设信息一致的报错信息,确定报错信息所在的逻辑卷所对应的阵列卡;再获取阵列卡对应的阵列卡日志中的硬盘指标信息;其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息;之后,针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件;若判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息;其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。以达到对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理的目的。
可选的,在本申请的另一实施例中,隐性坏盘的定位方法的一种实施方式,如图2所示,包括:
S201、实时监控每一个节点服务器的系统日志中的所有关键字。
其中,关键字可以包括但不限于Lun reset、Reset logical等,此处不做限定。
S202、判断系统日志中的所有关键字中,是否有预设的关键字。
具体的,若判断出系统日志中的所有关键字中有预设的关键字,则执行步骤S203。
S203、确定关键字所在的逻辑卷所对应的阵列卡。
S204、获取阵列卡对应的阵列卡日志中的硬盘指标信息。
其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息。
需要说明的是,步骤S204的具体实现过程与上述步骤S103的具体实现过程相同,可相互参见。
S205、针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件。
需要说明的是,步骤S205的具体实现过程与上述步骤S104的具体实现过程相同,可相互参见。
S206、若判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息。
其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。
需要说明的是,步骤S206的具体实现过程与上述步骤S105的具体实现过程相同,可相互参见。
由以上方案可知,本申请提供的一种隐性坏盘的定位方法中,该方法包括:通过实时监控每一个节点服务器的系统日志中的所有关键字;然后,判断系统日志中的所有关键字中,是否有预设的关键字若判断出系统日志中的所有关键字中有预设的关键字,则确定关键字所在的逻辑卷所对应的阵列卡;再获取阵列卡对应的阵列卡日志中的硬盘指标信息;其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息;之后,针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件;若判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息;其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。以达到对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理的目的。
本申请另一实施例提供了一种隐性坏盘的定位装置,如图3所示,具体包括:
监控单元301,用于实时监控每一个节点服务器的系统日志。
确定单元302,用于若系统日志中包括与预设信息一致的报错信息,确定报错信息所在的逻辑卷所对应的阵列卡。
获取单元303,用于获取阵列卡对应的阵列卡日志中的硬盘指标信息。
其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息。
判断单元304,用于针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件。
可选的,在本申请的另一实施例中,判断单元304的一种实施方式,包括:
判断子单元,针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否与硬盘指标信息对应的标准信息一致。
其中,若判断出硬盘指标信息与硬盘指标信息对应的标准信息不一致,则说明硬盘指标信息满足硬盘指标信息对应的报警条件。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在申请的另一实施例中,隐性坏盘的定位装置的一种实施方式,还包括:
保存单元,用于针对每一个硬盘的硬盘指标信息,保存硬盘指标信息以及硬盘指标信息对应的标准信息。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
可选的,在申请的另一实施例中,隐性坏盘的定位装置的一种实施方式,还包括:
分类单元,用于将硬盘指标信息与硬盘指标信息对应的标准信息不一致的硬盘指标信息按照预设的类别进行分类。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,此处不再赘述。
报警单元305,用于若判断单元304判断出,硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息。
其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图1所示,此处不再赘述。
由以上方案可知,本申请提供的一种隐性坏盘的定位装置中,通过监控单元301实时监控每一个节点服务器的系统日志;然后,若系统日志中包括与预设信息一致的报错信息,确定单元302确定报错信息所在的逻辑卷所对应的阵列卡;获取单元303获取阵列卡对应的阵列卡日志中的硬盘指标信息;其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息;之后,判断单元304针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件;若判断单元304判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则报警单元305发送报警信息;其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。以达到对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理的目的。
可选的,在本申请的另一实施例中,隐性坏盘的定位装置的一种实施方式,如图4所示,包括:
监控子单元401,用于实时监控每一个节点服务器的系统日志中的所有关键字。
关键字判断单元402,用于判断系统日志中的所有关键字中,是否有预设的关键字。
确定子单元403,用于若关键字判断单元402判断出,系统日志中的所有关键字中有预设的关键字,则确定关键字所在的逻辑卷所对应的阵列卡。
获取单元404,用于获取阵列卡对应的阵列卡日志中的硬盘指标信息。
其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息。
判断单元405,用于针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件。
报警单元406,用于若判断单元405判断出,硬盘指标信息满足硬盘指标信息对应的报警条件,则发送报警信息。
其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。
本申请上述实施例公开的单元的具体工作过程,可参见对应的方法实施例内容,如图2所示,此处不再赘述。
由以上方案可知,本申请提供的一种隐性坏盘的定位装置中,通过监控子单元401实时监控每一个节点服务器的系统日志中的所有关键字;然后,关键字判断单元402判断系统日志中的所有关键字中,是否有预设的关键字若关键字判断单元402判断出系统日志中的所有关键字中有预设的关键字,则确定子单元403确定关键字所在的逻辑卷所对应的阵列卡;获取单元404获取阵列卡对应的阵列卡日志中的硬盘指标信息;其中,硬盘指标信息包括多个硬盘的多项硬盘指标信息;之后,判断单元405针对每一个硬盘的硬盘指标信息,判断硬盘指标信息是否满足硬盘指标信息对应的报警条件;若判断单元405判断出硬盘指标信息满足硬盘指标信息对应的报警条件,则报警单元406发送报警信息;其中,报警信息包括硬盘指标信息以及硬盘指标信息所在的硬盘的序列号和槽位。以达到对可能出现数据块损坏的硬盘进行预测,从而在出现坏盘之前,对可能发生坏盘的硬盘进行及时处理的目的。
本申请另一实施例提供了一种电子设备,如图5所示,包括:
一个或多个处理器501。
存储装置502,其上存储有一个或多个程序。
当所述一个或多个程序被所述一个或多个处理器501执行时,使得所述一个或多个处理器501实现如上述实施例中任意一项所述的方法。
本申请另一实施例提供了一种计算机存储介质,其上存储有计算机程序,其中,计算机程序被处理器执行时实现如上述实施例中任意一项所述的方法。
在本申请公开的上述实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本公开的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本公开各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,直播设备,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种隐性坏盘的定位方法,其特征在于,包括:
实时监控每一个节点服务器的系统日志;
若所述系统日志中包括与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡;
获取所述阵列卡对应的阵列卡日志中的硬盘指标信息;其中,所述硬盘指标信息包括多个硬盘的多项硬盘指标信息;
针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件;
若判断出所述硬盘指标信息满足所述硬盘指标信息对应的报警条件,则发送报警信息;其中,所述报警信息包括所述硬盘指标信息以及所述硬盘指标信息所在的硬盘的序列号和槽位。
2.根据权利要求1所述的定位方法,其特征在于,所述实时监控每一个节点服务器的系统日志,包括:
实时监控每一个节点服务器的系统日志中的所有关键字;
其中,所述若所述系统日志出现与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡,包括:
判断所述系统日志中的所有关键字中,是否有预设的关键字;
若判断出所述系统日志中的所有关键字中有所述预设的关键字,则确定所述关键字所在的逻辑卷所对应的阵列卡。
3.根据权利要求1所述的定位方法,其特征在于,所述针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件,包括:
针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否与所述硬盘指标信息对应的标准信息一致;
其中,若判断出所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致,则说明所述硬盘指标信息满足所述硬盘指标信息对应的报警条件。
4.根据权利要求3所述的定位方法,其特征在于,所述针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否与所述硬盘指标信息对应的标准信息一致之后,还包括:
针对每一个所述硬盘的硬盘指标信息,保存所述硬盘指标信息以及所述硬盘指标信息对应的标准信息。
5.根据权利要求4所述的定位方法,其特征在于,所述针对每一个所述硬盘的硬盘指标信息,保存所述硬盘指标信息以及所述硬盘指标信息对应的标准信息之后,还包括:
将所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致的硬盘指标信息按照预设的类别进行分类。
6.一种隐性坏盘的定位装置,其特征在于,包括:
监控单元,用于实时监控每一个节点服务器的系统日志;
确定单元,用于若所述系统日志中包括与预设信息一致的报错信息,确定所述报错信息所在的逻辑卷所对应的阵列卡;
获取单元,用于获取所述阵列卡对应的阵列卡日志中的硬盘指标信息;其中,所述硬盘指标信息包括多个硬盘的多项硬盘指标信息;
判断单元,用于针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否满足所述硬盘指标信息对应的报警条件;
报警单元,用于若所述判断单元判断出,所述硬盘指标信息满足所述硬盘指标信息对应的报警条件,则发送报警信息;其中,所述报警信息包括所述硬盘指标信息以及所述硬盘指标信息所在的硬盘的序列号和槽位。
7.根据权利要求6所述的定位装置,其特征在于,所述监控单元,包括:
监控子单元,用于实时监控每一个节点服务器的系统日志中的所有关键字;
其中,所述确定单元,包括:
关键字判断单元,用于判断所述系统日志中的所有关键字中,是否有预设的关键字;
确定子单元,用于若关键字判断单元判断出,所述系统日志中的所有关键字中有所述预设的关键字,则确定所述关键字所在的逻辑卷所对应的阵列卡。
8.根据权利要求6所述的定位装置,其特征在于,所述判断单元,包括:
判断子单元,针对每一个所述硬盘的硬盘指标信息,判断所述硬盘指标信息是否与所述硬盘指标信息对应的标准信息一致;
其中,若判断出所述硬盘指标信息与所述硬盘指标信息对应的标准信息不一致,则说明所述硬盘指标信息满足所述硬盘指标信息对应的报警条件。
9.一种电子平台,其特征在于,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至5中任一所述的方法。
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至5中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011223432.0A CN112346932A (zh) | 2020-11-05 | 2020-11-05 | 隐性坏盘的定位方法、装置、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011223432.0A CN112346932A (zh) | 2020-11-05 | 2020-11-05 | 隐性坏盘的定位方法、装置、电子设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112346932A true CN112346932A (zh) | 2021-02-09 |
Family
ID=74428332
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011223432.0A Pending CN112346932A (zh) | 2020-11-05 | 2020-11-05 | 隐性坏盘的定位方法、装置、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112346932A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150067410A1 (en) * | 2013-08-27 | 2015-03-05 | Tata Consultancy Services Limited | Hardware failure prediction system |
CN106250258A (zh) * | 2016-07-29 | 2016-12-21 | 北京云集智造科技有限公司 | 一种磁盘故障定位方法及装置 |
WO2017125014A1 (zh) * | 2016-01-18 | 2017-07-27 | 中兴通讯股份有限公司 | 硬盘监控方法及装置 |
CN107066370A (zh) * | 2017-04-26 | 2017-08-18 | 郑州云海信息技术有限公司 | 一种自动监控并收集故障硬盘日志的工具及方法 |
CN109117327A (zh) * | 2018-07-20 | 2019-01-01 | 郑州云海信息技术有限公司 | 一种硬盘检测方法及装置 |
CN109240883A (zh) * | 2018-08-30 | 2019-01-18 | 郑州云海信息技术有限公司 | 定位smart报错硬盘的方法、系统、设备及存储介质 |
CN110989926A (zh) * | 2019-11-11 | 2020-04-10 | 北京字节跳动网络技术有限公司 | 故障磁盘槽位定位方法、装置及电子设备 |
-
2020
- 2020-11-05 CN CN202011223432.0A patent/CN112346932A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150067410A1 (en) * | 2013-08-27 | 2015-03-05 | Tata Consultancy Services Limited | Hardware failure prediction system |
WO2017125014A1 (zh) * | 2016-01-18 | 2017-07-27 | 中兴通讯股份有限公司 | 硬盘监控方法及装置 |
CN106250258A (zh) * | 2016-07-29 | 2016-12-21 | 北京云集智造科技有限公司 | 一种磁盘故障定位方法及装置 |
CN107066370A (zh) * | 2017-04-26 | 2017-08-18 | 郑州云海信息技术有限公司 | 一种自动监控并收集故障硬盘日志的工具及方法 |
CN109117327A (zh) * | 2018-07-20 | 2019-01-01 | 郑州云海信息技术有限公司 | 一种硬盘检测方法及装置 |
CN109240883A (zh) * | 2018-08-30 | 2019-01-18 | 郑州云海信息技术有限公司 | 定位smart报错硬盘的方法、系统、设备及存储介质 |
CN110989926A (zh) * | 2019-11-11 | 2020-04-10 | 北京字节跳动网络技术有限公司 | 故障磁盘槽位定位方法、装置及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107025153B (zh) | 磁盘的故障预测方法和装置 | |
CN110213068B (zh) | 一种消息中间件的监控方法及相关设备 | |
CN110224874B (zh) | 一种设备故障的处理方法及装置 | |
CN113254255B (zh) | 一种云平台日志的分析方法、系统、设备及介质 | |
CN112579327B (zh) | 一种故障检测方法、装置及设备 | |
CN109614390A (zh) | 数据库读写分离方法、装置、服务系统、设备及介质 | |
CN113708986B (zh) | 服务器监控装置、方法及计算机可读存储介质 | |
CN114465870A (zh) | 告警信息的处理方法及装置、存储介质和电子设备 | |
CN113641526A (zh) | 告警根因定位方法、装置、电子设备及计算机存储介质 | |
CN114153646B (zh) | 一种运维故障处置方法、装置及存储介质、处理器 | |
CN110069217B (zh) | 一种数据存储方法及装置 | |
CN114996065A (zh) | 内存故障预测方法、装置及设备 | |
KR20160099159A (ko) | 악성 코드를 탐지하기 위한 전자 시스템 및 방법 | |
CN113326064A (zh) | 划分业务逻辑模块的方法、电子设备及存储介质 | |
CN112416974A (zh) | 一种数据处理方法、装置、设备及可读存储介质 | |
CN112346932A (zh) | 隐性坏盘的定位方法、装置、电子设备及计算机存储介质 | |
CN112306989A (zh) | 数据库实例的处理方法及装置、存储介质、电子装置 | |
CN111835566A (zh) | 一种系统故障管理方法、装置及系统 | |
CN116643906A (zh) | 云平台故障的处理方法、装置、电子设备及存储介质 | |
CN114415970B (zh) | 分布式存储系统的磁盘故障处理方法、装置及服务器 | |
CN115509853A (zh) | 一种集群数据异常检测方法及电子设备 | |
CN113409876A (zh) | 一种故障硬盘的定位方法及系统 | |
CN114416560A (zh) | 程序崩溃分析聚合方法和系统 | |
CN113485872A (zh) | 故障处理方法、装置及分布式存储系统 | |
CN111581044A (zh) | 集群优化方法、装置、服务器及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |