CN111176945A - 节点故障定位方法、装置、设备及计算机可读存储介质 - Google Patents

节点故障定位方法、装置、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN111176945A
CN111176945A CN201911385170.5A CN201911385170A CN111176945A CN 111176945 A CN111176945 A CN 111176945A CN 201911385170 A CN201911385170 A CN 201911385170A CN 111176945 A CN111176945 A CN 111176945A
Authority
CN
China
Prior art keywords
log
function module
information
target
processing layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201911385170.5A
Other languages
English (en)
Inventor
彭超峰
贺计文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN201911385170.5A priority Critical patent/CN111176945A/zh
Publication of CN111176945A publication Critical patent/CN111176945A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data

Abstract

本发明公开了一种节点故障定位方法,包括:当通过inotify进程服务监测到异常信息记录文件存在修改动作时,对修改后异常信息记录文件进行解析,得到目标异常信息;检测目标异常信息是否携带有日志功能模块标识信息;若是,则生成与日志功能模块标识信息对应的目标功能模块日志收集指令,以根据收集到的目标功能模块日志信息进行节点故障定位;若否,则向日志处理层发送全量日志收集指令,以根据收集到的全量日志信息进行节点故障定位。本发明较大地提高了日志收集效率,缩短了故障定位时长,实现对节点故障的快速排查。本发明还公开了一种节点故障定位装置、设备及存储介质,具有相应技术效果。

Description

节点故障定位方法、装置、设备及计算机可读存储介质
技术领域
本发明涉及分布式存储技术领域,特别是涉及一种节点故障定位方法、装置、设备及计算机可读存储介质。
背景技术
随着分布式存储系统投入使用,大大提高了用户数据存储的可靠性和安全性。但是也随之带来一些问题:分布式存储系统中节点数量的增多,导致节点运行过程中产生的日志信息大量增加,当分布式存储系统中存在节点出现问题时,需要基于记录的日志信息进行节点故障定位。
现有的节点故障定位方式为对预先记录的日志信息进行全部收集,基于全部日志信息进行定位和排查问题,日志信息文档过大,冗余信息太多,日志收集效率低,节点故障定位耗时长,若不能快速收集信息进行定位解决,重则导致宕机、存储信息丢失、存储系统崩溃,影响系统的正常运行,并且如果此问题具有低概率复现,无疑会加大复现成本。
综上所述,如何有效地解决节点故障定位耗时长,影响系统的正常运行,成本高等问题,是目前本领域技术人员急需解决的问题。
发明内容
本发明的目的是提供一种节点故障定位方法,该方法较大地提高了日志收集效率,缩短了故障定位时长,实现对节点故障的快速排查,降低了对系统运行的影响,降低了成本;本发明的另一目的是提供一种节点故障定位装置、设备及计算机可读存储介质。
为解决上述技术问题,本发明提供如下技术方案:
一种节点故障定位方法,包括:
当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;
对所述修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;
检测所述目标异常信息是否携带有日志功能模块标识信息;
若是,则生成与所述日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;
若否,则向所述日志处理层发送全量日志收集指令,以使所述日志处理层根据收集到的全量日志信息进行节点故障定位。
在本发明的一种具体实施方式中,生成与所述日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位,包括:
根据所述日志功能模块标识信息确定所述目标异常信息对应的目标功能模块、目标异常信息生成时段、以及目标节点信息;
根据所述目标功能模块、所述目标异常信息生成时段、以及所述目标节点信息生成所述目标功能模块日志收集指令,并向所述日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位。
在本发明的一种具体实施方式中,在确定所述目标异常信息携带有日志功能模块标识信息之后,还包括:
按照预设的问题上报周期向目标终端发送邮件提醒信息。
在本发明的一种具体实施方式中,在确定所述目标异常信息未携带日志功能模块标识信息之后,还包括:
向所述目标终端发送紧急邮件警告信息,并向所述目标终端发送异常信息弹窗指令,以使所述目标终端对所述目标异常信息进行界面弹窗显示。
在本发明的一种具体实施方式中,还包括:
向所述日志处理层发送日志上传指令,以使所述日志处理层将收集到的所述目标功能模块日志信息或所述全量日志信息上传至ftp服务器。
在本发明的一种具体实施方式中,向所述日志处理层发送日志上传指令,以使所述日志处理层将收集到的所述目标功能模块日志信息或所述全量日志信息上传至ftp服务器,包括:
向所述日志处理层发送日志压缩上传指令,以使所述日志处理层将收集到的所述目标功能模块日志信息或所述全量日志信息进行压缩处理,并将压缩后日志信息上传至所述ftp服务器。
在本发明的一种具体实施方式中,还包括:
当检测到inotify进程服务失效时,通过图形用户界面查看是否所述异常信息记录文件是否存在修改。
一种节点故障定位装置,包括:
文件获取单元,用于当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;
异常信息获得单元,用于对所述修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;
标识信息检测单元,用于检测所述目标异常信息是否携带有日志功能模块标识信息;
第一节点故障定位单元,用于当检测到所述目标异常信息携带有日志功能模块标识信息时,生成与所述日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;
第二节点故障定位单元,用于当检测到所述目标异常信息未携带日志功能模块标识信息时,向所述日志处理层发送全量日志收集指令,以使所述日志处理层根据收集到的全量日志信息进行节点故障定位。
一种节点故障定位设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如前所述节点故障定位方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述节点故障定位方法的步骤。
应用本发明实施例所提供的方法,当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;检测目标异常信息是否携带有日志功能模块标识信息;若是,则生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;若否,则向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。通过利用inotify进程服务对异常信息记录文件进行监测,当确定生成的目标异常信息携带日志功能模块标识信息时,日志处理层直接收集目标功能模块日志信息,不需要收集全部日志,较大地提高了日志收集效率,缩短了故障定位时长,实现对节点故障的快速排查,降低了对系统运行的影响,降低了成本。
相应的,本发明实施例还提供了与上述节点故障定位方法相对应的节点故障定位装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中节点故障定位方法的一种实施流程图;
图2为本发明实施例中节点故障定位方法的另一种实施流程图;
图3为本发明实施例中一种节点故障定位装置的结构框图;
图4为本发明实施例中一种节点故障定位设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一:
参见图1,图1为本发明实施例中节点故障定位方法的一种实施流程图,该方法可以包括以下步骤:
S101:当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件。
可以预先部署异常信息记录文件对节点生成的异常信息进行记录,并部署inotify进程服务对异常信息记录文件进行监测,如可以通过inotify进程服务监测异常信息记录文件是否存在修改动作,具体的,为保证能够及时发现异常信息,可以设置为实时监测。当通过inotify进程服务监测到异常信息记录文件存在修改动作时,说明系统中存在节点异常,从而获取修改后异常信息记录文件。
Inotify进程服务是一个Linux内核特性,它监控文件系统,并且及时向专门的应用程序发出相关的事件警告,比如删除、读、写和卸载操作等。还可以跟踪活动的源头和目标等细节。在本发明实施例中Inotify进程服务用于监测异常信息记录文件是否存在修改。
S102:对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息。
在获取到修改后异常信息记录文件之后,可以对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息。根据节点当前问题的严重性,目标异常信息可以将节点当前问题划分为致命、严重问题和一般、告警、未知问题。
S103:检测目标异常信息是否携带有日志功能模块标识信息,若是,则执行步骤S104,若否,则执行步骤S105。
在节点测试过程中或通过对历次发生节点故障时对应生成的日志信息进行分析,可以预先汇总对日志信息进行分类,将同类日志信息划分为同一日志功能模块,每个日志功能模块对应类似的节点故障,并设置各日志功能模块对应的日志功能模块标识信息。在解析得到当次生成的目标异常信息之后,可以检测目标异常信息是否携带有日志功能模块标识信息,若是,则说明系统先前存在节点出现过类似节点故障,对类似异常信息进行过预先汇总,存在汇总得到的目标异常信息对应的日志功能模块,在这种情况下,可以继续执行步骤S104。若否,则说明系统先前未出现过类似节点故障,并不存在汇总得到的目标异常信息对应的日志功能模块,在这种情况下,可以继续执行步骤S105。
日志功能模块标识信息可以包括功能模块信息、异常信息生成时段信息、故障节点的节点信息等。
S104:生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位。
在检测到目标异常信息携带有日志功能模块标识信息之后,可以生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,从而日志处理层能够根据收集到的目标功能模块日志信息进行节点故障定位。通过分功能模块进行日志收集,仅需对相应的存储集群模块日志信息进行收集,不需要对存储集群全日志信息、存储集群系统信息、存储集群配置信息、历史性能数据等冗余信息进行收集,较大地提高了日志收集效率,缩短了故障定位时长,实现对节点故障的快速排查,较大地降低了由于长时间不能进行故障定位,出现节点宕机、存储信息丢失、系统崩溃等现象的概率。
S105:向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。
在检测到目标异常信息未携带日志功能模块标识信息之后,可以向日志处理层发送全量日志收集指令,从而日志处理层能够根据收集到的全量日志信息进行节点故障定位。
应用本发明实施例所提供的方法,当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;检测目标异常信息是否携带有日志功能模块标识信息;若是,则生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;若否,则向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。通过利用inotify进程服务对异常信息记录文件进行监测,当确定生成的目标异常信息携带日志功能模块标识信息时,日志处理层直接收集目标功能模块日志信息,不需要收集全部日志,较大地提高了日志收集效率,缩短了故障定位时长,实现对节点故障的快速排查,降低了对系统运行的影响,降低了成本。
需要说明的是,基于上述实施例一,本发明实施例还提供了相应的改进方案。在后续实施例中涉及与上述实施例一中相同步骤或相应步骤之间可相互参考,相应的有益效果也可相互参照,在下文的改进实施例中不再一一赘述。
实施例二:
参见图2,图2为本发明实施例中节点故障定位方法的另一种实施流程图,该方法可以包括以下步骤:
S201:当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件。
S202:对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息。
S203:检测目标异常信息是否携带有日志功能模块标识信息,若是,则执行步骤S204,若否,则执行步骤S208。
S204:根据日志功能模块标识信息确定目标异常信息对应的目标功能模块、目标异常信息生成时段、以及目标节点信息。
日志功能模块标识信息可以包含目标功能模块、目标异常信息生成时段、以及目标节点信息,在检测到目标异常信息携带有日志功能模块标识信息之后,可以根据日志功能模块标识信息确定目标异常信息对应的目标功能模块、目标异常信息生成时段、以及目标节点信息,从而定位到是哪一节点的哪一功能模块在哪一特定时段出现了异常。
S205:根据目标功能模块、目标异常信息生成时段、以及目标节点信息生成目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位。
在得到目标异常信息对应的目标功能模块、目标异常信息生成时段、以及目标节点信息之后,可以根据目标功能模块、目标异常信息生成时段、以及目标节点信息生成目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,从而日志处理层能够快速收集目标节点中目标功能模块对应的日志集中目标异常信息生成时段的日志信息,目标功能模块日志信息,根据收集到的目标功能模块日志信息进行节点故障定位。
S206:按照预设的问题上报周期向目标终端发送邮件提醒信息。
对于携带有日志功能模块标识信息的目标异常信息,由于系统先前对其进行过相应总结,其问题级别大都比较低。可以预先设置对携带有日志功能模块标识信息的目标异常信息进行问题上报的周期,在监测到异常信息记录文件被修改,且通过对修改后异常信息记录文件解析得到目标异常信息,并确定目标异常信息携带有日志功能模块标识信息之后,可以按照预设的问题上报周期向目标终端发送邮件提醒信息。
需要说明的是,问题上报周期可以根据实际情况进行设定和调整,本发明实施例对此不做限定。
S207:向日志处理层发送日志压缩上传指令,以使日志处理层将收集到的目标功能模块日志信息进行压缩处理,并将压缩后日志信息上传至ftp服务器。
在收集到目标功能模块日志信息之后,向日志处理层发送日志压缩上传指令,以使日志处理层将收集到的目标功能模块日志信息进行压缩处理,并将压缩后日志信息上传至ftp服务器。如可以利用zip数据文件压缩格式、tar压缩打包工具等进行日志压缩。从而使得系统维护人员基于上传的日志信息对出现过的节点故障进行进一步地总结。
S208:向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。
S209:向目标终端发送紧急邮件警告信息,并向目标终端发送异常信息弹窗指令,以使目标终端对目标异常信息进行界面弹窗显示。
在监测到异常信息记录文件被修改,且通过对修改后异常信息记录文件解析得到目标异常信息,并确定目标异常信息未携带日志功能模块标识信息之后,说明当前问题比较紧急,可以目标终端发送紧急邮件警告信息,并可以向目标终端发送异常信息弹窗指令,从而目标终端对目标异常信息进行界面弹窗显示,以对及时通知相应人员进行系统维护。
S210:向日志处理层发送日志压缩上传指令,以使日志处理层将收集到的全量日志信息进行压缩处理,并将压缩后日志信息上传至ftp服务器。
在收集到全量日志信息之后,可以向日志处理层发送日志压缩上传指令,以使日志处理层将收集到的全量日志信息进行压缩处理,并将压缩后日志信息上传至ftp服务器。使得系统维护人员基于记录的全量日志信息进行节点故障总结,以便后续基于总结得到的经验数据进行快速节点故障定位。
在本发明的一种具体实施方式中,该方法还可以包括以下步骤:
当检测到inotify进程服务失效时,通过图形用户界面查看是否异常信息记录文件是否存在修改。
为应对inotify进程被杀死,导致inotify进程服务失效的情况,可以预先设置图形用户界面(GUI,Graphical User Interface),当检测到inotify进程服务失效时,通过图形用户界面查看是否异常信息记录文件是否存在修改,从而进一步保证对节点故障进行及时定位。
相应于上面的方法实施例,本发明实施例还提供了一种节点故障定位装置,下文描述的节点故障定位装置与上文描述的节点故障定位方法可相互对应参照。
参见图3,图3为本发明实施例中一种节点故障定位装置的结构框图,该装置可以包括:
文件获取单元31,用于当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;
异常信息获得单元32,用于对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;
标识信息检测单元33,用于检测目标异常信息是否携带有日志功能模块标识信息;
第一节点故障定位单元34,用于当检测到目标异常信息携带有日志功能模块标识信息时,生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;
第二节点故障定位单元35,用于当检测到目标异常信息未携带日志功能模块标识信息时,向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。
应用本发明实施例所提供的装置,当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;检测目标异常信息是否携带有日志功能模块标识信息;若是,则生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;若否,则向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。通过利用inotify进程服务对异常信息记录文件进行监测,当确定生成的目标异常信息携带日志功能模块标识信息时,日志处理层直接收集目标功能模块日志信息,不需要收集全部日志,较大地提高了日志收集效率,缩短了故障定位时长,实现对节点故障的快速排查,降低了对系统运行的影响,降低了成本。
在本发明的一种具体实施方式中,第一节点故障定位单元34包括:
标识信息解析子单元,用于根据日志功能模块标识信息确定目标异常信息对应的目标功能模块、目标异常信息生成时段、以及目标节点信息;
第一节点故障定位子单元,用于根据目标功能模块、目标异常信息生成时段、以及目标节点信息生成目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位。
在本发明的一种具体实施方式中,该装置还可以包括:
邮件发送单元,用于在确定目标异常信息携带有日志功能模块标识信息之后,按照预设的问题上报周期向目标终端发送邮件提醒信息。
在本发明的一种具体实施方式中,邮件发送单元,还用于在确定目标异常信息未携带日志功能模块标识信息之后,向目标终端发送紧急邮件警告信息;
该装置还可以包括:
弹窗显示单元,用于在确定目标异常信息未携带日志功能模块标识信息之后,向目标终端发送异常信息弹窗指令,以使目标终端对目标异常信息进行界面弹窗显示。
在本发明的一种具体实施方式中,该装置还可以包括:
日志上传单元,用于向日志处理层发送日志上传指令,以使日志处理层将收集到的目标功能模块日志信息或全量日志信息上传至ftp服务器。
在本发明的一种具体实施方式中,日志上传单元具体为向日志处理层发送日志压缩上传指令,以使日志处理层将收集到的目标功能模块日志信息或全量日志信息进行压缩处理,并将压缩后日志信息上传至ftp服务器的单元。
在本发明的一种具体实施方式中,该装置还可以包括:
文件查看单元,用于当检测到inotify进程服务失效时,通过图形用户界面查看是否异常信息记录文件是否存在修改。
相应于上面的方法实施例,参见图4,图4为本发明所提供的节点故障定位设备的示意图,该设备可以包括:
存储器41,用于存储计算机程序;
处理器42,用于执行上述存储器41存储的计算机程序时可实现如下步骤:
当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;检测目标异常信息是否携带有日志功能模块标识信息;若是,则生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;若否,则向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。
对于本发明提供的设备的介绍请参照上述方法实施例,本发明在此不做赘述。
相应于上面的方法实施例,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;对修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;检测目标异常信息是否携带有日志功能模块标识信息;若是,则生成与日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送目标功能模块日志收集指令,以使日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;若否,则向日志处理层发送全量日志收集指令,以使日志处理层根据收集到的全量日志信息进行节点故障定位。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
对于本发明提供的计算机可读存储介质的介绍请参照上述方法实施例,本发明在此不做赘述。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置、设备及计算机可读存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

Claims (10)

1.一种节点故障定位方法,其特征在于,包括:
当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;
对所述修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;
检测所述目标异常信息是否携带有日志功能模块标识信息;
若是,则生成与所述日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;
若否,则向所述日志处理层发送全量日志收集指令,以使所述日志处理层根据收集到的全量日志信息进行节点故障定位。
2.根据权利要求1所述的节点故障定位方法,其特征在于,生成与所述日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位,包括:
根据所述日志功能模块标识信息确定所述目标异常信息对应的目标功能模块、目标异常信息生成时段、以及目标节点信息;
根据所述目标功能模块、所述目标异常信息生成时段、以及所述目标节点信息生成所述目标功能模块日志收集指令,并向所述日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位。
3.根据权利要求2所述的节点故障定位方法,其特征在于,在确定所述目标异常信息携带有日志功能模块标识信息之后,还包括:
按照预设的问题上报周期向目标终端发送邮件提醒信息。
4.根据权利要求3所述的节点故障定位方法,其特征在于,在确定所述目标异常信息未携带日志功能模块标识信息之后,还包括:
向所述目标终端发送紧急邮件警告信息,并向所述目标终端发送异常信息弹窗指令,以使所述目标终端对所述目标异常信息进行界面弹窗显示。
5.根据权利要求1至4任一项所述的节点故障定位方法,其特征在于,还包括:
向所述日志处理层发送日志上传指令,以使所述日志处理层将收集到的所述目标功能模块日志信息或所述全量日志信息上传至ftp服务器。
6.根据权利要求5所述的节点故障定位方法,其特征在于,向所述日志处理层发送日志上传指令,以使所述日志处理层将收集到的所述目标功能模块日志信息或所述全量日志信息上传至ftp服务器,包括:
向所述日志处理层发送日志压缩上传指令,以使所述日志处理层将收集到的所述目标功能模块日志信息或所述全量日志信息进行压缩处理,并将压缩后日志信息上传至所述ftp服务器。
7.根据权利要求1所述的节点故障定位方法,其特征在于,还包括:
当检测到inotify进程服务失效时,通过图形用户界面查看是否所述异常信息记录文件是否存在修改。
8.一种节点故障定位装置,其特征在于,包括:
文件获取单元,用于当通过inotify进程服务监测到异常信息记录文件存在修改动作时,获取修改后异常信息记录文件;
异常信息获得单元,用于对所述修改后异常信息记录文件进行解析,得到当次生成的目标异常信息;
标识信息检测单元,用于检测所述目标异常信息是否携带有日志功能模块标识信息;
第一节点故障定位单元,用于当检测到所述目标异常信息携带有日志功能模块标识信息时,生成与所述日志功能模块标识信息对应的目标功能模块日志收集指令,并向日志处理层发送所述目标功能模块日志收集指令,以使所述日志处理层根据收集到的目标功能模块日志信息进行节点故障定位;
第二节点故障定位单元,用于当检测到所述目标异常信息未携带日志功能模块标识信息时,向所述日志处理层发送全量日志收集指令,以使所述日志处理层根据收集到的全量日志信息进行节点故障定位。
9.一种节点故障定位设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述节点故障定位方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述节点故障定位方法的步骤。
CN201911385170.5A 2019-12-28 2019-12-28 节点故障定位方法、装置、设备及计算机可读存储介质 Withdrawn CN111176945A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911385170.5A CN111176945A (zh) 2019-12-28 2019-12-28 节点故障定位方法、装置、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911385170.5A CN111176945A (zh) 2019-12-28 2019-12-28 节点故障定位方法、装置、设备及计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN111176945A true CN111176945A (zh) 2020-05-19

Family

ID=70650490

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911385170.5A Withdrawn CN111176945A (zh) 2019-12-28 2019-12-28 节点故障定位方法、装置、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN111176945A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291805A (zh) * 2020-10-29 2021-01-29 浪潮电子信息产业股份有限公司 一种omc系统监控方法、装置、设备及可读存储介质
CN113656252A (zh) * 2021-08-24 2021-11-16 北京百度网讯科技有限公司 故障定位方法、装置、电子设备以及存储介质
CN113660107A (zh) * 2021-06-29 2021-11-16 广东电网有限责任公司广州供电局 故障定位方法、系统、计算机设备和存储介质
CN114567573A (zh) * 2022-03-10 2022-05-31 平安普惠企业管理有限公司 异常数据的定位方法、装置、服务器及存储介质
WO2022148300A1 (zh) * 2021-01-07 2022-07-14 苏州浪潮智能科技有限公司 一种bios问题定位方法、装置和计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017201897A1 (zh) * 2016-05-27 2017-11-30 深圳Tcl数字技术有限公司 智能电视故障信息收集方法及装置
CN108052412A (zh) * 2017-12-28 2018-05-18 努比亚技术有限公司 重启故障定位方法、移动终端及计算机可读存储介质
WO2018098972A1 (zh) * 2016-11-30 2018-06-07 华为技术有限公司 一种日志恢复方法、存储装置和存储节点
CN108683562A (zh) * 2018-05-18 2018-10-19 深圳壹账通智能科技有限公司 异常检测定位方法、装置、计算机设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017201897A1 (zh) * 2016-05-27 2017-11-30 深圳Tcl数字技术有限公司 智能电视故障信息收集方法及装置
WO2018098972A1 (zh) * 2016-11-30 2018-06-07 华为技术有限公司 一种日志恢复方法、存储装置和存储节点
CN108052412A (zh) * 2017-12-28 2018-05-18 努比亚技术有限公司 重启故障定位方法、移动终端及计算机可读存储介质
CN108683562A (zh) * 2018-05-18 2018-10-19 深圳壹账通智能科技有限公司 异常检测定位方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
王宇飞等: "基于OSGi的分布式系统集中日志管理方案", 《计算机系统应用》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112291805A (zh) * 2020-10-29 2021-01-29 浪潮电子信息产业股份有限公司 一种omc系统监控方法、装置、设备及可读存储介质
CN112291805B (zh) * 2020-10-29 2023-11-07 浪潮电子信息产业股份有限公司 一种omc系统监控方法、装置、设备及可读存储介质
WO2022148300A1 (zh) * 2021-01-07 2022-07-14 苏州浪潮智能科技有限公司 一种bios问题定位方法、装置和计算机可读存储介质
CN113660107A (zh) * 2021-06-29 2021-11-16 广东电网有限责任公司广州供电局 故障定位方法、系统、计算机设备和存储介质
CN113660107B (zh) * 2021-06-29 2024-04-19 广东电网有限责任公司广州供电局 故障定位方法、系统、计算机设备和存储介质
CN113656252A (zh) * 2021-08-24 2021-11-16 北京百度网讯科技有限公司 故障定位方法、装置、电子设备以及存储介质
CN113656252B (zh) * 2021-08-24 2023-07-25 北京百度网讯科技有限公司 故障定位方法、装置、电子设备以及存储介质
CN114567573A (zh) * 2022-03-10 2022-05-31 平安普惠企业管理有限公司 异常数据的定位方法、装置、服务器及存储介质
CN114567573B (zh) * 2022-03-10 2023-12-15 贵州中融信通科技有限公司 异常数据的定位方法、装置、服务器及存储介质

Similar Documents

Publication Publication Date Title
CN111176945A (zh) 节点故障定位方法、装置、设备及计算机可读存储介质
KR101856543B1 (ko) 인공지능 기반의 장애 예측 시스템
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
CN104268061B (zh) 一种适用于虚拟机的存储状态监控方法
CN109034423B (zh) 一种故障预警判定的方法、装置、设备及存储介质
CN105589795A (zh) 基于预测模型的磁盘故障预测方法及装置
CN112788022B (zh) 流量异常检测方法、装置、存储介质及处理器
CN107065720A (zh) 智能电机故障录波预警系统
CN105607973B (zh) 一种虚拟机系统中设备故障处理的方法、装置及系统
CN102609350A (zh) 一种服务器内存故障报警方法
CN110784352B (zh) 一种基于Oracle Goldengate的数据同步监控告警方法及装置
CN112799909A (zh) 一种服务器自动化管理系统及方法
CN107342880B (zh) 异常信息采集方法及系统
CN116627358B (zh) 一种基于大数据的计算机外接设备检测系统及方法
CN104238540A (zh) 用于系统异常诊断的信息采集方法、装置及医疗设备
CN117331790A (zh) 一种用于数据中心的机房故障检测方法及装置
CN117220917A (zh) 一种基于云计算的网络实时监控方法
CN112444697A (zh) 一种电力线路信息监测系统及方法
CN111060149A (zh) 一种基于电力设备的数据监测方法及装置
CN113626236B (zh) 一种分布式文件系统的故障诊断方法、装置、设备及介质
CN112860527A (zh) 应用服务器的故障监测方法及装置
CN112134760A (zh) 链路状态监控方法、装置、设备及计算机可读存储介质
CN105827447A (zh) 一种业务报警方法和装置
JP4396509B2 (ja) メモリエラー管理システム
CN206930947U (zh) 智能电机故障录波预警系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20200519