CN109885505A - 一种故障定位的方法、系统及相关组件 - Google Patents

一种故障定位的方法、系统及相关组件 Download PDF

Info

Publication number
CN109885505A
CN109885505A CN201910217427.XA CN201910217427A CN109885505A CN 109885505 A CN109885505 A CN 109885505A CN 201910217427 A CN201910217427 A CN 201910217427A CN 109885505 A CN109885505 A CN 109885505A
Authority
CN
China
Prior art keywords
fault location
sentence
information
failure
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910217427.XA
Other languages
English (en)
Inventor
王启勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Power Commercial Systems Co Ltd
Original Assignee
Inspur Power Commercial Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Power Commercial Systems Co Ltd filed Critical Inspur Power Commercial Systems Co Ltd
Priority to CN201910217427.XA priority Critical patent/CN109885505A/zh
Publication of CN109885505A publication Critical patent/CN109885505A/zh
Pending legal-status Critical Current

Links

Abstract

本申请公开了一种故障定位的方法,所述方法包括当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。本方法能够实现高效的故障定位,提高服务器故障的处理效率。本申请还公开了一种故障定位的系统、一种计算机可读存储介质及一种电子设备,具有以上有益效果。

Description

一种故障定位的方法、系统及相关组件
技术领域
本发明涉及服务器维护技术领域,特别涉及一种故障定位的方法、系统、一种计算机可读存储介质及一种电子设备。
背景技术
服务器BMC软件相关工作主要包括功能开发和维护,其中维护工作往往占据相当重要的地位。当产品交付以后,可能会存在服务器软件故障,因此高效地处理故障、更快地发布版本,才能在服务器市场中更好地站稳脚跟。
在服务器BMC软件故障处理的相关技术中,对于已知故障和类似故障需要维护人员进行人工排查和定位,大大增加了维护人员的工作量,影响故障处理的效率。
因此,如何实现高效的故障定位,提高服务器故障的处理效率是本领域技术人员目前需要解决的技术问题。
发明内容
本申请的目的是提供一种故障定位的方法、系统、一种计算机可读存储介质及一种电子设备,能够实现高效的故障定位,提高服务器故障的处理效率。
为解决上述技术问题,本申请提供一种故障定位的方法,该方法包括:
当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;
将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;
将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
可选的,根据所述故障定位指令获取目标服务器的日志信息包括:
根据所述故障定位指令通过打包下载的方式获取所述目标服务器的日志信息;其中,所述日志信息包括内核态信息和用户态信息。
可选的,将所述日志信息与故障库中的故障语句进行语句比对得到比对结果包括:
确定所述日志信息中的目标字段;
将所述目标字段与所述故障库中的故障语句进行语句比对得到比对结果。
可选的,根据所述目标故障语句执行故障定位操作得到故障定位信息包括:
查询故障定位表中与所述目标故障语句对应的故障定位信息;其中,所述故障定位表中存储有所有所述故障语句与故障定位信息的对应关系。
可选的,在根据所述目标故障语句执行故障定位操作得到故障定位信息之后,还包括:
将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面。
可选的,在将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面之前,还包括:
对重复的故障定位信息执行去重操作。
本申请还提供了一种故障定位的系统,该系统包括:
信息获取模块,用于当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;
比对模块,用于将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;
定位模块,用于将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
可选的,所述信息获取模块具体为当接收到故障定位指令时,根据所述故障定位指令通过打包下载的方式获取目标服务器的日志信息的模块;其中,所述日志信息包括内核态信息和用户态信息。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序执行时实现上述故障定位的方法执行的步骤。
本申请还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时实现上述故障定位的方法执行的步骤。
本申请提供了一种故障定位的方法,包括当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
本申请通过将目标服务器日志信息与故障库中的故障语句进行文字对比,将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句。可以确定日志信息中存在的已知故障语句或与已知故障语句相类似的语句进而确定目标服务器实际存在的故障,从而实现对目标服务器中的已知故障或类似故障进行故障定位。本实施例能够实现高效的故障定位,提高服务器故障的处理效率。本申请同时还提供了一种故障定位的系统、一种计算机可读存储介质和一种电子设备,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例所提供的一种故障定位的方法的流程图;
图2为本申请实施例所提供的另一种故障定位的方法的流程图;
图3为本申请实施例所提供的一种故障定位的系统的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
下面请参见图1,图1为本申请实施例所提供的一种故障定位的方法的流程图。
具体步骤可以包括:
S101:当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;
其中,本实施例的执行主体可以为BMC(基板管理控制器,Baseboard ManagementController)软件,当接收到上层应用下发的故障定位指令时,执行本实施例的相关操作。该故障定位指令可以是当检测到服务器的某些服务无法正常运行时生成的,也可以是维护人员主动下发的,此处不进行具体的限定。
在接收到故障定位指令后,可以根据故障定位指令获取能够分析目标服务器存在哪些故障的日志信息。具体的,本步骤可以通过解析故障定位指令得到目标服务器的设备ID以及需要获取的日志信息对应的时间信息,进而根据设备ID确定目标服务器,根据时间信息获取目标服务器在时间信息对应的时间段内的日志信息。本实施例不限定目标服务器的数量,也不对日志信息所对应的时间段长短进行限定。
在获取日志信息的方式可以为对多个故障相关的文件进行一一下载,包括dmesg信息、proc信息、info信息、error信息、critical信息、debug信息、sel信息、net信息等。当然,作为一种可行的实施方式,可以通过打包下载的方式实现并行采集目标服务器的日志信息;其中,所述日志信息可以包括内核态信息和用户态信息。
S102:将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;
其中,本步骤建立在已经获取了日志信息的基础上,本实施例默认故障库中存在多个故障语句,可以根据实际维护过程中检测到的故障语句构建故障库。
本步骤可以将日志信息中的每一语句与故障库中的每一故障语句进行语句对比,得到比对结果。比对结果可以包括日志信息中每一语句与故障库中的每一故障语句比对后得到的相似度。
可以理解的是,故障库可以根据实际应用中的故障检测情况进行更新,每当发现新的故障后,可以将新的已知故障添加至故障库中;当存在故障误检的情况时,可以将故障误检对应的故障语句从故障库中剔除。
S103:将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
其中,在对日志信息与故障库中的故障语句进行语句比对之后,可以确定日志信息中每一语句与故障库中的故障语句的相似度,本步骤将语句相似度大于预设值的故障语句作为目标故障语句。当日志信息中存在某一语句与故障库中的一条故障语句完全一致时,可以判定目标故障库存在该故障语句对应的故障。当日志信息中存在某一语句与故障库中的一条故障语句不完全一致,但语句相似度大于预设值时,可以判定目标故障库存在与该故障语句对应故障相类似的故障。本步骤日志信息中某一语句可以存在多条与之对应的目标故障语句,作为一种可行的实施方式,可以将语句相似度最高的一条目标故障语句作为优选目标故障语句,以便利用优选目标故障语句执行故障定位操作得到故障定位信息。
本实施例通过将目标服务器日志信息与故障库中的故障语句进行文字对比,将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句。可以确定日志信息中存在的已知故障语句或与已知故障语句相类似的语句进而确定目标服务器实际存在的故障,从而实现对目标服务器中的已知故障或类似故障进行故障定位。本实施例能够实现高效的故障定位,提高服务器故障的处理效率。
下面请参见图2,图2为本申请实施例所提供的另一种故障定位的方法的流程图;
具体步骤可以包括:
S201:当接收到故障定位指令时,根据所述故障定位指令通过打包下载的方式获取所述目标服务器的日志信息。
其中,所述日志信息包括内核态信息和用户态信息。本步骤可以基于BMC软件的故障信息一键采集功能实现,主要包括两步:采集日志、导出日志。整个操作仅需不到一分钟就能完成。但是采集的日志信息却非常全面,主要涵盖了用户态和内核态的相关信息。可由于服务器软件故障一般暴露在外场、产线,并且外场和产线不会一直长时间的保存故障环境供软件人员调试,所以采用上述方法可以在短时间内采集完善的故障信息。
S202:确定所述日志信息中的目标字段。
其中,目标字段为日志信息中用于描述故障的关键语句,日志信息中存在特定的用于描述故障的字段,即目标字段。
S203:将所述目标字段与所述故障库中的故障语句进行语句比对得到比对结果。
S204:将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句。
S205:查询故障定位表中与所述目标故障语句对应的故障定位信息。
其中,所述故障定位表中存储有所有所述故障语句与故障定位信息的对应关系。
S206:对重复的故障定位信息执行去重操作。
S207:将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面。
上述实施例,针对服务器BMC软件的维护问题采用一键日志收集以及故障筛查自定位的方法,能够快速收集日志信息,若日志信息中的目标字段是故障库的已知问题可以实现故障自定位。本实施例能够减少软件人员的大量重复性工作,提高故障处理的效率。
请参见图3,图3为本申请实施例所提供的一种故障定位的系统的结构示意图;
该系统可以包括:
信息获取模块100,用于当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;
比对模块200,用于将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;
定位模块300,用于将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
本实施例通过将目标服务器日志信息与故障库中的故障语句进行文字对比,将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句。可以确定日志信息中存在的已知故障语句或与已知故障语句相类似的语句进而确定目标服务器实际存在的故障,从而实现对目标服务器中的已知故障或类似故障进行故障定位。本实施例能够实现高效的故障定位,提高服务器故障的处理效率。
进一步的,所述信息获取模块100具体为当接收到故障定位指令时,根据所述故障定位指令通过打包下载的方式获取目标服务器的日志信息的模块;其中,所述日志信息包括内核态信息和用户态信息。
进一步的,比对模块200包括:
字段确定单元,用于确定所述日志信息中的目标字段;
语句比对单元,用于将所述目标字段与所述故障库中的故障语句进行语句比对得到比对结果。
进一步的,定位模块300包括:
目标故障语句选择单元,用于将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句
定位信息查询单元,用于查询故障定位表中与所述目标故障语句对应的故障定位信息;其中,所述故障定位表中存储有所有所述故障语句与故障定位信息的对应关系。
进一步的,该系统还包括:
结果上传模块,用于在根据所述目标故障语句执行故障定位操作得到故障定位信息之后,将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面。
进一步的,该系统还包括:
去重模块,用于在将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面之前,对重复的故障定位信息执行去重操作。
由于系统部分的实施例与方法部分的实施例相互对应,因此系统部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
本申请还提供了一种计算机可读存储介质,其上存有计算机程序,该计算机程序被执行时可以实现上述实施例所提供的步骤。该存储介质可以包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请还提供了一种电子设备,可以包括存储器和处理器,所述存储器中存有计算机程序,所述处理器调用所述存储器中的计算机程序时,可以实现上述实施例所提供的步骤。当然所述电子设备还可以包括各种网络接口,电源等组件。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

Claims (10)

1.一种故障定位的方法,其特征在于,包括:
当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;
将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;
将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
2.根据权利要求1所述方法,其特征在于,根据所述故障定位指令获取目标服务器的日志信息包括:
根据所述故障定位指令通过打包下载的方式获取所述目标服务器的日志信息;其中,所述日志信息包括内核态信息和用户态信息。
3.根据权利要求1所述方法,其特征在于,将所述日志信息与故障库中的故障语句进行语句比对得到比对结果包括:
确定所述日志信息中的目标字段;
将所述目标字段与所述故障库中的故障语句进行语句比对得到比对结果。
4.根据权利要求3所述方法,其特征在于,根据所述目标故障语句执行故障定位操作得到故障定位信息包括:
查询故障定位表中与所述目标故障语句对应的故障定位信息;其中,所述故障定位表中存储有所有所述故障语句与故障定位信息的对应关系。
5.根据权利要求1至4任一项所述方法,其特征在于,在根据所述目标故障语句执行故障定位操作得到故障定位信息之后,还包括:
将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面。
6.根据权利要求5所述方法,其特征在于,在将所述故障定位信息和所述故障定位信息对应的处理方案上传至用户界面之前,还包括:
对重复的故障定位信息执行去重操作。
7.一种故障定位的系统,其特征在于,包括:
信息获取模块,用于当接收到故障定位指令时,根据所述故障定位指令获取目标服务器的日志信息;
比对模块,用于将所述日志信息与故障库中的故障语句进行语句比对得到比对结果;
定位模块,用于将所述比对结果中语句相似度大于预设值的故障语句作为目标故障语句,并根据所述目标故障语句执行故障定位操作得到故障定位信息。
8.根据权利要求7所述系统,其特征在于,所述信息获取模块具体为当接收到故障定位指令时,根据所述故障定位指令通过打包下载的方式获取目标服务器的日志信息的模块;其中,所述日志信息包括内核态信息和用户态信息。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述故障定位的方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至6任一项所述故障定位的方法的步骤。
CN201910217427.XA 2019-03-21 2019-03-21 一种故障定位的方法、系统及相关组件 Pending CN109885505A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910217427.XA CN109885505A (zh) 2019-03-21 2019-03-21 一种故障定位的方法、系统及相关组件

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910217427.XA CN109885505A (zh) 2019-03-21 2019-03-21 一种故障定位的方法、系统及相关组件

Publications (1)

Publication Number Publication Date
CN109885505A true CN109885505A (zh) 2019-06-14

Family

ID=66933458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910217427.XA Pending CN109885505A (zh) 2019-03-21 2019-03-21 一种故障定位的方法、系统及相关组件

Country Status (1)

Country Link
CN (1) CN109885505A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612701A (zh) * 2020-12-24 2021-04-06 北京浪潮数据技术有限公司 一种程序故障定位方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014196129A1 (ja) * 2013-06-03 2014-12-11 日本電気株式会社 障害分析装置、障害分析方法、および、記録媒体
CN108880847A (zh) * 2017-05-16 2018-11-23 北京微影时代科技有限公司 一种定位故障的方法及装置
CN109086155A (zh) * 2018-07-27 2018-12-25 郑州云海信息技术有限公司 服务器故障定位方法、装置、设备及计算机可读存储介质
CN109388623A (zh) * 2018-11-02 2019-02-26 郑州云海信息技术有限公司 一种设备故障检测的方法、系统及相关组件

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014196129A1 (ja) * 2013-06-03 2014-12-11 日本電気株式会社 障害分析装置、障害分析方法、および、記録媒体
CN108880847A (zh) * 2017-05-16 2018-11-23 北京微影时代科技有限公司 一种定位故障的方法及装置
CN109086155A (zh) * 2018-07-27 2018-12-25 郑州云海信息技术有限公司 服务器故障定位方法、装置、设备及计算机可读存储介质
CN109388623A (zh) * 2018-11-02 2019-02-26 郑州云海信息技术有限公司 一种设备故障检测的方法、系统及相关组件

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612701A (zh) * 2020-12-24 2021-04-06 北京浪潮数据技术有限公司 一种程序故障定位方法、装置、设备及可读存储介质
CN112612701B (zh) * 2020-12-24 2024-02-23 北京浪潮数据技术有限公司 一种程序故障定位方法、装置、设备及可读存储介质

Similar Documents

Publication Publication Date Title
CN110928772B (zh) 一种测试方法及装置
US9781020B2 (en) Deploying applications in a networked computing environment
WO2019006654A1 (zh) 金融自助设备维修派单生成方法、手持终端及电子设备
US10177984B2 (en) Isolation of problems in a virtual environment
US9122784B2 (en) Isolation of problems in a virtual environment
JPWO2004061681A1 (ja) 運用管理方法および運用管理サーバ
US20090006493A1 (en) Method For Enabling Traceability And Recovery From Errors During Migration Of Software Applications
CN106663041B (zh) 从系统故障恢复基于云的服务的易用性的方法及装置
US20180004797A1 (en) Application resiliency management using a database driver
US10831587B2 (en) Determination of cause of error state of elements in a computing environment based on an element's number of impacted elements and the number in an error state
CN109271172A (zh) 一种swarm集群的宿主机性能扩展方法及装置
US10089167B2 (en) Log file reduction according to problem-space network topology
CN104866296A (zh) 数据处理方法和装置
EP3202091B1 (en) Operation of data network
CN113672427A (zh) 基于rpa及ai的异常处理方法、装置、设备及介质
CN111865673A (zh) 一种自动化故障管理方法、装置及系统
JP2010009411A (ja) 仮想化環境運用支援システム及び仮想環境運用支援プログラム
CN105468511A (zh) 网页脚本错误定位方法及装置
CN109885505A (zh) 一种故障定位的方法、系统及相关组件
CN104539449A (zh) 一种故障信息处理方法与相关装置
CN110764949A (zh) 硬盘更换方法、硬盘更换装置、硬盘更换设备及存储介质
JP2023044720A (ja) クラッシュしたアプリケーションを修復するためのコンピュータ実装方法、コンピュータプログラム製品、およびリモートコンピュータサーバ(クラッシュしたプロセスのリモート修復)
CN114445162A (zh) 反向追溯企业发票系统配置的方法
JP2014109975A (ja) 性能分析装置、性能分析方法及び性能分析プログラム
CN112306862A (zh) 一种前端自动化测试系统及方法、存储介质、计算设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190614

RJ01 Rejection of invention patent application after publication