CN113760666A - 系统异常的处理方法、设备及存储介质 - Google Patents

系统异常的处理方法、设备及存储介质 Download PDF

Info

Publication number
CN113760666A
CN113760666A CN202110108806.2A CN202110108806A CN113760666A CN 113760666 A CN113760666 A CN 113760666A CN 202110108806 A CN202110108806 A CN 202110108806A CN 113760666 A CN113760666 A CN 113760666A
Authority
CN
China
Prior art keywords
abnormal
preset
alternative
target system
solution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110108806.2A
Other languages
English (en)
Inventor
田彦博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110108806.2A priority Critical patent/CN113760666A/zh
Publication of CN113760666A publication Critical patent/CN113760666A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种系统异常的处理方法、设备及存储介质,通过获取针对目标系统异常状况的报警信息,并根据报警信息获取目标系统异常状况相关的检索关键词;根据检索关键词以及预设的异常知识库,获取目标系统异常状况对应的备选解决方案;从异常知识库获取各备选解决方案的历史使用时间信息和频次信息,根据各备选解决方案的历史使用时间信息和频次信息,对各备选解决方案进行排序,并输出排序后的备选解决方案。本发明实施例可根据报警信息自动给出备选解决方案,且对备选解决方案进行排序,以指导技术人员按照排序尝试备选解决方案,使得系统异常状况快速得到解决,而无需依赖技术人员的经验。

Description

系统异常的处理方法、设备及存储介质
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种系统异常的处理方法、设备及存储介质。
背景技术
随着互联网应用逐步深入到生活,为了满足越来越多用户使用互联网应用的需求,几乎所有互联网公司都采用了大量的服务器作为服务的载体,通过网络设备进行互联互通。服务器及网络相关设备通常部署的较为分散,一旦服务器中的服务、服务器本身、网络设备出现故障,故障可能长时间得不到解决甚至出现大面积故障,对部分用户造成服务性能极差甚至错误,用户体验极差的情况出现,尤其是一些大型电子商务应用中,由于用户量巨大,在集中促销时面对海量用户请求,一旦出现长时间故障,会严重影响用户体验,大大降低促销这种营销方式的效果,浪费运营费用。
现有技术中,针对系统异常情况确定解决方案通常采用下面以下方式:方式一,通过预案方式提前给出系统可能出现的异常情况以及对应的预设解决方案,后续通过检索方式检索到备选解决方案后再逐个尝试,直至系统异常情况最终解决;方式二,则需要技术人员借助外部系统如日志系统、APM(Application Performance Management,应用性能管理)系统、硬件监控系统,依靠经验逐一查找系统异常情况的问题根源,并有技术人员给出最终解决方案。
现有技术的系统异常情况的处理方法中,严重依赖相关技术人员的经验,对于经验不够丰富或者无经验丰富的人员可能导致系统异常状态无法快速解决。
发明内容
本发明实施例提供一种系统异常的处理方法、设备及存储介质,用以在系统异常的处理时降低对技术人员经验的依赖,使得系统异常状况能够快速得到解决。
第一方面,本发明实施例提供一种系统异常的处理方法,包括:
获取针对目标系统异常状况的报警信息,并根据所述报警信息获取所述目标系统异常状况相关的检索关键词;
根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,其中所述异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案;
从所述异常知识库获取各所述备选解决方案的历史使用时间信息和频次信息,根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序,并输出排序后的备选解决方案。
第二方面,本发明实施例提供一种系统异常的处理设备包括:
获取模块,用于获取针对目标系统异常状况的报警信息,并根据所述报警信息获取所述目标系统异常状况相关的检索关键词;
检索模块,用于根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,其中所述异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案;
排序模块,用于从所述异常知识库获取各所述备选解决方案的历史使用时间信息和频次信息,根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序;
输出模块,用于输出排序后的备选解决方案。
第三方面,本发明实施例提供一种电子设备,包括:至少一个处理器;以及存储器;
所述存储器存储计算机指令;
所述至少一个处理器执行所述存储器存储的计算机指令,使得所述至少一个处理器执行如第一方面所述的方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机指令,当处理器执行所述计算机指令时,实现如第一方面所述的方法。
第五方面,本发明实施例提供一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如第一方面所述的方法。
本发明实施例提供的系统异常的处理方法、设备及存储介质,通过获取针对目标系统异常状况的报警信息,并根据报警信息获取目标系统异常状况相关的检索关键词;根据检索关键词以及预设的异常知识库,获取目标系统异常状况对应的备选解决方案;从异常知识库获取各备选解决方案的历史使用时间信息和频次信息,根据各备选解决方案的历史使用时间信息和频次信息,对各备选解决方案进行排序,并输出排序后的备选解决方案。本发明实施例可根据报警信息自动给出备选解决方案,且对备选解决方案进行排序,以指导技术人员按照排序尝试备选解决方案,使得系统异常状况快速得到解决,而无需依赖技术人员的经验。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为本发明一实施例提供的系统异常的处理方法的应用场景图;
图2为本发明一实施例提供的系统异常的处理方法的流程图;
图3为本发明另一实施例提供的系统异常的处理方法的流程图;
图4为本发明一实施例提供的系统异常的处理设备的框图;
图5为本发明一实施例提供的执行系统异常的处理方法的电子设备的框图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
针对现有技术的上述技术问题,本发明实施例提供一种自动监控系统异常状况,并在系统出现异常状况后进行报警,并根据报警信息自动给出备选解决方案,且备选解决方案按照特定顺序进行排序,技术人员可直接按照备选解决方案的顺序进行尝试,以实现快速确定最终解决方案,使得系统异常状况快速得到解决,而无需依赖技术人员的经验。
具体的,可预先配置异常知识库,异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案,并且还可记录每一预设解决方案的历史使用时间信息和频次信息;当目标系统出现异常状况时,在获取到目标系统异常状况的报警信息后,根据报警信息获取所述目标系统异常状况相关的检索关键词;然后根据检索关键词在预设的异常知识库中进行检索,得到目标系统异常状况对应的备选解决方案;再根据各备选解决方案的历史使用时间信息和频次信息,对各备选解决方案进行排序,并输出排序后的备选解决方案,提供给技术人员,以使技术人员按照备选解决方案的顺序依次进行尝试,直至确定最终解决方案,使得系统异常状况快速得到解决。
本发明实施例提供的系统异常的处理方法可适用于如图1所示的应用场景,所述应用场景包括数据库101以及服务器102,还可包括显示设备103和/或终端设备104。其中数据库101可用于存储异常知识库,包括多个预设系统异常状况信息以及对应的预设解决方案,并且还可记录每一预设解决方案的历史使用时间信息和频次信息。服务器102用于接收针对目标系统异常状况的报警信息,并根据报警信息获取目标系统异常状况相关的检索关键词;根据检索关键词以及预设的异常知识库,获取目标系统异常状况对应的备选解决方案,其中异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案;从异常知识库获取各备选解决方案的历史使用时间信息和频次信息,根据各备选解决方案的历史使用时间信息和频次信息,对各备选解决方案进行排序,并输出排序后的备选解决方案,例如将排序后的备选解决方案显示于显示设备103或发送给技术人员的终端设备104。
本发明实施例可应用于任意系统异常的处理,例如电子商务平台的系统,其中系统也不限于包括服务器、网络设备等。
本发明实施例提供的数据传输的方法,旨在解决现有技术的如上技术问题。
下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
图2为本发明实施例提供的系统异常的处理方法流程图。本实施例提供了一种系统异常的处理方法,其执行主体为服务器或者其他电子设备,该系统异常的处理方法具体步骤如下:
S201、获取针对目标系统异常状况的报警信息,并根据所述报警信息获取所述目标系统异常状况相关的检索关键词。
在本实施例中,可通过监控系统来监控目标系统,进而在确定目标系统出现异常时进行报警,也即发出针对目标系统异常状况的报警信息,例如,报警信息可以为“【警告】某某系统(如com.jd.xyz)采集点:com.jd.xyz.xyz.query 10:51:00至10:56:00,可用率=92.98%[偏差6.93%],超过5次可用率<99.9%【时间】2020-09-27 10:57:42【类型】方法可用率监控”。
而本实施例的执行主体在获取到针对目标系统异常状况的报警信息后,可根据报警信息获取所述目标系统异常状况相关的检索关键词。
可选的,检索关键词可包括直接从报警信息中获取的第一检索关键词,还可包括从目标系统异常时刻前后预定时间段内目标系统和/或其相关系统异常信息中获取的第二检索关键词。
具体的,在获取第一检索关键词时,可对报警信息进行解析,获取报警唯一标识、报警对应系统中服务的唯一标识、触发报警的配置项、报警阈值、真实报警值等关键词,例如上述举例中的报警信息,对应的第一检索关键词可以为:系统唯一标识-com.jd.xyz,报警对应系统中服务的唯一标识-com.jd.xyz.xyz.query,触发报警的配置项-方法可用率监控,报警阈值-99.9%,真实报警值-92.98%。
而获取第二检索关键词是考虑到目标系统出现异常时在异常时刻前后预定时间段内目标系统和/或其相关系统通常也会表现出来一定的异常,因此本实施例中可根据报警信息,获取目标系统异常时刻前后预定时间段内目标系统和/或其相关系统的状态,例如可从监控系统获取,若预定时间段内目标系统和/或其相关系统出现异常,则获取预定时间段内的目标系统和/或其相关系统的异常信息,并从异常信息提取关键词,确定其为所述第二检索关键词,其中异常信息可以与上述的报警信息类似,同样的,从异常信息提取关键词的过程也可与上述报警信息解析过程类似,此处不再赘述。
S202、根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,其中所述异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案。
在本实施例中,可以预先在异常知识库中录入多个预设系统异常状况信息以及对应的预设解决方案,其中余数解决方案可以为处理异常所使用的固定步骤、可操作的具体步骤形成的文档或者数据。可选的,异常知识库可包括两部分,其中一部分为预案知识库,也即包括开发人员提前给出系统可能出现的异常状况以及对应的预设解决方案,例如,包括但不限于接口名称、报警关联标识、故障原因(网络、调用上游、数据异常等)、以及预设解决方案,可包括不同报警阈值对应的预案操作步骤、不同报警阈值对应的降级步骤等;而另一部分则为应急处理知识库,也即在应用过程中根据真实遇到的系统异常状况所采取的解决方案,随着报警的发生而逐步录入和完善应急处理知识库,其中包括但不限于接口名、报警唯一标识、报警类型(可用率、性能等)、不同报警阈值的具体操作步骤等。
本实施例中在获取到检索关键词后,可基于检索关键词从异常知识库中进行检索,获取目标系统异常状况对应的备选解决方案。例如针对上述示例的系统异常情况的检索关键词,可以从异常知识库中获取到如下三个备选解决方案:1、日志中存在userException,找上游处理;2、服务器JVM进行full GC,导致接口超时;3、上游接口超时,导致可用率将降低。
可选的,在检索关键词包括第一检索关键词和第二检索关键词的情况下,可根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,也即基于第一检索关键词和第二检索关键词从异常知识库中进行检索,获取目标系统异常状况对应的备选解决方案。
更进一步的,在一种可选实施例中,如图3所示,在根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案时,具体可包括:
S2021、所述根据所述第一检索关键词以及预设的异常知识库,获取与所述第一检索关键词匹配的预设解决方案,并将其确定为第一备选解决方案;
S2022、根据所述第二检索关键词,从所述第一备选解决方案中获取与所述第二检索关键词匹配的预设解决方案,并将其确定为最终的所述目标系统异常状况对应的备选解决方案。
在本实施例中,可根据第一检索关键词进行检索,从异常知识库中获取与第一检索关键词匹配的预设解决方案,作为第一备选解决方案;在根据第二检索关键词在第一备选解决方案范围内进行二次检索,将第二检索关键词作为确定最终的备选解决方案的一个辅助判断条件,从而缩小备选解决方案的数量,使得最终筛选出来的备选解决方案为最优的解决方案,解决系统异常的可能性最高。
可选的,本实施例中也可将对第一备选解决方案以与第二检索关键词的匹配程度进行排序,例如将与第二检索关键词最匹配的预设解决方案排在前面。
当然,需要说明的是,若预定时间段内目标系统和/或其相关系统未出现异常,可直接根据第一检索关键词以及预设的异常知识库,获取与所述第一检索关键词匹配的预设解决方案,并将其直接确定为最终的所述目标系统异常状况对应的备选解决方案。
在另一种可选实施例中,在根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案时,具体还可包括:
根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取与所述第一检索关键词以及所述第二检索关键词匹配的预设解决方案,并将其确定为最终的所述目标系统异常状况对应的备选解决方案。
在本实施例中,不需要经过两步检索,而是直接基于第一检索关键词和第二检索关键词进行一次检索,即可得到最终的备选解决方案,简化了检索流程。
S203、从所述异常知识库获取各所述备选解决方案的历史使用时间信息和频次信息,根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序,并输出排序后的备选解决方案。
在本实施例中,为了给出使技术人员在备选解决方案中快速确定最终有效的备选解决方案,可对备选解决方案进行排序,将最优的备选解决方案或者解决系统异常的可能性最高的备选解决方案排在前面,技术人员可优先进行尝试。在排序时考虑的是各备选解决方案的历史使用时间信息和频次信息,历史使用时间越近的、使用频次越高的,则该备选解决方案解决系统异常的可能性越大,因此可基于各备选解决方案的历史使用时间信息和频次信息确定各备选解决方案的顺序。
可选的,本实施例中在根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序时,可对于任一所述备选解决方案,根据所述备选解决方案的历史使用时间信息和频次信息、以及预设的牛顿冷却定律公式,获取所述备选解决方案的权重参数;根据各所述备选解决方案的权重参数对各所述备选解决方案进行排序。
在本实施例中,可基于牛顿冷却定律公式,获取每一备选解决方案的权重参数,其中牛顿冷却定律公式以及权重参数用于表征备选解决方案的热度,解决方案随着使用时间的久远而热度逐步下降,也即权重参数也逐步下降。
具体的,牛顿冷却定律计算公式如下:
Figure BDA0002918515090000081
其中,T表示备选解决方案在预定时间段使用频次所占的权重,也即所述权重参数,t表示当前时间,t0表示历史使用时间,本实施例中可以天为单位,k代表比例系数。
需要说明的是,在获取所述目标系统异常状况对应的备选解决方案时,可根据所述检索关键词获取所述备选解决方案的初始排序,例如可首先根据与第一检索关键词的匹配程度确定排序、或者根据第一检索关键词的关联权重确定排序,然后在根据第二检索关键词对排序进行调整,从而得到初始排序。
进一步的,若从所述异常知识库未获取到各所述备选解决方案的历史使用时间信息和频次信息,则并输出按照所述初始排序进行排序后的所述备选解决方案。
此外,本实施例中还可将根据检索关键词获取备选解决方案的初始排序的方式,与根据历史使用时间信息和频次信息、以及预设的牛顿冷却定律公式的排序方式进行结合。
例如针对上述示例的系统异常情况的第一检索关键词,可以从异常知识库中获取到如下三个备选解决方案:1、日志中存在userException,找上游处理;2、服务器JVM进行full GC,导致接口超时;3、上游接口超时,导致可用率将降低。此时的排序是根据第一检索关键词的关联权重确定的排序。
进一步的,分析异常时刻前后预定时间段内目标系统和/或其相关系统的状态,若目标系统和/或其相关系统存在异常或者满足特定条件,例如存在userException,查询jvm是否存在fullGC,假如日志中无userException,但是存在fullgc,上游超时相应的监控报警,则调整上述备选解决方案的顺序:1、服务器JVM进行full GC,导致接口超时;2、日志中存在userException,找上游处理;3、上游接口超时,导致可用率将降低。
最后,根据牛顿冷却的那个率公式获取备选解决方案的权重参数,进而根据权重参数再次进行排序的调整,例如备选解决方案3在昨天被频繁使用,则对备选解决方案2和3重新进行排序得到最终结果:1、服务器JVM进行full GC,导致接口超时;2、上游接口超时,导致可用率将降低;3、日志中存在userException,找上游处理。进一步的,可将排序后的备选解决方案输出。
本实施例提供的系统异常的处理方法,通过获取针对目标系统异常状况的报警信息,并根据报警信息获取目标系统异常状况相关的检索关键词;根据检索关键词以及预设的异常知识库,获取目标系统异常状况对应的备选解决方案;从异常知识库获取各备选解决方案的历史使用时间信息和频次信息,根据各备选解决方案的历史使用时间信息和频次信息,对各备选解决方案进行排序,并输出排序后的备选解决方案。本实施例可根据报警信息自动给出备选解决方案,且对备选解决方案进行排序,以指导技术人员按照排序尝试备选解决方案,使得系统异常状况快速得到解决,而无需依赖技术人员的经验。
在上述任一实施例的基础上,所述输出排序后的备选解决方案后,还可包括:
接收所述目标系统异常状况被解决后用户输入的最终解决方案的反馈信息;
若所述最终解决方案属于所述备选解决方案,则更新所述异常知识库中所述备选解决方案的历史使用时间信息和频次信息;或者
若所述最终解决方案不属于所述备选解决方案,则将所述最终解决方案增加至所述异常知识库中,并记录其历史使用时间信息和频次信息。
在本实施例中,技术人员可基于备选解决方案进行尝试,其中备选解决方案可能能够解决系统异常状况,也可能不能解决系统异常状况,若不能解决系统异常状况,则需要技术人员采用其他途径确定解决方案,例如根据经验或者咨询专家等。
在目标系统异常状况被解决后,技术人员可将最终解决方案反馈给本实施例的执行主体,进而在接收到用户输入的最终解决方案的反馈信息后,若最终解决方案属于备选解决方案,则可更新异常知识库中该备选解决方案的历史使用时间信息和频次信息;若最终解决方案不属于备选解决方案,则可将最终解决方案增加至异常知识库中,对异常数据库进行补充和完善,并记录该条解决方案的历史使用时间信息和频次信息。
图4为本发明实施例系统异常的处理设备的结构图。本实施例提供的系统异常的处理设备可以执行系统异常的处理方法实施例提供的处理流程,如图4所示,所述系统异常的处理设备400包括获取模块401、检索模块402、排序模块403以及输出模块404。
获取模块401,用于获取针对目标系统异常状况的报警信息,并根据所述报警信息获取所述目标系统异常状况相关的检索关键词;
检索模块402,用于根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,其中所述异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案;
排序模块403,用于从所述异常知识库获取各所述备选解决方案的历史使用时间信息和频次信息,根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序;
输出模块404,用于输出排序后的备选解决方案。
在上述任一实施例的基础上,所述排序模块403在根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序时,用于:
对于任一所述备选解决方案,根据所述备选解决方案的历史使用时间信息和频次信息、以及预设的牛顿冷却定律公式,获取所述备选解决方案的权重参数;
根据各所述备选解决方案的权重参数对各所述备选解决方案进行排序。
在上述任一实施例的基础上,所述检索模块402在获取所述目标系统异常状况对应的备选解决方案时,还用于:
根据所述检索关键词获取所述备选解决方案的初始排序;
所述输出模块404还用于:
若从所述异常知识库未获取到各所述备选解决方案的历史使用时间信息和频次信息,则并输出按照所述初始排序进行排序后的所述备选解决方案。
在上述任一实施例的基础上,所述获取模块401在根据所述报警信息获取所述目标系统异常状况相关的检索关键词时,用于:
从所述报警信息中提取关键词,并确定其为与所述目标系统异常状况相关的第一检索关键词;
根据所述报警信息,获取目标系统异常时刻前后预定时间段内所述目标系统和/或其相关系统的状态,若所述预定时间段内所述目标系统和/或其相关系统出现异常,则获取所述预定时间段内的所述目标系统和/或其相关系统的异常信息,并从所述异常信息提取关键词,并确定其为与所述目标系统异常状况相关的第二检索关键词;
所述检索模块402在根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案时,用于:
根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案。
在上述任一实施例的基础上,所述检索模块402在根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案时,用于:
所述根据所述第一检索关键词以及预设的异常知识库,获取与所述第一检索关键词匹配的预设解决方案,并将其确定为第一备选解决方案;
根据所述第二检索关键词,从所述第一备选解决方案中获取与所述第二检索关键词匹配的预设解决方案,并将其确定为最终的所述目标系统异常状况对应的备选解决方案。
在上述任一实施例的基础上,所述检索模块402在根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案时,用于:
根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取与所述第一检索关键词以及所述第二检索关键词匹配的预设解决方案,并将其确定为最终的所述目标系统异常状况对应的备选解决方案。
在上述任一实施例的基础上,所述设备还包括知识库更新模块,用于:
接收所述目标系统异常状况被解决后用户输入的最终解决方案的反馈信息;
若所述最终解决方案属于所述备选解决方案,则更新所述异常知识库中所述备选解决方案的历史使用时间信息和频次信息;或者
若所述最终解决方案不属于所述备选解决方案,则将所述最终解决方案增加至所述异常知识库中,并记录其历史使用时间信息和频次信息。
本发明实施例提供的系统异常的处理设备可以具体用于执行上述图2-3所提供的方法实施例,具体功能此处不再赘述。
本发明实施例提供的系统异常的处理设备,通过获取针对目标系统异常状况的报警信息,并根据报警信息获取目标系统异常状况相关的检索关键词;根据检索关键词以及预设的异常知识库,获取目标系统异常状况对应的备选解决方案;从异常知识库获取各备选解决方案的历史使用时间信息和频次信息,根据各备选解决方案的历史使用时间信息和频次信息,对各备选解决方案进行排序,并输出排序后的备选解决方案。本实施例可根据报警信息自动给出备选解决方案,且对备选解决方案进行排序,以指导技术人员按照排序尝试备选解决方案,使得系统异常状况快速得到解决,而无需依赖技术人员的经验。
图5为本发明实施例提供的电子设备的结构示意图。本发明实施例提供的电子设备可以执行系统异常的处理方法实施例提供的处理流程,如图5所示,电子设备50包括存储器51、处理器52、计算机程序;其中,计算机程序存储在存储器51中,并被配置为由处理器52执行以上实施例所述的系统异常的处理方法。此外,电子设备50还可具有通讯接口53,用于接收控制指令。
图5所示实施例的电子设备可用于执行上述系统异常的处理方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
另外,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的系统异常的处理方法。
另外,本实施例还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的系统异常的处理方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明实施例各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明实施例各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本发明实施例的技术方案,而非对其限制;尽管参照前述各实施例对本发明实施例进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的范围。

Claims (11)

1.一种系统异常的处理方法,其特征在于,包括:
获取针对目标系统异常状况的报警信息,并根据所述报警信息获取所述目标系统异常状况相关的检索关键词;
根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,其中所述异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案;
从所述异常知识库获取各所述备选解决方案的历史使用时间信息和频次信息,根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序,并输出排序后的备选解决方案。
2.根据权利要求1所述的方法,其特征在于,所述根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序,包括:
对于任一所述备选解决方案,根据所述备选解决方案的历史使用时间信息和频次信息、以及预设的牛顿冷却定律公式,获取所述备选解决方案的权重参数;
根据各所述备选解决方案的权重参数对各所述备选解决方案进行排序。
3.根据权利要求1所述的方法,其特征在于,所述获取所述目标系统异常状况对应的备选解决方案,还包括:
根据所述检索关键词获取所述备选解决方案的初始排序;
若从所述异常知识库未获取到各所述备选解决方案的历史使用时间信息和频次信息,则并输出按照所述初始排序进行排序后的所述备选解决方案。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述报警信息获取所述目标系统异常状况相关的检索关键词,包括:
从所述报警信息中提取关键词,并确定其为与所述目标系统异常状况相关的第一检索关键词;
根据所述报警信息,获取目标系统异常时刻前后预定时间段内所述目标系统和/或其相关系统的状态,若所述预定时间段内所述目标系统和/或其相关系统出现异常,则获取所述预定时间段内的所述目标系统和/或其相关系统的异常信息,并从所述异常信息提取关键词,并确定其为与所述目标系统异常状况相关的第二检索关键词;
所述根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,包括:
根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案。
5.根据权利要求4所述的方法,其特征在于,所述根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,包括:
所述根据所述第一检索关键词以及预设的异常知识库,获取与所述第一检索关键词匹配的预设解决方案,并将其确定为第一备选解决方案;
根据所述第二检索关键词,从所述第一备选解决方案中获取与所述第二检索关键词匹配的预设解决方案,并将其确定为最终的所述目标系统异常状况对应的备选解决方案。
6.根据权利要求4所述的方法,其特征在于,所述根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,包括:
根据所述第一检索关键词、所述第二检索关键词以及预设的异常知识库,获取与所述第一检索关键词以及所述第二检索关键词匹配的预设解决方案,并将其确定为最终的所述目标系统异常状况对应的备选解决方案。
7.根据权利要求1-3任一项所述的方法,其特征在于,所述输出排序后的备选解决方案后,还包括:
接收所述目标系统异常状况被解决后用户输入的最终解决方案的反馈信息;
若所述最终解决方案属于所述备选解决方案,则更新所述异常知识库中所述备选解决方案的历史使用时间信息和频次信息;或者
若所述最终解决方案不属于所述备选解决方案,则将所述最终解决方案增加至所述异常知识库中,并记录其历史使用时间信息和频次信息。
8.一种系统异常的处理设备,其特征在于,包括:
获取模块,用于获取针对目标系统异常状况的报警信息,并根据所述报警信息获取所述目标系统异常状况相关的检索关键词;
检索模块,用于根据所述检索关键词以及预设的异常知识库,获取所述目标系统异常状况对应的备选解决方案,其中所述异常知识库中包括多个预设系统异常状况信息以及对应的预设解决方案;
排序模块,用于从所述异常知识库获取各所述备选解决方案的历史使用时间信息和频次信息,根据各所述备选解决方案的历史使用时间信息和频次信息,对各所述备选解决方案进行排序;
输出模块,用于输出排序后的备选解决方案。
9.一种电子设备,其特征在于,包括:至少一个处理器;以及存储器;
所述存储器存储计算机指令;
所述至少一个处理器执行所述存储器存储的计算机指令,使得所述至少一个处理器执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机指令,当处理器执行所述计算机指令时,实现如权利要求1-7任一项所述的方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1-7任一项所述的方法。
CN202110108806.2A 2021-01-27 2021-01-27 系统异常的处理方法、设备及存储介质 Pending CN113760666A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110108806.2A CN113760666A (zh) 2021-01-27 2021-01-27 系统异常的处理方法、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110108806.2A CN113760666A (zh) 2021-01-27 2021-01-27 系统异常的处理方法、设备及存储介质

Publications (1)

Publication Number Publication Date
CN113760666A true CN113760666A (zh) 2021-12-07

Family

ID=78786464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110108806.2A Pending CN113760666A (zh) 2021-01-27 2021-01-27 系统异常的处理方法、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113760666A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114371675A (zh) * 2021-12-31 2022-04-19 四川德胜集团钒钛有限公司 一种运行设备的异常预测运维系统和方法
CN116010132A (zh) * 2022-06-17 2023-04-25 新豪峰农业开发(珠海市)股份有限公司 一种基于云平台大数据的实时数据安全处理系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114371675A (zh) * 2021-12-31 2022-04-19 四川德胜集团钒钛有限公司 一种运行设备的异常预测运维系统和方法
CN116010132A (zh) * 2022-06-17 2023-04-25 新豪峰农业开发(珠海市)股份有限公司 一种基于云平台大数据的实时数据安全处理系统

Similar Documents

Publication Publication Date Title
CN108615119B (zh) 一种异常用户的识别方法及设备
JP7373611B2 (ja) ログ監査方法、装置、電子機器、媒体およびコンピュータプログラム
CN110908883B (zh) 用户画像数据监控方法、系统、设备及存储介质
CN113760666A (zh) 系统异常的处理方法、设备及存储介质
CN114693192A (zh) 风控决策方法、装置、计算机设备和存储介质
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN105989152B (zh) 搜索引擎服务质量的监控方法、装置和系统
CN110011845B (zh) 日志采集方法及系统
CN111694721A (zh) 一种微服务的故障监测方法和装置
CN111124891A (zh) 接入状态的检测方法和装置、存储介质及电子装置
CN110781232A (zh) 数据处理方法、装置、计算机设备和存储介质
US11822578B2 (en) Matching machine generated data entries to pattern clusters
CN115186164A (zh) 搜索请求控制方法及其装置、设备、介质、产品
CN113626387A (zh) 一种任务数据的导出方法、装置、电子设备及存储介质
CN109254880A (zh) 一种处理数据库宕机的方法及装置
CN114385436A (zh) 服务器分组方法、装置、电子设备和存储介质
CN114428704A (zh) 全链路分布式监控的方法、装置、计算机设备和存储介质
CN115858324B (zh) 基于ai的it设备故障处理方法、装置、设备和介质
CN108881159B (zh) 一种安全控制方法
CN113687849B (zh) 一种固件批量升级方法、装置、设备及存储介质
CN113407859B (zh) 一种资源推荐方法、装置、电子设备及存储介质
CN116910352A (zh) 基于人工智能的报表推荐方法、装置、设备及介质
CN115481142A (zh) 慢查询语句处理方法、装置、电子设备及存储介质
CN116385014A (zh) 业务数据的处理方法、处理设备和计算机可读存储介质
CN112667464A (zh) 一种信息系统状态智能化分析方法、系统及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination