CN109213655A - 针对告警的解决方案确定方法、装置、存储介质和设备 - Google Patents
针对告警的解决方案确定方法、装置、存储介质和设备 Download PDFInfo
- Publication number
- CN109213655A CN109213655A CN201810797691.0A CN201810797691A CN109213655A CN 109213655 A CN109213655 A CN 109213655A CN 201810797691 A CN201810797691 A CN 201810797691A CN 109213655 A CN109213655 A CN 109213655A
- Authority
- CN
- China
- Prior art keywords
- error log
- solution
- log
- alarm
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3065—Monitoring arrangements determined by the means or processing involved in reporting the monitored data
- G06F11/3072—Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3003—Monitoring arrangements specially adapted to the computing system or computing system component being monitored
- G06F11/302—Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a software system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/3051—Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
- G06F9/453—Help systems
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Human Computer Interaction (AREA)
- Debugging And Monitoring (AREA)
Abstract
本公开涉及一种针对告警的解决方案确定方法、装置、存储介质和设备,该方法包括:针对系统中的应用设置有对应的日志输出器,用于将解析得到的该应用的错误日志存储在时间序列数据库中,使得在监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志,并根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案。能够在监测到针对某一指标的告警时,快速地确定合适的解决方案。因此,能够提高错误日志查找效率以及提高确定解决方案的效率。
Description
技术领域
本公开涉及系统运维领域,具体地,涉及一种针对告警的解决方案确定方法、装置、存储介质和设备。
背景技术
日志是系统中各个应用运行情况的重要记录,为查找和明确应用的运行情况提供有力的依据。在运维领域中,当实际生产环境发生系统告警时,快速定位到引发系统告警所产生的日志,是解决运维问题的重要手段。
在传统的运维中,运维工程师往往是在系统发生问题后,通过人工查找相关日志,定位错误日志记录,然后采取解决措施。由于采用人工查找的方式效率太低,后来,出现了将系统中各个应用的日志统一推送到搜索引擎中,然后对相关告警内容进行搜索的方式。但是,由于随着大数据时代的来临,系统中的数据量也在快速增长,相应产生的错误日志也是海量的,对于海量数据如果采用将日志统一推送到搜索引擎并进行搜索的方式,其效率依然较低。另外,在定位错误日志记录后,目前多是通过人工分析的方式来确定该错误日志对应的解决方案。因此,以上方式并不能提高日志系统对于问题解决的效率,不能对解决方案进行有效管理。
发明内容
本公开的目的是提供一种针对告警的解决方案确定方法、装置、存储介质和设备,用于解决目前错误日志查找效率低,以及确定相应解决方案效率低的问题。
为了实现上述目的,本公开的第一方面,提供一种针对告警的解决方案确定方法,所述方法包括:
当监测到针对第一指标的告警时,根据所述告警中指示的告警时间以及所述第一指标对应的第一应用,在时间序列数据库中查找与所述第一应用以及所述告警时间对应的目标错误日志;其中,所述时间序列数据库中记录有由多个应用的日志输出器解析得到的所述多个应用的错误日志,所述第一应用为所述多个应用中的任一应用;
根据所述目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与所述目标错误日志匹配的解决方案,作为用于解决所述告警的解决方案。
可选地,所述错误日志中包含:发生错误的出错时间,所述当监测到针对第一指标的告警时,根据所述告警中指示的告警时间以及所述第一指标对应的第一应用,在时间序列数据库中查找与所述第一应用以及所述告警时间对应的目标错误日志,包括:
当监测到针对第一指标的告警时,在所述时间序列数据库中查找由所述第一应用的所述日志输出器解析输入的错误日志;
当查找到由所述第一应用的所述日志输出器解析输入的一条或多条错误日志时,在所述一条或多条错误日志中确定出错时间与所述告警时间匹配的错误日志,作为所述目标错误日志,所述目标错误日志为一条或多条日志。
可选地,所述根据所述目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与所述目标错误日志匹配的解决方案,作为用于解决所述告警的解决方案,包括:
根据所述目标错误日志的文本内容获取第一词向量;
根据所述多个错误日志的文本内容获取所述多个错误日志的词向量;
根据第一词向量和所述多个错误日志的词向量,分别获取所述目标错误日志与所述多个错误日志的文本相似度;
获取所述多个解决方案的命中率,所述命中率用于表示解决方案已成功解决问题的次数;
根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,对所述多个解决方案进行排序;
将所述排序中排名最高的n个解决方案确定为与所述目标错误日志匹配的解决方案,以获取用于解决所述告警的解决方案。
可选地,所述根据第一词向量和所述多个错误日志的词向量,分别获取所述目标错误日志与所述多个错误日志的文本相似度,包括:
根据第一词向量和所述多个错误日志的词向量,利用文本相似度计算公式分别获取所述目标错误日志与所述多个错误日志的文本相似度;
所述文本相似度计算公式包括:
其中,Si表示所述目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,E表示所述第一词向量,Ei表示所述第i个错误日志的词向量,π表示圆周率,ET表示E的转置矩阵。
可选地,所述根据所述目标错误日志与所述多个错误日志的文本相似度,以及多个解决方案的命中率,对所述多个解决方案进行排序,包括:
根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,利用匹配度计算公式分别获取所述目标错误日志与所述多个解决方案的匹配度;
根据所述目标错误日志与多个解决方案的匹配度由高到低对所述多个解决方案进行排序;
所述匹配度计算公式包括:
其中,Ri表示所述目标错误日志与所述多个解决方案中的第i个解决方案的匹配度,Si表示所述目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,e表示自然常数,Ci表示所述多个解决方案中的第i个解决方案的命中率,α为可调参数,用于调整命中率对匹配度的影响,α>0。
第二方面,提供一种针对告警的解决方案确定装置,所述装置包括:
日志查找模块,用于当监测到针对第一指标的告警时,根据所述告警中指示的告警时间以及所述第一指标对应的第一应用,在时间序列数据库中查找与所述第一应用以及所述告警时间对应的目标错误日志;其中,所述时间序列数据库中记录有由多个应用的日志输出器解析得到的所述多个应用的错误日志,所述第一应用为所述多个应用中的任一应用;
方案匹配模块,用于根据所述目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与所述目标错误日志匹配的解决方案,作为用于解决所述告警的解决方案。
可选地,所述错误日志中包含:发生错误的出错时间,所述日志查找模块,用于:
当监测到针对第一指标的告警时,在所述时间序列数据库中查找由所述第一应用的所述日志输出器解析输入的错误日志;
当查找到由所述第一应用的所述日志输出器解析输入的一条或多条错误日志时,在所述一条或多条错误日志中确定出错时间与所述告警时间匹配的错误日志,作为所述目标错误日志,所述目标错误日志为一条或多条日志。
可选地,所述方案匹配模块,包括:
词向量获取子模块,用于根据所述目标错误日志的文本内容获取第一词向量;
所述词向量获取子模块,还用于根据所述多个错误日志的文本内容获取所述多个错误日志的词向量;
相似度获取子模块,用于根据第一词向量和所述多个错误日志的词向量,分别获取所述目标错误日志与所述多个错误日志的文本相似度;
命中率获取子模块,用于获取所述多个解决方案的命中率,所述命中率用于表示解决方案已成功解决问题的次数;
排序子模块,用于根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,对所述多个解决方案进行排序;
方案选择子模块,用于将所述排序中排名最高的n个解决方案确定为与所述目标错误日志匹配的解决方案,以获取用于解决所述告警的解决方案。
可选地,所述相似度获取子模块,用于:
根据第一词向量和所述多个错误日志的词向量,利用文本相似度计算公式分别获取所述目标错误日志与所述多个错误日志的文本相似度;
所述文本相似度计算公式包括:
其中,Si表示所述目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,E表示所述第一词向量,Ei表示所述第i个错误日志的词向量,π表示圆周率,ET表示E的转置矩阵。
可选地,所述排序子模块,用于:
根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,利用匹配度计算公式分别获取所述目标错误日志与所述多个解决方案的匹配度;
根据所述目标错误日志与所述多个解决方案的匹配度由高到低对所述多个解决方案进行排序;
所述匹配度计算公式包括:
其中,Ri表示所述目标错误日志与所述多个解决方案中的第i个解决方案的匹配度,Si表示所述目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,e表示自然常数,Ci表示所述多个解决方案中的第i个解决方案的命中率,α为可调参数,用于调整命中率对匹配度的影响,α>0。
第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述方法的步骤。
第四方面,提供一种电子设备,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现第一方面所述方法的步骤。
本公开提供的技术方案中,针对系统中的应用设置有对应的日志输出器,用于将解析得到的该应用的错误日志存储在时间序列数据库中,使得在监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志,并根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案。通过上述技术方案,能够在监测到针对某一指标的告警时,基于该指标对应的应用以及记录的告警时间,在时间序列数据库中快速的找到匹配的错误日志,并基于解决方案字典中记录的针对多个错误日志的多个解决方案,为当前的错误日志快速地确定合适的解决方案。因此,能够提高错误日志查找效率以及提高确定解决方案的效率。
本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是根据本公开一示例性实施例示出的一种针对告警的解决方案确定方法的流程图;
图2是根据图1所示实施例示出的一种错误日志查找方法的流程示意图;
图3是根据图1所示实施例示出的一种解决方案确定方法的流程示意图;
图4是根据本公开一示例性实施例示出的一种针对告警的解决方案确定装置的框图;
图5是根据图4所示实施例示出的一种方案匹配模块的框图;
图6是根据一示例性实施例示出的一种电子设备的框图;
图7是根据一示例性实施例示出的另一种电子设备的框图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
在对本公开实施例提供的针对告警的解决方案确定方法进行说明之前,首先对本公开各个实施例涉及的应用场景进行介绍,其中该应用场景包括:数据采集端、日志服务端以及管理端,其中数据采集端为针对系统中各个应用(Application,应用程序,也称应用)设置的日志输出器(log_exporter),每个应用对应的日志输出器能够解析对应引用的日志,当解析出该应用的错误日志时,该日志输出器能够将该错误日志以指定的格式推送至该日志服务端,该日志服务端可以是一个时间序列数据库(Time Sequence DataBase,TSDB),由于时间序列数据库所采用的存储方式能够提高时间相关数据的处理能力,且相对于目前的关系型数据库其存储空间的占用减半,因此能够提高查询速度。该管理端可以是移动终端、计算机、服务器等设备,或者可以是其中的一种或几种设备结合构成的监控管理系统,用于监控整个运维系统中各个应用的指标,当发生指标告警时,该管理端能够从日志服务端定位相应的错误日志,并为其匹配对应的解决方案。下面对本公开提供的针对告警的解决方案确定方法进行说明。
图1是根据本公开一示例性实施例示出的一种针对告警的解决方案确定方法的流程图,如图1所示,该方法包括:
步骤101,当监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志。
示例的,该告警可以以告警消息的形式输出,该告警中至少包括:产生指标告警的应用的信息,例如应用的ID或者名称,用于指示产生指标告警的是哪一个应用,该告警还包括告警时间,用于指示该指标告警产生的时间。
其中,该时间序列数据库中记录有由多个应用的日志输出器解析得到的该多个应用的错误日志,该第一应用为该多个应用中的任一应用。另外,该多个应用可以是运维系统中的全部应用,也可以是该运维系统中需要监控的部分应用。以系统中的应用mysql、tomcat和solr为例,其对应的日志输出器可以表示为mysql_exporter、tomcat_exporter和solr_exporter,这三个日志输出器分别解析应用mysql、tomcat和solr的日志。
步骤102,根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案。
其中,该解决方案字典是预先设置的,并且是随着运维系统的运行实时更新的。任意运维人员在工作中只要遇到错误日志,并提供了能够解决该错误日志的问题的技术方案后,都可以将该解决方案输入到该解决方案字典中,示例的,在输入解决方案时可以按照以下信息输入:解决方案、该解决方案针对的错误日志,还可以输入方案提出者的ID。因此该解决方案字典中能够记录的针对多个错误日志的多个解决方案。
进一步的,该错误日志中包含:发生错误的出错时间。图2是根据图1所示实施例示出的一种错误日志查找方法的流程示意图,如图2所示,步骤101所述的当监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志,可以包括以下步骤:
步骤1011,当监测到针对第一指标的告警时,在该时间序列数据库中查找由该第一应用的日志输出器解析输入的错误日志。
步骤1012,当查找到由该第一应用的日志输出器解析输入的一条或多条错误日志时,在该一条或多条错误日志中确定出错时间与该告警时间匹配的错误日志,作为目标错误日志,该目标错误日志为一条或多条日志。
例如,当接收到告警显示:应用mysql产生指标A告警,告警时间可以采用“时-分-秒”的格式,例如告警时间为22:12:07。则可以根据该告警在该时间序列数据库中首先查找由mysql_exporter输入的错误日志,从而可以筛选掉其他应用的日志,提高查询速度。其中,mysql_exporter输入的错误日志可能有一条或多条。其次,可以在mysql_exporter输入的错误日志中查找出错时间与告警时间22:12:07匹配的错误日志,这里的匹配可以是时间完全相同,或者时间相近(例如与告警时间22:12:07相差的时长小于预设的阈值),从而可以在时间序列数据库中快速定位该目标错误日志。由于错误日志是基于时间存储在时间序列数据库中的,因此当某一指标产生告警时,与告警时间所对应的错误日志中最有可能记录了产生告警的原因。因此针对查找到的目标错误日志进行解决方案的选择,可以很大概率地选择到合适的解决方案。
图3是根据图1所示实施例示出的一种解决方案确定方法的流程示意图,如图3所示,步骤102所述的根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案,可以包括以下步骤:
步骤1021,根据该目标错误日志的文本内容获取第一词向量。
步骤1022,根据该多个错误日志的文本内容获取该多个错误日志的词向量。
步骤1023,根据该第一词向量和该多个错误日志的词向量,分别获取该目标错误日志与该多个错误日志的文本相似度。
其中,词向量是用来将自然语言中的词进行数学化的一种方式,这是因为要将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化。词向量技术是将词转化成为稠密向量,由于对于相似的词,其对应的词向量也相近。因此,通过目标错误日志和解决方案字典中记录的针对多个错误日志的词向量即可确定该目标错误日志与该多个错误日志的文本相似度。
示例的,该步骤1023可以包括:
根据第一词向量和该多个错误日志的词向量,利用文本相似度计算公式分别获取该目标错误日志与该多个错误日志的文本相似度;
其中,该文本相似度计算公式可以包括:
其中,Si表示目标错误日志与该多个错误日志中的第i个错误日志的文本相似度,E表示该第一词向量,Ei表示该第i个错误日志的词向量,π表示圆周率,ET表示E的转置矩阵。
步骤1024,获取该多个解决方案的命中率,该命中率用于表示解决方案已成功解决问题的次数。
其中,该命中率可以理解为运维人员使用该解决方案已成功解决问题的次数。
步骤1025,根据该目标错误日志与该多个错误日志的文本相似度,以及该多个解决方案的命中率,对该多个解决方案进行排序。
示例的,步骤1025可以包括:
根据该目标错误日志与该多个错误日志的文本相似度,以及该多个解决方案的命中率,利用匹配度计算公式分别获取该目标错误日志与多个解决方案的匹配度。
其中,该匹配度是用于表示解决方案与当前的目标错误日志匹配程度高低的一个指标,该匹配度的值越高,说明解决方案与当前的目标错误日志的匹配程度越高,则解决该目标错误日志的问题的可能性就越高。
根据该目标错误日志与多个解决方案的匹配度由高到低对该多个解决方案进行排序。
示例的,可以用R表示该匹配度,从而该匹配度计算公式可以包括:
其中,Ri表示该目标错误日志与该多个解决方案中的第i个解决方案的匹配度,Si表示该目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,e表示自然常数,Ci表示所述多个解决方案中的第i个解决方案的命中率,α为可调参数,用于调整命中率对匹配度的影响,α>0。
步骤1026,将该排序中排名最高的n个解决方案确定为与该目标错误日志匹配的解决方案,以获取用于解决该告警的解决方案。
其中,n可以大于或等于1,即可以选择该排序中排名最高的一个解决方案作为与该目标错误日志匹配的解决方案,以解决该告警对应的问题;或者,也可以选择排序中排名最高的几个解决方案作为用于解决该告警的解决方案,并将这几个解决方案依次用来尝试解决当前告警对应的问题,直至问题解决。
本公开提供的技术方案中,针对系统中的应用设置有对应的日志输出器,用于将解析得到的该应用的错误日志存储在时间序列数据库中,使得在监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志,并根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案。通过上述技术方案,能够在监测到针对某一指标的告警时,基于该指标对应的应用以及记录的告警时间,在时间序列数据库中快速的找到匹配的错误日志,并基于解决方案字典中记录的针对多个错误日志的多个解决方案,为当前的错误日志快速地确定合适的解决方案。因此,能够提高错误日志查找效率以及提高确定解决方案的效率。
图4是根据本公开一示例性实施例示出的一种针对告警的解决方案确定装置的框图,如图4所示,该装置400可以包括:
日志查找模块401,用于当监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志;其中,该时间序列数据库中记录有由多个应用的日志输出器解析得到的该多个应用的错误日志,该第一应用为该多个应用中的任一应用;
方案匹配模块402,用于根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案。
可选的,该错误日志中包含:发生错误的出错时间,该日志查找模块401,可以用于:
当监测到针对第一指标的告警时,在该时间序列数据库中查找由该第一应用的该日志输出器解析输入的错误日志;
当查找到由该第一应用的该日志输出器解析输入的一条或多条错误日志时,在该一条或多条错误日志中确定出错时间与该告警时间匹配的错误日志,作为该目标错误日志,该目标错误日志为一条或多条日志。
图5是根据图4所示实施例示出的一种方案匹配模块的框图,如图5所示,该方案匹配模块402,可以包括:
词向量获取子模块4021,用于根据该目标错误日志的文本内容获取第一词向量;
该词向量获取子模块4021,还用于根据该多个错误日志的文本内容获取该多个错误日志的词向量;
相似度获取子模块4022,用于根据第一词向量和该多个错误日志的词向量,分别获取该目标错误日志与该多个错误日志的文本相似度;
命中率获取子模块4023,用于获取该多个解决方案的命中率,该命中率用于表示解决方案已成功解决问题的次数;
排序子模块4024,用于根据该目标错误日志与该多个错误日志的文本相似度,以及多个解决方案的命中率,对该多个解决方案进行排序;
方案选择子模块4025,用于将该排序中排名最高的n个解决方案确定为与该目标错误日志匹配的解决方案,以获取用于解决该告警的解决方案。
可选的,该相似度获取子模块4022,可以用于:
根据第一词向量和该多个错误日志的词向量,利用文本相似度计算公式分别获取该目标错误日志与该多个错误日志的文本相似度;
该文本相似度计算公式包括:
其中,Si表示该目标错误日志与该多个错误日志中的第i个错误日志的文本相似度,E表示该第一词向量,Ei表示该第i个错误日志的词向量,π表示圆周率,ET表示E的转置矩阵。
可选的,该排序子模块4024,可以用于:
根据该目标错误日志与该多个错误日志的文本相似度,以及多个解决方案的命中率,利用匹配度计算公式分别获取该目标错误日志与多个解决方案的匹配度;
根据该目标错误日志与多个解决方案的匹配度由高到低对该多个解决方案进行排序;
该匹配度计算公式包括:
其中,Ri表示该目标错误日志与该多个解决方案中的第i个解决方案的匹配度,Si表示该目标错误日志与该多个错误日志中的第i个错误日志的文本相似度,e表示自然常数,Ci表示该多个解决方案中的第i个解决方案的命中率,α为可调参数,用于调整命中率对匹配度的影响,α>0。
本公开提供的技术方案中,针对系统中的应用设置有对应的日志输出器,用于将解析得到的该应用的错误日志存储在时间序列数据库中,使得上述装置在监测到针对第一指标的告警时,根据该告警中指示的告警时间以及该第一指标对应的第一应用,在时间序列数据库中查找与该第一应用以及该告警时间对应的目标错误日志,并根据该目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与该目标错误日志匹配的解决方案,作为用于解决该告警的解决方案。通过上述技术方案,能够在监测到针对某一指标的告警时,基于该指标对应的应用以及记录的告警时间,在时间序列数据库中快速的找到匹配的错误日志,并基于解决方案字典中记录的针对多个错误日志的多个解决方案,为当前的错误日志快速地确定合适的解决方案。因此,能够提高错误日志查找效率以及提高确定解决方案的效率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种电子设备600的框图。如图6所示,该电子设备600可以包括:处理器601,存储器602。该电子设备600还可以包括多媒体组件603,输入/输出(I/O)接口604,以及通信组件605中的一者或多者。
其中,处理器601用于控制该电子设备600的整体操作,以完成上述的针对告警的解决方案确定方法中的全部或部分步骤。存储器602用于存储各种类型的数据以支持在该电子设备600的操作,这些数据例如可以包括用于在该电子设备600上操作的任何应用程序或方法的指令,以及应用程序相关的数据,例如联系人数据、收发的消息、图片、音频、视频等等。该存储器602可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。多媒体组件603可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器602或通过通信组件605发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口604为处理器601和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件605用于该电子设备600与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near FieldCommunication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件605可以包括:Wi-Fi模块,蓝牙模块,NFC模块。
在一示例性实施例中,电子设备600可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(DigitalSignal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的针对告警的解决方案确定方法。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的针对告警的解决方案确定方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器602,上述程序指令可由电子设备600的处理器601执行以完成上述的针对告警的解决方案确定方法。
图7是根据一示例性实施例示出的另一种电子设备700的框图。例如,电子设备700可以被提供为一服务器。参照图7,电子设备700包括处理器722,其数量可以为一个或多个,以及存储器732,用于存储可由处理器722执行的计算机程序。存储器732中存储的计算机程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器722可以被配置为执行该计算机程序,以执行上述的针对告警的解决方案确定方法。
另外,电子设备700还可以包括电源组件726和通信组件750,该电源组件726可以被配置为执行电子设备700的电源管理,该通信组件750可以被配置为实现电子设备700的通信,例如,有线或无线通信。此外,该电子设备700还可以包括输入/输出(I/O)接口758。电子设备700可以操作基于存储在存储器732的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM等等。
在另一示例性实施例中,还提供了一种包括程序指令的计算机可读存储介质,该程序指令被处理器执行时实现上述的针对告警的解决方案确定方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器732,上述程序指令可由电子设备700的处理器722执行以完成上述的针对告警的解决方案确定方法。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (10)
1.一种针对告警的解决方案确定方法,其特征在于,所述方法包括:
当监测到针对第一指标的告警时,根据所述告警中指示的告警时间以及所述第一指标对应的第一应用,在时间序列数据库中查找与所述第一应用以及所述告警时间对应的目标错误日志;其中,所述时间序列数据库中记录有由多个应用的日志输出器解析得到的所述多个应用的错误日志,所述第一应用为所述多个应用中的任一应用;
根据所述目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与所述目标错误日志匹配的解决方案,作为用于解决所述告警的解决方案。
2.根据权利要求1所述的方法,其特征在于,所述错误日志中包含:发生错误的出错时间,所述当监测到针对第一指标的告警时,根据所述告警中指示的告警时间以及所述第一指标对应的第一应用,在时间序列数据库中查找与所述第一应用以及所述告警时间对应的目标错误日志,包括:
当监测到针对第一指标的告警时,在所述时间序列数据库中查找由所述第一应用的所述日志输出器解析输入的错误日志;
当查找到由所述第一应用的所述日志输出器解析输入的一条或多条错误日志时,在所述一条或多条错误日志中确定出错时间与所述告警时间匹配的错误日志,作为所述目标错误日志,所述目标错误日志为一条或多条日志。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与所述目标错误日志匹配的解决方案,作为用于解决所述告警的解决方案,包括:
根据所述目标错误日志的文本内容获取第一词向量;
根据所述多个错误日志的文本内容获取所述多个错误日志的词向量;
根据第一词向量和所述多个错误日志的词向量,分别获取所述目标错误日志与所述多个错误日志的文本相似度;
获取所述多个解决方案的命中率,所述命中率用于表示解决方案已成功解决问题的次数;
根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,对所述多个解决方案进行排序;
将所述排序中排名最高的n个解决方案确定为与所述目标错误日志匹配的解决方案,以获取用于解决所述告警的解决方案。
4.根据权利要求3所述的方法,其特征在于,所述根据第一词向量和所述多个错误日志的词向量,分别获取所述目标错误日志与所述多个错误日志的文本相似度,包括:
根据第一词向量和所述多个错误日志的词向量,利用文本相似度计算公式分别获取所述目标错误日志与所述多个错误日志的文本相似度;
所述文本相似度计算公式包括:
其中,Si表示所述目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,E表示所述第一词向量,Ei表示所述第i个错误日志的词向量,π表示圆周率,ET表示E的转置矩阵。
5.根据权利要求3所述的方法,其特征在于,所述根据所述目标错误日志与所述多个错误日志的文本相似度,以及多个解决方案的命中率,对所述多个解决方案进行排序,包括:
根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,利用匹配度计算公式分别获取所述目标错误日志与所述多个解决方案的匹配度;
根据所述目标错误日志与所述多个解决方案的匹配度由高到低对所述多个解决方案进行排序;
所述匹配度计算公式包括:
其中,Ri表示所述目标错误日志与所述多个解决方案中的第i个解决方案的匹配度,Si表示所述目标错误日志与所述多个错误日志中的第i个错误日志的文本相似度,e表示自然常数,Ci表示所述多个解决方案中的第i个解决方案的命中率,α为可调参数,用于调整命中率对匹配度的影响,α>0。
6.一种针对告警的解决方案确定装置,其特征在于,所述装置包括:
日志查找模块,用于当监测到针对第一指标的告警时,根据所述告警中指示的告警时间以及所述第一指标对应的第一应用,在时间序列数据库中查找与所述第一应用以及所述告警时间对应的目标错误日志;其中,所述时间序列数据库中记录有由多个应用的日志输出器解析得到的所述多个应用的错误日志,所述第一应用为所述多个应用中的任一应用;
方案匹配模块,用于根据所述目标错误日志在解决方案字典中记录的针对多个错误日志的多个解决方案中确定与所述目标错误日志匹配的解决方案,作为用于解决所述告警的解决方案。
7.根据权利要求6所述的装置,其特征在于,所述错误日志中包含:发生错误的出错时间,所述日志查找模块,用于:
当监测到针对第一指标的告警时,在所述时间序列数据库中查找由所述第一应用的所述日志输出器解析输入的错误日志;
当查找到由所述第一应用的所述日志输出器解析输入的一条或多条错误日志时,在所述一条或多条错误日志中确定出错时间与所述告警时间匹配的错误日志,作为所述目标错误日志,所述目标错误日志为一条或多条日志。
8.根据权利要求6所述的装置,其特征在于,所述方案匹配模块,包括:
词向量获取子模块,用于根据所述目标错误日志的文本内容获取第一词向量;
所述词向量获取子模块,还用于根据所述多个错误日志的文本内容获取所述多个错误日志的词向量;
相似度获取子模块,用于根据第一词向量和所述多个错误日志的词向量,分别获取所述目标错误日志与所述多个错误日志的文本相似度;
命中率获取子模块,用于获取所述多个解决方案的命中率,所述命中率用于表示解决方案已成功解决问题的次数;
排序子模块,用于根据所述目标错误日志与所述多个错误日志的文本相似度,以及所述多个解决方案的命中率,对所述多个解决方案进行排序;
方案选择子模块,用于将所述排序中排名最高的n个解决方案确定为与所述目标错误日志匹配的解决方案,以获取用于解决所述告警的解决方案。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-5中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括:
存储器,其上存储有计算机程序;
处理器,用于执行所述存储器中的所述计算机程序,以实现权利要求1-5中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810797691.0A CN109213655B (zh) | 2018-07-19 | 2018-07-19 | 针对告警的解决方案确定方法、装置、存储介质和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810797691.0A CN109213655B (zh) | 2018-07-19 | 2018-07-19 | 针对告警的解决方案确定方法、装置、存储介质和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109213655A true CN109213655A (zh) | 2019-01-15 |
CN109213655B CN109213655B (zh) | 2022-02-18 |
Family
ID=64990046
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810797691.0A Active CN109213655B (zh) | 2018-07-19 | 2018-07-19 | 针对告警的解决方案确定方法、装置、存储介质和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109213655B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096427A (zh) * | 2019-03-18 | 2019-08-06 | 平安普惠企业管理有限公司 | 基于软件测试的异常系统定位方法及装置 |
CN110163482A (zh) * | 2019-04-19 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 确定活动方案的安全方案数据的方法、终端设备及服务器 |
CN110377703A (zh) * | 2019-07-22 | 2019-10-25 | 中国工商银行股份有限公司 | 报错信息处理方法、装置和设备 |
CN111082966A (zh) * | 2019-11-01 | 2020-04-28 | 平安科技(深圳)有限公司 | 基于批量告警事件的定位方法、装置、电子设备及介质 |
CN112306787A (zh) * | 2019-07-24 | 2021-02-02 | 阿里巴巴集团控股有限公司 | 报错日志处理方法、装置、电子设备和智能音箱 |
CN112422345A (zh) * | 2020-11-18 | 2021-02-26 | 青岛海尔科技有限公司 | 日志传输方法及装置、存储介质、电子装置 |
CN112579662A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种井下作业处理方法、系统及电子设备 |
CN113660223A (zh) * | 2021-07-28 | 2021-11-16 | 上海纽盾科技股份有限公司 | 基于告警信息的网络安全数据处理方法、装置及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011118610A (ja) * | 2009-12-02 | 2011-06-16 | Canon It Solutions Inc | 携帯端末、携帯端末の制御方法、プログラム及び記憶媒体 |
CN106776235A (zh) * | 2017-02-06 | 2017-05-31 | 北京并行科技股份有限公司 | 一种运维机房的监控系统、方法和搜索引擎 |
CN107430612A (zh) * | 2015-02-12 | 2017-12-01 | 微软技术许可有限责任公司 | 查找描述对计算问题的解决方案的文档 |
CN107592223A (zh) * | 2017-09-11 | 2018-01-16 | 北京富通东方科技有限公司 | 一种基于大数据的智能告警处理方法 |
CN108124252A (zh) * | 2017-12-29 | 2018-06-05 | 深圳市金立通信设备有限公司 | 一种获取信息的方法、终端及计算机可读存储介质 |
-
2018
- 2018-07-19 CN CN201810797691.0A patent/CN109213655B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011118610A (ja) * | 2009-12-02 | 2011-06-16 | Canon It Solutions Inc | 携帯端末、携帯端末の制御方法、プログラム及び記憶媒体 |
CN107430612A (zh) * | 2015-02-12 | 2017-12-01 | 微软技术许可有限责任公司 | 查找描述对计算问题的解决方案的文档 |
CN106776235A (zh) * | 2017-02-06 | 2017-05-31 | 北京并行科技股份有限公司 | 一种运维机房的监控系统、方法和搜索引擎 |
CN107592223A (zh) * | 2017-09-11 | 2018-01-16 | 北京富通东方科技有限公司 | 一种基于大数据的智能告警处理方法 |
CN108124252A (zh) * | 2017-12-29 | 2018-06-05 | 深圳市金立通信设备有限公司 | 一种获取信息的方法、终端及计算机可读存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110096427A (zh) * | 2019-03-18 | 2019-08-06 | 平安普惠企业管理有限公司 | 基于软件测试的异常系统定位方法及装置 |
CN110163482A (zh) * | 2019-04-19 | 2019-08-23 | 阿里巴巴集团控股有限公司 | 确定活动方案的安全方案数据的方法、终端设备及服务器 |
CN110163482B (zh) * | 2019-04-19 | 2023-01-13 | 创新先进技术有限公司 | 确定活动方案的安全方案数据的方法、终端设备及服务器 |
CN110377703A (zh) * | 2019-07-22 | 2019-10-25 | 中国工商银行股份有限公司 | 报错信息处理方法、装置和设备 |
CN112306787A (zh) * | 2019-07-24 | 2021-02-02 | 阿里巴巴集团控股有限公司 | 报错日志处理方法、装置、电子设备和智能音箱 |
CN112306787B (zh) * | 2019-07-24 | 2022-08-09 | 阿里巴巴集团控股有限公司 | 报错日志处理方法、装置、电子设备和智能音箱 |
CN112579662A (zh) * | 2019-09-30 | 2021-03-30 | 北京国双科技有限公司 | 一种井下作业处理方法、系统及电子设备 |
CN111082966A (zh) * | 2019-11-01 | 2020-04-28 | 平安科技(深圳)有限公司 | 基于批量告警事件的定位方法、装置、电子设备及介质 |
CN112422345A (zh) * | 2020-11-18 | 2021-02-26 | 青岛海尔科技有限公司 | 日志传输方法及装置、存储介质、电子装置 |
CN113660223A (zh) * | 2021-07-28 | 2021-11-16 | 上海纽盾科技股份有限公司 | 基于告警信息的网络安全数据处理方法、装置及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN109213655B (zh) | 2022-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109213655A (zh) | 针对告警的解决方案确定方法、装置、存储介质和设备 | |
CN109299110B (zh) | 数据查询方法、装置、存储介质和电子设备 | |
CN109670163B (zh) | 信息识别方法、信息推荐方法、模板构建方法及计算设备 | |
CN105976818B (zh) | 指令识别的处理方法及装置 | |
CN105912630B (zh) | 一种信息扩展方法及装置 | |
JP2020518861A (ja) | 音声認識方法、装置、デバイス、及び記憶媒体 | |
CN106033416A (zh) | 一种字符串处理方法及装置 | |
CN106776763B (zh) | 目的地搜索方法及装置 | |
CN109710739B (zh) | 一种信息处理方法及装置、存储介质 | |
CN109710732B (zh) | 信息查询方法、装置、存储介质和电子设备 | |
CN112035638B (zh) | 信息处理方法、装置、存储介质及设备 | |
US20230057414A1 (en) | Machine learning techniques for generating string-based database mapping prediction | |
CN109348262B (zh) | 一种主播相似度的计算方法、装置、设备和存储介质 | |
CN110874358B (zh) | 多属性列的存储、检索方法和装置以及电子设备 | |
CN112052784B (zh) | 物品的搜索方法、装置、设备及计算机可读存储介质 | |
GB2518876A (en) | Method, apparatus and computer program product for similarity determination in multimedia content | |
CN112836521A (zh) | 问答匹配方法、装置、计算机设备及存储介质 | |
CN110727769A (zh) | 语料库生成方法及装置、人机交互处理方法及装置 | |
KR101130206B1 (ko) | 입력 순서와 무관한 문자 입력 메커니즘을 제공하는 방법, 기기 및 컴퓨터 프로그램 제품 | |
CN115062134A (zh) | 知识问答模型训练及知识问答方法、装置和计算机设备 | |
CN112487159B (zh) | 检索方法、检索装置及计算机可读存储介质 | |
CN114842982B (zh) | 一种面向医疗信息系统的知识表达方法、装置及系统 | |
CN107885827B (zh) | 文件获取方法、装置、存储介质及电子设备 | |
JP2007080040A (ja) | ヘルプデスク支援方法及び装置並びにヘルプデスク支援プログラム | |
KR20200074624A (ko) | 도메인 기반의 음성 인식 모델의 최적화가 가능한 음성 인식 장치 및 그 동작 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |