CN116991620B - 一种解决方案确定方法、装置、设备及介质 - Google Patents

一种解决方案确定方法、装置、设备及介质 Download PDF

Info

Publication number
CN116991620B
CN116991620B CN202310975425.3A CN202310975425A CN116991620B CN 116991620 B CN116991620 B CN 116991620B CN 202310975425 A CN202310975425 A CN 202310975425A CN 116991620 B CN116991620 B CN 116991620B
Authority
CN
China
Prior art keywords
alarm
information
vector
alarm information
event
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202310975425.3A
Other languages
English (en)
Other versions
CN116991620A (zh
Inventor
胡伟
梁玫娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Youtejie Information Technology Co ltd
Original Assignee
Beijing Youtejie Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Youtejie Information Technology Co ltd filed Critical Beijing Youtejie Information Technology Co ltd
Priority to CN202310975425.3A priority Critical patent/CN116991620B/zh
Publication of CN116991620A publication Critical patent/CN116991620A/zh
Application granted granted Critical
Publication of CN116991620B publication Critical patent/CN116991620B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Alarm Systems (AREA)

Abstract

本发明公开了一种解决方案确定方法、装置、设备及介质。其中,方法包括:定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;确定各告警事件的向量;确定与各告警事件对应的相似告警事件;确定各告警事件的解决方案。本发明实施例可以准确地归并各个告警信息中的由同一个故障导致的具有关联关系的告警信息,可以自动基于告警信息的归并结果,准确地确定用于解决引起告警信息的故障的解决方案,降低解决方案确定过程的人工成本和时间成本。

Description

一种解决方案确定方法、装置、设备及介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种解决方案确定方法、装置、设备及介质。
背景技术
为了提高办公效率以及实现信息化办公,企业中会部署企业内部的计算机系统。在计算机系统的运行过程中,通常会通过监控平台对计算机系统中的各个组件进行监控。监控平台在检测到计算机系统中的指定组件无法正常工作之后会生成与指定组件对应的告警信息。
计算机系统在运行过程中可能会出现各种的故障。任何一个故障都有可能导致计算机系统中的多个组件无法正常工作,监控平台生成大量的告警信息。在获取到与计算机系统对应的大量的告警信息之后,需要及时对告警信息进行处理,确定用于解决引起告警信息的故障的解决方案。
相关技术中,常用的解决方案确定方案为:计算机系统的运维人员在获取到与计算机系统对应的大量的告警信息之后,基于运维人员的个人经验,来确定用于解决引起告警信息的故障的解决方案。相关技术中的解决方案确定方案根据个人经验确定用于解决引起告警信息的故障的解决方案,人工成本和时间成本较高,且准确性无法保证。
发明内容
本发明提供了一种解决方案确定方法、装置、设备及介质,以解决相关技术中的解决方案确定方案根据个人经验确定用于解决引起告警信息的故障的解决方案,人工成本和时间成本较高,且准确性无法保证的问题。
根据本发明的一方面,提供了一种解决方案确定方法,包括:
定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;
根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;
将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;
根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量;
根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件;
根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户。
根据本发明的另一方面,提供了一种解决方案确定装置,包括:
信息获取模块,用于定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;
信息存储模块,用于根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;
信息归并模块,用于将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;
向量确定模块,用于根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量;
事件确定模块,用于根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件;
方案确定模块,用于根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;
以及与所述至少一个处理器网络通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的解决方案确定方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的解决方案确定方法。
本发明实施例的技术方案,通过定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;然后根据组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;根据各告警事件包含的各个告警信息,确定各告警事件的向量;根据各告警事件的向量与各个历史告警事件的向量之间的距离,确定与各告警事件对应的相似告警事件;根据与各告警事件对应的相似告警事件,确定各告警事件的解决方案,将各告警事件以及各告警事件的解决方案提供给目标用户,解决了相关技术中的解决方案确定方案根据个人经验确定用于解决引起告警信息的故障的解决方案,人工成本和时间成本较高,且准确性无法保证的问题,取到了可以自动根据与告警信息相关的调用关系和时间信息,确定用于准确衡量获取到的各个告警信息之间的关联程度的各个告警信息的向量,然后基于各个告警信息的向量,准确地归并获取到的各个告警信息中的由同一个故障导致的具有关联关系的告警信息,可以自动基于获取到的告警信息的归并结果,准确地确定用于解决引起告警信息的故障的解决方案,降低解决方案确定过程的人工成本和时间成本,并将归并结果和解决方案提供给计算机系统的运维人员,帮助运维人员快速解决故障的有益效果。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一提供的一种解决方案确定方法的流程图。
图2为本发明实施例二提供的一种解决方案确定方法的流程图。
图3为本发明实施例三提供的一种解决方案确定装置的结构示意图。
图4为实现本发明实施例的解决方案确定方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“目标”、“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包含”、“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供的一种解决方案确定方法的流程图。本实施例可适用于在获取到与计算机系统对应的大量的告警信息之后,对告警信息进行处理,确定用于解决引起告警信息的故障的解决方案的情况。该方法可以由解决方案确定装置来执行,该解决方案确定装置可以采用硬件和/或软件的形式实现,该解决方案确定装置可配置于电子设备中。电子设备用于在获取到与计算机系统对应的大量的告警信息之后,对告警信息进行处理,确定用于解决引起告警信息的故障的解决方案。如图1所示,该方法包括:
步骤101、定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息。
可选的,企业内部的计算机系统中设置有多个组件。每一个组件是用于实现指定业务功能的软件组件或硬件组件。计算机系统在运行过程中会调用指定组件实现指定业务功能。每一个组件设置有唯一对应的组件编号。组件的组件编号是用于唯一标识组件的数字编号。
可选的,在计算机系统的运行过程中,监控平台会对计算机系统中的各个组件进行监控,检测各个组件是否可以正常工作。监控平台可以是企业中设置的用于对计算机系统中的各个组件进行监控的计算机平台。监控平台在检测到指定组件无法正常工作之后,生成与指定组件对应的告警信息。告警信息是用于表征指定组件无法正常工作的信息。
可选的,电子设备与监控平台建立了通信连接,可以基于建立的通信连接进行信息交互。电子设备可以从监控平台中获取监控平台生成的告警信息。电子设备可以定时获取当前时刻之前的预设时长内的各个告警信息,对获取到的各个告警信息进行处理。
可选的,定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息,包括:按照预设时间间隔,定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息。预设时间间隔是预先设置的一个时间间隔。预设时长是预先设置的一个时长。预设时间间隔可以等于预设时长,也可以小于预设时长。预设时间间隔和预设时长可以根据业务需求进行设置,本发明不作具体限定。
可选的,当前时刻之前的预设时长内的组件调用序列是由计算机系统在当前时刻之前的预设时长内依次调用的组件的组件编号构成的序列。当前时刻之前的预设时长内的组件调用序列包含按照调用时间从前到后的顺序排列的各个组件编号。各个组件编号是计算机系统在当前时刻之前的预设时长内调用的所有组件的组件编号。组件编号的调用时间是组件编号标识的组件被计算机系统调用的时间。各个组件编号既包含在当前时刻之前的预设时长内被调用之后可以正常工作的组件的组件编号,也包含在当前时刻之前的预设时长内被调用之后无法正常工作的组件的组件编号。告警信息的组件编号是告警信息指示的无法正常工作的组件的组件编号。在当前时刻之前的预设时长内被调用之后无法正常工作的组件的组件编号即为当前时刻之前的预设时长内的各个告警信息的组件编号。
可选的,当前时刻之前的预设时长内的各个告警信息是监控平台在当前时刻之前的预设时长内生成的所有告警信息。当前时刻之前的预设时长内的各个告警信息即为与计算机系统对应的大量的告警信息。
可选的,电子设备每隔预设时间间隔,执行一次获取当前时刻之前的预设时长内的组件调用序列以及获取当前时刻之前的预设时长内的各个告警信息的操作,然后针对获取到的当前时刻之前的预设时长内的组件调用序列和各个告警信息:根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量;根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量;根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中;根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中;将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件,将各所述告警事件提供给目标用户。目标用户可以是计算机系统的运维人员。由此,定时获取与计算机系统对应的大量的告警信息,对获取到的与计算机系统对应的大量的告警信息进行统一处理,归并由同一个故障导致的具有关联关系的告警信息,将归并结果提供给计算机系统的运维人员,帮助运维人员快速定位故障并排除故障。
可选的,获取当前时刻之前的预设时长内的组件调用序列,包括:发送序列获取请求至目标用户的终端设备,以使目标用户上传当前时刻之前的预设时长内的组件调用序列;获取目标用户上传的当前时刻之前的预设时长内的组件调用序列。序列获取请求是用于请求目标用户上传当前时刻之前的预设时长内的组件调用序列的请求。目标用户的终端设备是目标用户使用的终端设备。电子设备发送序列获取请求至目标用户的终端设备。目标用户在通过终端设备接收到序列获取请求之后,通过终端设备将当前时刻之前的预设时长内的组件调用序列上传至电子设备。电子设备获取目标用户上传的当前时刻之前的预设时长内的组件调用序列。
可选的,获取当前时刻之前的预设时长内的各个告警信息,包括:从监控平台中获取当前时刻之前的预设时长内的各个告警信息。
步骤102、根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中。
可选的,各个告警信息的关联信息包括各个告警信息的组件编号、告警时间以及告警编号;根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中,包括:根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量;根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量;根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中;根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中。
可选的,所述组件调用序列包含按照调用时间从前到后的顺序排列的各个组件编号;根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量,包括:将所述组件调用序列输入至预设词向量模型中,得到各个组件编号的词向量;确定各个告警信息的组件编号;在各个组件编号中查询与各个告警信息的组件编号相同的目标组件编号,将与各个告警信息的组件编号相同的目标组件编号的词向量确定为各个告警信息的组件编号的词向量。
可选的,预设词向量模型是电子设备中设置的用于将单词序列中的各个单词转化为预设维度的词向量的模型。预设词向量模型可以是电子设备中设置的Word2Vec模型。预设词向量模型的输入是由多个单词构成的单词序列,预设词向量模型的输出是单词序列中的各个单词的词向量。在将由多个单词构成的单词序列输入至预设词向量模型中之后,预设词向量模型可以根据每个单词在单词序列中的先后顺序对单词序列中的每个单词进行词向量化操作,从而得到单词序列中的每个单词的词向量,然后输出单词序列中的每个单词的词向量。单词的词向量是用于表示单词的向量。每个单词的词向量的维度是预设维度。预设维度是一个预先设置的向量维度。预设维度可以根据业务需求进行设置,本发明不作具体限制。
可选的,当前时刻之前的预设时长内的组件调用序列即为一个由多个单词构成的单词序列。每一个组件编号即为一个单词。在将当前时刻之前的预设时长内的组件调用序列输入至预设词向量模型中之后,预设词向量模型可以根据每个组件编号在组件调用序列中的先后顺序对组件调用序列中的每个组件编号进行词向量化操作,从而得到当前时刻之前的预设时长内的组件调用序列中的每个组件编号的词向量,然后输出当前时刻之前的预设时长内的组件调用序列中的每个组件编号的词向量。组件编号的词向量是用于表示组件编号的向量。
可选的,告警信息的组件编号是告警信息指示的无法正常工作的组件的组件编号。告警信息中包含告警信息的组件编号。确定各个告警信息的组件编号,包括:从各个告警信息中提取各个告警信息的组件编号。
可选的,针对获取到的每一个告警信息执行下述操作:在各个组件编号中查询与告警信息的组件编号相同的目标组件编号;将与所述告警信息的组件编号相同的目标组件编号的词向量确定为所述告警信息的组件编号的词向量。目标组件编号是与告警信息的组件编号相同的组件编号。目标组件编号的词向量即为告警信息的组件编号的词向量。由此,基于计算机系统在当前时刻之前的预设时长内调用的所有组件的组件编号的词向量,确定当前时刻之前的预设时长内的各个告警信息的组件编号的词向量。
可选的,根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量,包括:根据信息编号字典,确定各个告警信息的告警编号;根据各个告警信息的告警时间和告警编号,生成与各个告警信息对应的告警编号序列;将所述告警编号序列输入至预设词向量模型中,得到各个告警信息的告警编号的词向量。
可选的,根据信息编号字典,确定各个告警信息的告警编号,包括:针对每一个告警信息执行下述操作:在信息编号字典中存储的告警信息中,查询与告警信息相同的目标告警信息;将查询到的所述目标告警信息对应的告警编号确定为告警信息的告警编号。
可选的,信息编号字典是电子设备中设置的用于存储监控平台可以生成的各个不同的告警信息、以及各个不同的告警信息的告警编号的字典。告警信息的告警编号是用于唯一标识告警信息的数字编号。目标用户为监控平台可以生成的每一个不同的告警信息设置一个数字编号。目标用户将监控平台可以生成的各个不同的告警信息、以及各个不同的告警信息的告警编号上传至电子设备。电子设备获取目标用户上传的监控平台可以生成的各个不同的告警信息、以及各个不同的告警信息的告警编号,将监控平台可以生成的各个不同的告警信息、以及各个不同的告警信息的告警编号作为键值对存入信息编号字典中。具体的,针对监控平台可以生成的每一个不同的告警信息,电子设备将告警信息作为关键字,告警信息的告警编号作为关键字的键值,对应存储至信息编号字典中。
可选的,针对获取到的每一个告警信息,在信息编号字典中存储的告警信息中,查询与告警信息相同的目标告警信息,然后将查询到的目标告警信息对应的告警编号确定为告警信息的告警编号。目标告警信息是与告警信息相同的告警信息。目标告警信息对应的告警编号即为告警信息的告警编号。由此,基于信息编号字典中存储的监控平台可以生成的各个不同的告警信息、以及各个不同的告警信息的告警编号,确定本次获取到的当前时刻之前的预设时长内的各个告警信息的告警编号。
可选的,告警信息的告警时间是监控平台生成告警信息的时间。电子设备可以在从监控平台中获取当前时刻之前的预设时长内的各个告警信息的同时,从监控平台中获取当前时刻之前的预设时长内的各个告警信息的告警时间。与各个告警信息对应的告警编号序列是按照告警时间从前到后的顺序排列的各个告警信息的告警编号。
可选的,根据各个告警信息的告警时间和告警编号,生成与各个告警信息对应的告警编号序列,包括:按照告警时间从前到后的顺序,对各个告警信息的告警编号进行排序,得到与各个告警信息对应的告警编号序列。按照告警时间从前到后的顺序,对各个告警信息的告警编号进行排序,即可得到按照告警时间从前到后的顺序排列的各个告警信息的告警编号,从而得到与各个告警信息对应的告警编号序列。
可选的,与各个告警信息对应的告警编号序列即为一个由多个单词构成的单词序列。每一个告警编号即为一个单词。在将与各个告警信息对应的告警编号序列输入至预设词向量模型中之后,预设词向量模型可以根据每个告警编号在告警编号序列中的先后顺序对告警编号序列中的每个告警编号进行词向量化操作,从而得到告警编号序列中的每个告警编号的词向量,然后输出告警编号序列中的每个告警编号的词向量。告警编号的词向量是用于表示告警编号的向量。
可选的,告警信息的向量是用于表示告警信息的向量。各个告警信息的向量之间的距离的大小可以用于表征各个告警信息之间的关联程度。
可选的,根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中,包括:针对每一个告警信息执行下述操作:将告警信息的组件编号的词向量和所述告警信息的告警编号的词向量相加,得到第一目标向量;将所述第一目标向量确定为所述告警信息的向量;将所述告警信息的告警编号和向量作为键值对存入信息词向量字典中。
可选的,告警信息的组件编号是告警信息指示的无法正常工作的组件的组件编号。告警信息的组件编号与告警信息紧密关联,告警信息的组件编号的词向量也与告警信息紧密关联。告警信息的告警编号是用于唯一标识告警信息的数字编号。告警信息的告警编号与告警信息紧密关联,告警信息的告警编号的词向量也与告警信息紧密关联。将告警信息的组件编号的词向量和所述告警信息的告警编号的词向量相加后得到的向量也与告警信息紧密关联。
可选的,告警信息的第一目标向量是将告警信息的组件编号的词向量和所述告警信息的告警编号的词向量相加后得到的向量。通常情况下,在两个告警信息存在关联关系,由同一个故障导致时,两个告警信息的第一目标向量之间的距离会较小。在两个告警信息不存在关联关系,不是由同一个故障导致时,两个告警信息的第一目标向量之间的距离会较大。因此,如果检测到两个告警信息的第一目标向量之间的距离较小,则可以确定两个告警信息存在关联关系,由同一个故障导致;如果检测到两个告警信息的第一目标向量之间的距离较大,则可以确定两个告警信息不存在关联关系,不是由同一个故障导致。各个告警信息的第一目标向量之间的距离的大小可以用于表征各个告警信息之间的关联程度。
可选的,各个告警信息的第一目标向量与各个告警信息紧密关联,可以用于表示各个告警信息,且各个告警信息的第一目标向量之间的距离的大小可以用于表征各个告警信息之间的关联程度。因此,可以将告警信息的第一目标向量确定为告警信息的向量。
可选的,根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中,包括:针对每一个告警信息执行下述操作:将告警信息的组件编号的词向量和所述告警信息的告警编号的词向量串联,得到第二目标向量;将所述第二目标向量确定为所述告警信息的向量;将所述告警信息的告警编号和向量作为键值对存入信息词向量字典中。
可选的,告警信息的组件编号是告警信息指示的无法正常工作的组件的组件编号。告警信息的组件编号与告警信息紧密关联,告警信息的组件编号的词向量也与告警信息紧密关联。告警信息的告警编号是用于唯一标识告警信息的数字编号。告警信息的告警编号与告警信息紧密关联,告警信息的告警编号的词向量也与告警信息紧密关联。将告警信息的组件编号的词向量和所述告警信息的告警编号的词向量串联后得到的向量也与告警信息紧密关联。
可选的,告警信息的第二目标向量是将告警信息的组件编号的词向量和所述告警信息的告警编号的词向量串联后得到的向量。通常情况下,在两个告警信息存在关联关系,由同一个故障导致时,两个告警信息的第二目标向量之间的距离会较小。在两个告警信息不存在关联关系,不是由同一个故障导致时,两个告警信息的第二目标向量之间的距离会较大。因此,如果检测到两个告警信息的第二目标向量之间的距离较小,则可以确定两个告警信息存在关联关系,由同一个故障导致;如果检测到两个告警信息的第二目标向量之间的距离较大,则可以确定两个告警信息不存在关联关系,不是由同一个故障导致。各个告警信息的第二目标向量之间的距离的大小可以用于表征各个告警信息之间的关联程度。
可选的,各个告警信息的第二目标向量与各个告警信息紧密关联,可以用于表示各个告警信息,且各个告警信息的第二目标向量之间的距离的大小可以用于表征各个告警信息之间的关联程度。因此,可以将告警信息的第二目标向量确定为告警信息的向量。
可选的,信息词向量字典是电子设备中设置的用于存储电子设备获取到的各个告警信息的告警编号和向量的字典。电子设备在确定获取到的各个告警信息的告警编号和向量之后,先清空信息词向量字典中存储的电子设备上一次获取到的各个告警信息的告警编号和向量,然后将电子设备本次获取到的各个告警信息的告警编号和向量作为键值对存入信息词向量字典中。具体的,针对电子设备本次获取到的每一个告警信息,电子设备将告警信息的告警编号作为关键字,告警信息的向量作为关键字的键值,对应存储至信息词向量字典中。
可选的,根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中,包括:针对每一个告警信息执行下述操作:从所述信息词向量字典中获取告警信息和每个其他告警信息的向量;分别计算每个其他告警信息的向量与所述告警信息的向量之间的距离;检测每个其他告警信息的向量与所述告警信息的向量之间的距离是否小于预设距离阈值;将向量与所述告警信息的向量之间的距离小于所述预设距离阈值的其他告警信息确定为与所述告警信息具有关联关系的关联告警信息;将所述告警信息与所述关联告警信息存储至同一个告警信息集合中。
可选的,电子设备从所述信息词向量字典中获取告警信息和每个其他告警信息的向量。每个其他告警信息是本次获取的各个告警信息中的除告警信息之外的每一个告警信息。信息词向量字典中存储有告警信息和每个其他告警信息的向量。
可选的,其他告警信息的向量与所述告警信息的向量之间的距离可以是其他告警信息的向量与所述告警信息的向量之间的欧式距离或余弦距离。电子设备可以根据预设的欧式距离计算公式或余弦距离计算公式,分别计算每个其他告警信息的向量与所述告警信息的向量之间的欧式距离或余弦距离。
可选的,各个告警信息的向量可以用于准确衡量各个告警信息之间的关联程度。通常情况下,在两个告警信息存在关联关系,由同一个故障导致时,两个告警信息的向量的距离会较小。在两个告警信息不存在关联关系,不是由同一个故障导致时,两个告警信息的向量的距离会较大。因此,如果检测到两个告警信息的向量的距离较小,则可以确定两个告警信息存在关联关系,由同一个故障导致;如果检测到两个告警信息的向量的距离较大,则可以确定两个告警信息不存在关联关系,不是由同一个故障导致。
可选的,预设距离阈值是一个预先设置的距离。与所述告警信息具有关联关系的关联告警信息是与所述告警信息存在关联关系,由同一个故障导致的其他告警信息。检测每个其他告警信息的向量与所述告警信息的向量之间的距离是否小于预设距离阈值。如果某一个其他告警信息的向量与所述告警信息的向量之间的距离小于预设距离阈值,表明该其他告警信息的向量与所述告警信息的向量之间的距离较小,则可以确定该其他告警信息与所述告警信息存在关联关系,由同一个故障导致,将该其他告警信息确定为与所述告警信息具有关联关系的关联告警信息。
可选的,告警信息集合是用于存储告警信息的集合。电子设备在确定与所述告警信息具有关联关系的关联告警信息之后,将所述告警信息与所述关联告警信息存储至同一个告警信息集合中。具体的,电子设备先检测与所述告警信息具有关联关系的关联告警信息是否已存储至某一个告警信息集合中。若与所述告警信息具有关联关系的关联告警信息已存储至某一个告警信息集合,则将所述告警信息存储至该告警信息集合中。若与所述告警信息具有关联关系的关联告警信息还没有存储至任意一个告警信息集合,则创建一个告警信息集合,将所述告警信息、与所述告警信息具有关联关系的关联告警信息存储至创建的告警信息集合中。
步骤103、将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件。
可选的,在根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中之后,可以得到至少一个告警信息集合。每一个告警信息集合包含由同一个故障导致的具有关联关系的告警信息。每一个告警事件是按照告警时间从前到后的顺序串联在一起的由同一个故障导致的具有关联关系的多个告警信息。
可选的,将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件,包括:针对每一个告警信息集合执行下述操作:按照告警时间从前到后的顺序,对告警信息集合中的各个告警信息进行排序,将排序后的各个告警信息串联在一起,组成一个告警事件。
由此,基于当前时刻之前的预设时长内的各个告警信息的向量,将当前时刻之前的预设时长内的各个告警信息中的由同一个故障导致的具有关联关系的告警信息归并为告警事件。得到的各个告警事件即为当前时刻之前的预设时长内的各个告警信息的归并结果。
步骤104、根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量。
可选的,告警事件的向量是用于表示告警事件的向量。各个告警事件的向量之间的距离的大小可以用于表征各个告警事件之间的相似程度。
可选的,根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量,包括:针对每一个告警事件执行下述操作:将告警事件包含的各个告警信息的向量相加,得到目标向量;将所述目标向量确定为所述告警事件的向量。
可选的,告警事件包含的各个告警信息与告警事件紧密关联,告警事件包含的各个告警信息的向量也与告警事件紧密关联。告警事件的目标向量是将告警事件包含的各个告警信息的向量相加后得到的向量。告警事件的目标向量也与告警事件紧密关联。通常情况下,在两个告警事件比较相似时,两个告警事件的目标向量之间的距离会较小。在两个告警事件不相似时,两个告警事件的目标向量之间的距离会较大。因此,如果检测到两个告警事件的目标向量之间的距离较小,则可以确定两个告警事件比较相似;如果检测到两个告警事件的目标向量之间的距离较大,则可以确定两个告警事件不相似。各所述告警事件的目标向量与各所述告警事件紧密关联,可以用于表示各所述告警事件,且不同的告警事件的目标向量之间的距离的大小可以用于表征不同的告警信息之间的关联程度。因此,可以将告警事件的目标向量确定为告警信息的向量。
步骤105、根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件。
可选的,在定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息之前,还包括:获取目标用户上传的各个历史告警事件、以及各个历史告警事件的向量和解决方案;将各个历史告警事件、以及各个历史告警事件的向量和解决方案对应存储至电子设备的本地数据库中。
可选的,每一个历史告警事件是将某一个故障可以引起的所有告警信息串联在一起后组成的一个告警事件。各个告警信息按照告警时间从前到后的顺序排列。每一个历史告警事件是不相同的。每一个历史告警事件对应的故障是不相同的。历史告警事件的向量是用于表示历史告警事件的向量。故障的解决方案可以是用于解决故障的操作步骤。历史告警事件的解决方案是用于解决引起历史告警事件包含的告警信息的故障的解决方案。
可选的,根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件,包括:针对每一个告警事件执行下述操作:分别计算每个历史告警事件的向量与告警事件的向量之间的距离;检测每个历史告警事件的向量与告警事件的向量之间的距离是否小于目标距离阈值;将向量与告警事件的向量之间的距离是否小于所述目标距离阈值的历史告警事件确定为与所述告警事件对应的相似告警事件。
可选的,历史告警事件的向量与告警事件的向量之间的距离可以是历史告警事件的向量与告警事件的向量之间的欧式距离或余弦距离。电子设备可以根据预设的欧式距离计算公式或余弦距离计算公式,分别计算每个历史告警事件的向量与告警事件的向量之间的距离。
可选的,通常情况下,在两个告警事件比较相似时,两个告警事件的向量之间的距离会较小。在两个告警事件不相似时,两个告警事件的向量之间的距离会较大。因此,如果检测到两个告警事件的向量的距离较小,则可以确定两个告警事件比较相似;如果检测到两个告警事件的向量之间的距离会较大,则可以确定两个告警事件不相似。
可选的,目标距离阈值是一个预先设置的距离。与各所述告警事件对应的相似告警事件是与各所述告警事件比较相似的历史告警事件。检测每个历史告警事件的向量与告警事件的向量之间的距离是否小于目标距离阈值。如果某一个历史告警事件的向量与告警事件的向量之间的距离小于目标距离阈值,表明该历史告警事件的向量与告警事件的向量之间的距离较小,则可以确定该历史告警事件是与告警事件对应的相似告警事件。
步骤106、根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户。
可选的,根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,包括:将与各所述告警事件对应的相似告警事件的解决方案确定为各所述告警事件的解决方案。
可选的,针对每一个告警事件,将与告警事件对应的相似告警事件的解决方案确定为所述告警事件的解决方案。与告警事件对应的相似告警事件是与所述告警事件比较相似的历史告警事件。通常情况下,两个比较相似的告警事件包含的告警信息是由同一个故障引起的。与告警事件比较相似的历史告警事件的解决方案即为告警事件的解决方案。因此,将与各所述告警事件对应的相似告警事件的解决方案确定为各所述告警事件的解决方案,从而基于与各所述告警事件对应的相似告警事件,准确地确定各所述告警事件的解决方案。
可选的,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户,包括:将各所述告警事件以及各所述告警事件的解决方案发送至目标用户的终端设备。目标用户的终端设备是目标用户使用的终端设备。
本发明实施例的技术方案,通过定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;然后根据组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;根据各告警事件包含的各个告警信息,确定各告警事件的向量;根据各告警事件的向量与各个历史告警事件的向量之间的距离,确定与各告警事件对应的相似告警事件;根据与各告警事件对应的相似告警事件,确定各告警事件的解决方案,将各告警事件以及各告警事件的解决方案提供给目标用户,解决了相关技术中的解决方案确定方案根据个人经验确定用于解决引起告警信息的故障的解决方案,人工成本和时间成本较高,且准确性无法保证的问题,取到了可以自动根据与告警信息相关的调用关系和时间信息,确定用于准确衡量获取到的各个告警信息之间的关联程度的各个告警信息的向量,然后基于各个告警信息的向量,准确地归并获取到的各个告警信息中的由同一个故障导致的具有关联关系的告警信息,可以自动基于获取到的告警信息的归并结果,准确地确定用于解决引起告警信息的故障的解决方案,降低解决方案确定过程的人工成本和时间成本,并将归并结果和解决方案提供给计算机系统的运维人员,帮助运维人员快速解决故障的有益效果。
实施例二
图2为本发明实施例二提供的一种解决方案确定方法的流程图。本发明实施例可以与上述一个或者多个实施例中各个可选方案结合。如图2所示,该方法包括:
步骤201、定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息。
步骤202、根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量。
步骤203、根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量。
步骤204、根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中。
步骤205、根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中。
步骤206、将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件。
步骤207、根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量。
步骤208、根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件。
步骤209、根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户。
本发明实施例的技术方案,可以自动根据与告警信息相关的调用关系和时间信息,确定用于准确衡量获取到的各个告警信息之间的关联程度的各个告警信息的向量,然后基于各个告警信息的向量,准确地归并获取到的各个告警信息中的由同一个故障导致的具有关联关系的告警信息,可以自动基于获取到的告警信息的归并结果,准确地确定用于解决引起告警信息的故障的解决方案,降低解决方案确定过程的人工成本和时间成本,并将归并结果和解决方案提供给计算机系统的运维人员,帮助运维人员快速解决故障。
实施例三
图3为本发明实施例三提供的一种解决方案确定装置的结构示意图。所述装置可以配置于电子设备中。如图3所示,所述装置包括:信息获取模块301、信息存储模块302、信息归并模块303、向量确定模块304、事件确定模块305以及方案确定模块306。
其中,信息获取模块301,用于定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;信息存储模块302,用于根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;信息归并模块303,用于将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;向量确定模块304,用于根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量;事件确定模块305,用于根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件;方案确定模块306,用于根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户。
本发明实施例的技术方案,通过定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;然后根据组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;根据各告警事件包含的各个告警信息,确定各告警事件的向量;根据各告警事件的向量与各个历史告警事件的向量之间的距离,确定与各告警事件对应的相似告警事件;根据与各告警事件对应的相似告警事件,确定各告警事件的解决方案,将各告警事件以及各告警事件的解决方案提供给目标用户,解决了相关技术中的解决方案确定方案根据个人经验确定用于解决引起告警信息的故障的解决方案,人工成本和时间成本较高,且准确性无法保证的问题,取到了可以自动根据与告警信息相关的调用关系和时间信息,确定用于准确衡量获取到的各个告警信息之间的关联程度的各个告警信息的向量,然后基于各个告警信息的向量,准确地归并获取到的各个告警信息中的由同一个故障导致的具有关联关系的告警信息,可以自动基于获取到的告警信息的归并结果,准确地确定用于解决引起告警信息的故障的解决方案,降低解决方案确定过程的人工成本和时间成本,并将归并结果和解决方案提供给计算机系统的运维人员,帮助运维人员快速解决故障的有益效果。
在本发明实施例的一个可选实施方式中,可选的,各个告警信息的关联信息包括各个告警信息的组件编号、告警时间以及告警编号;信息存储模块302具体用于:根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量;根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量;根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中;根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中。
在本发明实施例的一个可选实施方式中,可选的,信息归并模块303具体用于:针对每一个告警信息集合执行下述操作:按照告警时间从前到后的顺序,对告警信息集合中的各个告警信息进行排序,将排序后的各个告警信息串联在一起,组成一个告警事件。
在本发明实施例的一个可选实施方式中,可选的,向量确定模块304具体用于:针对每一个告警事件执行下述操作:将告警事件包含的各个告警信息的向量相加,得到目标向量;将所述目标向量确定为所述告警事件的向量。
在本发明实施例的一个可选实施方式中,可选的,事件确定模块305具体用于:根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件,包括:针对每一个告警事件执行下述操作:分别计算每个历史告警事件的向量与告警事件的向量之间的距离;检测每个历史告警事件的向量与告警事件的向量之间的距离是否小于目标距离阈值;将向量与告警事件的向量之间的距离是否小于所述目标距离阈值的历史告警事件确定为与所述告警事件对应的相似告警事件。
在本发明实施例的一个可选实施方式中,可选的,方案确定模块306在执行根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案的操作时,具体用于:将与各所述告警事件对应的相似告警事件的解决方案确定为各所述告警事件的解决方案。
在本发明实施例的一个可选实施方式中,可选的,方案确定模块306在执行将各所述告警事件以及各所述告警事件的解决方案提供给目标用户的操作时,具体用于:将各所述告警事件以及各所述告警事件的解决方案发送至目标用户的终端设备。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述解决方案确定装置可执行本发明任意实施例所提供的解决方案确定方法,具备执行解决方案确定方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实现本发明实施例的解决方案确定方法的电子设备10的结构示意图。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11网络通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18构建到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在随机访问存储器(RAM)13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、只读存储器(ROM)12以及随机访问存储器(RAM)13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至输入/输出(I/O)接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如解决方案确定方法。
在一些实施例中,解决方案确定方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由只读存储器(ROM)12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序构建到随机访问存储器(RAM)13并由处理器11执行时,可以执行上文描述的解决方案确定方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行解决方案确定方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的解决方案确定方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (8)

1.一种解决方案确定方法,其特征在于,包括:
定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;其中,组件调用序列是由计算机系统在当前时刻之前的预设时长内依次调用的组件的组件编号构成的序列;
根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;
将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;
根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量;
根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件;
根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户;
各个告警信息的关联信息包括各个告警信息的组件编号、告警时间以及告警编号;
所述根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中,包括:
根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量;
根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量;
根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中;
根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中;
所述根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量,包括:
针对每一个告警事件执行下述操作:
将告警事件包含的各个告警信息的向量相加,得到目标向量;
将所述目标向量确定为所述告警事件的向量。
2.根据权利要求1所述的解决方案确定方法,其特征在于,将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件,包括:
针对每一个告警信息集合执行下述操作:
按照告警时间从前到后的顺序,对告警信息集合中的各个告警信息进行排序,将排序后的各个告警信息串联在一起,组成一个告警事件。
3.根据权利要求1所述的解决方案确定方法,其特征在于,根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件,包括:
针对每一个告警事件执行下述操作:
分别计算每个历史告警事件的向量与告警事件的向量之间的距离;
检测每个历史告警事件的向量与告警事件的向量之间的距离是否小于目标距离阈值;
将向量与告警事件的向量之间的距离是否小于所述目标距离阈值的历史告警事件确定为与所述告警事件对应的相似告警事件。
4.根据权利要求1所述的解决方案确定方法,其特征在于,根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,包括:
将与各所述告警事件对应的相似告警事件的解决方案确定为各所述告警事件的解决方案。
5.根据权利要求1所述的解决方案确定方法,其特征在于,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户,包括:
将各所述告警事件以及各所述告警事件的解决方案发送至目标用户的终端设备。
6.一种解决方案确定装置,其特征在于,包括:
信息获取模块,用于定时获取当前时刻之前的预设时长内的组件调用序列和各个告警信息;其中,组件调用序列是由计算机系统在当前时刻之前的预设时长内依次调用的组件的组件编号构成的序列;
信息存储模块,用于根据所述组件调用序列和各个告警信息的关联信息,确定各个告警信息的向量,并根据各个告警信息的向量,将具有关联关系的告警信息存储至同一个告警信息集合中;
信息归并模块,用于将每一个告警信息集合中的告警信息归并为一个告警事件,得到至少一个告警事件;
向量确定模块,用于根据各所述告警事件包含的各个告警信息,确定各所述告警事件的向量;
事件确定模块,用于根据各所述告警事件的向量与各个历史告警事件的向量之间的距离,确定与各所述告警事件对应的相似告警事件;
方案确定模块,用于根据与各所述告警事件对应的相似告警事件,确定各所述告警事件的解决方案,将各所述告警事件以及各所述告警事件的解决方案提供给目标用户;
各个告警信息的关联信息包括各个告警信息的组件编号、告警时间以及告警编号;
信息存储模块具体用于:根据所述组件调用序列和各个告警信息的组件编号,确定各个告警信息的组件编号的词向量;根据各个告警信息的告警时间和告警编号,确定各个告警信息的告警编号的词向量;根据各个告警信息的组件编号的词向量和各个告警信息的告警编号的词向量,确定各个告警信息的向量,并将各个告警信息的告警编号和向量作为键值对存入信息词向量字典中;根据所述信息词向量字典,将具有关联关系的告警信息存储至同一个告警信息集合中;
向量确定模块具体用于:针对每一个告警事件执行下述操作:将告警事件包含的各个告警信息的向量相加,得到目标向量;将所述目标向量确定为所述告警事件的向量。
7.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;
以及与所述至少一个处理器网络通信连接的存储器;
其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的解决方案确定方法。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-5中任一项所述的解决方案确定方法。
CN202310975425.3A 2023-08-03 2023-08-03 一种解决方案确定方法、装置、设备及介质 Active CN116991620B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310975425.3A CN116991620B (zh) 2023-08-03 2023-08-03 一种解决方案确定方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310975425.3A CN116991620B (zh) 2023-08-03 2023-08-03 一种解决方案确定方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN116991620A CN116991620A (zh) 2023-11-03
CN116991620B true CN116991620B (zh) 2024-02-23

Family

ID=88526209

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310975425.3A Active CN116991620B (zh) 2023-08-03 2023-08-03 一种解决方案确定方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN116991620B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664374A (zh) * 2018-05-17 2018-10-16 腾讯科技(深圳)有限公司 故障告警模型创建方法、装置、故障告警方法及装置
CN110321268A (zh) * 2019-06-12 2019-10-11 平安科技(深圳)有限公司 一种告警信息处理方法及装置
WO2021082697A1 (zh) * 2019-11-01 2021-05-06 平安科技(深圳)有限公司 基于批量告警事件的定位方法、装置、电子设备及介质
WO2022007108A1 (zh) * 2020-07-07 2022-01-13 南京邮电大学 一种基于深度学习的网络告警定位方法
CN114765575A (zh) * 2021-01-04 2022-07-19 中国移动通信有限公司研究院 一种网络故障原因预测方法、装置及电子设备
CN115396289A (zh) * 2022-08-31 2022-11-25 广东电网有限责任公司 一种故障告警确定方法、装置、电子设备及存储介质
CN116132263A (zh) * 2023-02-24 2023-05-16 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664374A (zh) * 2018-05-17 2018-10-16 腾讯科技(深圳)有限公司 故障告警模型创建方法、装置、故障告警方法及装置
CN110321268A (zh) * 2019-06-12 2019-10-11 平安科技(深圳)有限公司 一种告警信息处理方法及装置
WO2021082697A1 (zh) * 2019-11-01 2021-05-06 平安科技(深圳)有限公司 基于批量告警事件的定位方法、装置、电子设备及介质
WO2022007108A1 (zh) * 2020-07-07 2022-01-13 南京邮电大学 一种基于深度学习的网络告警定位方法
CN114765575A (zh) * 2021-01-04 2022-07-19 中国移动通信有限公司研究院 一种网络故障原因预测方法、装置及电子设备
CN115396289A (zh) * 2022-08-31 2022-11-25 广东电网有限责任公司 一种故障告警确定方法、装置、电子设备及存储介质
CN116132263A (zh) * 2023-02-24 2023-05-16 北京优特捷信息技术有限公司 告警解决方案推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN116991620A (zh) 2023-11-03

Similar Documents

Publication Publication Date Title
CN116049146B (zh) 一种数据库故障处理方法、装置、设备及存储介质
CN116089231B (zh) 一种故障告警方法、装置、电子设备及存储介质
CN116010220A (zh) 一种告警诊断方法、装置、设备及存储介质
CN113468021B (zh) 监控性能数据的方法、装置、设备以及存储介质
CN116991620B (zh) 一种解决方案确定方法、装置、设备及介质
CN116991683B (zh) 一种告警信息处理方法、装置、设备及介质
CN116545905A (zh) 一种服务健康检测方法、装置、电子设备及存储介质
CN116991684B (zh) 一种告警信息处理方法、装置、设备及介质
CN115629903A (zh) 任务延迟监控方法、装置、设备及存储介质
CN114327988B (zh) 一种可视化网络故障关系确定方法和装置
CN116089499A (zh) 基于kafka数据量的数据统计方法、装置及介质
CN117609801A (zh) 一种数据比对方法、装置、设备及介质
CN117938909A (zh) 一种数据传输方法、装置、设备及介质
CN117424850A (zh) 一种异常链路聚合方法、查询方法、装置、设备及介质
CN117493127A (zh) 一种应用程序检测方法、装置、设备及介质
CN117421155A (zh) 一种告警处理方法、装置、设备及介质
CN117611138A (zh) 一种运维设备的异常检测方法、装置以及电子设备
CN117608904A (zh) 一种故障定位方法、装置、电子设备和存储介质
CN117290179A (zh) 一种事件超时状态的确定方法、装置、设备和存储介质
CN117163793A (zh) 电梯故障处理方法、装置、系统、电子设备和存储介质
CN117389828A (zh) 供电服务器管理方法、装置、系统、设备以及存储介质
CN117749614A (zh) 一种协议规则确定方法、装置、电子设备及存储介质
CN118280611A (zh) 一种换热器监测方法、装置、设备及介质
CN115914271A (zh) 一种控制系统报警方法、装置、电子设备及存储介质
CN117234736A (zh) 一种指令处理方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant