CN116846741B - 一种告警收敛方法、装置、设备及存储介质 - Google Patents

一种告警收敛方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116846741B
CN116846741B CN202311116028.7A CN202311116028A CN116846741B CN 116846741 B CN116846741 B CN 116846741B CN 202311116028 A CN202311116028 A CN 202311116028A CN 116846741 B CN116846741 B CN 116846741B
Authority
CN
China
Prior art keywords
call link
service
call
identity
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311116028.7A
Other languages
English (en)
Other versions
CN116846741A (zh
Inventor
王贝宁
宋蕴真
夏子承
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiajia Technology Co ltd
Original Assignee
Jiajia Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiajia Technology Co ltd filed Critical Jiajia Technology Co ltd
Priority to CN202311116028.7A priority Critical patent/CN116846741B/zh
Publication of CN116846741A publication Critical patent/CN116846741A/zh
Application granted granted Critical
Publication of CN116846741B publication Critical patent/CN116846741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0677Localisation of faults
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/60Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本申请提出一种告警收敛方法、装置、设备及存储介质,方法包括:获取告警信息,对告警信息进行分析,确定告警信息对应的跟踪身份标识,根据跟踪身份标识生成残缺调用链路拓扑,有利于迅速确定当前告警实际对应的残缺调用链路拓扑,根据残缺调用链路拓扑与预设业务调用链路集合进行匹配,考虑业务调用关系因素,确定残缺调用链路拓扑潜在归属的至少一目标调用链路,有利于提高收敛压缩效果、运维人员了解告警所影响业务,快速了解定位问题原因,提高分析效率;目标调用链路中的服务节点以服务节点所支持服务的服务接口为粒度划分,有利于运维人员更加直观、迅速了解服务节点对应的服务接口,进一步提高运维人员定位问题原因的效率。

Description

一种告警收敛方法、装置、设备及存储介质
技术领域
本申请涉及运维领域,尤其涉及一种告警收敛方法、装置、设备及存储介质。
背景技术
现有的告警收敛方法主要有几种方式:1)、通过对告警进行属性、时间分类进而归为一类;2)、通过CMDB(Configuration Management Database,配置管理数据库)的资产关系进行某种图划分从而进行压缩;3)、通过文本相似度等对告警文本进行聚合,从而实现告警压缩。然而,现有的方法都是通过将告警呈现在其所属全量拓扑的所有节点上进行告警分析,一方面数据分析量庞大,分析效率低,不利于运维人员快速找到问题原因;另一方面,忽略了业务调用关系对于告警的重要性,压缩效果差,无法知道告警所影响的业务,同样不利于不利于运维人员定位问题原因。
发明内容
本申请实施例提供一种告警收敛方法、装置、设备及存储介质,以解决相关技术存在的至少一问题,技术方案如下:
第一方面,本申请实施例提供了一种告警收敛的方法,包括:
获取告警信息;
对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识;
根据所述跟踪身份标识生成残缺调用链路拓扑;
对所述残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定所述残缺调用链路拓扑潜在归属的至少一目标调用链路;
其中,所述目标调用链路中的服务节点以所述服务节点所支持服务的服务接口为粒度划分。
在一种实施方式中,所述对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识包括:
对所述告警信息进行分析,确定所述告警信息对应的异常服务节点的第一跨度身份标识;
根据所述第一跨度身份标识确定所述异常服务节点所归属的跟踪身份标识。
在一种实施方式中,所述根据所述跟踪身份标识生成残缺调用链路拓扑包括:
根据所述跟踪身份标识进行第一查询,确定除所述异常服务节点之外归属于所述跟踪身份标识的其他服务节点以及每一所述其他服务节点对应的第二跨度身份标识;
根据所述跟踪身份标识进行第二查询,确定不同的所述第二跨度身份标识之间以及所述第一跨度身份标识与所述第二跨度身份标识之间的父子关系;
根据所述父子关系、所有所述其他服务节点以及所述异常服务节点进行串联处理,生成所述残缺调用链路拓扑。
在一种实施方式中,所述预设业务调用链路集合通过以下步骤生成:
获取历史调用链数据;
从所述历史调用链数据中提取历史调用链,并从所述历史调用链中确定所有原始节点;
获取每一所述原始节点所支持服务对应的服务接口,以所述服务接口为粒度分别对所述原始节点进行划分,生成划分结果;
根据所述划分结果构建预设业务调用链路,返回所述从所述历史调用链数据中提取历史调用链的步骤,直至所述历史调用链数据中的所有历史调用链均被提取,得到预设业务调用链路集合;所述预设业务调用链路集合包括若干个预设业务调用链路。
在一种实施方式中,所述从所述历史调用链数据中提取历史调用链的步骤之前,还包括以下至少之一:
从所述历史调用链数据中确定断链数据,并将所述断链数据从所述历史调用链数据中进行删除;
从所述历史调用链数据中确定错链数据,并将所述错链数据从所述历史调用链数据中进行删除;
从所述历史调用链数据中确定调用失败数据,并将所述调用失败数据从所述历史调用链数据中进行删除。
在一种实施方式中,还包括:
将所述预设业务调用链路集合中的各个所述预设业务调用链路进行对比;
当存在重复的目标预设业务调用链路,对所述目标预设业务调用链路进行去重处理,得到更新后的预设业务调用链路集合。
在一种实施方式中,所述对所述残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定所述残缺调用链路拓扑潜在归属的至少一目标调用链路,包括:
将所述残缺调用链路拓扑与所述预设业务调用链路集合中的每一所述预设业务调用链路进行对比匹配;
将存在与所述残缺调用链路拓扑相同内容的至少一预设业务调用链路确定为所述残缺调用链路拓扑潜在归属的至少一目标调用链路。
第二方面,本申请实施例提供了一种告警收敛装置,包括:
获取模块,用于获取告警信息;
分析模块,用于对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识;
确定模块,用于根据所述跟踪身份标识生成残缺调用链路拓扑;对所述残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定所述残缺调用链路拓扑潜在归属的至少一目标调用链路;
其中,所述目标调用链路中的服务节点以所述服务节点所支持服务的服务接口为粒度划分。
第三方面,本申请实施例提供了一种电子设备,包括:处理器和存储器,该存储器中存储指令,该指令由该处理器加载并执行,以实现上述各方面任一种实施方式中的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被执行时实现上述各方面任一种实施方式中的方法。
上述技术方案中的有益效果至少包括:
获取告警信息,对告警信息进行分析,确定告警信息对应的跟踪身份标识,根据跟踪身份标识生成残缺调用链路拓扑,有利于迅速确定当前告警所实际对应的残缺调用链路拓扑;根据残缺调用链路拓扑与预设业务调用链路集合进行匹配,考虑业务调用关系因素,确定残缺调用链路拓扑潜在归属的至少一目标调用链路,有利于提高收敛压缩效果,有利于运维人员了解告警所影响业务,快速了解定位问题原因,提高分析效率;目标调用链路中的服务节点以服务节点所支持服务的服务接口为粒度划分,有利于运维人员更加直观、迅速了解服务节点对应的服务接口,进一步提高运维人员定位问题原因的效率。
上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本申请进一步的方面、实施方式和特征将会是容易明白的。
附图说明
在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请公开的一些实施方式,而不应将其视为是对本申请范围的限制。
图1为本申请一实施例告警收敛方法的步骤流程示意图;
图2为本申请一实施例调用链路的举例示意图;
图3为本申请一实施例预设业务调用链路的举例示意图;
图4为本申请一实施例的告警收敛装置的结构框图;
图5为本申请一实施例的电子设备的结构框图。
具体实施方式
在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。
参照图1,示出本申请一实施例的告警收敛方法的流程图,该告警收敛方法至少可以包括步骤S100-S300:
S100、获取告警信息。
本申请实施例中,告警信息可以为系统运行过程中,系统所检测到符合告警条件所产生的信息,告警信息中可以包括但不限于出现故障的异常服务节点的相关信息,而系统可以获取该告警信息后续进行进一步的分析处理。在一种实施方式中,系统可以为任意具有告警功能系统,不作具体限定,本申请实施例中以系统为业务系统为例进行告警收敛方法的说明,业务系统可以实时检测产生告警信息。需要说明的是,系统还可以为独立的不具有告警功能的第三方分析系统,该分析系统可以获取到其他系统传送的告警信息并进行进一步的分析,不作具体限定。
S200、对告警信息进行分析,确定告警信息对应的跟踪身份标识。
在一种实施方式中,步骤S200包括步骤S210-S220:
S210、对告警信息进行分析,确定告警信息对应的异常服务节点的第一跨度身份标识。
本申请实施例中,业务系统在获取到告警信息后,可以对告警信息进行分析,提取告警信息中异常服务节点的相关信息。例如,如图2所示中的调用链路,A→B→D→G,A→C→E→H为调用链路的正常部分,业务系统不会产生告警信息,而假设服务节点C调用服务节点F失败即C没有成功的调用F,此时C→F→I→J/K的调用链路无法正常执行,此时认为服务节点C、F、I、J、K中存在至少一个异常服务节点。
可选地,异常服务节点的相关信息包括但不限于异常服务节点的名称,例如可以为span_name以及第一跨度身份标识(第一span_id)等等。
S220、根据第一跨度身份标识查询异常服务节点所归属的跟踪身份标识。
本申请实施例中,业务系统每执行一次请求会生成一条调用链路,每一条调用链路会配置对应的唯一的跟踪身份标识(trace_id),每一条调用链路下具有至少一个服务节点,因此跟踪身份标识下具有服务节点的跨度身份标识(span_id),或者说服务节点的跨度身份标识(span_id)归属于跟踪身份标识(trace_id),而跨度身份标识以及跟踪身份标识可以存储于业务系统中。因此,在业务系统中可以根据第一跨度身份标识查询异常服务节点所归属的跟踪身份标识。例如,如图2所示,根据异常服务节点C的第一跨度身份标识可以查询到第一跨度身份标识所归属的调用链路A→C的跟踪身份标识(trace_id)。需要说明的是,在一种实施方式中,业务系统可以在生成告警信息时直接查询异常服务节点C的第一跨度身份标识所归属的跟踪身份标识,即告警信息中可以直接包含跟踪身份标识。
S300、根据跟踪身份标识生成残缺调用链路拓扑。
在一种实施方式中,步骤S300中根据跟踪身份标识生成残缺调用链路拓扑,包括步骤S310-S330:
S310、根据跟踪身份标识进行第一查询,确定除异常服务节点之外归属于跟踪身份标识的其他服务节点以及每一其他服务节点对应的第二跨度身份标识。
可选地,在确定跟踪身份标识(trace_id)后,利用跟踪身份标识进行第一查询,可以查询确定除了异常服务节点之外的归属于跟踪身份标识(trace_id)的所有服务节点(记为其他服务节点),以及每一其他服务节点对应的第二跨度身份标识(第二span_id)。例如图2中,根据调用链路A→C的跟踪身份标识可以找到其他服务节点A的第二跨度身份标识。
S320、根据跟踪身份标识进行第二查询,确定不同的第二跨度身份标识之间以及第一跨度身份标识与第二跨度身份标识之间的父子关系。
可选地,在确定跟踪身份标识(trace_id)后,利用跟踪身份标识进行第二查询,可以查询确定不同的第二跨度身份标识之间以及第一跨度身份标识与第二跨度身份标识之间的父子关系。需要说明的是,业务系统在生成调用链路时,由于服务节点之间存在调用关系,因此会存在父子关系,例如图2中的A为C的父节点,C为A的子节点,C为F的父节点,F为C的子节点,而业务系统会对在服务节点产生调用时记录每一服务节点的父跨度身份标识(parent_span_id),例如C的父跨度身份标识为A的第二跨度身份标识,以此类推,可以得到不同的第二跨度身份标识之间,以及第一跨度身份标识与第二跨度身份标识之间的父子关系。
S330、根据父子关系、所有其他服务节点以及异常服务节点进行串联处理,生成残缺调用链路拓扑。
本申请实施例中,在得到不同的第二跨度身份标识之间,以及第一跨度身份标识与第二跨度身份标识之间的父子关系后,即可以将所有其他服务节点以及异常服务节点进行串联处理,生成残缺调用链路拓扑。需要说明的是,如图2所示,正常情况下应该存在A→C→F→I→J/K的调用链路,但是由于服务节点C、F、I、J、K中存在至少一个服务节点异常,不存在F→I→J/K,此时在跟踪身份标识(trace_id)下不会找到F→I→J/K的span_name以及span_id等等内容,因此实际上最终生成的是A→C的残缺调用链路拓扑。
在一种实施方式中,步骤S300中记载的预设业务调用链路集合事先生成并存储,具体生成步骤包括S01-S04:
S01、获取历史调用链数据。
可选地,历史调用链数据可以为业务系统在历史时间执行各个请求时所生成的所有调用链的相关数据,历史时间的长度可以根据实际情况设定。
可选地,在步骤S01之后可以包括预处理步骤,预处理步骤包括S01A-S01C,其他实施方式中可以包括S01A-S01C中的其中一种或者多种:
S01A、从历史调用链数据中确定断链数据,并将断链数据从历史调用链数据中进行删除。
需要说明的是,历史调用链数据中的历史调用链可能会存在断链数据,即例如某些span_id无法串联,这些断链数据对后续的匹配会产生干扰,导致误判,因此需要将断链数据从历史调用链数据中进行删除。
S01B、从历史调用链数据中确定错链数据,并将错链数据从历史调用链数据中进行删除。
需要说明的是,历史调用链数据中的历史调用链可能会存在错链数据,例如不同的历史调用链连起来,同样这些错链数据对后续的匹配会产生干扰,导致误判,因此需要将错链数据从历史调用链数据中进行删除。
S01C、从历史调用链数据中确定调用失败数据,并将调用失败数据从历史调用链数据中进行删除。
需要说明的是,业务系统在生成调用链时,该调用链最终是成功调用还是错误调用都会存储有一个调用状态status,当status=1为调用成功,status=0为调用失败,需要将status=0的调用失败数据从历史调用链数据中进行删除,避免对后续匹配产生干扰,因为只有正常的链路才能刻画业务正常运转时服务的调用情况。
S02、从历史调用链数据中提取历史调用链,并从历史调用链中确定所有原始节点。
可选地,历史调用链数据包括大量的历史调用链,因此需要从历史调用链数据中提取历史调用链,然后根据每一历史调用链的trace_id,为了便于区分记为历史跟踪身份标识,利用历史跟踪身份标识可以确定归属的span_id,为了便于区分记为历史跨度身份标识,根据历史跨度身份标识可以确定所有原始节点。
S03、获取每一原始节点所支持服务对应的服务接口,以服务接口为粒度分别对原始节点进行划分,生成划分结果。
本申请实施例中,考虑到一些原始节点可能具有多个支持的服务,每一服务对应一个服务接口,为了使得后续的匹配结果更加精准、精细化以及真正反映业务关系、业务逻辑,以服务接口为粒度分别对原始节点进行划分,以服务接口粒度作为调用链拓扑的节点,生成划分结果。例如,假设一个服务节点为数据库服务,支持增、删、改、查这四个服务,这四个服务都对应一个服务接口,调用对应的服务接口可以实现对应的服务。需要说明的是,一些实施例中,当系统数据无法进行接口级别的粒度划分,而只能细分至服务级别,此时也可以用服务名作为节点名称(span_name)。
S04、根据划分结果构建预设业务调用链路,返回从历史调用链数据中提取历史调用链的步骤,直至历史调用链数据中的所有历史调用链均被提取,得到预设业务调用链路集合。
本申请实施例中,根据划分结果构建预设业务调用链路,例如一个历史调用链中的某个服务节点具有若干个服务接口,例如服务接口的名称分别为create、delete、update,服务节点所提供的服务为order,将服务节点的名称(span_name)配置为order/create、order/delete、order/update,利用该服务节点作为服务节点参与预设业务调用链路的构建,从而以服务接口粒度作为预设业务调用链路的拓扑的节点,返回从历史调用链数据中提取历史调用链的步骤,直至历史调用链数据中的所有历史调用链均被提取,得到与trace_id数目相同的预设业务调用链路(拓扑形式),这些预设业务调用链路构成预设业务调用链路集合。
在一些实施例中,在步骤S04之后可以包括步骤S05-S06:
S05、将预设业务调用链路集合中的各个预设业务调用链路进行对比。
可选地,从预设业务调用链路集合中逐个选取预设业务调用链路,与其他预设业务调用链路进行两两对比,判断是否有重复的预设业务调用链路。
S06、当存在重复的目标预设业务调用链路,对目标预设业务调用链路进行去重处理,得到更新后的预设业务调用链路集合。
可选地,当存在重复的目标预设业务调用链路,因为重复的目标预设业务调用链路实际上表现一样的业务逻辑,如果保留重复的目标预设业务调用链路后续会增加运维人员的负担,例如具有多条目标预设业务调用链路:购物车-选择商品-确认购买-付款,因此需要对目标预设业务调用链路进行去重处理,仅仅保留其中一条,例如有10条目标预设业务调用链路:购物车-选择商品-确认购买-付款,只留下其中一条,从而得到更新后的预设业务调用链路集合。其中,更新后的预设业务调用链路集合中相互没有完全相同的预设业务调用链路。
S400、对残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定残缺调用链路拓扑潜在归属的至少一目标调用链路。
在一些实施例中,步骤S400中对残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定残缺调用链路拓扑潜在归属的至少一目标调用链路,包括步骤S410-S420:
S410、将残缺调用链路拓扑与预设业务调用链路集合中的每一预设业务调用链路进行对比匹配。
本申请实施例中,需要将残缺调用链路拓扑与预设业务调用链路集合中的每一预设业务调用链路进行对比匹配,确定具有哪些预设业务调用链路与残缺调用链路拓扑存在相同的部分。
S420、将存在与残缺调用链路拓扑相同内容的至少一预设业务调用链路确定为残缺调用链路拓扑潜在归属的至少一目标调用链路。
本申请实施例中,将存在与残缺调用链路拓扑相同内容的至少一预设业务调用链路确定为残缺调用链路拓扑潜在归属的至少一目标调用链路,从而实现告警收敛压缩,将当前的告警信息的问题定位目标调用链路中,而目标调用链路用于展示给运维人员,从而可以减轻运维人员的负担,提高运维人员寻找问题的效率。例如,如图3所示,例如根据残缺调用链路拓扑A→C找到图3中两条目标调用链路,A→C→F→I→J/K,以及A→C→F→L→M/N,这样运维人员可以迅速根据两条目标调用链路确定问题原因,究竟是哪一条目标调用链路的哪个服务节点出现问题,例如是C、F、L哪一个服务节点出现问题。
需要说明的是,由于预设业务调用链路中的服务节点以服务接口为粒度划分,因此对比匹配后的目标调用链路中的服务节点同样以服务节点所支持服务(存在)的服务接口为粒度划分。这样,例如运维人员需要排查服务节点F是否出现问题时,可以直接对服务节点F进行排查,例如对每一个服务接口进行排查,不需要运维人员先查询服务节点F的资料,确定服务节点F所支持的服务以及对应的服务接口后,然后再排查是否哪个服务接口出现问题,能够提高运维人员的排查效率。综上,利用服务接口为粒度划分服务节点,能够提高目标调用链路的参考价值、精细度以及准确度,大大减少运维人员的工作,有利于提高问题定位的效率,尤其在告警风暴的情况下,即短时间产生大量的告警信息时,能够很好地为运维人员提供有效的参考以迅速定位问题。另外,基于预设业务调用链路集合进行匹配,也能够为故障排查提供良好的业务视角,判断整体业务里是哪些业务调用链出现了问题,以从业务视角对告警进行压缩,帮助运维人员快速了解告警对业务的影响范围。
需要说明的是,本申请实施例中,可以在离线阶段即事先构建预设业务调用链路集合,而不是在产生告警时再去构建预设业务调用链路,因此使得告警信息产生时的分析、收敛更加方便,效率更高,同时也避免了构建预设业务调用链路集合对业务系统的资源占用,有利于保证告警信息的分析和处理效率。
参照图4,示出了本申请一实施例的告警收敛装置的结构框图,该装置可以包括:
获取模块,用于获取告警信息;
分析模块,用于对告警信息进行分析,确定告警信息对应的跟踪身份标识;
确定模块,用于根据跟踪身份标识生成残缺调用链路拓扑,对残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定残缺调用链路拓扑潜在归属的至少一目标调用链路;
其中,目标调用链路中的服务节点以服务节点所支持服务的服务接口为粒度划分。
本申请实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。
参照图5,示出了本申请一实施例电子设备的结构框图,该电子设备包括:存储器310和处理器320,存储器310内存储有可在处理器320上运行的指令,处理器320加载并执行该指令实现上述实施例中的告警收敛方法。其中,存储器310和处理器320的数量可以为一个或多个。
在一种实施方式中,电子设备还包括通信接口330,用于与外界设备进行通信,进行数据交互传输。如果存储器310、处理器320和通信接口330独立实现,则存储器310、处理器320和通信接口330可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(PeripheralComponentInterconnect ,PCI)总线或扩展工业标准体系结构(Extended IndustryStandard Architecture ,EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
可选的,在具体实现上,如果存储器310、处理器320及通信接口330集成在一块芯片上,则存储器310、处理器320及通信接口330可以通过内部接口完成相互间的通信。
本申请实施例提供了一种计算机可读存储介质,其存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中提供的告警收敛方法。
本申请实施例还提供了一种芯片,该芯片包括,包括处理器,用于从存储器中调用并运行存储器中存储的指令,使得安装有芯片的通信设备执行本申请实施例提供的方法。
本申请实施例还提供了一种芯片,包括:输入接口、输出接口、处理器和存储器,输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连,处理器用于执行存储器中的代码,当代码被执行时,处理器用于执行申请实施例提供的方法。
应理解的是,上述处理器可以是中央处理器(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(digital signal processing,DSP)、专用集成电路(application specific integrated circuit,ASIC)、现场可编程门阵列(fieldprogrammablegate array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是,处理器可以是支持进阶精简指令集机器(advanced RISC machines,ARM)架构的处理器。
进一步地,可选的,上述存储器可以包括只读存储器和随机存取存储器,还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以包括只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electrically EPROM,EEPROM)或闪存。易失性存储器可以包括随机存取存储器(random access memory,RAM),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的RAM可用。例如,静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic random access memory ,DRAM) 、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data date SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlink DRAM,SLDRAM)和直接内存总线随机存取存储器(direct rambus RAM,DR RAM)。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本申请的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
应理解的是,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,该程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器,磁盘或光盘等。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种告警收敛方法,其特征在于,包括:
获取告警信息;
对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识;
根据所述跟踪身份标识生成残缺调用链路拓扑;
对所述残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定所述残缺调用链路拓扑潜在归属的至少一目标调用链路;
其中,所述目标调用链路中的服务节点以所述服务节点所支持服务的服务接口为粒度划分;
所述对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识包括:对所述告警信息进行分析,确定所述告警信息对应的异常服务节点的第一跨度身份标识;根据所述第一跨度身份标识确定所述异常服务节点所归属的跟踪身份标识;
所述根据所述跟踪身份标识生成残缺调用链路拓扑包括:
根据所述跟踪身份标识进行第一查询,确定除所述异常服务节点之外归属于所述跟踪身份标识的其他服务节点以及每一所述其他服务节点对应的第二跨度身份标识;
根据所述跟踪身份标识进行第二查询,确定不同的所述第二跨度身份标识之间以及所述第一跨度身份标识与所述第二跨度身份标识之间的父子关系;
根据所述父子关系、所有所述其他服务节点以及所述异常服务节点进行串联处理,生成所述残缺调用链路拓扑。
2.根据权利要求1所述告警收敛方法,其特征在于:所述预设业务调用链路集合通过以下步骤生成:
获取历史调用链数据;
从所述历史调用链数据中提取历史调用链,并从所述历史调用链中确定所有原始节点;
获取每一所述原始节点所支持服务对应的服务接口,以所述服务接口为粒度分别对所述原始节点进行划分,生成划分结果;
根据所述划分结果构建预设业务调用链路,返回所述从所述历史调用链数据中提取历史调用链的步骤,直至所述历史调用链数据中的所有历史调用链均被提取,得到预设业务调用链路集合;所述预设业务调用链路集合包括若干个预设业务调用链路。
3.根据权利要求2所述告警收敛方法,其特征在于:所述从所述历史调用链数据中提取历史调用链的步骤之前,还包括以下至少之一:
从所述历史调用链数据中确定断链数据,并将所述断链数据从所述历史调用链数据中进行删除;
从所述历史调用链数据中确定错链数据,并将所述错链数据从所述历史调用链数据中进行删除;
从所述历史调用链数据中确定调用失败数据,并将所述调用失败数据从所述历史调用链数据中进行删除。
4.根据权利要求2所述告警收敛方法,其特征在于:还包括:
将所述预设业务调用链路集合中的各个所述预设业务调用链路进行对比;
当存在重复的目标预设业务调用链路,对所述目标预设业务调用链路进行去重处理,得到更新后的预设业务调用链路集合。
5.根据权利要求2所述告警收敛方法,其特征在于:所述对所述残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定所述残缺调用链路拓扑潜在归属的至少一目标调用链路,包括:
将所述残缺调用链路拓扑与所述预设业务调用链路集合中的每一所述预设业务调用链路进行对比匹配;
将存在与所述残缺调用链路拓扑相同内容的至少一预设业务调用链路确定为所述残缺调用链路拓扑潜在归属的至少一目标调用链路。
6.一种告警收敛装置,其特征在于,包括:
获取模块,用于获取告警信息;
分析模块,用于对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识;
确定模块,用于根据所述跟踪身份标识生成残缺调用链路拓扑;对所述残缺调用链路拓扑与预设业务调用链路集合进行匹配,确定所述残缺调用链路拓扑潜在归属的至少一目标调用链路;
其中,所述目标调用链路中的服务节点以所述服务节点所支持服务的服务接口为粒度划分;
所述对所述告警信息进行分析,确定所述告警信息对应的跟踪身份标识包括:对所述告警信息进行分析,确定所述告警信息对应的异常服务节点的第一跨度身份标识;根据所述第一跨度身份标识确定所述异常服务节点所归属的跟踪身份标识;
所述根据所述跟踪身份标识生成残缺调用链路拓扑包括:
根据所述跟踪身份标识进行第一查询,确定除所述异常服务节点之外归属于所述跟踪身份标识的其他服务节点以及每一所述其他服务节点对应的第二跨度身份标识;
根据所述跟踪身份标识进行第二查询,确定不同的所述第二跨度身份标识之间以及所述第一跨度身份标识与所述第二跨度身份标识之间的父子关系;
根据所述父子关系、所有所述其他服务节点以及所述异常服务节点进行串联处理,生成所述残缺调用链路拓扑。
7.一种电子设备,其特征在于,包括:处理器和存储器,所述存储器中存储指令,所述指令由所述处理器加载并执行,以实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被执行时实现如权利要求1-5中任一项所述的方法。
CN202311116028.7A 2023-08-31 2023-08-31 一种告警收敛方法、装置、设备及存储介质 Active CN116846741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311116028.7A CN116846741B (zh) 2023-08-31 2023-08-31 一种告警收敛方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311116028.7A CN116846741B (zh) 2023-08-31 2023-08-31 一种告警收敛方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN116846741A CN116846741A (zh) 2023-10-03
CN116846741B true CN116846741B (zh) 2023-11-28

Family

ID=88171059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311116028.7A Active CN116846741B (zh) 2023-08-31 2023-08-31 一种告警收敛方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116846741B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110460460A (zh) * 2019-07-08 2019-11-15 阿里巴巴集团控股有限公司 业务链路故障定位方法、装置及设备
WO2020173080A1 (zh) * 2019-02-27 2020-09-03 华为技术有限公司 调用链信息查询方法以及设备
CN112737800A (zh) * 2019-10-28 2021-04-30 顺丰科技有限公司 服务节点故障定位方法、调用链生成方法及服务器
CN113268399A (zh) * 2021-06-15 2021-08-17 上海天正信息科技有限公司 一种告警处理方法、装置和电子设备
WO2021179574A1 (zh) * 2020-03-12 2021-09-16 平安科技(深圳)有限公司 根因定位方法、装置、计算机设备和存储介质
CN114584453A (zh) * 2022-02-17 2022-06-03 中国银联股份有限公司 一种应用系统的故障分析方法及装置
CN115514619A (zh) * 2022-09-20 2022-12-23 建信金融科技有限责任公司 告警收敛方法及系统
CN115599621A (zh) * 2021-06-28 2023-01-13 深信服科技股份有限公司(Cn) 微服务异常诊断方法、装置、设备及存储介质
WO2023140876A1 (en) * 2022-01-24 2023-07-27 Rakuten Mobile, Inc. Topology alarm correlation

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020173080A1 (zh) * 2019-02-27 2020-09-03 华为技术有限公司 调用链信息查询方法以及设备
CN110460460A (zh) * 2019-07-08 2019-11-15 阿里巴巴集团控股有限公司 业务链路故障定位方法、装置及设备
CN112737800A (zh) * 2019-10-28 2021-04-30 顺丰科技有限公司 服务节点故障定位方法、调用链生成方法及服务器
WO2021179574A1 (zh) * 2020-03-12 2021-09-16 平安科技(深圳)有限公司 根因定位方法、装置、计算机设备和存储介质
CN113268399A (zh) * 2021-06-15 2021-08-17 上海天正信息科技有限公司 一种告警处理方法、装置和电子设备
CN115599621A (zh) * 2021-06-28 2023-01-13 深信服科技股份有限公司(Cn) 微服务异常诊断方法、装置、设备及存储介质
WO2023140876A1 (en) * 2022-01-24 2023-07-27 Rakuten Mobile, Inc. Topology alarm correlation
CN114584453A (zh) * 2022-02-17 2022-06-03 中国银联股份有限公司 一种应用系统的故障分析方法及装置
CN115514619A (zh) * 2022-09-20 2022-12-23 建信金融科技有限责任公司 告警收敛方法及系统

Also Published As

Publication number Publication date
CN116846741A (zh) 2023-10-03

Similar Documents

Publication Publication Date Title
CN112631913B (zh) 应用程序的运行故障监控方法、装置、设备和存储介质
CN112242938B (zh) 探测方法、装置、电子设备及计算机可读存储介质
CN110362479B (zh) 系统升级测试方法和系统
CN112363937B (zh) 差异覆盖率测试方法、装置、计算机设备和存储介质
CN111885051B (zh) 数据验证方法、装置及电子设备
CN111711540B (zh) 政企业务告警识别方法和装置
CN112819631A (zh) 业务数据处理方法、装置、计算机设备和存储介质
CN111324540B (zh) 一种接口测试方法及装置
CN112769615B (zh) 一种异常分析方法及装置
CN114625554A (zh) 故障修复方法、装置、电子设备及存储介质
CN113392000A (zh) 测试用例执行结果分析方法、装置、设备及存储介质
CN116846741B (zh) 一种告警收敛方法、装置、设备及存储介质
CN111221742B (zh) 一种测试案例的更新方法、装置、存储介质和服务器
CN114500249B (zh) 一种根因定位方法和装置
CN116319421A (zh) 基于云平台的故障检测方法、装置、故障检测系统及介质
CN115629919A (zh) 一种快速故障系统切换的方法及装置
CN111552703B (zh) 一种数据处理方法及装置
CN113704114A (zh) 功能接口的自动化测试方法、装置、设备及介质
CN112631905A (zh) 执行过程数据管理方法、装置、计算机设备及存储介质
CN114818645B (zh) 基于数据主体的自动化报告生成方法、装置、设备及介质
CN117155772B (zh) 一种告警信息丰富方法、装置、设备及存储介质
CN112612471B (zh) 代码处理方法、装置、设备及存储介质
CN115208895B (zh) 一种用于区块链技术的自动化组网方法及系统
CN116820934A (zh) 数据库规范检测方法、装置、电子设备及存储介质
CN117608992A (zh) 一种追踪日志信息的方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant