CN114968701A - 全业务场景链路的监控方法及相关设备 - Google Patents

全业务场景链路的监控方法及相关设备 Download PDF

Info

Publication number
CN114968701A
CN114968701A CN202210297670.9A CN202210297670A CN114968701A CN 114968701 A CN114968701 A CN 114968701A CN 202210297670 A CN202210297670 A CN 202210297670A CN 114968701 A CN114968701 A CN 114968701A
Authority
CN
China
Prior art keywords
service
physical topology
monitoring
module
business
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210297670.9A
Other languages
English (en)
Inventor
程琦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Life Insurance Co ltd
Original Assignee
China Life Insurance Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Life Insurance Co ltd filed Critical China Life Insurance Co ltd
Priority to CN202210297670.9A priority Critical patent/CN114968701A/zh
Publication of CN114968701A publication Critical patent/CN114968701A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3089Monitoring arrangements determined by the means or processing involved in sensing the monitored data, e.g. interfaces, connectors, sensors, probes, agents

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供的全业务场景链路的监控方法及相关设备,其中,包括多个业务活动,业务活动包括服务调用节点,服务调用节点所在的IT产品包括物理拓扑模块,所述方法包括:根据业务活动的时序关系确定链路结构;根据业务活动的属性信息以及链路结构生成包括多个业务活动的监控视图;通过外设告警设备对监控视图中的服务调用节点以及物理拓扑模块进行监控;响应于服务调用节点的服务关键指标和/或物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。本申请提供的方法将多个业务活动整合在一条监控链路视图中,能够使技术人员清楚知悉发生异常的业务的异常信息,保证了对异常情况的及时处理,解决了因监控系统分散导致的故障排查效率低下的问题。

Description

全业务场景链路的监控方法及相关设备
技术领域
本申请涉及数据可视化技术领域,尤其涉及一种全业务场景链路的监控方法及相关设备。
背景技术
现有技术中,解决IT产品的故障主要依赖IT监控系统,在大型企业的产品运维中,同一个IT产品需要同时动用多个不同的监控系统进行监控,且各监控系统分属不同的技术人员负责。在出现故障问题时,各技术人员报告各监控系统收集到的数据,如网络前端请求数、宿主机CPU、内存负载、服务错误或慢交易数、数据库缓慢会话数等监控信息,再由故障诊断人员汇总信息后定位故障位置和给出处理方案,这个过程会耗费大量时间,导致无法及时对故障进行处理,造成用户损失。
发明内容
有鉴于此,本申请的目的在于提出一种全业务场景链路的监控方法及相关设备。
基于上述目的,本申请提供了一种全业务场景链路的监控方法,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,所述方法包括:确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;根据所述时序关系确定链路结构;根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图;通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。
可选地,所述时序关系包括业务数据的流动方向;所述根据所述时序关系确定链路结构,包括:根据所述业务数据的流动方向确定主链、支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置,以确定所述链路结构。
可选地,所述属性信息包括所述业务活动的业务编号、业务功能名称以及所述服务调用节点所在的IT产品名称,所述根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图,包括:根据所述主链、所述支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置在浏览器中布局并得到初始监控视图;将所述业务活动的所述业务编号、所述业务功能名称以及所述所述服务调用节点所在的IT产品名称显示在所述初始监控视图中,得到所述监控视图。
可选地,所述物理拓扑关键指标包括所述物理拓扑模块的请求数、用户数、应用宿主机CPU使用率、应用宿主机内存使用率、数据库应用连接数、数据库连接数、会话数、数据库内存使用率;所述服务关键指标包括所述服务调用节点的服务错误交易率、服务调用平均响应时长、以及所述服务调用节点所在的所述业务活动的业务调用次数。
可选地,所述通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控,包括:从所述物理拓扑模块中获取历史物理拓扑关键指标以及实时物理拓扑关键指标;计算所述历史物理拓扑关键指标的历史模块均值;从所述服务调用节点中获取历史服务关键指标以及实时服务关键指标;计算所述历史服务关键指标的历史服务均值。
可选地,所述响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,包括:响应于所述实时物理拓扑关键指标高于第一阈值和/或所述实时服务关键指标高于第二阈值,确定该物理拓扑模块的所述物理拓扑关键指标和/或该服务调用节点的所述服务关键指标出现异常,其中,所述第一阈值根据所述历史模块均值确定,所述第二阈值根据所述历史服务均值确定。
可选地,所述发出告警信息,包括:将出现异常的所述服务调用节点和/或所述物理拓扑模块所在的所述业务活动突出显示,并在所述监控视图上显示该服务调用节点的所述服务关键指标以及该物理拓扑模块的所述物理拓扑关键指标。
基于同一发明构思,本申请还提供了一种全业务场景链路的监控装置,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,所述装置包括:第一确定模块,被配置为确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;第二确定模块,被配置为根据所述时序关系确定链路结构;视图生成模块,被配置为根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图;监控模块,被配置为通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;显示模块,被配置为响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。
基于同一发明构思,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现所述全业务场景链路的监控方法。
基于同一发明构思,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行所述全业务场景链路的监控方法。
从上面所述可以看出,本申请提供的全业务场景链路的监控方法及相关设备,其中,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,所述方法包括:确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;根据所述时序关系确定链路结构;根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图;通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。本申请提供的方法将多个业务活动整合在一条监控链路视图中,能够使技术人员清楚知悉发生异常的业务的异常信息,保证了对异常情况的及时处理,解决了因监控系统分散导致的故障排查效率低下的问题。
附图说明
为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例的全业务场景链路的监控方法的整体流程示意图;
图2为本申请实施例的全业务场景链路的监控方法的部分流程示意图;
图3为本申请实施例的全业务场景链路的监控装置的结构示意图;
图4为本申请实施例的电子设备硬件结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。“上”、“下”、“左”、“右”等仅用于表示相对位置关系,当被描述对象的绝对位置改变后,则该相对位置关系也可能相应地改变。
在大型企业的产品运维中,IT产品的各监控数据分散在各种不同的监控系统中,且均为局部的监控,没有同一业务场景下全链路监控,且每个监控系统通常是分属不同人员甚至不同团队进行维护监控。而且相关技术中的监控系统均基于各种IT产品,而非具体的业务活动场景,紧急故障事件可能发生在具体业务活动场景的链路上的任意环节,且前端故障表现和后台业务活动对应关系复杂,需要协调不同团队的技术人员获取各环节监控信息以定位故障位置,会耗费大量时间,导致无法及时对故障进行处理,造成用户损失。
有鉴于此,本申请实施例提供了一种全业务场景链路的监控方法,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,如图1所示,所述方法包括:
步骤S101、确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系。所述属性信息包括所述业务活动的业务编号、业务功能名称以及业务所属IT产品名称,所述时序关系包括业务数据的流动方向。所述属性信息以及所述时序关系都为技术人员预先设计好的。
步骤S102、根据所述时序关系确定链路结构。步骤S102使技术人员在业务活动出现异常时,能够清楚知悉发生异常的业务活动与其他业务活动之间的时序关系,便于后续对异常情况的及时处理。
步骤S103、根据所述属性信息以及所述链路结构生成包括所述多个业务活动的监控视图。所述监控视图实现了对全业务场景链路的数据可视化,使技术人员能够清楚知悉对全业务场景链路的监控情况,提升工作效率。
步骤S104、通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控。所述外设告警设备包括多个能够监控所述服务调用节点以及所述物理拓扑模块的局部告警产品,能够对不同服务调用节点以及所述物理拓扑模块进行针对性的异常监控,进一步保证IT产品的平稳运行。由于从服务调用节点以及物理拓扑模块中获取的关键指标不同,所以需要同时对服务调用节点以及物理拓扑模块进行监控,使异常监控覆盖的指标范围尽可能大,从而保证IT产品的平稳运行。
步骤S105、响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。只要服务调用节点和物理拓扑模块中任一的关键指标出现异常,均会发出告警信息,防止异常堆积引发连锁反应,进一步保证了IT产品的平稳运行。
本申请实施例提供的方法包括:确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;根据所述时序关系确定链路结构;根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图;通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。本申请提供的方法将多个业务活动整合在一条监控链路视图中,能够使技术人员清楚知悉发生异常的业务的异常信息,保证了对异常情况的及时处理,解决了因监控系统分散导致的故障排查效率低下的问题。
一种具体的实施例中,在所述步骤S101之前,所述方法还包括:确定所述物理拓扑模块的数据结构以及模块间关系,所述确定所述物理拓扑模块的数据结构包括:将各所述IT产品的同一类多个物理节点作为一个物理拓扑模块,确定所述数据结构包括确定每个所述物理拓扑模块的功能名称(即该物理拓扑模块承载的功能,例如负载均衡、反向代理、内网灰度分流、静态资源、微服务网关、服务注册等)、模块类型(例如负载均衡nginx、负载均衡Haproxy、服务注册中心zookeeper、静态资源nginx、服务网关zuul、应用服务器、数据库服务器等)、模块监控方式(如容器监控探活、pinpoint监控、zabbix监控等)、模块编号id(1、2、3…)、模块所属IT产品名称(即公司里各IT产品名,如核心业务处理系统、核保业务处理系统等)、资源IP(组成模块各物理节点的IP)等。
所述确定所述物理拓扑模块的模块间关系包括:将流出数据的物理拓扑模块作为源端模块,流入数据的物理拓扑模块作为目的端模块,并确定所述模块间关系,如源端模块编号、目的端模块编号、关联类型(如服务转发,数据流转等)、关联功能简述(如业务请求转发、数据请求、服务注册等)等。
在一些实施例中,所述时序关系包括业务数据的流动方向;所述步骤S102,包括:
根据所述业务数据的流动方向确定主链、支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置,以确定所述链路结构。在一种具体的实施例中,所述业务活动为服务调用级粒度,每个前端用户操作对应一个后端服务调用,每一个后端服务调用对应一个所述业务活动,然后根据业务数据的流动方向将后端服务调用直接对应的所述业务活动确定为主链,如有被其他业务活动调用的业务活动,则将其作为支链加入进去,最后根据业务数据的流动方向确定每个业务活动在主链或支链上的位置,以确定所述链路结构,解决了发生异常时前端表现无法与后端服务调用相对应的问题。
在一些实施例中,所述属性信息包括所述业务活动的业务编号、业务功能名称以及所述服务调用节点所在的IT产品名称,如图2所示,所述步骤S103包括:
步骤S201、根据所述主链、所述支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置在浏览器中布局并得到初始监控视图。一种具体的实施例中,利用D3js开发自动布局算法生成所述监控视图。
步骤S202、将所述业务活动的所述业务编号、所述业务功能名称以及所述所述服务调用节点所在的IT产品名称显示在所述初始监控视图中,得到所述监控视图。
上述步骤实现了全业务场景链路图的数据可视化,一方面显示业务活动之间的时序关系,另一方面显示业务活动的属性信息,使技术人员在业务活动产生异常时能够清楚知悉该业务活动的信息,进一步保证对异常的及时处理,从而保证IT产品的平稳运行。
一种具体的实施例中,所述属性信息包括:业务编号id(0、1、2、3…)、前序业务编号id(1、2、3…)、业务调用方所属IT产品名称、源业务活动(调用方业务活动)、业务被调用方所属IT产品名称、目的业务活动(被调用方业务活动)、业务活动调用的功能描述(如生成投保单号、校验黑名单、计算保费、调用规则引擎等)、接口名称(接口地址及api名称)等。
在一些实施例中,所述物理拓扑关键指标包括所述物理拓扑模块的请求数、用户数、应用宿主机CPU使用率、应用宿主机内存使用率、数据库应用连接数、数据库连接数、会话数、数据库内存使用率;所述服务关键指标包括所述服务调用节点的服务错误交易率、服务调用平均响应时长、以及所述服务调用节点所在的所述业务活动的业务调用次数。
在一些实施例中,所述步骤S104包括:
从所述物理拓扑模块中获取历史物理拓扑关键指标以及实时物理拓扑关键指标;计算所述历史物理拓扑关键指标的历史模块均值;从所述服务调用节点中获取历史服务关键指标以及实时服务关键指标;计算所述历史服务关键指标的历史服务均值。在一种具体的实施例中,所述外设告警设备大量收集历史关键指标,每运行一段时自动计算一定时间段内关键指标的均值,作为异常的判决依据。
在一些实施例中,所述步骤S105中的所述响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,包括:
响应于所述实时物理拓扑关键指标高于第一阈值和/或所述实时服务关键指标高于第二阈值,确定该物理拓扑模块的所述物理拓扑关键指标和/或该服务调用节点的所述服务关键指标出现异常,其中,所述第一阈值根据所述历史模块均值确定,所述第二阈值根据所述历史服务均值确定。具体实施时,所述第一阈值/第二阈值可以设置为所述历史模块均值/历史服务均值的1.1~1.3倍,若外设告警设备监控到的实施物理拓扑关键指标/实时服务关键指标超出历史模块均值/历史服务均值的1.1~1.3倍,则该物理拓扑模块/服务调用节点明显发生异常,此种异常的判断方法的阈值为根据历史均值灵活调控的,能够较为精准地反映物理拓扑模块和服务调用节点的运行状况,同时也能较为精准地发现异常,进一步保证了IT产品的平稳运行。
在一些实施例中,所述步骤S105中的所述发出告警信息,包括:将出现异常的所述服务调用节点和/或所述物理拓扑模块所在的所述业务活动突出显示,并在所述监控视图上显示该服务调用节点的所述服务关键指标以及该物理拓扑模块的所述物理拓扑关键指标。一种具体的实施例中,上述步骤还可以为:将出现异常的所述业务活动突出显示,响应于用户发出指令(例如点击监控视图中出现异常的业务活动),再在所述监控视图上显示所述服务关键指标以及所述物理拓扑关键指标。当业务活动出现异常,通过将关键指标信息显示出来,给当前场景做一个全面的快照,解决了发生异常时需要协调不同团队的人获取各环节监控信息,再去定位异常发生的位置,耗时多、效率低下的问题。
需要说明的是,本申请实施例的方法可以由单个设备执行,例如一台计算机或服务器等。本实施例的方法也可以应用于分布式场景下,由多台设备相互配合来完成。在这种分布式场景的情况下,这多台设备中的一台设备可以只执行本申请实施例的方法中的某一个或多个步骤,这多台设备相互之间会进行交互以完成所述的方法。
需要说明的是,上述对本申请的一些实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于上述实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种全业务场景链路的监控装置,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,如图3所示,所述装置包括:
第一确定模块10,被配置为确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;
第二确定模块20,被配置为根据所述时序关系确定链路结构;
视图生成模块30,被配置为根据所述属性信息以及所述链路结构生成包括所述多个业务活动的监控视图;
监控模块40,被配置为通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;
显示模块50,被配置为响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。
本申请实施例提供的装置包括:第一确定模块,被配置为确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;第二确定模块,被配置为根据所述时序关系确定链路结构;视图生成模块,被配置为根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图;监控模块,被配置为通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;显示模块,被配置为响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。本申请提供的装置将多个业务活动整合在一条监控链路视图中,能够使技术人员清楚知悉发生异常的业务的异常信息,保证了对异常情况的及时处理,解决了因监控系统分散导致的故障排查效率低下的问题。
在一些实施例中,所述时序关系包括业务数据的流动方向;所述第二确定模块还被配置为:根据所述业务数据的流动方向确定主链、支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置,以确定所述链路结构。
在一些实施例中,所述属性信息包括所述业务活动的业务编号、业务功能名称以及所述服务调用节点所在的IT产品名称,所述视图生成模块还被配置为:根据所述主链、所述支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置在浏览器中布局并得到初始监控视图;将所述业务活动的所述业务编号、所述业务功能名称以及所述服务调用节点所在的IT产品名称显示在所述初始监控视图中,得到所述监控视图。
在一些实施例中,所述物理拓扑关键指标包括所述物理拓扑模块的请求数、用户数、应用宿主机CPU使用率、应用宿主机内存使用率、数据库应用连接数、数据库连接数、会话数、数据库内存使用率;所述服务关键指标包括所述服务调用节点的服务错误交易率、服务调用平均响应时长、以及所述服务调用节点所在的所述业务活动的业务调用次数。
在一些实施例中,所述监控模块还被配置为:从所述物理拓扑模块中获取历史物理拓扑关键指标以及实时物理拓扑关键指标;计算所述历史物理拓扑关键指标的历史模块均值;从所述服务调用节点中获取历史服务关键指标以及实时服务关键指标;计算所述历史服务关键指标的历史服务均值。
在一些实施例中,所述显示模块还被配置为:响应于所述实时物理拓扑关键指标高于第一阈值和/或所述实时服务关键指标高于第二阈值,确定该物理拓扑模块的所述物理拓扑关键指标和/或该服务调用节点的所述服务关键指标出现异常,其中,所述第一阈值根据所述历史模块均值确定,所述第二阈值根据所述历史服务均值确定。
在一些实施例中,所述显示模块还被配置为:将出现异常的所述服务调用节点和/或所述物理拓扑模块所在的所述业务活动突出显示,并在所述监控视图上显示该服务调用节点的所述服务关键指标以及该物理拓扑模块的所述物理拓扑关键指标。
为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。
上述实施例的装置用于实现前述任一实施例中相应的全业务场景链路的监控方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上任意一实施例所述的全业务场景链路的监控方法。
图4示出了本实施例所提供的一种更为具体的电子设备硬件结构示意图,该设备可以包括:处理器410、存储器420、输入/输出接口430、通信接口440和总线450。其中处理器410、存储器420、输入/输出接口430和通信接口440通过总线450实现彼此之间在设备内部的通信连接。
处理器410可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本说明书实施例所提供的技术方案。
存储器420可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器420可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器420中,并由处理器410来调用执行。
输入/输出接口430用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
通信接口440用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线450包括一通路,在设备的各个组件(例如处理器410、存储器420、输入/输出接口430和通信接口440)之间传输信息。
需要说明的是,尽管上述设备仅示出了处理器410、存储器420、输入/输出接口430、通信接口440以及总线450,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本说明书实施例方案所必需的组件,而不必包含图中所示的全部组件。
上述实施例的电子设备用于实现前述任一实施例中相应的全业务场景链路的监控方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
基于同一发明构思,与上述任意实施例方法相对应的,本申请还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行如上任一实施例所述的全业务场景链路的监控方法。
本实施例的计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
上述实施例的存储介质存储的计算机指令用于使所述计算机执行如上任一实施例所述的全业务场景链路的监控方法,并且具有相应的方法实施例的有益效果,在此不再赘述。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本申请的范围(包括权利要求)被限于这些例子;在本申请的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本申请实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。
另外,为简化说明和讨论,并且为了不会使本申请实施例难以理解,在所提供的附图中可以示出或可以不示出与集成电路(IC)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本申请实施例难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本申请实施例的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本申请的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本申请实施例。因此,这些描述应被认为是说明性的而不是限制性的。
尽管已经结合了本申请的具体实施例对本申请进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
本申请实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、修改和变型。因此,凡在本申请实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种全业务场景链路的监控方法,其特征在于,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,所述方法包括:
确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;
根据所述时序关系确定链路结构;
根据所述属性信息以及所述链路结构生成包括所述多个业务活动的监控视图;
通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;
响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。
2.根据权利要求1所述的全业务场景链路的监控方法,其特征在于,所述时序关系包括业务数据的流动方向;所述根据所述时序关系确定链路结构,包括:
根据所述业务数据的流动方向确定主链、支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置,以确定所述链路结构。
3.根据权利要求2所述的全业务场景链路的监控方法,其特征在于,所述属性信息包括所述业务活动的业务编号、业务功能名称以及所述服务调用节点所在的IT产品名称,所述根据所述属性信息以及所述链路结构生成包括所述多个业务活动的所述监控视图,包括:
根据所述主链、所述支链以及所述多个业务活动中的每个业务活动在所述主链或所述支链上的位置在浏览器中布局并得到初始监控视图;
将所述业务活动的所述业务编号、所述业务功能名称以及所述服务调用节点所在的IT产品名称显示在所述初始监控视图中,得到所述监控视图。
4.根据权利要求1所述的全业务场景链路的监控方法,其特征在于,所述物理拓扑关键指标包括所述物理拓扑模块的请求数、用户数、应用宿主机CPU使用率、应用宿主机内存使用率、数据库应用连接数、数据库连接数、会话数、数据库内存使用率;
所述服务关键指标包括所述服务调用节点的服务错误交易率、服务调用平均响应时长、以及所述服务调用节点所在的所述业务活动的业务调用次数。
5.根据权利要求4所述的全业务场景链路的监控方法,其特征在于,所述通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控,包括:
从所述物理拓扑模块中获取历史物理拓扑关键指标以及实时物理拓扑关键指标;计算所述历史物理拓扑关键指标的历史模块均值;
从所述服务调用节点中获取历史服务关键指标以及实时服务关键指标;计算所述历史服务关键指标的历史服务均值。
6.根据权利要求5所述的全业务场景链路的监控方法,其特征在于,所述响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,包括:
响应于所述实时物理拓扑关键指标高于第一阈值和/或所述实时服务关键指标高于第二阈值,确定该物理拓扑模块的所述物理拓扑关键指标和/或该服务调用节点的所述服务关键指标出现异常,其中,所述第一阈值根据所述历史模块均值确定,所述第二阈值根据所述历史服务均值确定。
7.根据权利要求1所述的全业务场景链路的监控方法,其特征在于,所述发出告警信息,包括:
将出现异常的所述服务调用节点和/或所述物理拓扑模块所在的所述业务活动突出显示,并在所述监控视图上显示该服务调用节点的所述服务关键指标以及该物理拓扑模块的所述物理拓扑关键指标。
8.一种全业务场景链路的监控装置,其特征在于,所述全业务场景链路包括多个业务活动,所述业务活动包括一个或多个服务调用节点,所述服务调用节点所在的IT产品包括物理拓扑模块,所述装置包括:
第一确定模块,被配置为确定所述多个业务活动的属性信息,以及所述多个业务活动之间的时序关系;
第二确定模块,被配置为根据所述时序关系确定链路结构;
视图生成模块,被配置为根据所述属性信息以及所述链路结构生成包括所述多个业务活动的监控视图;
监控模块,被配置为通过外设告警设备对所述监控视图中的所述业务活动的所述服务调用节点以及所述物理拓扑模块进行监控;
显示模块,被配置为响应于所述监控视图中的所述服务调用节点的服务关键指标和/或所述物理拓扑模块的物理拓扑关键指标出现异常,发出告警信息。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任意一项所述的方法。
10.一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,其特征在于,所述计算机指令用于使计算机执行权利要求1至7任一所述方法。
CN202210297670.9A 2022-03-23 2022-03-23 全业务场景链路的监控方法及相关设备 Pending CN114968701A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210297670.9A CN114968701A (zh) 2022-03-23 2022-03-23 全业务场景链路的监控方法及相关设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210297670.9A CN114968701A (zh) 2022-03-23 2022-03-23 全业务场景链路的监控方法及相关设备

Publications (1)

Publication Number Publication Date
CN114968701A true CN114968701A (zh) 2022-08-30

Family

ID=82975455

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210297670.9A Pending CN114968701A (zh) 2022-03-23 2022-03-23 全业务场景链路的监控方法及相关设备

Country Status (1)

Country Link
CN (1) CN114968701A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115801893A (zh) * 2022-11-10 2023-03-14 中国工商银行股份有限公司 业务系统的监控方法及相关设备
CN117555767A (zh) * 2023-11-21 2024-02-13 上海卫盾信息科技有限公司 Sql语句执行时间监测方法、系统、存储介质及电子设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN111245672A (zh) * 2019-12-30 2020-06-05 青岛特来电云科技有限公司 一种通用可扩展的追踪业务全链路的监控方法及系统
CN113961412A (zh) * 2020-07-01 2022-01-21 阿里巴巴集团控股有限公司 业务监控处理方法、装置及电子设备

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108833184A (zh) * 2018-06-29 2018-11-16 腾讯科技(深圳)有限公司 服务故障定位方法、装置、计算机设备及存储介质
CN111245672A (zh) * 2019-12-30 2020-06-05 青岛特来电云科技有限公司 一种通用可扩展的追踪业务全链路的监控方法及系统
CN113961412A (zh) * 2020-07-01 2022-01-21 阿里巴巴集团控股有限公司 业务监控处理方法、装置及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115801893A (zh) * 2022-11-10 2023-03-14 中国工商银行股份有限公司 业务系统的监控方法及相关设备
CN115801893B (zh) * 2022-11-10 2025-06-17 中国工商银行股份有限公司 业务系统的监控方法及相关设备
CN117555767A (zh) * 2023-11-21 2024-02-13 上海卫盾信息科技有限公司 Sql语句执行时间监测方法、系统、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN103548009B (zh) 用于跨云管理和故障查找的方法和系统
CN108989136B (zh) 业务端到端性能监控方法及装置
JP2025038175A (ja) データセンタオペレーションまたはクラウドインフラストラクチャで仮想現実または拡張現実を使用するためのシステムおよび方法
CN112187933B (zh) 一种多架构云平台中服务的监控方法和系统
CN114968701A (zh) 全业务场景链路的监控方法及相关设备
CN108769179A (zh) 一种服务健康状态评估方法及装置
US11853330B1 (en) Data structure navigator
CN104104734A (zh) 日志分析方法和装置
CN109101371B (zh) 一种容灾切换方法及装置
CN115168224A (zh) 微服务系统健康度的评估方法及相关设备
CN102572954B (zh) 一种漫游清算服务调度方法、中间件及系统
CN116136801B (zh) 云平台的数据处理方法、装置、电子设备及存储介质
CN114880321A (zh) 一种业务预警方法和装置
CN106571969B (zh) 一种云服务可用性评估方法和系统
WO2024164730A1 (zh) 一种混合云管的异常实时上报方法、系统、设备和介质
CN117743183A (zh) 业务流程测试方法、装置、电子设备及存储介质
CN115168203A (zh) 接口模拟方法、装置、系统、计算机设备和存储介质
CN115391127A (zh) 一种拨测方法、装置、存储介质及芯片
CN112596974A (zh) 一种全链路监控方法、装置、设备和存储介质
CN117097635B (zh) 调用链路采样方法、装置、存储介质及设备
CN117313189B (zh) 光纤二次回路可视化分析方法、系统、终端及存储介质
CN111858180B (zh) 分布式块存储系统的数据重构时间预测方法、系统及终端
CN110083523A (zh) 接口测试方法、装置、计算机装置、及可读存储介质
CN116633006A (zh) 电力调度系统、方法、装置、计算机设备和存储介质
CN107046604A (zh) 基于sip协议的ip电话巡检系统、方法及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination