CN111614483A - 链路监控方法、装置、存储介质及计算机设备 - Google Patents
链路监控方法、装置、存储介质及计算机设备 Download PDFInfo
- Publication number
- CN111614483A CN111614483A CN202010269888.4A CN202010269888A CN111614483A CN 111614483 A CN111614483 A CN 111614483A CN 202010269888 A CN202010269888 A CN 202010269888A CN 111614483 A CN111614483 A CN 111614483A
- Authority
- CN
- China
- Prior art keywords
- data
- index
- target
- link
- link data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000004044 response Effects 0.000 claims description 29
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 abstract description 11
- 238000013024 troubleshooting Methods 0.000 abstract description 9
- 230000003993 interaction Effects 0.000 abstract description 8
- 230000002159 abnormal effect Effects 0.000 abstract description 7
- 238000012806 monitoring device Methods 0.000 abstract 1
- 238000013507 mapping Methods 0.000 description 15
- 238000005070 sampling Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 230000005856 abnormality Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0677—Localisation of faults
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/069—Management of faults, events, alarms or notifications using logs of notifications; Post-processing of notifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/22—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks comprising specially adapted graphical user interfaces [GUI]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5003—Managing SLA; Interaction between SLA and QoS
- H04L41/5009—Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
- H04L43/045—Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
Abstract
本发明公开了一种链路监控方法、装置、存储介质及计算机设备,涉及计算机技术领域领域。其中方法包括:采集指标数据,并在指标展示页面上展示指标数据;响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据;对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。上述方法可以在指标数据发生异常时,快速定位到问题发生时间段内的链路数据,进而通过链路数据准确的定位出问题出现的具体位置,缩短了排障时间,简化了交互过程,提高了获取有效信息的效率。
Description
技术领域
本发明涉及计算机技术领域,尤其是涉及一种链路监控方法、装置、存储介质及计算机设备。
背景技术
微服务架构作为一种松耦合的面向服务的架构,近年来受到了极大的关注。在微服务架构中,互联网后端服务会被拆分为不同的服务,这些后端服务通常由不同的语言开发、不同的人员维护以及不同的机器运行,在这样的架构下,一个服务产生故障就可能导致整个系统发生崩溃,由于微服务架构的各个应用被分散成多个服务,定位故障点非常困难。
在现有技术中,一般会建立一套全链路监控系统,以及时发现故障发生的征兆。但是,随着业务的发展,微服务的数量越来越多,服务之间的调用关系也越来越复杂,一个请求可能会经过数十个微服务的协作调用才能获取到结果,因此,在这种情况下,服务链路监控的难度正在逐步加大,以往单一的通过输入多个查询过滤条件调取相应的链路日志查找异常,已经很难快速而准确地定位出故障发生的根源,这会延长系统的排障时间,造成不可估量的损失。
发明内容
有鉴于此,本申请提供了一种链路监控方法、装置、存储介质及计算机设备,主要目的在于解决服务链路监控难度大、链路故障定位效率低,排障时间过长的技术问题。
根据本发明的第一个方面,提供了一种链路监控方法,该方法包括:
采集指标数据,并在指标展示页面上展示指标数据;
响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据;
对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
在一个实施方式中,采集指标数据,并在指标展示页面上展示指标数据,包括:采集至少一项指标数据,并依据至少一项指标数据分别生成每一项指标数据的图表数据;在指标展示页面上展示至少一项指标数据的图表数据。
在一个实施方式中,响应于指标展示页面上针对目标指标数据的触发指令,包括:响应于指标展示页面上针对目标指标数据的点击指令和/或移动指令和/或触控指令,生成针对目标指标数据的触发指令。
在一个实施方式中,响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据,包括:响应于指标展示页面上针对目标指标数据的触发指令,获取目标指标数据的指标名称、时间范围和标签信息;根据目标指标数据的指标名称、时间范围和标签信息,获取目标链路数据的业务标识;根据目标链路数据的业务标识,获取目标链路数据。
在一个实施方式中,根据目标链路数据的业务标识,获取目标链路数据,包括:根据目标链路数据的业务标识,获取与目标链路数据的业务标识相对应的链路数据;在与目标链路数据的业务标识相对应的链路数据中提取出各链路数据的响应时间参数;根据各链路数据的响应时间参数,筛选出预设数量的链路数据作为目标链路数据。
在一个实施方式中,对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示,包括:对目标链路数据进行解析处理,得到与每一条目标链路数据相关联的日志信息;将与每一条目标链路数据相关联的日志信息,按照目标链路数据的业务标识分页展示在链路展示页面上。
在一个实施方式中,所述方法还包括:响应于链路展示页面上针对日志信息的触发指令,获取与日志信息相对应的指标数据;展示与日志信息相对应的指标数据。
根据本发明的第二个方面,提供了一种链路监控装置,该装置包括:
指标数据展示模块,用于采集指标数据,并在指标展示页面上展示指标数据;
链路数据获取模块,用于响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据;
链路数据展示模块,用于对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
在一个实施方式中,指标数据展示模块,具体用于采集至少一项指标数据,并依据所述一指标数据分别生成每一项指标数据的图表数据;在指标展示页面上展示至少一项指标数据的图表数据。
在一个实施方式中,链路数据获取模块,具体用于响应于指标展示页面上针对目标指标数据的点击指令和/或移动指令和/或触控指令,生成针对目标指标数据的触发指令。
在一个实施方式中,链路数据获取模块,具体还用于响应于指标展示页面上针对目标指标数据的触发指令,获取目标指标数据的指标名称、时间范围和标签信息;根据目标指标数据的指标名称、时间范围和标签信息,获取目标链路数据的业务标识;根据目标链路数据的业务标识,获取目标链路数据。
在一个实施方式中,链路数据获取模块,具体还用于根据目标链路数据的业务标识,获取与所述目标链路数据的业务标识相对应的链路数据;在与目标链路数据的业务标识相对应的链路数据中提取出各链路数据的响应时间参数;根据各链路数据的响应时间参数,筛选出预设数量的链路数据作为目标链路数据。
在一个实施方式中,链路数据展示模块,具体用于对目标链路数据进行解析处理,得到与每一条目标链路数据相关联的日志信息;将与每一条目标链路数据相关联的日志信息,按照目标链路数据的业务标识分页展示在链路展示页面上。
在一个实施方式中,所述装置还包括指标数据获取模块,所述指标数据获取模块,用于响应于链路展示页面上针对日志信息的触发指令,获取与日志信息相对应的指标数据;指标数据展示模块,还用于展示与日志信息相对应的指标数据。
根据本发明的第三个方面,提供了一种存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述链路监控方法。
根据本发明的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述链路监控方法。
本发明提供的一种链路监控方法、装置、存储介质及计算机设备,首先采集指标数据,并在指标展示页面上展示指标数据,使系统中的各个组件的运行状态可以直观的展现在指标展示页面上,使用户可以通过指标数据的变化趋势及时了解故障发生的大致时间点,然后响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据,有效的将指标数据和链路数据结合在一起,提高了信息交互的效率,最后对目标链路数据进行解析,并对解析后的目标链路数据进行展示,使用户快速定位到问题发生的具体位置,缩短排障时间。通过本方案,可以在指标数据发生异常时,快速定位到问题发生时间段内的链路数据,进而通过链路数据准确的定位出问题出现的具体位置,缩短了排障时间,简化了交互过程,提高了获取有效信息的效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了本发明实施例提供的一种链路监控方法的流程示意图;
图2示出了本发明实施例提供的另一种链路监控方法的流程示意图;
图3示出了本发明实施例提供的一种链路监控方法的场景示意图;
图4示出了本发明实施例提供的另一种链路监控方法的场景示意图;
图5示出了本发明实施例提供的又一种链路监控方法的场景示意图;
图6示出了本发明实施例提供的一种链路监控装置的结构示意图;
图7示出了本发明实施例提供的另一种链路监控装置的结构示意图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
如背景技术所述,在微服务架构中,一个服务发生故障就可能对整个系统产生雪崩效应,从而导致整个系统发生崩溃和瘫痪。以往在单体应用架构中,排查问题主要是通过查看各应用调用的链路日志,研究错误信息和调用堆栈。然而,微服务架构的整个应用已经被分散成多个服务,这使得定位故障点非常困难,往往需要一个台机器一台机器地查看链路日志,一个服务一个服务地手工调用,因而,微服务架构虽然逻辑设计上优于单体应用架构,但是,微服务架构也引入了新的问题,例如,定位故障点非常困难,导致系统稳定性下降;服务数量变多导致其中一个服务出现故障的概率增大,且一个服务故障就可能导致整个系统发生崩溃和瘫痪;服务数量非常多,部署和管理的工作量很大等等。在这种情形下,就需要建立起一套链路监控系统,以及时发现故障发生的征兆,提高系统的稳定性,减少系统故障造成的损失。
在现有技术的链路监控系统中,当用户希望查询具体某个时间段下的某个应用的链路数据时,需要手动在搜索框内指定过滤条件并选择时间区间,排序后再选择查看,虽然有的链路监控系统优化了日志监控界面的交互过程,但仍然需要手动去做繁琐的选择操作,且不容易直接定位到故障点,从而浪费了大量的时间查看日志。
在一个实施例中,如图1所示,提供了一种链路监控方法,以该方法应用于计算机设备为例进行说明,包括以下步骤:
101、采集指标数据,并在指标展示页面上展示指标数据。
其中,指标数据指的系统中各个组件在各个监控维度下的数据值,该数据值可以衡量系统中各个组件的运行状况。在微服务架构中,组件繁多且各个组件需要监控的指标也各有不同。例如,缓存组件一般需要监控占用内存值和网络流量;数据库组件需要监控连接数和磁盘空间;业务服务组件需要监控并发数、响应延迟和错误率等。
具体的,监控系统可以部署一个指标采集组件,并通过这个指标采集组件从各个服务模块的各个组件提供的数据输出接口处获取指标数据;或者,监控系统也可以对日志库中的链路数据进行实时计算或离线运算,以获取各个组件的指标数据。另外,在获取指标数据的时候,可以采用定时采样或者埋点采样的方式,其中,定时采样指的是以一定的时间间隔采集指标数据,埋点采样指的是对埋点日志的指标数据进行采集,其中,埋点指的是系统在当前节点的上下文信息,埋点日志通常包含链路数据的业务标识,日志信息的业务标识、调用的开始时间,协议类型、调用方ip和端口,请求的服务名、调用耗时,调用结果,异常信息等信息,另外,埋点日志也可以预留可扩展字段,为扩展做准备。
进一步的,链路监控系统在采集到一项或多项指标数据后,可以在指标展示页面上展示指标数据,例如,链路监控系统可以通过绘制指标数据曲线或形成数据表格等形式来展示各项指标数据,另外,监控系统也可以根据需要为指标数据设定阈值,以使得指标数据在超过阈值时发出告警信息,从而使得用户更快速的了解故障发生的征兆。
102、响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据。
其中,目标指标数据指的是用户待查看的指标数据,通常来讲,目标指标数据可以是指标数据中较为突出的一个或一组数据,目标指标数据展示在指标展示页面上,可以表现为指标数据曲线上的一个数据点。针对目标指标数据的触发指令指的是用户与指标展示页面上目标指标数据的一种交互方式,具体可以为鼠标移动到目标指标数据上、鼠标点击在目标指标数据上或手指触控到目标指标数据上等场景。链路数据指的是应用调用的上下文信息、请求信息、请求处理信息、请求结果等日志信息,通常以链路数据的业务标识,即链路日志ID标识每一条请求的响应路径。
具体的,监控系统在获取到指标展示页面上针对目标指标数据的触发指令时,可以获取与该目标指标数据相关联的目标链路数据,其中,与目标指标数据相关联的目标链路数据可以通过预先存储的指标数据与链路数据的映射关系获取。即指标数据与链路数据的映射关系可以预先存储在系统中,以备随时调取查询。在本实施例中,可以在通过链路数据计算指标数据的过程中记录并存储指标数据与链路数据的映射关系,也可以在通过接口获取指标数据的过程中,在指标数据的上下文信息中获取链路数据,然后记录并存储指标数据与链路数据的映射关系。
需要说明的是,目标指标数据展示在指标展示页面上的状态可以只是指标数据曲线上的一个数据点,即用户触发的可能仅是一个数据点,但是由于指标数据的数据量较大,且指标数据展示的视野较为有限,此时监控系统响应的触发指令可能是多个目标指标数据,所以在获取与目标指标数据相关联的目标链路数据时,也会获取到多条目标链路数据。
103、对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
具体的,监控系统在获取到一条或多条目标链路数据之后,可以对一条或多条目标链路数据进行解析,以将链路数据转换为有意义的数据便于用户分析,其中,解析出的信息包括但不限于各目标链路数据的业务标识,目标链路数据下的各条日志信息,各条日志信息所对应的应用名称、文件路径、日志内容、生成时间、指标数据以及应用所在服务器的地址等信息,进一步的,监控系统可以将解析好的目标链路数据按照链路数据的业务标识进行分类展示,并在分类展示的过程中按照应用被调用的时间顺序或应用的接口被调用的时间顺序展示各日志信息。
本实施例提供的链路监控方法,首先采集指标数据,并在指标展示页面上展示指标数据,使系统中的各个组件的运行状态可以直观的展现在指标展示页面上,使用户可以通过指标数据的变化趋势及时了解故障发生的大致时间点,然后响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据,有效的将指标数据和链路数据结合在一起,提高了信息交互的效率,最后对目标链路数据进行解析,并对解析后的目标链路数据进行展示,使用户快速定位到问题发生的具体位置,缩短排障时间。通过上述实施例提供的方法,可以在指标数据发生异常的同时,快速定位到问题发生时间段内的链路数据,进而通过链路数据准确的定位出问题出现的具体位置,缩短了排障时间,简化了交互过程,提高了获取有效信息的效率。
进一步的,作为上述实施例具体实施方式的细化和扩展,为了完整说明本实施例的实施过程,提供了链路监控方法,如图2所示,该方法包括以下步骤:
201、采集指标数据,并在指标展示页面上展示指标数据。
具体的,监控系统可以部署一个指标采集组件,并通过指标采集组件从各个服务模块的各个组件提供的数据输出接口处获取指标数据;或者也可以对日志库中的链路数据进行实时计算或离线运算,以获取各个组件的指标数据。另外,在获取指标数据的时候,可以采用定时采样或者埋点采样的方式。
在一个实施例中,链路监控系统采集的指标数据为至少一项,在采集到至少一项指标数据之后,可以依据至少一项指标数据分别生成每一项指标数据的图表数据,并在指标展示页面上展示至少一项指标数据的图表数据,通过图表数据展示指标数据,可以直观的展示各项指标数据的变化趋势和实时动态,易于观察和分析。在本实施例中,一项指标数据指的是每一个服务模块中每一个组件最细化的指标数据,例如,对于业务服务组件来说,一项指标数据可以指一个应用的服务响应时间数据,通过采集各个服务模块中各个组件的各项指标数据,用户可以随时根据的需要调整监控系统指标展示页面的展示内容,如调整应用名称和展示时间范围等信息,并随时观测自己所关心的指标数据,从而通过指标数据的变化趋势了解和分析故障发生的大致时间点。
202、响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据。
具体的,监控系统在获取到指标展示页面上针对目标指标数据的点击指令、移动指令或触控指令之后,可以生成针对目标指标数据的触发指令,然后监控系统可以获取触控指令指示的位置,并通过触控指令指示的位置确定目标指标数据的位置,并以此获取目标指标数据的指标名称、时间范围和标签信息,其中,指标名称即目标指标数据的名称,时间范围是触发的数据点所涵盖的预先设置的时间范围,标签信息包括应用所在服务器地址、IDC服务商等信息,根据目标指标数据的指标名称、时间范围和标签信息,就可以通过预存储的指标数据与链路数据的映射关系获取目标链路数据的业务标识,即获取目标链路的链路日志ID,根据目标链路数据的链路日志ID就可以获取目标链路数据,当然,本实施例也可以直接通过目标指标数据的指标名称、时间范围和标签信息获取目标链路数据。
在一个实施例中,指标数据与链路数据的映射关系是预先存储在系统中的,其中,获取指标数据与链路数据的映射关系的方式有多种,例如,可以通过链路数据计算指标数据,然后记录并存储指标数据与链路数据的映射关系,也可以通过接口获取指标数据之后,在指标数据的上下文信息中获取链路数据,记录并存储指标数据与链路数据的映射关系。以某个指标数据为例,该指标数据由MetricName指标名、Timestamp时间戳、Value数据值和Tags标签组成,其中,MetricName=soa_response,Timestamp=1577907600000,Value=123,Tags:ip=1.1.1.1,host=test.vm,idc=sh,这个指标数据代表着在“2020/1/2 3:40:00”时刻,一个应用产生了一个值为“123”的“soa_response”指标,该指标上的标签信息为“ip=1.1.1.1,host=test.vm,idc=sh”。这条指标数据可以由收集到的链路日志计算而来,如应用在“2020/1/2 3:40:00”时触发了一次RPC调用,产生一条链路数据,记录了RPC调用的详情信息,这其中该指标数据与链路数据的映射关系,就可以被存储在链路监控系统中,需要说明的是,链路监控系统在将链路数据计算成指标数据的过程中,可以不一一生成指标数据与链路日志ID的对应关系,而是使用采样的策略,如同一个指标名在一秒钟的窗口内只生成一个映射关系,以此来减少映射关系的数量,减轻存储的压力。此外,链路监控系统也可以自行记录指标数据,而不依赖链路数据,那么在获取每个应用的指标数据时,就会在一个链路的上下文中,将链路日志ID的信息写到指标数据中,从而直接生成指标数据与链路数据的映射关系并存储在链路监控系统中。
在一个实施例中,监控系统可以通过两个Key-Value的集合结构来存储指标数据与链路数据的映射关系,其中,第一集合中的Key是指标名称+时间范围+标签信息,Value是链路日志ID,第二集合中的Key是链路日志ID,Value是链路日志全文信息。需要说明的是,通过目标指标数据的指标名称、时间信息和标签信息映射目标链路数据的链路日志ID,可以准确的找到目标指标数据对应的链路日志ID,单独的指标名称、时间信息或标签信息映射的链路日志ID都会存在重复的问题,通过三种区别信息共同映射一个链路日志ID,就可以指向唯一一个链路日志ID或唯一一条链路数据,其中,指标数据的时间范围可以根据指标数据的图表数据上的时间范围确定,例如,指标数据的图表数据展示的是6小时以内的监控曲线,那么设定的一个数据点的时间范围可以为10秒,监控系统在获取到一个目标指标数据的触发指令时,会将触发指令指向的时间点的10秒范围内的所有指标数据查找出来,确定这些指标数据的指标名称和标签信息,然后通过指标名称、时间范围(10秒)和标签信息查找到这些指标数据对应的链路日志ID,继而在日志库中查询到链路日志ID对应的链路日志全文。
进一步的,在一个实施例中,在与目标指标数据相对应的链路数据较多的情况下,可以提取出各链路数据的响应时间参数或其他具有标识性的参数,然后,根据各链路数据的响应时间参数或其他具有标识性的参数,筛选出预设数量的链路数据作为目标链路数据。通过这种方式,可以筛选出具有典型特征的目标链路数据,由于故障的发生通常具有时间一致性,如某一段时间内数据库连接超时或某下游应用响应失败等,所以查询到的故障发生时间段内指标数据异常的链路数据,具有极强的排查价值。
203、对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
具体的,监控系统在获取到目标链路数据之后,可以对目标链路数据进行解析处理,以得到与每一条目标链路数据相关联的日志信息,其中,解析出的信息包括但不限于各目标链路数据的业务标识,目标链路数据下的各条日志信息,各条日志信息所对应的应用名称、文件路径、日志内容、生成时间、指标数据以及应用所在服务器的地址等信息,解析处理后,监控系统就可以将与每一条目标链路数据相关联的日志信息,按照目标链路数据的业务标识分页展示在链路展示页面上。
在一个具体的示例中,参照图3和图4,展示了一个应用的指标展示页面,在该指标展示页面上,展示有该应用的多项指标数据,包括应用响应时间、每秒查询率和服务成功率等指标数据,在用户查看指标数据的过程中,发现18:25分左右有一个数据点有异常(参见图3中圆圈圈出的位置),于是,用户将鼠标移动到这个数据点上或点击该数据点,监控系统获取到针对该数据点的触发指令后,可以获取与该数据点相关的在18:25分的10秒范围内的目标指标数据的指标名称和服务器地址等标签信息,然后通过指标名称、时间范围和标签信息获取到与目标指标数据相关联的目标链路数据,由于数据量较多,监控系统就将这10秒范围内的链路数据中筛选出性能指标最突出(本示例中为响应时间最长)的前50-100条链路数据筛选出来进行解析和展示,在展示时采用的策略是按照目标链路数据的链路日志ID将不同链路日志ID的日志信息分页展示在链路展示页面上,以使用户便于分析和排查问题所在。
204、响应于链路展示页面上针对日志信息的触发指令,获取与日志信息相对应的指标数据。
具体的,链路展示页面上展示有目标链路数据的日志信息,通过获取链路展示页面上针对日志信息的点击指令、移动指令或触控指令,监控系统可以获取到与该日志信息相对应的指标数据,与指标数据和链路数据的多对多的对应关系不同的是,日志信息与指标数据的对应关系是一对一的,即与日志信息相对应的指标数据是唯一的。
205、展示与日志信息相对应的指标数据。
具体的,在获取到与日志信息相对应的指标数据之后,监控系统可以对获取到的指标数据进行展示,展示的方式同样可以通过图表数据的形式进行展示。在一个示例中,如图5所示,展示了通过日志信息获取指标数据并展示指标数据的场景示意图。通过这种方式,用户可以在指标数据和链路数据之间进行快速切换,进一步提高了获取有效信息的效率。
本实施例提供的链路监控方法,充分挖掘了指标数据与链路数据之间的关联关系,使用户既可以通过指标数据查看链路数据,也可以通过链路数据查看指标数据,从而使用户在发现指标数据异常时,可以快速定位到问题发生时间段内的日志信息,进而通过链路日志全文准确的定位出问题发生的具体位置,缩短了排障时间,简化了交互过程,提高了获取有效信息的效率。
进一步的,作为图1、图2所示方法的具体实现,本实施例提供了一种链路监控装置,如图6所示,该装置包括:指标数据展示模块31、链路数据获取模块32、链路数据展示模块33。
指标数据展示模块31,可用于采集指标数据,并在指标展示页面上展示指标数据;
链路数据获取模块32,可用于响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据;
链路数据展示模块33,可用于对目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
在具体的应用场景中,所述指标数据展示模块31,具体可用于采集至少一项指标数据,并依据所述一指标数据分别生成每一项指标数据的图表数据;在指标展示页面上展示至少一项指标数据的图表数据。
在具体的应用场景中,所述链路数据获取模块32,具体可用于响应于指标展示页面上针对目标指标数据的点击指令和/或移动指令,生成针对目标指标数据的触发指令。
在具体的应用场景中,所述链路数据获取模块32,具体还可用于响应于指标展示页面上针对目标指标数据的触发指令,获取目标指标数据的指标名称、时间范围和标签信息;根据目标指标数据的指标名称、时间范围和标签信息,获取目标链路数据的业务标识;根据目标链路数据的业务标识,获取目标链路数据。
在具体的应用场景中,所述链路数据获取模块32,具体还可用于根据目标链路数据的业务标识,获取与所述目标链路数据的业务标识相对应的链路数据;在与目标链路数据的业务标识相对应的链路数据中提取出各链路数据的响应时间参数;根据各链路数据的响应时间参数,筛选出预设数量的链路数据作为目标链路数据。
在具体的应用场景中,所述链路数据展示模块33,具体可用于对目标链路数据进行解析处理,得到与每一条目标链路数据相关联的日志信息;将与每一条目标链路数据相关联的日志信息,按照目标链路数据的业务标识分页展示在链路展示页面上。
在具体的应用场景中,如图7所示,所述装置还包括指标数据获取模块34,所述指标数据获取模块34,具体可用于响应于链路展示页面上针对日志信息的触发指令,获取与日志信息相对应的指标数据,所述指标数据展示模块31,还可用于展示与日志信息相对应的指标数据。
需要说明的是,本实施例提供的一种链路监控装置所涉及各功能单元的其它相应描述,可以参考图1、图2中的对应描述,在此不再赘述。
基于上述如图1、图2所示方法,相应的,本实施例还提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述如图1、图2所示的链路监控方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该待识别软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
基于上述如图1、图2所示的方法,以及图6和图7所示的链路监控装置实施例,为了实现上述目的,本实施例还提供了一种链路监控的实体设备,具体可以为个人计算机、服务器、智能手机、平板电脑、智能手表、或者其它网络设备等,该实体设备包括存储介质和处理器;存储介质,用于存储计算机程序;处理器,用于执行计算机程序以实现上述如图1、图2所示的方法。
可选的,该实体设备还可以包括用户接口、网络接口、摄像头、射频(RadioFrequency,RF)电路,传感器、音频电路、WI-FI模块等等。用户接口可以包括显示屏(Display)、输入单元比如键盘(Keyboard)等,可选用户接口还可以包括USB接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)等。
本领域技术人员可以理解,本实施例提供的一种链路监控的实体设备结构并不构成对该实体设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件布置。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述实体设备硬件和待识别软件资源的程序,支持信息处理程序以及其它待识别软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现,也可以通过硬件实现。通过应用本申请的技术方案,首先采集指标数据,并在指标展示页面上展示指标数据,然后响应于指标展示页面上针对目标指标数据的触发指令,获取与目标指标数据相关联的目标链路数据,最后对目标链路数据进行解析,并对解析后的目标链路数据进行展示。与现有技术相比,可以在指标数据发生异常的同时,快速定位到问题发生时间段内的链路数据,进而通过链路数据准确的定位出问题出现的具体位置,缩短了排障时间,简化了交互过程,提高了获取有效信息的效率。
本领域技术人员可以理解附图只是一个优选实施场景的示意图,附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中,也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
上述本申请序号仅仅为了描述,不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景,但是,本申请并非局限于此,任何本领域的技术人员能思之的变化都应落入本申请的保护范围。
Claims (10)
1.一种链路监控方法,其特征在于,所述方法包括:
采集指标数据,并在指标展示页面上展示所述指标数据;
响应于所述指标展示页面上针对目标指标数据的触发指令,获取与所述目标指标数据相关联的目标链路数据;
对所述目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
2.根据权利要求1所述的方法,其特征在于,所述采集指标数据,并在指标展示页面上展示所述指标数据,包括:
采集至少一项指标数据,并依据所述至少一项指标数据分别生成每一项指标数据的图表数据;
在所述指标展示页面上展示至少一项指标数据的图表数据。
3.根据权利要求2所述的方法,其特征在于,所述响应于所述指标展示页面上针对目标指标数据的触发指令,包括:
响应于所述指标展示页面上针对所述目标指标数据的点击指令和/或移动指令和/或触控指令,生成所述针对目标指标数据的触发指令。
4.根据权利要求3所述的方法,其特征在于,所述响应于所述指标展示页面上针对目标指标数据的触发指令,获取与所述目标指标数据相关联的目标链路数据,包括:
响应于所述指标展示页面上针对目标指标数据的触发指令,获取所述目标指标数据的指标名称、时间范围和标签信息;
根据所述目标指标数据的指标名称、时间范围和标签信息,获取目标链路数据的业务标识;
根据所述目标链路数据的业务标识,获取所述目标链路数据。
5.根据权利要求4所述的方法,其特征在于,所述根据所述目标链路数据的业务标识,获取所述目标链路数据,包括:
根据所述目标链路数据的业务标识,获取与所述目标链路数据的业务标识相对应的链路数据;
在所述与目标链路数据的业务标识相对应的链路数据中提取出各链路数据的响应时间参数;
根据所述各链路数据的响应时间参数,筛选出预设数量的链路数据作为目标链路数据。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述对所述目标链路数据进行解析处理,并对解析后的目标链路数据进行展示,包括:
对所述目标链路数据进行解析处理,得到与每一条目标链路数据相关联的日志信息;
将所述与每一条目标链路数据相关联的日志信息,按照目标链路数据的业务标识分页展示在链路展示页面上。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
响应于所述链路展示页面上针对所述日志信息的触发指令,获取与所述日志信息相对应的指标数据;
展示所述与日志信息相对应的指标数据。
8.一种链路监控装置,其特征在于,所述装置包括:
指标数据展示模块,用于采集指标数据,并在指标展示页面上展示所述指标数据;
链路数据获取模块,用于响应于所述指标展示页面上针对目标指标数据的触发指令,获取与所述目标指标数据相关联的目标链路数据;
链路数据展示模块,用于对所述目标链路数据进行解析处理,并对解析后的目标链路数据进行展示。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010269888.4A CN111614483A (zh) | 2020-04-08 | 2020-04-08 | 链路监控方法、装置、存储介质及计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010269888.4A CN111614483A (zh) | 2020-04-08 | 2020-04-08 | 链路监控方法、装置、存储介质及计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111614483A true CN111614483A (zh) | 2020-09-01 |
Family
ID=72202177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010269888.4A Pending CN111614483A (zh) | 2020-04-08 | 2020-04-08 | 链路监控方法、装置、存储介质及计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111614483A (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112187579A (zh) * | 2020-09-28 | 2021-01-05 | 中国建设银行股份有限公司 | 数据传输异常辅助处理方法、装置、设备及可读存储介质 |
CN112291302A (zh) * | 2020-09-28 | 2021-01-29 | 北京京东尚科信息技术有限公司 | 物联网设备行为数据分析方法与处理系统 |
CN112383436A (zh) * | 2020-11-17 | 2021-02-19 | 珠海大横琴科技发展有限公司 | 一种网络监控的方法和装置 |
CN114448696A (zh) * | 2022-01-26 | 2022-05-06 | 北京华顺信安科技有限公司 | 一种网络探测行为数据查询分析的方法及系统 |
CN114598622A (zh) * | 2022-03-10 | 2022-06-07 | 平安科技(深圳)有限公司 | 数据监控方法及装置、存储介质、计算机设备 |
CN115037653A (zh) * | 2022-06-28 | 2022-09-09 | 北京奇艺世纪科技有限公司 | 业务流量监控方法、装置、电子设备和存储介质 |
WO2024066771A1 (zh) * | 2022-09-28 | 2024-04-04 | 中兴通讯股份有限公司 | 一种前传链路的故障根因定位方法及装置 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1351446A1 (en) * | 2002-04-02 | 2003-10-08 | Agilent Technologies, Inc. - a Delaware corporation - | Graphical user interface for monitoring multiple events in a communications networks element |
US6654803B1 (en) * | 1999-06-30 | 2003-11-25 | Nortel Networks Limited | Multi-panel route monitoring graphical user interface, system and method |
US20060044326A1 (en) * | 2003-04-10 | 2006-03-02 | Fujitsu Limited | System performance information display method, program, and storage medium |
US20090024911A1 (en) * | 2007-01-29 | 2009-01-22 | Apple Inc. | Graph data visualization tool |
CN101667941A (zh) * | 2009-09-27 | 2010-03-10 | 中兴通讯股份有限公司 | 链路性能的检测方法及装置 |
CN106357474A (zh) * | 2016-08-30 | 2017-01-25 | 成都科来软件有限公司 | 一种基于链路的数据流量基线获取方法及装置 |
CN106487574A (zh) * | 2016-04-01 | 2017-03-08 | 国家计算机网络与信息安全管理中心 | 自动化运行维护监测系统 |
CN106528390A (zh) * | 2016-11-04 | 2017-03-22 | 智者四海(北京)技术有限公司 | 一种应用监控方法及装置 |
CN106982143A (zh) * | 2017-04-19 | 2017-07-25 | 济南浪潮高新科技投资发展有限公司 | 一种利用拓扑实现电信指标监控的方法 |
CN108228147A (zh) * | 2016-12-15 | 2018-06-29 | 中国移动通信集团公司 | 一种性能数据日志获取方法及装置 |
CN109062772A (zh) * | 2018-07-16 | 2018-12-21 | 曙光信息产业(北京)有限公司 | 集群指标告警的实现方法及集群指标告警系统 |
CN109672741A (zh) * | 2018-12-25 | 2019-04-23 | 鼎信信息科技有限责任公司 | 微服务监控方法、装置、计算机设备和存储介质 |
CN110442550A (zh) * | 2019-07-05 | 2019-11-12 | 北京邮电大学 | 日志聚屏实时可视化方法及装置 |
CN110768843A (zh) * | 2019-10-31 | 2020-02-07 | 腾讯科技(深圳)有限公司 | 网络问题分析方法、装置、终端及存储介质 |
-
2020
- 2020-04-08 CN CN202010269888.4A patent/CN111614483A/zh active Pending
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6654803B1 (en) * | 1999-06-30 | 2003-11-25 | Nortel Networks Limited | Multi-panel route monitoring graphical user interface, system and method |
EP1351446A1 (en) * | 2002-04-02 | 2003-10-08 | Agilent Technologies, Inc. - a Delaware corporation - | Graphical user interface for monitoring multiple events in a communications networks element |
US20060044326A1 (en) * | 2003-04-10 | 2006-03-02 | Fujitsu Limited | System performance information display method, program, and storage medium |
US20090024911A1 (en) * | 2007-01-29 | 2009-01-22 | Apple Inc. | Graph data visualization tool |
CN101667941A (zh) * | 2009-09-27 | 2010-03-10 | 中兴通讯股份有限公司 | 链路性能的检测方法及装置 |
CN106487574A (zh) * | 2016-04-01 | 2017-03-08 | 国家计算机网络与信息安全管理中心 | 自动化运行维护监测系统 |
CN106357474A (zh) * | 2016-08-30 | 2017-01-25 | 成都科来软件有限公司 | 一种基于链路的数据流量基线获取方法及装置 |
CN106528390A (zh) * | 2016-11-04 | 2017-03-22 | 智者四海(北京)技术有限公司 | 一种应用监控方法及装置 |
CN108228147A (zh) * | 2016-12-15 | 2018-06-29 | 中国移动通信集团公司 | 一种性能数据日志获取方法及装置 |
CN106982143A (zh) * | 2017-04-19 | 2017-07-25 | 济南浪潮高新科技投资发展有限公司 | 一种利用拓扑实现电信指标监控的方法 |
CN109062772A (zh) * | 2018-07-16 | 2018-12-21 | 曙光信息产业(北京)有限公司 | 集群指标告警的实现方法及集群指标告警系统 |
CN109672741A (zh) * | 2018-12-25 | 2019-04-23 | 鼎信信息科技有限责任公司 | 微服务监控方法、装置、计算机设备和存储介质 |
CN110442550A (zh) * | 2019-07-05 | 2019-11-12 | 北京邮电大学 | 日志聚屏实时可视化方法及装置 |
CN110768843A (zh) * | 2019-10-31 | 2020-02-07 | 腾讯科技(深圳)有限公司 | 网络问题分析方法、装置、终端及存储介质 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112187579A (zh) * | 2020-09-28 | 2021-01-05 | 中国建设银行股份有限公司 | 数据传输异常辅助处理方法、装置、设备及可读存储介质 |
CN112291302A (zh) * | 2020-09-28 | 2021-01-29 | 北京京东尚科信息技术有限公司 | 物联网设备行为数据分析方法与处理系统 |
CN112187579B (zh) * | 2020-09-28 | 2021-11-23 | 中国建设银行股份有限公司 | 数据传输异常辅助处理方法、装置、设备及可读存储介质 |
CN112383436A (zh) * | 2020-11-17 | 2021-02-19 | 珠海大横琴科技发展有限公司 | 一种网络监控的方法和装置 |
CN114448696A (zh) * | 2022-01-26 | 2022-05-06 | 北京华顺信安科技有限公司 | 一种网络探测行为数据查询分析的方法及系统 |
CN114598622A (zh) * | 2022-03-10 | 2022-06-07 | 平安科技(深圳)有限公司 | 数据监控方法及装置、存储介质、计算机设备 |
CN114598622B (zh) * | 2022-03-10 | 2023-04-25 | 平安科技(深圳)有限公司 | 数据监控方法及装置、存储介质、计算机设备 |
CN115037653A (zh) * | 2022-06-28 | 2022-09-09 | 北京奇艺世纪科技有限公司 | 业务流量监控方法、装置、电子设备和存储介质 |
CN115037653B (zh) * | 2022-06-28 | 2023-10-13 | 北京奇艺世纪科技有限公司 | 业务流量监控方法、装置、电子设备和存储介质 |
WO2024066771A1 (zh) * | 2022-09-28 | 2024-04-04 | 中兴通讯股份有限公司 | 一种前传链路的故障根因定位方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111614483A (zh) | 链路监控方法、装置、存储介质及计算机设备 | |
CN110245078B (zh) | 一种软件的压力测试方法、装置、存储介质和服务器 | |
CN111522922B (zh) | 日志信息查询方法、装置、存储介质及计算机设备 | |
US9959015B2 (en) | Systems and methods for monitoring and analyzing performance in a computer system with node pinning for concurrent comparison of nodes | |
US10205643B2 (en) | Systems and methods for monitoring and analyzing performance in a computer system with severity-state sorting | |
CN106649063B (zh) | 用于监测程序运行时耗时数据的方法及系统 | |
US10303533B1 (en) | Real-time log analysis service for integrating external event data with log data for use in root cause analysis | |
US9047348B2 (en) | Event correlation in cloud computing | |
US8688729B2 (en) | Efficiently collecting transaction-separated metrics in a distributed enviroment | |
US20130047169A1 (en) | Efficient Data Structure To Gather And Distribute Transaction Events | |
CN111078513A (zh) | 日志处理方法、装置、设备、存储介质及日志告警系统 | |
CN111400189A (zh) | 代码覆盖率监测方法、装置、电子设备及存储介质 | |
US20180095819A1 (en) | Incident analysis program, incident analysis method, information processing device, service identification program, service identification method, and service identification device | |
US20200125544A1 (en) | Method and Apparatus of Collecting and Reporting Database Application Incompatibilities | |
CN109800124B (zh) | Cpu使用率监控方法、装置、电子设备及存储介质 | |
CN111158926A (zh) | 业务请求分析方法、装置及设备 | |
CN114143369A (zh) | 一种云平台的服务监控系统 | |
CN114172949A (zh) | 一种微服务链路监控追踪方法和系统 | |
CN110011845B (zh) | 日志采集方法及系统 | |
JP2004348640A (ja) | ネットワーク管理システム及びネットワーク管理方法 | |
CN114327988B (zh) | 一种可视化网络故障关系确定方法和装置 | |
CN111368104A (zh) | 信息处理方法、装置及设备 | |
US11487746B2 (en) | Business impact analysis | |
CN114996080A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113781068A (zh) | 线上问题解决方法、装置、电子设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200901 |
|
RJ01 | Rejection of invention patent application after publication |