CN116366482A - 应用监控方法、系统和相关设备 - Google Patents
应用监控方法、系统和相关设备 Download PDFInfo
- Publication number
- CN116366482A CN116366482A CN202310375545.XA CN202310375545A CN116366482A CN 116366482 A CN116366482 A CN 116366482A CN 202310375545 A CN202310375545 A CN 202310375545A CN 116366482 A CN116366482 A CN 116366482A
- Authority
- CN
- China
- Prior art keywords
- link
- application
- communication quality
- sub
- communication
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000012544 monitoring process Methods 0.000 title claims abstract description 31
- 238000004891 communication Methods 0.000 claims abstract description 172
- 230000008569 process Effects 0.000 claims abstract description 11
- 230000002159 abnormal effect Effects 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000008439 repair process Effects 0.000 claims description 7
- 230000001364 causal effect Effects 0.000 claims description 4
- 238000012549 training Methods 0.000 claims description 4
- 230000002085 persistent effect Effects 0.000 claims description 3
- 230000006403 short-term memory Effects 0.000 claims description 2
- 230000000007 visual effect Effects 0.000 abstract description 3
- 230000005540 biological transmission Effects 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 102100026278 Cysteine sulfinic acid decarboxylase Human genes 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 108010064775 protein C activator peptide Proteins 0.000 description 2
- 238000012098 association analyses Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
- H04L43/045—Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B17/00—Monitoring; Testing
- H04B17/30—Monitoring; Testing of propagation channels
- H04B17/309—Measuring or estimating channel quality parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Data Mining & Analysis (AREA)
- Environmental & Geological Engineering (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- Electromagnetism (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本申请公开了应用监控方法、系统和相关设备,该方法包括:确定待监控的应用及应用对应的链路,链路中包含多个节点;根据应用对应的环境信息获取链路对应的通信参数;展示链路中至少一段子链路的通信质量指标,其中,子链路是任意两个节点之间的通路,通信质量指标基于通信参数算得。本申请可通过通信参数计算并展示链路的通信质量指标,使得应用的访问质量(或称为访问体验)能被实时监控并得到可视化的反馈;其中,通信质量指标可按子链路的不同分段展示,从而方便使用者及时准确地感知、定位并处理所发生的故障,最大化地降低用户对应用的报障频率,提升业务水平及用户满意度。
Description
技术领域
本申请实施例涉及互联网技术领域,尤其涉及应用监控方法、系统和相关设备。
背景技术
随着业务数字化进程的不断推进,以及人力成本的不断上升,企业越来越关注用户(如员工)的办公体验。业务数字化后,业务系统即生产工具(包含研发设计、生产制造、经营管理或市场营销等工具),进而用户对业务系统(可称为应用)访问体验的好坏,会直接影响企业的生产效率。
因此,为有效了解员工对数字化业务的办公体验,保障企业生产效率,用户访问体验需要提前地被及时感知。但是现有技术中,用户业务出现异常时,往往需要使用者如运维人员手动排查或定位异常原因,需耗费大量的运维时间、人力物力成本,从而给用户带来较差的使用体验。因此,有必要提供相应的解决方案。
发明内容
本申请实施例提供了应用监控方法、系统和相关设备,用于保障业务应用的相关“访问体验”数据实时可见,降低用户对应用访问质量的报障频率。
本申请实施例第一方面提供一种应用监控方法,包括:
确定待监控的应用及所述应用对应的链路,其中,所述链路中包含多个节点;
根据所述应用对应的环境信息获取所述链路对应的通信参数;
展示所述链路中至少一段子链路的通信质量指标,其中,所述子链路是任意两个节点之间的通路,所述通信质量指标是基于所述通信参数计算得来的。
本申请第一方面所述的方法在具体实施时可采用本申请第二方面所述的内容实现。
本申请实施例第二方面提供一种应用监控系统,包括:
确定单元,用于确定待监控的应用及所述应用对应的链路,其中,所述链路中包含多个节点;
获取单元,用于根据所述应用对应的环境信息获取所述链路对应的通信参数;
展示单元,用于展示所述链路中至少一段子链路的通信质量指标,其中,所述子链路是任意两个节点之间的通路,所述通信质量指标是基于所述通信参数计算得来的。
本申请实施例第三方面提供一种电子设备,包括:
中央处理器,存储器以及输入输出接口;
所述存储器为短暂存储存储器或持久存储存储器;
所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行本申请实施例第一方面或第一方面的任一具体实现方式所描述的方法。
本申请实施例第四方面提供一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如本申请实施例第一方面或第一方面的任一具体实现方式所描述的方法。
本申请实施例第五方面提供一种包含指令或计算机程序的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如本申请实施例第一方面或第一方面的任一具体实现方式所描述的方法。
从以上技术方案可以看出,本申请实施例至少具有以下优点:
本申请实施例可通过通信参数计算并展示链路的通信质量指标,使得应用的访问质量(或称为访问体验)能被实时监控并得到可视化的反馈;其中,通信质量指标可按子链路的不同分段展示,从而方便使用者及时准确地感知、定位并处理所发生的故障,最大化地降低用户对应用的报障频率,提升业务水平及用户满意度。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
需要说明的是,虽然各实施例所涉及的流程性示意图(若存在)中各个步骤按照箭头的指示依次绘制,但除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
图1为本申请实施例的一个系统架构示意图;
图2为本申请实施例应用监控方法的一个流程示意图;
图3为本申请实施例应用监控方法的另一流程示意图;
图4为本申请实施例应用监控系统的一个结构示意图;
图5为本申请实施例电子设备的一个结构示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在以下的描述中,涉及到“一个具体实施方式”或“一个具体示例”等类似表达,其描述了所有可能实施例的子集,但是可以理解,“一个具体实施方式”或“一个具体示例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。在以下的描述中,涉及到的术语多个是指至少两个。本申请所说的某数值达到阈值(如果存在),在一些具体示例中,可包括前者大于阈值后者的情况。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
为便于理解和说明,在对本申请做进一步的详细说明之前,将对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
请参阅图1,图1示出了一种适用于本申请实施例的应用环境示意图。本申请实施例提供的应用监控方法可应用于如图1所示的交互系统100,该交互系统100包括终端设备101以及服务器102,服务器102与终端设备101通信连接,其中,服务器102可以是传统服务器,也可以是云端服务器,在此不作具体限定。
其中,终端设备101可以是具有显示屏且支持数据输入的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式计算机和可穿戴式电子设备等;具体的,数据输入可以是基于终端设备101上具有的语音模块输入语音、基于字符输入模块输入字符或基于图像输入模块输入图像等,还可以是基于终端设备101上安装有的手势识别模块,使得用户可以实现手势输入等交互方式。终端设备101上可以安装有客户端应用程序,用户可以基于客户端应用程序(例如搜索类APP、采购类APP、聊天小程序等应用)与服务器102进行通信,或还可以基于客户端应用程序实现前述数据输入。类似的,服务器102也可以部署有服务端应用程序,该服务端应用程序可以配合前述客户端应用程序实施本方法,如对客户端应用程序输入的数据进行有关处理,如分析得通信质量指标或返回某信息给终端设备101。
在一些实施方式中,用户可使用终端设备101操作某类应用,从而访问到服务器102关联有的待浏览信息或完成采购业务等。服务器102可根据配置信息确定待监控的应用及应用对应的链路(如某待监控应用至某搜索类服务器的链路),链路中间可包含路由器等多个节点;服务器102可根据应用对应的环境信息获取链路对应的通信参数,并展示链路中至少一段子链路的通信质量指标,通信质量指标可基于通信参数计算得来。当然,服务器102可以将该通信质量指标发送给终端设备101展示,或展示在服务器102本身的WEB等平台上。需说明的是,通信质量指标可以由服务器102自行算得,或者可以由除服务器102之外的途经节点(如链路途经的路由器)算得后发送给服务器102,或者由二者共同实施计算功能;换言之,本申请实施例提供的方法可由服务器和其他节点设备共同实现,也可以全部在服务器侧实现,或还可以全部在除服务器102之外的其他节点设备侧实现,具体可根据实际应用场景确定,此处不做限制。
上述的应用环境仅为方便理解所作的示例,可以理解的是,本申请实施例不仅局限于上述应用环境。
下面将对本申请的方法做进一步的详细说明。
请参阅图2,本申请第一方面提供一种应用监控方法的一个具体实施例,该实施例包括如下操作步骤:
步骤21、确定待监控的应用及应用对应的链路。
在一些具体示例中,可根据配置信息确定待监控的应用及应用对应的链路,其中,链路中包含多个节点。示例性的,配置信息包含应用对应的访问域名和/或IP地址。在另一些实施例中,还可以接受用户输入的请求信息,用户请求信息中包含了待监控的应用,根据用户所在终端与待监控应用之间的路径确定该应用对应的链路。
例如,用户可在全球广域网(WEB)平台配置本应用监控方法,填写要监控的域名和/或IP地址等配置信息,进而选择要监控的应用是哪个,如可以是某搜索类APP或某社交类APP等功能性应用。进一步地,该应用监控方法不仅能适用于上述WEB网络环境,还可以适用于用户数据报协议(UDP,UserDatagramProtocol)、流媒体、视频会议或物联网等不同的网络环境,换言之,本申请实施例的待监控应用及其监控方法可以部署在不同环境下使用。在各个网络环境(或称为运行环境)内,本方法可以进行不同维度的质量分析,即环境不同算得的通信质量指标类型也有所不同,如视频会议环境下可分析得视频会议的帧率、清晰度或网络抖动等通信质量指标,UDP环境下反而没有WEB环境下算得的丢包率或重传率等通信质量指标。
本申请实施例的节点可以指用户终端设备如用户主机,或还可以指路由器或某类应用的业务服务器(如百度服务器)等网络设备。示例性的,用户设备(如用户主机)A访问百度服务器E的百度搜索这一应用时(具体可以是访问该服务器中的某业务,如文件阅览业务),中间可途经过B、C、D三个节点,此节点具体可以是路由器或网站点,则该用户访问业务的全链路(或称为总链路)为:A-B-C-D-E,该全链路即百度搜索这一应用对应的链路。
需补充说明的是,上述UDP是OSI(OpenSystemInterconnection,开放式系统互联)参考模型中一种无连接的传输层协议,提供面向事务的信息传送服务。
步骤22、根据应用对应的环境信息获取链路对应的通信参数。
环境信息具体可指前述应用在当时使用环境下的硬件配置信息(如CPU和/或内存信息)、软件属性(如操作系统信息)和/或带宽等。通信参数可以包含报文数或数据收发时间等通信相关参数,该通信参数作为计算所需的参数,可用于计算重传率、往返时延RTT、域名系统(DNS,DomainNameSystem)解析、TCP握手和SSL握手中的至少一种通信质量指标(可称为网络指标或特征指标)。这些通信质量指标(具体可指后述的通信质量参数)不仅能表示应用的网络质量,还能侧面反映用户在该环境下对应用的访问体验,例如,RTT值越小表示网络状态越好、数据传输时延越小,重传率越小表示网络传输造成的丢包率少、传输效果好。
需补充说明的是,上述RTT:全称为Round-TripTime,可译为往返时延,在计算机网络中它是一个重要的性能指标,表示从发送端发送数据开始,到发送端收到来自接收端的确认(接收端收到数据后便立即发送确认),总共经历的时延。RTT主要由三个部分决定:链路的传播时间、末端系统的处理时间以及路由器缓存中的排队和处理时间;其中,前面两个部分的值作为一个TCP(TransmissionControlProtocol,传输控制协议)连接相对固定,路由器的缓存中的排队和处理时间会随着整个网络拥塞程度的变化而变化,所以RTT的变化在一定程度上能反映网络拥塞程度的变化。
值得注意的是,所述链路对应的通信参数可以是链路中各个节点中,任意两个节点之间的通信参数。
在一些具体示例中,获取通信参数的方式有主动探测方式、真实流量抓包方式两种。可采用任一方式获取链路对应的通信参数:(主动探测方式)根据待监控应用的环境信息,向待监控应用发起探测请求(如发起HTTP请求报文),以获得链路各节点反馈的通信参数;或,(真实流量抓包方式)抓取并分析与前述环境信息相匹配的目标流量,以得到通信参数。
示例性的,关于真实流量抓包方式,可使用PCAP等手段根据待监控应用的环境信息抓取用户真实流量,并通过DNS解析服务器将TCP五元组与域名DNS解析做关联,对满足用户配置的流量做基础的参数分析提取,而提取出的参数特征(即通信参数)可上报给云端服务器做进一步的分析处理,以得到通信质量指标。相比于主动探测方式,真实流量抓包方式得到的结果更准确,且可以利用真实流量执行更准确的分析。
需补充说明的是,上述PCAP的全称为packetcapture,是一个用于捕获网络流量的应用程序接口(API)。计算得到重传率、RTT、DNS解析、TCP握手、SSL握手等任意通信质量参数的方式,可以参见通信领域的现有技术。本申请提及的“任意”或“至少一”(若存在),可指所列举示例中的任一种示例或这些示例之间的任意组合。传输控制协议(TCP)五元组:五元组通常是指源IP地址、源端口、目的IP地址、目的端口和传输层协议,五元组能够区分不同会话。例如:192.168.1.110000TCP121.14.88.7680就构成了一个五元组,其意义是,一个IP地址为192.168.1.1的终端通过端口10000,利用TCP协议,和IP地址为121.14.88.76、端口为80的终端进行连接。
步骤23、展示链路中至少一段子链路的通信质量指标。
其中,子链路是任意两个节点之间的通路(此子链路包含首末节点形成的全链路),通信质量指标是基于通信参数计算得来的。例如,子链路可以是上述全链路“A-B-C-D-E”中的任意段组合线路:A-B线路、B-C、C-D线路、D-E线路、A-E线路或C-E线路等,故相应的,可分段地分别呈现各子链路的通信质量指标。
所述通信质量指标可由路由器或服务器等节点设备负责算出;可以分析多段子链路(如B-C线路、C-D线路)之间的通信参数,从而算得并展示该多段线路对应的总体的通信质量指标,如展示出B-D线路之间的通信质量等级;展示效果具体可展示在WEB平台。
在一些具体示例中,通信质量指标可以包括通信质量等级或通信质量参数,通信质量参数基于通信参数算得;通信质量等级的获得方式可包括:(方式一)通过TCP五元组信息分析通信质量参数,以得到通信质量等级;或,(方式二)通过比对通信质量参数和相应的指标基准值,确定子链路在当时环境下的通信质量等级,指标基准值由历史一段时间内的通信参数训练得到,不同环境(如视频会议或物联网等运行环境)下对应的指标基准值不同。具体的,指标基准值可通过人工智能方式,学习历史时段内的大量通信参数得到。
示例性的,前述方式一可针对真实流量抓包方式由云端服务器实施,服务器在大数据分析过程中,可以通过TCP五元组等信息,将同一条数据流(即同一租户IP)下各子链路的通信质量参数进行关联分析,最终分析得每个用户对当中每条子链路的质量评分如语音质量得分,该语音质量得分越大表示子链路对应所处的通信质量等级越优,即越靠近“优”等级。
前述方式二可以是,通过人工智能方式训练大量的历史真实数据如不同应用在不同环境下的历史性通信参数,以得到基准值预测模型。后续利用该基准值预测模型,能动态地计算出不同环境下每个通信质量参数对应的指标基准值;该基准值可理解为合格阈值或达标均值,可用于评估子链路在当时网络下的通信质量等级。例如,可以预测出重传率、RTT等通信质量参数分别对应的指标基准值,步骤33预展示的重传率、RTT结果,若越大于相应的重传率基准值、RTT基准值,则表示网络质量越不好,相应的通信质量等级越差,如越接近“差”等级。
当然,上述前述方式一和二的实施主体也可以是全链路途径的某节点设备如路由器,或,由路由器和云端服务器共同实施,具体可实际情况选定。
综上,本申请实施例可通过通信参数计算并展示链路的通信质量指标,使得应用的访问质量(或称为访问体验)能被实时监控并得到可视化的反馈;其中,通信质量指标可按子链路的不同分段展示,从而方便使用者及时准确地感知(包括对全局的用户访问体验情况“心中有数”)、定位并处理应用所发生的故障,最大化地降低用户对应用的报障频率,提升业务水平及用户满意度。
在上述示例说明的基础上,下面将提供一些具体的可能实施示例,实际应用中,这些示例之间的实施内容可根据相应的功能原理和应用逻辑由需地结合实施。
请参阅图3,本申请提供一种应用监控方法的另一具体实施例,该实施例包括如下操作步骤:
步骤31、确定待监控的应用及应用对应的链路。
步骤32、根据应用对应的环境信息获取链路对应的通信参数。
步骤33、展示链路中至少一段子链路的通信质量指标。
优选的,为进一步综合分析用户对应用的访问体验,提高评判水平和事件应对能力,因此,除了展示链路中至少一段子链路的通信质量指标之外,还可以至少展示下述任一类信息(即展示多方面的内容):
通信质量指标在指定时段内对应的通信参数;应用在历史时段内的上下行流量和/或应用流速;子链路结构和/或相应的链路质量评分;异常子链路对应的异常根因和/或修复方案;节点下属节点对应的通信质量指标和/或用户流量。其中,上下行流量、应用流速、链路质量评分、用户流量可分别根据通信参数获得。
示例性的,除了分段展示多段子链路(如B-D、A-E和/或A-B等)的通信质量指标(具体可含通信质量等级)之外,还可以对这些子链路的通信参数进行展示;具体的,用户可以在呈现的通信质量指标中,触发(如点击或者滑动到某处)某一线路中某一时间段(即指定时段)内的通信质量指标,并呈现该时间段内通信质量指标对应的具体通信参数。
进一步地,可以展示应用在历史时段内的上下行流量和/或应用流速。
进一步地,可以展示子链路结构和/或全链路结构,具体可以网络拓扑的形式表示链路结构,相应的,或还可以展示对应的链路质量评分(如用户体验评分和/或如“优”的链路质量等级);其中,该链路质量评分具体可以是上述语音质量得分,该语音质量得分区间可自定为1~100分,语音质量得分越大可表示该链路质量越优,而评分差的网络设备可在WEB平台给出告警提示。
进一步地,因各个节点下还包含其连接的各个下属节点IP(此下属节点IP具体可携带节点的名称信息),故本申请实施例还支持显示各个节点下所有IP对应的通信质量等级(或称为用户体验状态);进一步地,针对选定的待监控的应用,还可以展示某一节点下所有IP对应的用户流量。
考虑到应用会有产生故障的时候,故在上述说明的基础上,本申请实施例的方法还可以包括如下操作:
步骤34、根据异常的通信质量指标,检测出链路中的异常子链路;基于异常子链路中各节点之间的事件关联关系和/或因果关系确定异常根因。其中,上述异常的通信质量指标可指超出预设指标区间的参数。
具体地,可通过异常通信质量指标识别出上述链路中的异常子链路,该异常子链路大多情况有多条,但一般的,引发多条子链路异常的根因或起源是其中的某些(如某条)决定性子链路,只要找到这种决定性子链路就能解决各异常子链路的故障问题。示例性的,可结合人工智能的能力和运维思路,基于异常子链路中各节点之间的事件关联关系(如总部节点的数据来源于各分站点),和/或因果关系(如用户主机至业务服务器之间的通信靠路由器WAN口和站点等连通),确定引起通信质量指标异常的异常根因,此相当于以确定出引发连带故障的决定性子链路;例如,该根因可能是决定性子链路中某两节点之间的时延过高。上述异常的通信质量指标,或可呈现为通信质量等级不符合预设结果,如通信质量等级(或称为网络质量等级)为差或“业务不可达”。
进一步的,如上述步骤34确定异常根因之后,本申请实施例还可以包括如下操作:将异常根因输入预先训练的分析模型,以确定异常根因对应的修复方案。相应得到的修复方案可能是下述任一种:更换或升级节点(如路由器)、改正DNS服务器的解析信息、减少网络负载、修复或更换流量套餐、检查链路中某分站点或总站点的通信等,具体可由实际情况确定,此处不限制。上述分析模型可通过训练大量的历史根因得到,该历史根因可以是不同环境下的不同应用产生。
上述步骤31至33与步骤21至23的操作内容类似,具体不再赘述。步骤34与步骤32之后的任一步骤之间的先后执行顺序可以不限,也可以同时执行,具体可视情况而定。
综上,本申请实施例的通信质量指标能实时可见,使得使用者对全局的用户访问体验如网络质量能够做到“心中有数”。从单个用户维度来看,当某个用户访问某个应用的质量变差时,使用者能够通过本申请方法及时地感知到问题出现,以便快速地进行故障定位和维修等处理,从而在用户感知前恢复该应用的访问质量,最大化地降低用户的报障频率,提升业务效率和用户体验。
在一些具体示例中,上述配置信息可包括租户IP(如用户主机等用户终端的IP地址),当然,该租户IP也可以用户名称等指代某用户的信息替代,相应的,步骤22的具体操作过程可包括:根据应用对应的环境信息获取该链路中属于同一租户的通信参数。
此处,获取同一租户(如同一租户IP)的通信参数,有助于区分并汇集同一用户终端产生的各链路数据,有效防止关联到其他租户的通信参数,从而避免计算错误、资源占用或影响监控进度。简言之,对通信参数按租户的不同进行收集,有助于针对性地分析出各租户链路的通信质量指标,准确反馈不同租户对应用质量的访问体验,避免数据串用而低价值。
相应的,步骤23的具体实施过程包括:展示租户IP对应链路中至少一段子链路的通信质量指标。如此按租户维度分批展示不同用户的通信质量分析结果,有助于针对性地全面感知单个用户对应用的访问体验,增强展示效果和预警性。
当然,上述通信质量指标可按上行类结果(可含上行通信质量等级)和下行类结果(可含下行通信质量等级)进行区分并展示,从而体现更细化的粒度展现效果,保障统计数据翔实。
在一些具体示例中,上述通信质量等级可包含网络质量等级为优、良或差的等分析结果,故相应的,步骤23的具体实施过程可包括:通过不同的标识和/或方式展示至少一段子链路的通信质量等级,此处标识的类型可包含颜色类标识、文字类标识或图形类标识,此处的方式可包含静态展示方式或动态展示方式。
示例性的,优、良或差等级等不同的通信质量等级可通过不同的预设标识呈现,如绿色可表示网络质量等级为优,蓝色表示网络质量等级为良,黄色表示网络质量等级为差;当然,可以在优、良或差等级之外再设置“业务不可达”等级(可用红色标识表示),该“业务不可达”等级的产生原因可能是总链路中的某节点故障、网络带宽被占用或用户网络已断等不良状况。或者,还可以通过不同的图形(如不同高低的柱状图或不同大小的饼状图)或文字(如优、良、差)呈现不同的通信质量等级。如WAN1、WAN2、WAN4等,可视为中间节点如路由器的网口名称,电信专线可视为中间节点如基站点名称,当然也可以是全链路的起末节点如用户主机、百度服务器。
请参阅图4,本申请第二方面提供一种应用监控系统的一个具体示例,该系统包括:
确定单元401,用于确定待监控的应用及应用对应的链路,其中,链路中包含多个节点;
获取单元402,用于根据应用对应的环境信息获取链路对应的通信参数;
展示单元403,用于展示链路中至少一段子链路的通信质量指标,其中,子链路是任意两个节点之间的通路,通信质量指标是基于通信参数计算得来的。
可选地,确定单元401还用于:
根据异常的通信质量指标,检测出链路中的异常子链路;
基于异常子链路中各节点之间的事件关联关系和/或因果关系确定异常根因。
可选地,确定单元401还用于:
将异常根因输入预先训练的分析模型,以确定异常根因对应的修复方案。
可选地,通信质量指标包括通信质量等级;展示单元403具体用于:
通过不同的标识和/或方式展示至少一段子链路的通信质量等级。
可选地,展示单元403还用于至少展示下述任一类信息:
通信质量指标在指定时段内对应的通信参数;
应用在历史时段内的上下行流量和/或应用流速;
子链路结构和/或相应的链路质量评分;
异常子链路对应的异常根因和/或修复方案;
节点下属节点对应的通信质量指标和/或用户流量;其中可选的,上下行流量、应用流速、链路质量评分、用户流量分别根据通信参数获得。
可选地,通信质量指标包括通信质量等级和通信质量参数,通信质量参数基于通信参数算得;获取单元402具体用于:
通过TCP五元组信息分析通信质量参数,以得到通信质量等级;
或,
通过比对通信质量参数和相应的指标基准值,确定子链路在当时环境下的通信质量等级,指标基准值由历史一段时间内的通信参数训练得到,不同环境下对应的指标基准值不同。
可选地,配置信息包括租户IP,获取单元402具体用于:
根据应用对应的环境信息获取该链路中属于同一租户IP的通信参数;
相应的,展示单元403具体用于:
展示租户IP对应链路中至少一段子链路的通信质量指标。
本申请实施例中,应用监控系统各单元所执行的操作,与前述第一方面或第一方面的任一具体方法实施例所描述的操作类似,具体此处不再赘述。当然,本申请第一方面各操作的具体实现过程也可参见第二方面的相关描述实现。
请参阅图5,本申请实施例的电子设备500可以包括一个或一个以上中央处理器CPU(CPU,centralprocessingunits)501和存储器505,该存储器505中存储有一个或一个以上的应用程序或数据。
其中,存储器505可以是易失性存储或持久存储。存储在存储器505的程序可以包括一个或一个以上模块,每个模块可以包括对电子设备中的一系列指令操作。更进一步地,中央处理器501可以设置为与存储器505通信,在电子设备500上执行存储器505中的一系列指令操作。
电子设备500还可以包括一个或一个以上电源502,一个或一个以上有线或无线网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作系统,例如WindowsServerTM,MacOSXTM,UnixTM,LinuxTM,FreeBSDTM等。
该中央处理器501可以执行前述第一方面或第一方面的任一具体方法实施例所执行的操作,具体不再赘述。
本申请提供的一种计算机可读存储介质,包括指令,当所述指令在计算机上运行时,使得计算机执行如上述第一方面或第一方面的任一具体实现方式所描述的方法。
本申请提供的一种包含指令或计算机程序的计算机程序产品,当所述计算机程序产品在计算机上运行时,使得计算机执行如上述第一方面或第一方面的任一具体实现方式所描述的方法。
可以理解的是,在本申请的各种实施例中,各步骤的序号大小并不意味着执行顺序的先后,各步骤的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统(若存在)、装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统或装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品(计算机程序产品)存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,业务服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,randomaccess memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (10)
1.一种应用监控方法,其特征在于,包括:
确定待监控的应用及所述应用对应的链路,其中,所述链路中包含多个节点;
根据所述应用对应的环境信息获取所述链路对应的通信参数;
展示所述链路中至少一段子链路的通信质量指标,其中,所述子链路是任意两个节点之间的通路,所述通信质量指标是基于所述通信参数计算得来的。
2.根据权利要求1所述的应用监控方法,其特征在于,所述方法还包括:
根据异常的所述通信质量指标,检测出所述链路中的异常子链路;
基于所述异常子链路中各节点之间的事件关联关系和/或因果关系确定异常根因。
3.根据权利要求2所述的应用监控方法,其特征在于,所述方法还包括:
将所述异常根因输入预先训练的分析模型,以确定所述异常根因对应的修复方案。
4.根据权利要求1所述的应用监控方法,其特征在于,所述通信质量指标包括通信质量等级;所述展示所述链路中至少一段子链路的通信质量指标,包括:
通过不同的标识和/或方式展示所述至少一段子链路的所述通信质量等级。
5.根据权利要求1所述的应用监控方法,其特征在于,根据所述应用对应的环境信息获取所述链路对应的通信参数之后,所述方法还包括至少展示下述任一类信息:
所述通信质量指标在指定时段内对应的所述通信参数;
所述应用在历史时段内的上下行流量和/或应用流速;
所述子链路结构和/或相应的链路质量评分;
异常子链路对应的异常根因和/或修复方案;
所述节点下属节点对应的通信质量指标和/或用户流量。
6.根据权利要求1所述的应用监控方法,其特征在于,所述通信质量指标包括通信质量等级和通信质量参数,所述通信质量参数基于所述通信参数算得;所述通信质量等级的获得过程,包括:
通过TCP五元组信息分析所述通信质量参数,以得到所述通信质量等级;
或,
通过比对所述通信质量参数和相应的指标基准值,确定所述子链路在当时环境下的所述通信质量等级,所述指标基准值由历史一段时间内的通信参数训练得到,不同环境下对应的所述指标基准值不同。
7.根据权利要求1所述的应用监控方法,其特征在于,所述根据所述应用对应的环境信息获取所述链路对应的通信参数包括:
根据所述应用对应的环境信息获取该链路中属于同一租户的通信参数;
相应的,所述展示所述链路中至少一段子链路的通信质量指标包括:
展示所述租户对应链路中至少一段子链路的通信质量指标。
8.一种应用监控系统,其特征在于,包括:
确定单元,用于确定待监控的应用及所述应用对应的链路,其中,所述链路中包含多个节点;
获取单元,用于根据所述应用对应的环境信息获取所述链路对应的通信参数;
展示单元,用于展示所述链路中至少一段子链路的通信质量指标,其中,所述子链路是任意两个节点之间的通路,所述通信质量指标是基于所述通信参数计算得来的。
9.一种电子设备,其特征在于,包括:
中央处理器,存储器以及输入输出接口;
所述存储器为短暂存储存储器或持久存储存储器;
所述中央处理器配置为与所述存储器通信,并执行所述存储器中的指令操作以执行权利要求1至7中任意一项所述的方法。
10.一种计算机可读存储介质,其特征在于,包括指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310375545.XA CN116366482A (zh) | 2023-03-30 | 2023-03-30 | 应用监控方法、系统和相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310375545.XA CN116366482A (zh) | 2023-03-30 | 2023-03-30 | 应用监控方法、系统和相关设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116366482A true CN116366482A (zh) | 2023-06-30 |
Family
ID=86908130
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310375545.XA Pending CN116366482A (zh) | 2023-03-30 | 2023-03-30 | 应用监控方法、系统和相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116366482A (zh) |
-
2023
- 2023-03-30 CN CN202310375545.XA patent/CN116366482A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7178646B2 (ja) | ネットワークのセキュリティモニタリング方法、ネットワークのセキュリティモニタリング装置及びシステム | |
EP3211831B1 (en) | N-tiered end user response time eurt breakdown graph for problem domain isolation | |
KR102076862B1 (ko) | 네트워크 성능지표를 시각화하는 방법 및 장치, 및 시스템 | |
US10027694B1 (en) | Detecting denial of service attacks on communication networks | |
US10862781B2 (en) | Identifying network issues using an agentless probe and end-point network locations | |
US20030225549A1 (en) | Systems and methods for end-to-end quality of service measurements in a distributed network environment | |
US20060045019A1 (en) | Network testing agent with integrated microkernel operating system | |
US7903657B2 (en) | Method for classifying applications and detecting network abnormality by statistical information of packets and apparatus therefor | |
KR20190088342A (ko) | 네트워크 성능 진단 방법 및 장치, 및 시스템 | |
US20210184937A1 (en) | Auto discovery of network proxies | |
EP3682595B1 (en) | Obtaining local area network diagnostic test results | |
CN110890972B (zh) | 一种业务系统的健康度评估方法及装置 | |
US10230590B2 (en) | Performance metric of a system conveying web content | |
US10439899B2 (en) | Service summary view | |
CN116366482A (zh) | 应用监控方法、系统和相关设备 | |
KR102027759B1 (ko) | 네트워크와 연관된 신규 장치 등록 방법 및 장치 | |
Uzun et al. | End-to-end internet speed analysis of mobile networks with mapReduce | |
US20210367870A1 (en) | Method, apparatus and system for diagnosing network performance | |
CN117880055B (zh) | 基于传输层指标的网络故障诊断方法、装置、设备及介质 | |
JP2006033715A (ja) | ネットワークe2e性能評価システムと方法およびプログラム | |
Milanesio et al. | Network level perspective in web sessions troubleshooting | |
GB2566467A (en) | Obtaining local area network diagnostic test results | |
US20230403209A1 (en) | Conferencing service rating determination | |
Bennett | You Get What You Measure: Internet Performance Measurement as a Policy Tool | |
WO2024138264A1 (en) | System for monitoring quality of service and latency of a cellular network and related methods |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |