CN112003763B - 网络链路的监测方法、监测装置、监测设备及存储介质 - Google Patents
网络链路的监测方法、监测装置、监测设备及存储介质 Download PDFInfo
- Publication number
- CN112003763B CN112003763B CN202010790315.6A CN202010790315A CN112003763B CN 112003763 B CN112003763 B CN 112003763B CN 202010790315 A CN202010790315 A CN 202010790315A CN 112003763 B CN112003763 B CN 112003763B
- Authority
- CN
- China
- Prior art keywords
- service node
- network link
- monitoring
- node
- load state
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 168
- 238000000034 method Methods 0.000 title claims abstract description 50
- 238000012806 monitoring device Methods 0.000 title claims abstract description 20
- 238000011156 evaluation Methods 0.000 claims abstract description 52
- 238000013515 script Methods 0.000 claims description 39
- 238000004590 computer program Methods 0.000 claims description 9
- 230000000977 initiatory effect Effects 0.000 claims description 8
- 230000004044 response Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 2
- 238000001514 detection method Methods 0.000 abstract description 6
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000012545 processing Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007123 defense Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/12—Network monitoring probes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1029—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers using data related to the state of servers by a load balancer
Abstract
本发明公开了一种网络链路的监测方法,基于服务器集群中的监测节点实现,通过获取服务器集群中各业务节点的负载状态信息,而后基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。相较于现有技术中网络链路性能检测工具在监测过程中以固定的访问频次获取被监测节点的性能数据,本发明提供了一种动态调整网络链路监测策略的监测方法,在业务节点负载达到预设值时降低对业务节点的网络链路监测访问频次,避免了因业务繁忙时造成网络负载加大而影响业务正常运转。本发明还公开了一种网络链路的监测装置、监测设备及存储介质,具有上述有益效果。
Description
技术领域
本发明涉及网络检测技术领域,特别是涉及一种网络链路的监测方法、监测装置、监测设备及存储介质。
背景技术
随着计算机技术和网络技术的飞速发展,数据中心的规模变得越来越大,一个机房中的机器有成千上万台,数量规模极其庞大。而且随着微服务架构的流行,服务按照不同的维度进行拆分,一起请求往往要涉及到很多个业务。互联网应用构建在不同的软件模块集之上,这些软件模块,有可能是由不同的团队开发,有可能涉及到第三方开源组件,可能使用不同的编程语言来实现,有可能部署在了几千台服务器,横跨多个不同的数据中心。因此,就需要一些可以帮助理解系统行为,用于分析性能问题的检测工具,以便发生故障的时候,能够快速定位和解决问题。
然而,因业务量庞大,现有的网络链路性能检测工具在监测过程中可能会对业务的运行造成影响,甚至导致业务中断。
发明内容
本发明的目的是提供一种网络链路的监测方法、监测装置、监测设备及存储介质,用于动态调整网络链路的监测策略,避免因业务繁忙时造成网络负载加大而影响业务正常运转。
为解决上述技术问题,本发明提供一种网络链路的监测方法,基于服务器集群中的监测节点,包括:
获取所述服务器集群中各业务节点的负载状态信息;
基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次。
可选的,所述获取所述服务器集群中各业务节点的负载状态信息,具体为:
应用在各所述业务节点预先部署的网络链路跟踪器脚本,获取各所述业务节点的本地负载状态信息以及各所述业务节点的关联业务节点的跨节点负载状态信息。
可选的,所述获取各所述业务节点的关联业务节点的跨节点负载状态信息,具体包括:
接收所述业务节点基于所述网络链路跟踪器脚本发起的跨节点数据访问请求;
根据所述跨节点数据访问请求获取对应的跨节点负载状态信息;
将所述对应的跨节点负载状态信息发送至发起所述跨节点数据访问请求的业务节点。
可选的,所述将所述对应的跨节点负载状态信息发送至发起所述跨节点数据访问请求的业务节点,具体包括:
根据所述跨节点数据访问请求所请求的关联业务节点的负载状态信息确定对所述关联业务节点的网络链路监测策略;
按对所述关联业务节点的网络链路监测策略,向所述关联业务节点发起访问并获取所述对应的跨节点负载状态信息。
可选的,所述基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次,具体为:
基于所述业务节点的负载状态信息进行评估,得到与所述业务节点对应的评估结果,并在所述对应的评估结果达到所述预设值时按所述预设规则降低对所述业务节点的网络链路监测访问频次。
可选的,所述基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次,具体为:
基于所述服务器集群中全体所述业务节点的负载状态信息进行评估,得到与所述服务器集群对应的整体评估结果,并在所述整体评估结果达到所述预设值时按所述预设规则降低对所述业务节点的网络链路监测访问频次。
可选的,所述基于所述服务器集群中全体所述业务节点的负载状态信息进行评估,得到与所述服务器集群对应的整体评估结果,具体为基于下述公式计算得到:
其中,f(n)为所述整体评估结果,n为全体所述业务节点的数量,Ni为第i个所述业务节点的网络负载,Ci为第i个所述业务节点的CPU负载,Mi为第i个所述业务节点的内存利用率,α、β、λ为预设的权值系数。
为解决上述技术问题,本发明还提供一种网络链路的监测装置,包括:
获取单元,用于获取所述服务器集群中各业务节点的负载状态信息;
监测单元,用于基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次。
为解决上述技术问题,本发明还提供一种网络链路的监测设备,包括:
存储器,用于存储指令,所述指令包括上述任意一项所述网络链路的监测方法的步骤;
处理器,用于执行所述指令。
为解决上述技术问题,本发明还提供一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述网络链路的监测方法的步骤。
本发明所提供的网络链路的监测方法,基于服务器集群中的监测节点实现,通过获取服务器集群中各业务节点的负载状态信息,而后基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。相较于现有技术中网络链路性能检测工具在监测过程中以固定的访问频次获取被监测节点的性能数据,本发明提供了一种动态调整网络链路监测策略的监测方法,在业务节点负载达到预设值时降低对业务节点的网络链路监测访问频次,避免了因业务繁忙时造成网络负载加大而影响业务正常运转。
本发明还提供一种网络链路的监测装置、监测设备及存储介质,具有上述有益效果,在此不再赘述。
附图说明
为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种网络链路的监测方法的流程图;
图2为本发明实施例提供的一种网络链路的监测方法的软件架构示意图;
图3为本发明实施例提供的一种网络链路的监测装置的结构示意图;
图4为本发明实施例提供的一种网络链路的监测设备的结构示意图。
具体实施方式
本发明的核心是提供一种网络链路的监测方法、监测装置、监测设备及存储介质,用于动态调整网络链路的监测策略,避免因业务繁忙时造成网络负载加大而影响业务正常运转。
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种网络链路的监测方法的流程图。
如图1所示,基于服务器集群中的监测节点,本发明实施例提供的网络链路的监测方法包括:
S101:获取服务器集群中各业务节点的负载状态信息。
S102:基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。
在具体实施中,预先从要监测的服务器集群中选择一个或多个节点设备作为监测节点。为了避免影响业务执行,优选地选取专用于监测服务器集群网络链路状态的节点作为监测节点,则服务器集群中其余用于执行业务的节点——业务节点,即为被监测的对象。
预先在监测节点和业务节点部署用于执行本发明实施例提供的网络链路的监测方法的相关脚本。
对于步骤S101来说,可以通过预先在各业务节点预先部署网络链路跟踪器脚本以实现对业务节点的负载状态信息的获取。由于要执行的业务可能会涉及到多个业务节点,对于一项业务,仅获取单个业务节点的负载状态信息往往是不够的,还需要根据其所执行的业务,获取与业务节点的关联业务节点的跨节点负载状态信息(即关联业务节点本地的负载状态信息)。则步骤S101具体为:应用在各业务节点预先部署的网络链路跟踪器脚本,获取各业务节点的本地负载状态信息以及各业务节点的关联业务节点的跨节点负载状态信息。各业务节点在接收到监测节点获取负载状态信息的信息后,调用本地的网络链路跟踪器脚本获取本地的负载状态信息以及关联业务节点的跨节点负载状态信息,发送至监测节点。
其中,负载状态信息具体可以包括业务节点上应用的性能数据(如系统吞吐量TPS、响应时间、错误记录等)、网络当前负载、本地CPU利用率、内存利用率、磁盘利用率等。网络链路跟踪器(Chain-tracker)脚本即部署于各个业务节点的埋点,以系统服务器的形式存在,用于根据从监测节点获取的网络链路监测策略在业务节点上执行网络链路监测任务。
对于步骤S102来说,可以预先在监测节点上部署网络链路控制器(Chain-master)脚本。监测节点在获取到各业务节点获取的负载状态信息后,调用网络链路控制器脚本对负载状态信息进行数据分析,评估各业务节点及服务器集群的负载状态,并根据评估结果调整下一步基于部署于各业务节点的网络链路跟踪器脚本执行网络链路监测的策略,调整方向为在业务节点负载较大时降低网路链路监测对业务节点的访问压力,避免在业务节点业务繁忙时因网路链路监测任务频繁访问影响业务正常运转。当评估结果小于预设值(预先与负载状态信息的类型对应设置)时,可以按照以往的固定频次对业务节点进行网络链路监测访问;当评估结果达到甚至超出预设值时,则按预设规则降低对业务节点的网络链路监测访问频次,如根据预先建立的计算模型来根据评估结果计算得到对应的网络链路监测访问频次。
本发明实施例提供的网络链路的监测方法,基于服务器集群中的监测节点实现,通过获取服务器集群中各业务节点的负载状态信息,而后基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。相较于现有技术中网络链路性能检测工具在监测过程中以固定的访问频次获取被监测节点的性能数据,本发明提供了一种动态调整网络链路监测策略的监测方法,在业务节点负载达到预设值时降低对业务节点的网络链路监测访问频次,避免了因业务繁忙时造成网络负载加大而影响业务正常运转。
图2为本发明实施例提供的一种网络链路的监测方法的软件架构示意图。
在上述实施例的基础上,为便于具体实施,本发明实施例提供一种用于实现网络链路监测的软件架构,如图2所示。
上述实施例中提到的网络链路跟踪器(如图2所示的Chain-tracker)为部署于业务节点的埋点,此外,预先在监测节点上部署网络链路控制器(如图2所示的Chain-master)脚本,用于对业务节点的负载状态信息进行分析并调整网络链路监测策略。
在业务节点上部署完网络链路跟踪器脚本并第一次启动时,业务节点可以利用网络链路跟踪器脚本从监测节点处(基于网络链路控制器脚本)获取初始网络链路监测策略;或由监测节点基于网络链路控制器脚本主动向业务节点下发初始网络链路监测策略。由业务节点基于网络链路跟踪器脚本执行该初始网络链路监测策略,开始基于业务节点上的应用、业务执行网络链路监测,根据具体的业务内容获取本地的负载状态信息及跨节点负载状态信息。该初始网络链路监测策略具体可以为按照固定频率获取业务节点本地的负载状态信息以及获取关联节点的跨节点负载状态信息。
同时,监测节点发送至业务节点的网络链路监测策略还可以包括业务节点获取跨节点负载状态信息时的允许时延,业务节点若在发出跨节点数据访问请求之后超出该允许时延后仍未收到跨节点负载状态信息,则可以记录并向监测节点反馈获取跨节点负载状态信息失败的情况。
在此基础上,通过在网络链路跟踪器和网络链路控制器之间部署网络链路选择器(如图2所示的Chain-selector)脚本,用于进一步实现网络链路监测策略的动态调整。则步骤S101:获取服务器集群中各业务节点的负载状态信息,具体包括:
接收业务节点基于网络链路跟踪器脚本发起的跨节点数据访问请求;根据跨节点数据访问请求获取对应的跨节点负载状态信息;将对应的跨节点负载状态信息发送至发起跨节点数据访问请求的业务节点。
在具体实施中,网络链路选择器可以为基于同步非阻塞式IO(NIO)方式开发的采集器,用于实现网络链路跟踪器与网络链路跟踪器之间、网路链路跟踪器与网络链路控制器之间请求的中转,服务器实现模式为一个请求一个线程,即客户端发送的连接请求都会注册到多路复用器(Selector)上,多路复用器轮询到连接有IO请求时才启动一个线程进行处理。故该网络链路选择器可以根据网络链路监测策略去控制请求转发的频次和数量,以达到减少网络链路监控系统在业务网络中对网络负载的影响。
选择一个第一中间节点部署网络链路选择器脚本,该第一中间节点可以为各业务节点和监测节点之间的某台设备,或可以为监测节点上。网络链路选择器第一次启动时从网络链路控制器处获取初始网络链路监测策略,或由网络链路控制器主动将初始网络链路监测策略发送至网络链路选择器。第一中间节点基于网络链路选择器脚本,与业务节点基于网络链路跟踪器脚本协调执行当前的网络链路监测策略。
令业务节点在基于网络链路跟踪器脚本获取其关联业务节点的跨节点负载状态信息时,只能通过部署了网络链路选择器脚本的第一中间节点进行获取。而该第一中间节点基于网络链路选择器脚本,可以对各业务节点的跨节点访问请求进行汇总、调度,如将一定时间内对同一个目标节点(业务节点基于网络链路跟踪器要访问的关联节点)的访问请求统一发送至该目标节点,以及将一定时间内接收到的来自同一业务节点的访问请求反馈统一返回给业务节点,形成在由网络链路控制器动态调控网络链路监测策略的基础上进一步的网络链路监测负载动态调控防线。
进一步的,将对应的跨节点负载状态信息发送至发起跨节点数据访问请求的业务节点,具体包括:
根据跨节点数据访问请求所请求的关联业务节点的负载状态信息确定对关联业务节点的网络链路监测策略;按对关联业务节点的网络链路监测策略,向关联业务节点发起访问并获取对应的跨节点负载状态信息。
作为为降低网络链路监测任务对业务网络影响而设置的第一道防线,第一中间节点基于网络链路选择器,根据关联业务节点的负载状态信息确定对关联业务节点的网络链路监测策略,动态调整帮各业务节点获取跨节点状态信息时的频次,进而还可以根据业务节点的负载状态信息动态调整向各业务节点反馈跨节点状态信息的频次。从而避免在业务节点获取本地的负载状态信息及跨节点负载状态信息时对业务网络产生不良影响。
作为为降低网络链路监测任务对业务网络影响而设置的第二道防线,步骤S102中监控节点基于网络链路控制器脚本分析接收到的负载状态信息,动态调整对业务节点的网络链路监测策略,具体可以基于另一脚本——网络链路策略规划(如图2所示的Chain-policy)脚本实现,监测节点调用预设的网络链路策略规划脚本对网络链路控制器脚本对业务节点负载状态信息的评估结果进行计算、转换,得到下一步的网络链路监测策略。
在具体实施中,步骤S102中基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次,具体可以为:基于业务节点的负载状态信息进行评估,得到与业务节点对应的评估结果,并在对应的评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。
由于服务器集群中业务节点数量众多,可能会给监测节点带来较大的计算压力,故步骤S102中基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次,还可以为:基于服务器集群中全体业务节点的负载状态信息进行评估,得到与服务器集群对应的整体评估结果,并在整体评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。进一步的,可以按预设规则,通过以下公式计算得到的整体评估结果统一调整对全体业务节点的网络链路监测策略:
其中,f(n)为整体评估结果,n为全体业务节点的数量,Ni为第i个业务节点的网络负载,Ci为第i个业务节点的CPU负载,Mi为第i个业务节点的内存利用率,α、β、λ为预设的权值系数。
基于上述公式,即基于全体业务节点的负载状态信息(从网络负载、CPU负载、内存利用率三方面考量)来制定针对全体业务节点的统一的网络链路监测策略。基于上述公式的思想,可以设置其他类型的负载状态信息以及根据需要设置各类负载状态信息的权值。
在此基础上,还可以将业务节点划分为几个群组,一个群组对应一个网络链路监测策略。
进一步的,为了确保各业务节点上网络链路监测任务的正常执行,如图2所示,还可以选择一个第二中间节点(可以为各业务节点和监测节点之间的某台设备,或可以为监测节点上)部署网络链路心跳(Chain-heartbeat)脚本,即第二中间节点可以和第一中间节点为同一节点。
同理,第二中间节点在初次运行网络链路心跳时,从监测节点处(基于网络链路控制器脚本)获取初始网络链路监测策略;或由监测节点基于网络链路控制器脚本主动向第二中间节点节点下发初始网络链路监测策略,并可以在后续监测过程中动态调整网络链路监测策略。
业务节点在运行网络链路跟踪器脚本时,定期将心跳数据包(具体可以为UDP数据结构)发送至第一中间节点,,第一中间节点调用网络链路选择器脚本,将心跳数据包发送至第二中间节点。第二中间节点运行网络链路心跳脚本监测各业务节点发送的心跳数据包,若在规定时间内未接收到某个业务节点发送的心跳数据包,且超出了网络链路监测策略预设的丢失次数,则向监测节点发送告警信息,提示监测节点该业务节点上运行的网路链路跟踪器异常的信息。
进一步的,监测节点在计算得到业务节点的负载评估结果后,还可以将负载评估结果以拓扑图等形式进行呈现,以便用户查看服务器集群当前的网络链路状态。则如图2所示,可以选择一个第三中间节点(可以为各业务节点和监测节点之间的某台设备,或可以为监测节点上)部署网路链路拓扑(Chain-topo)脚本。
在具体实施中,第三中间节点从监测节点处基于网络链路主控制获取负载状态信息及评估结果,根据预设的制图规则,生成json/yaml/xml等数据结构的数据,也可生成图像格式的拓扑图,更直观的向用户展示当前网络链路及应用的实时状态。
监测节点还可以将汇总后的负载状态信息和负载评估结果提供至第三方监控平台,以便做扩容管理。
上文详述了网络链路的监测方法对应的各个实施例,在此基础上,本发明还公开了与上述方法对应的网络链路的监测装置、监测设备及存储介质。
图3为本发明实施例提供的一种网络链路的监测装置的结构示意图。
如图3所示,本发明实施例提供的网络链路的监测装置包括:
获取单元301,用于获取服务器集群中各业务节点的负载状态信息;
监测单元302,用于基于负载状态信息对业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对业务节点的网络链路监测访问频次。
由于装置部分的实施例与方法部分的实施例相互对应,因此装置部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图4为本发明实施例提供的一种网络链路的监测设备的结构示意图。
如图4所示,本发明实施例提供的网络链路的监测设备包括:
存储器410,用于存储指令,所述指令包括上述任意一项实施例所述的网络链路的监测方法的步骤;
处理器420,用于执行所述指令。
其中,处理器420可以包括一个或多个处理核心,比如3核心处理器、8核心处理器等。处理器420可以采用数字信号处理DSP(Digital Signal Processing)、现场可编程门阵列FPGA(Field-Programmable Gate Array)、可编程逻辑阵列PLA(Programmable LogicArray)中的至少一种硬件形式来实现。处理器420也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称中央处理器CPU(CentralProcessing Unit);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器420可以集成有图像处理器GPU(Graphics Processing Unit),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器420还可以包括人工智能AI(Artificial Intelligence)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器410可以包括一个或多个存储介质,该存储介质可以是非暂态的。存储器410还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器410至少用于存储以下计算机程序411,其中,该计算机程序411被处理器420加载并执行之后,能够实现前述任一实施例公开的网络链路的监测方法中的相关步骤。另外,存储器410所存储的资源还可以包括操作系统412和数据413等,存储方式可以是短暂存储或者永久存储。其中,操作系统412可以为Windows。数据413可以包括但不限于上述方法所涉及到的数据。
在一些实施例中,网络链路的监测设备还可包括有显示屏430、电源440、通信接口450、输入输出接口460、传感器470以及通信总线480。
本领域技术人员可以理解,图4中示出的结构并不构成对网络链路的监测设备的限定,可以包括比图示更多或更少的组件。
本申请实施例提供的网络链路的监测设备,包括存储器和处理器,处理器在执行存储器存储的程序时,能够实现如上所述的网络链路的监测方法,效果同上。
需要说明的是,以上所描述的装置、设备实施例仅仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本发明各个实施例所述方法的全部或部分步骤。
为此,本发明实施例还提供一种存储介质,该存储介质上存储有计算机程序,计算机程序被处理器执行时实现如网络链路的监测方法的步骤。
该存储介质可以包括:U盘、移动硬盘、只读存储器ROM(Read-Only Memory)、随机存取存储器RAM(Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例中提供的存储介质所包含的计算机程序能够在被处理器执行时实现如上所述的网络链路的监测方法的步骤,效果同上。
以上对本发明所提供的一种网络链路的监测方法、监测装置、监测设备及存储介质进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置、设备及存储介质而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
Claims (9)
1.一种网络链路的监测方法,其特征在于,基于服务器集群中的监测节点,包括:
获取所述服务器集群中各业务节点的负载状态信息;
基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次;
所述负载状态信息包括所述业务节点上应用的性能数据、网络当前负载、本地CPU利用率、内存利用率、磁盘利用率;所述性能数据包括系统吞吐量TPS、响应时间、错误记录;
其中,所述获取所述服务器集群中各业务节点的负载状态信息,具体为:
应用在各所述业务节点预先部署的网络链路跟踪器脚本,获取各所述业务节点的本地负载状态信息以及各所述业务节点的关联业务节点的跨节点负载状态信息;
所述基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次,具体为:
当所述评估结果小于所述预设值时,按以往固定频次对所述业务节点进行网络链路监测访问;当所述评估结果大于等于所述预设值时,按所述预设规则降低对所述业务节点的网络链路监测访问频次。
2.根据权利要求1所述的监测方法,其特征在于,所述获取各所述业务节点的关联业务节点的跨节点负载状态信息,具体包括:
接收所述业务节点基于所述网络链路跟踪器脚本发起的跨节点数据访问请求;
根据所述跨节点数据访问请求获取对应的跨节点负载状态信息;
将所述对应的跨节点负载状态信息发送至发起所述跨节点数据访问请求的业务节点。
3.根据权利要求2所述的监测方法,其特征在于,所述将所述对应的跨节点负载状态信息发送至发起所述跨节点数据访问请求的业务节点,具体包括:
根据所述跨节点数据访问请求所请求的关联业务节点的负载状态信息确定对所述关联业务节点的网络链路监测策略;
按对所述关联业务节点的网络链路监测策略,向所述关联业务节点发起访问并获取所述对应的跨节点负载状态信息。
4.根据权利要求1所述的监测方法,其特征在于,所述基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次,具体为:
基于所述业务节点的负载状态信息进行评估,得到与所述业务节点对应的评估结果,并在所述对应的评估结果达到所述预设值时按所述预设规则降低对所述业务节点的网络链路监测访问频次。
5.根据权利要求1所述的监测方法,其特征在于,所述基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次,具体为:
基于所述服务器集群中全体所述业务节点的负载状态信息进行评估,得到与所述服务器集群对应的整体评估结果,并在所述整体评估结果达到所述预设值时按所述预设规则降低对所述业务节点的网络链路监测访问频次。
7.一种网络链路的监测装置,其特征在于,包括:
获取单元,用于获取服务器集群中各业务节点的负载状态信息;
监测单元,用于基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次;
所述负载状态信息包括所述业务节点上应用的性能数据、网络当前负载、本地CPU利用率、内存利用率、磁盘利用率;所述性能数据包括系统吞吐量TPS、响应时间、错误记录;
其中,所述获取所述服务器集群中各业务节点的负载状态信息,具体为:
应用在各所述业务节点预先部署的网络链路跟踪器脚本,获取各所述业务节点的本地负载状态信息以及各所述业务节点的关联业务节点的跨节点负载状态信息;
所述基于所述负载状态信息对所述业务节点的负载状态进行评估,并在评估结果达到预设值时按预设规则降低对所述业务节点的网络链路监测访问频次,具体为:
当所述评估结果小于所述预设值时,按以往固定频次对所述业务节点进行网络链路监测访问;当所述评估结果大于等于所述预设值时,按所述预设规则降低对所述业务节点的网络链路监测访问频次。
8.一种网络链路的监测设备,其特征在于,包括:
存储器,用于存储指令,所述指令包括权利要求1至6任意一项所述网络链路的监测方法的步骤;
处理器,用于执行所述指令。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任意一项所述网络链路的监测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010790315.6A CN112003763B (zh) | 2020-08-07 | 2020-08-07 | 网络链路的监测方法、监测装置、监测设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010790315.6A CN112003763B (zh) | 2020-08-07 | 2020-08-07 | 网络链路的监测方法、监测装置、监测设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112003763A CN112003763A (zh) | 2020-11-27 |
CN112003763B true CN112003763B (zh) | 2022-05-24 |
Family
ID=73463906
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010790315.6A Active CN112003763B (zh) | 2020-08-07 | 2020-08-07 | 网络链路的监测方法、监测装置、监测设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112003763B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113032217B (zh) * | 2021-03-26 | 2023-03-10 | 山东英信计算机技术有限公司 | 一种集群监控方法及相关装置 |
CN113194037B (zh) * | 2021-03-31 | 2022-05-24 | 新华三大数据技术有限公司 | 一种流量调度方法及装置 |
CN115473839B (zh) * | 2021-06-11 | 2024-03-05 | 北京字跳网络技术有限公司 | 基于埋点的数据处理方法、装置、设备及存储介质 |
CN113395356B (zh) * | 2021-07-06 | 2023-04-28 | 山东电力工程咨询院有限公司 | 一种数据中心的健康监控方法及系统 |
CN113709690B (zh) * | 2021-09-03 | 2024-02-06 | 无锡职业技术学院 | 基于网络负载的校园水路水压监测方法、设备、存储介质 |
CN114745277A (zh) * | 2022-03-30 | 2022-07-12 | 杭州博盾习言科技有限公司 | 公有云跨域专线的弹性伸缩方法、装置、电子设备及介质 |
CN117170985B (zh) * | 2023-11-02 | 2024-01-12 | 武汉大学 | 面向开放式地理信息网络服务的分布式监测方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104702680A (zh) * | 2015-02-13 | 2015-06-10 | 安科智慧城市技术(中国)有限公司 | 一种资源监测方法及系统 |
CN107070713A (zh) * | 2017-04-10 | 2017-08-18 | 广州油融互联网金融信息服务有限公司 | 一种数据监测处理方法 |
CN110417674A (zh) * | 2019-07-26 | 2019-11-05 | 新华三技术有限公司合肥分公司 | 一种数据流量分担方法及装置 |
CN110650195A (zh) * | 2019-09-24 | 2020-01-03 | 支付宝(杭州)信息技术有限公司 | 分布式负载均衡方法以及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5581489B2 (ja) * | 2010-09-29 | 2014-09-03 | 株式会社Pfu | ノード監視装置、ノード監視方法、及びノード監視プログラム |
JP5910811B2 (ja) * | 2011-07-27 | 2016-04-27 | 日本電気株式会社 | スイッチ装置の制御システム、その構成制御装置および構成制御方法 |
CN105204971B (zh) * | 2015-08-28 | 2018-03-16 | 浙江大学 | 一种基于朴素贝叶斯分类技术的动态监控间隔调整方法 |
CN108712464A (zh) * | 2018-04-13 | 2018-10-26 | 中国科学院信息工程研究所 | 一种面向集群微服务高可用的实现方法 |
CN110875838B (zh) * | 2018-09-03 | 2022-10-18 | 中移(杭州)信息技术有限公司 | 一种资源部署方法、装置和存储介质 |
-
2020
- 2020-08-07 CN CN202010790315.6A patent/CN112003763B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104702680A (zh) * | 2015-02-13 | 2015-06-10 | 安科智慧城市技术(中国)有限公司 | 一种资源监测方法及系统 |
CN107070713A (zh) * | 2017-04-10 | 2017-08-18 | 广州油融互联网金融信息服务有限公司 | 一种数据监测处理方法 |
CN110417674A (zh) * | 2019-07-26 | 2019-11-05 | 新华三技术有限公司合肥分公司 | 一种数据流量分担方法及装置 |
CN110650195A (zh) * | 2019-09-24 | 2020-01-03 | 支付宝(杭州)信息技术有限公司 | 分布式负载均衡方法以及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN112003763A (zh) | 2020-11-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112003763B (zh) | 网络链路的监测方法、监测装置、监测设备及存储介质 | |
US10812333B2 (en) | Microservice configuration apparatus and method | |
EP3637733B1 (en) | Load balancing engine, client, distributed computing system, and load balancing method | |
CN111131379B (zh) | 一种分布式流量采集系统和边缘计算方法 | |
EP3335120B1 (en) | Method and system for resource scheduling | |
US8533731B2 (en) | Apparatus and method for distrubuting complex events based on correlations therebetween | |
US20120311128A1 (en) | Performance testing in a cloud environment | |
CN111966289B (zh) | 基于Kafka集群的分区优化方法和系统 | |
US10498817B1 (en) | Performance tuning in distributed computing systems | |
CN111200526B (zh) | 网络设备的监控系统及方法 | |
CN103561055A (zh) | 基于会话的云计算环境下Web应用自动弹性扩展方法 | |
WO2011088256A2 (en) | Methods and apparatus for predicting the performance of a multi-tier computer software system | |
CN112231098A (zh) | 任务处理方法、装置、设备及存储介质 | |
CN111418187A (zh) | 云网络中的可伸缩统计和分析机制 | |
US20170111240A1 (en) | Service Elastic Method and Apparatus in Cloud Computing | |
CN104135525B (zh) | 云平台elb组件的资源扩展方法和装置 | |
Ali et al. | Probabilistic normed load monitoring in large scale distributed systems using mobile agents | |
CN111858656A (zh) | 一种基于分布式架构的静态数据的查询方法和设备 | |
CN112468310B (zh) | 流媒体集群节点管理方法、装置及存储介质 | |
CN107493333B (zh) | 一种基于SDN的云计算环境下web系统资源管理方法及系统 | |
CN115913967A (zh) | 一种云环境下基于资源需求预测的微服务弹性伸缩方法 | |
CN113079062B (zh) | 一种资源调整方法、装置、计算机设备和存储介质 | |
CN111813621A (zh) | 基于Flume数据中台的数据处理方法、装置、设备及介质 | |
TW202215262A (zh) | 一種具延遲感知負載平衡的反向代理方法和存儲裝置 | |
CN110955579A (zh) | 一种基于Ambari的大数据平台的监测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |