CN116582465A - 链路监控方法、介质、装置和计算设备 - Google Patents
链路监控方法、介质、装置和计算设备 Download PDFInfo
- Publication number
- CN116582465A CN116582465A CN202310761194.6A CN202310761194A CN116582465A CN 116582465 A CN116582465 A CN 116582465A CN 202310761194 A CN202310761194 A CN 202310761194A CN 116582465 A CN116582465 A CN 116582465A
- Authority
- CN
- China
- Prior art keywords
- node
- link
- monitoring
- monitored
- virtual node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 398
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000001514 detection method Methods 0.000 claims abstract description 73
- 238000004891 communication Methods 0.000 claims description 127
- 238000012545 processing Methods 0.000 claims description 33
- 230000002452 interceptive effect Effects 0.000 claims description 20
- 230000004044 response Effects 0.000 claims description 9
- 239000000523 sample Substances 0.000 claims description 7
- 230000005856 abnormality Effects 0.000 abstract description 14
- 238000011835 investigation Methods 0.000 abstract description 7
- 239000003795 chemical substances by application Substances 0.000 description 98
- 230000008859 change Effects 0.000 description 33
- 230000002159 abnormal effect Effects 0.000 description 24
- 238000010586 diagram Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 9
- 238000004043 dyeing Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 6
- 238000012423 maintenance Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000013024 troubleshooting Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/04—Network management architectures or arrangements
- H04L41/046—Network management architectures or arrangements comprising network management agents or mobile agents therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/12—Network monitoring probes
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/20—Arrangements for monitoring or testing data switching networks the monitoring system or the monitored elements being virtualised, abstracted or software-defined entities, e.g. SDN or NFV
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Computer And Data Communications (AREA)
Abstract
本公开的实施方式提供了一种链路监控方法、介质、装置和计算设备。该方法包括:响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文,再响应于反馈报文,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。本公开解决了相关技术中对链路中的异常排查效率较低的问题,快速有效地定位到出现异常的设备、网关等,从而加快问题排查速度,节省问题定位时间,提高云计算服务整体利用率。
Description
技术领域
本公开的实施方式涉及互联网技术领域,更具体地,本公开的实施方式涉及一种链路监控方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
随着云计算技术的发展,通过数据中心提供云计算服务,并对数据中心的计算资源和流量资源进行分配管理和网络运维,成为一个主要的应用方向。数据中心除了对计算资源和流量的运维,还需要对网络链路进行监控,以确保数据中心的各个物理节点(也即是计算节点)间、各个虚拟节点间能够正常通信,进而保证基于云计算的应用能够正常运行。
相关技术中,通常是在每个提供计算资源的每个计算节点上布置虚拟机,以对该计算节点的状态进行监测,但无法对计算节点内不同虚拟节点之间的通信状态进行精准监控,导致一旦数据中心出现流量通信异常,排查时间较长,效率较低。
发明内容
本公开提供一种链路监控方法、介质、装置和计算设备,以解决相关技术中对链路中的异常排查效率较低的问题。
在本公开实施方式的第一方面中,提供了一种链路监控系统,包括:
相互通讯连接的监控管理器、监控服务器和监控代理器,以及与监控管理器、监控代理器通讯连接的交互数据处理应用;
监控管理器用于向监控服务器发送配置命令,以使得监控服务器将配置命令转发到对应的监控代理器,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中;
监控代理器用于接收监控服务器发送的配置命令,对所在的计算节点中的目标虚拟节点对应待监控链路的状态进行监控,并将监控得到的监控数据发送到交互数据处理应用中,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点;
监控管理器还用于从交互数据处理应用中获取监控数据。
在本公开实施方式的第二方面中,提供了一种链路监控方法,应用于监控代理器,包括:
响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器设置于待监控链路所在的计算节点中;
响应于反馈报文,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
在本公开实施方式的第三方面中,提供了一种链路监控方法,应用于监控管理器,包括:
获取待监控的虚拟网络信息;
基于虚拟网络信息,通过设定的应用接口获取虚拟网络信息对应虚拟网络中的虚拟节点信息;
基于虚拟节点信息和虚拟网络信息,生成设定应用架构的配置命令,并发送到监控服务器,以使监控服务器将配置命令转发到对应的监控代理器,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中。
在本公开实施方式的第四方面中,提供了一种链路监控方法,应用于监控服务器,包括:
响应于接收到的配置命令,通过目标协议将配置命令转发到对应的计算节点上的监控代理器,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
在本公开实施方式的第五方面中,提供了一种计算机可读存储介质,包括:
计算机可读存储介质中存储有计算机执行指令,计算机执行指令被处理器执行时用于实现如本公开第一方面中的链路监控方法;和/或,计算机执行指令被处理器执行时用于实现如本公开第二方面中的链路监控方法;和/或,计算机执行指令被处理器执行时用于实现如本公开第三方面中的链路监控方法。
在本公开实施方式的第六方面中,提供了一种链路监控装置,应用于监控代理器,包括:
发送模块,用于响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器设置于待监控链路所在的计算节点中;
处理模块,用于响应于反馈报文,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
在本公开实施方式的第七方面中,提供了一种链路监控装置,应用于监控管理器,包括:
第一获取模块,用于获取待监控的虚拟网络信息;
第二获取模块,用于基于虚拟网络信息,通过设定的应用接口获取虚拟网络信息对应虚拟网络中的虚拟节点信息;
发送模块,用于基于虚拟节点信息和虚拟网络信息,生成设定应用架构的配置命令,并发送到监控服务器,以使监控服务器将配置命令转发到对应的监控代理器,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中。
在本公开实施方式的第八方面中,提供了一种链路监控装置,应用于监控服务器,包括:
处理模块,用于响应于接收到的配置命令,通过目标协议将配置命令转发到对应的计算节点上的监控代理器,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
在本公开实施方式的第九方面中,提供了一种计算设备,包括:至少一个处理器;
以及与至少一个处理器通信连接的存储器;
其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使计算设备执行如本公开第一方面中的链路监控方法。
根据本公开实施方式的链路监控方法、介质、装置和计算设备,根据接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文,然后在接收到反馈报文时,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。由此,根据配置命令构造并发送探测报文,再接收对应的反馈报文,以对实时接收到的配置命令所指定的虚拟网络中的虚拟节点的监控,从而实现用户对应虚拟网络中动态变化的节点的通信状态进行全面监控并能方便的判断云计算网络中分配给用户的资源,也即是用户对应虚拟网络的网络连通性,以便在用户对应虚拟网络出现异常时,快速有效地定位到出现异常的设备、网关和虚拟节点等,从而加快问题排查速度,节省问题定位时间,提高云计算服务整体利用率。
附图说明
通过参考附图阅读下文的详细描述,本公开示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本公开的若干实施方式,其中:
图1示意性地示出了根据本公开实施方式的应用场景图;
图2示意性地示出了根据本公开另一实施例的链路监控系统的结构示意图;
图3示意性地示出了根据本公开另一实施例的链路监控方法的流程图;
图4a示意性地示出了根据本公开另一实施例的链路监控方法的流程图;
图4b示意性地示出了图4a所示实施例中提供的构造并发送探测报文的方法流程图;
图5示意性地示出了根据本公开另一实施例的链路监控方法的流程图;
图6示意性地示出了根据本公开另一实施例的链路监控方法的流程图;
图7示意性地示出了根据本公开另一实施例的链路监控方法的流程图;
图8示意性地示出了根据本公开另一实施例的存储介质的结构示意图;
图9示意性地示出了根据本公开另一实施例的链路监控装置的结构示意图;
图10示意性地示出了根据本公开另一实施例的链路监控装置的结构示意图;
图11示意性地示出了根据本公开另一实施例的链路监控装置的结构示意图;
图12示意性地示出了根据本公开再一实施例的计算设备的结构示意图。
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本公开的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本公开,而并非以任何方式限制本公开的范围。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本公开的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本公开的实施方式,提出了一种链路监控方法、介质、装置和计算设备。
在本文中,需要理解的是,所涉及的术语仅用于方便理解,并未表示对含义的限制。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面是本公开中涉及的术语说明:
计算节点:在云计算环境中,用于提供计算资源并运行计算服务的物理机,每个物理机对应一个计算节点;不同计算节点之间可以通过网关设备等相互通信连接。
虚拟网络:也即是虚拟云网络、私有云网络,是一种布设在计算节点中的面向用户的网络服务;每个购买了云计算服务的用户会对应一个虚拟网络,一个虚拟网络可以只占用一个计算节点的部分计算资源,可以同时占用多个计算节点的计算资源;虚拟网络内的计算资源间可以相互通信,即使处在不同的计算节点中,只要属于同一虚拟网络即可;不同虚拟网络间则通常无法相互通信。
虚拟节点:在虚拟网络中划分出来的虚拟计算节点,通过多个虚拟计算节点,以分别执行不同任务,或共同执行较为复杂的任务;一个虚拟网络中通常包含多个虚拟节点,同一个虚拟网络中的不同虚拟节点一般都能相互通信,以共同执行任务。
链路:在本公开中,主要指与网络组件(包括计算节点等硬件和虚拟节点等软件)通信的通路状态,对应某个组件的链路,即指其他组件与对应组件的通信状态;相应的,存在物理链路(即通信硬件间相互通信时的通信状态)和虚拟链路(即软件间相互通信时的通信状态)两种类别。
在本文中,需要理解的是,所涉及的术语仅用于方便理解,并未表示对含义的限制。此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
另外,本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据,对数据的采集、传播、使用等,均符合国家相关法律法规要求,本公开实施方式/实施例可以互相组合。
发明概述
本发明人发现,相关技术中,随着云计算技术的发展,通过数据中心提供云计算服务,并根据云计算的流量和计算量需求,对计算资源和流量进行分配管理和网络运维,成为一个主要的应用方向。数据中心通过布设大量的计算节点用于提供计算资源,并可以根据用户的需求分配一定计算资源,以及建立用户对应的虚拟网络或私有云网络。在此基础上,数据中心会对应用户与计算资源间的通信流量进行监控,以实现网络流量的按需分配,优化网络服务的效率,提升网络资源价值。其中,对流量的监控中就涉及各个计算节点、计算节点内的虚拟节点、设备的链路的状态监控,若存在链路出现异常,通常就会对用户流量造成影响,进而影响用户的数据安全和使用体验;因此,在出现链路异常时,就需要及时进行排查处理,最大限度减小链路异常造成的影响。
相关技术中,通常是在每个提供计算资源的每个计算节点上布置一个专门用于进行网络监测的虚拟节点,以对该计算节点对应物理机进行进程状态监测,但无法实现对计算节点内部的虚拟网络中各虚拟节点间的链路的通信状态进行精准监控(因为非同一虚拟网络中的虚拟节点通常无法直接通信),导致一旦出现流量异常或链路通信异常,排查时间较长,效率较低;同时,这样的虚拟节点会占用计算节点的计算资源,在计算节点较多的时候会造成大量的计算资源浪费。
本公开提供的链路监控方法和监控系统,通过在每个计算节点配置监控代理器,并通过监控代理器根据接收到的包含待监控链路对应信息的配置命令,向待监控链路对应虚拟节点发送探测报文并接收对应的反馈报文,并据此确定待监控链路状态,由此,可以准确确定每个虚拟节点的状态,显著提高了链路通信异常时的排查时间效率。
在介绍了本公开的基本原理之后,下面具体介绍本公开的各种非限制性实施方式。
应用场景总览
首先参考图1所示,其为本公开提供的链路监控方法的应用场景示意图。在进行链路监控时,监控管理器110会将待监控链路的对应信息通过配置命令发送到监控服务器120,再由监控服务器120转发到对应的监控代理器130,监控代理器130根据接收到的配置命令,对所在计算节点140中的不同虚拟网络150中的虚拟节点151对应链路分别进行监控,从而实现链路监控过程。
需说明的是,图1所示场景中监控管理器、监控服务器、监控代理器、计算节点、虚拟网络、虚拟节点仅以一个或两个为例进行示例说明,但本公开不以此为限制,也就是说,监控管理器、监控服务器、监控代理器、计算节点、虚拟网络、虚拟节点的个数可以是任意的。
下面结合图1的应用场景,参考图3至7来描述根据本公开示例性实施方式的链路监控方法。需要注意的是,上述应用场景仅是为了便于理解本公开的精神和原理而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
图2为本公开一个实施例提供的链路监控系统的结构示意图。如图2所示,本实施例提供的链路监控系统200包括:
相互通讯连接的监控管理器210、监控服务器220和监控代理器230,以及与监控管理器210、监控代理器230通讯连接的交互数据处理应用;
监控管理器210用于向监控服务器220发送配置命令,以使得监控服务器220将配置命令转发到对应的监控代理器230,配置命令中包括待监控链路231所在的计算节点232的地址和待监控链路231对应目标虚拟节点233的地址,目标虚拟节点233部署于计算节点232中;
监控代理器230用于接收监控服务器220发送的配置命令,对所在的计算节点232中的目标虚拟节点233对应待监控链路231的状态进行监控,并将监控得到的监控数据发送到交互数据处理应用中,待监控链路231的状态用于表示通信节点与目标虚拟节点233通信的状态,通信节点用于表示与目标虚拟节点233存在通信连接关系的虚拟节点;
监控管理器210还用于从交互数据处理应用中获取监控数据。
具体的,监控管理器210通常与所在的数据中心相对应(可以是一个单独的设备或系统,或布设在多个设备中的一个统一的系统),以对整个数据中心的流量进行监控(也就能对整个数据中心的流量进行监控)。
监控服务器220可以有一个或多个,监控服务器220与监控管理器210相对应并通讯连接,监控服务器220主要接收监控管理器210发送的信息(即配置命令),进行处理后转发给对应的监控代理器230,因此,一个监控服务器220通常同时对应多个监控代理器230(可能存在特定重要的监控代理器230与监控服务器220间一一对应)。
监控代理器230设置于计算节点232中,以监控计算节点232中的链路状态,因此,监控代理器230与计算节点232通常一一对应(也可能存在监控代理器230不对应计算节点232而对应其他设备节点的情况,如网关节点)。
计算节点232中配置有虚拟网络234,以供用户使用。根据虚拟网络234所需要的计算资源的不同,一个计算节点232中可能存在多个虚拟网络234,也可能仅存在一个虚拟网络234,也可能存在有的虚拟网络234同时占用几个计算节点232。
每个虚拟网络234中通常有一个或多个虚拟节点,也即是待监控链路231对应的目标虚拟节点233(因为通常监控代理器230会对计算节点232中的所有虚拟节点对应链路均进行监控,因此,待监控链路231对应的目标虚拟节点233是虚拟网络234中的所有虚拟节点)。通信节点通常为与目标虚拟节点233属于同一虚拟网络234内的虚拟节点,可以是同一计算节点232内的同一虚拟网络234内的虚拟节点,也可以是不同计算节点232中的同一虚拟网络234内(此时该虚拟网络234同时存在于通过计算节点232中,且内部可以相互通信)的虚拟节点。
每个待监控链路231对应一个目标虚拟节点233,也即是,每个待监控链路231即一个目标虚拟节点233对应的链路。
因此,通过对计算节点232中所有待监控链路231进行监控,就能实现对应计算节点232中所有虚拟节点的通信状态进行监控,从而保证计算节点232整体的流量状态和通信状态。
进一步地,监控代理器230在通过监控各个待监控链路231获得的链路状态相关的监控数据,会直接发送到单独配置的交互数据处理应用240中。交互数据处理应用240通常直接布置在单独的设备,并能与监控管理器210和所有监控代理器230相互通信连接。由此,监控管理器210可以从交互数据处理应用240中提取监控数据,以根据监控数据中的特定信息调整发送给监控服务器220的配置命令(从而实现对应链路监控系统200中需要监控的待监控链路231的不断更新),或者生成通知信息、报警信息以发送给管理人员,以方便管理人员快速直接确定出现异常的链路所在位置,减少故障排除所需要的时间和精力。
进一步地,交互数据处理应用240可以采用消息管理系统/应用来实现接收监控数据并供监控管理器210提取的作用,具体消息管理系统的种类可以为现有的kafka、RocketMQ等系统,此处不做限制。
在本公开的一种实施例中,链路监控系统200中还配置有基于软件定义网络架构的云网络环境组件,监控管理器210与云网络环境组件通讯连接。
具体的,基于软件定义网络架构即现有SDN架构(对应的英文名为Software-defined networking),通过基于SDN架构的云网络环境组件配置链路监控系统200,能够利用其将网络控功能与转发功能分离的特点,将用于对数据中心中各个节点设备的监控移动到外部计算设备,且使得各个节点设备的状态对于链路监控系统200具有较高的透明度,方便数据中心对分布的各种节点设备的链路监控,提高管理效率。
在本公开的一种实施例中,链路监控系统200中还配置有用于配置云网络中设备状态的分布式协调服务250,监控管理器210与分布式协调服务250通讯连接。
具体的,分布式协调服务250用于保证链路监控系统200中各个设备间的数据一致性,防止数据脏读等问题。同时方便监控管理器210通过分布式协调服务250读取数据中心各个计算节点的配置信息,以便生成配置命令。
在本公开的一种实施例中,分布式协调服务250中获取得到的变动信息会定时存储到数据中心的对应记录设备、存储系统或存储服务中,以便监控管理器通过对应的应用接口从数据中心获取对应的配置信息。
具体的分布式协调服务可以采用现有的zookeeper、Nacos等服务来实现。
在本公开的一种实施例中,监控代理器230基于虚拟交换机服务而配置,虚拟交换机服务用于提供监控代理器230获取监控数据所需的通讯命令和虚拟通信端口。
具体的,虚拟交换机服务通过模拟虚拟的交换机的功能,以为监控代理器230提供用于收发探测报文和反馈报文的虚拟端口,而不需要实际在计算节点中固定配置一个虚拟节点,从而显著减小对计算资源的占用,同时也不需要受计算节点232中不同虚拟网络间的通信限制,从而实现对整个计算节点232中的虚拟节点的链路监控。
具体的虚拟交换机服务可以采用现有的OpenvSwitch、Hyper-V等服务来实现。
在本公开的一种实施例中,监控管理器210还用于,基于监控数据中的异常数据生成报警信息,并生成对应的日志记录。
具体的,在监控到待监控链路231存在异常时,监控管理器210会根据待监控链路231所在的计算节点232、目标虚拟节点233,生成对应的报警信息和日志信息,以便管理人员及时进行检修处理,并能方便后续进行日志分析,以更好地进行更新维护。
在本公开的一种实施例中,监控服务器220还包括调用虚拟网络对应计算节点、网关节点和监控代理器230的调用接口;监控服务器220还用于,对虚拟网络对应计算节点和网关节点的状态进行管理。
具体的,监控服务器220通过调用各类设备节点的接口,以实现与各个设备节点中的监控代理器230的通信;同时,通过对设备节点的状态管理,以确定需要发送配置命令的监控代理器230。
根据本公开实施方式的链路监控系统,通过监控管理器、监控服务器、监控代理器和交互数据处理应用的结合,实现对应用户对应虚拟网络中的目标虚拟节点对应链路的监控,进而实现对用户侧网络的连通性的监控,有效保证及时发现云计算网络中的流量异常问题,提高问题排查效率,快速定位异常链路所在位置,提高云计算服务的整体可用性。
图3为本公开一个实施例提供的链路监控方法的流程图。如图3所示,本实施例提供的链路监控方法包括以下步骤:
步骤S301、响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取所述目标虚拟节点基于所述探测报文回复的反馈报文。
其中,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器设置于待监控链路所在的计算节点中。
具体的,配置命令为监控管理器生成并发送给监控服务器,然后由监控服务器转发给监控代理器的指示信息。配置命令用于向监控代理器传递需要监控的待监控链路相关信息(即待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址),以使监控代理器能够根据配置命令确定需要监控的目标虚拟节点及发送探测报文所需的地址。
配置命令中通常包含了监控代理器所在计算节点中所有需要监控的目标虚拟节点及对应待监控链路的相关信息,当计算节点内的虚拟网络发生变化、虚拟网络内的虚拟节点发生变化时,监控管理器通常会重新生成对应的配置命令,并传递至监控代理器,以保证监控代理器能实时监控覆盖计算节点内所有需要监控的目标虚拟节点。
目标虚拟节点的地址即目标虚拟节点的网络地址,及用于接收探测报文的端口地址。目标虚拟节点通常为计算节点中的所有虚拟节点(或依次遍历所有虚拟节点的过程中选择的虚拟节点)。
监控代理器能够通过虚拟交换机服务,在计算节点内临时生成虚拟报文发送和接收的端口,并发出探测报文,相对于相关技术,不需要固定占用计算节点内的计算资源,提高计算资源利用效率;且通过临时生成的虚拟报文发送和接收端口来发送探测报文,其效果与通过计算节点内的通信节点与目标虚拟节点发送探测报文相同(因为虚拟报文发送和接收端口与计算节点内的通信节点的端口属于相同类型的虚拟端口),因而,可以通过虚拟报文发送和接收端口与目标虚拟节点对应端口的报文通信状态,来判断通信节点与目标虚拟节点的通信状态,因而确定待监控链路的通信状态。
探测报文的目的是获取目标虚拟节点基于探测报文返回的反馈报文。通过探测报文和反馈报文的来回传递,以确认目标虚拟节点对应的待监控链路的通畅(因为探测报文和反馈报文能够正常来回传递,说明监控代理器与目标虚拟节点间能够正常通信,此时就可以认为到目标虚拟节点的通信状态是正常的,因此,可以确认目标虚拟节点对应链路是处于正常状态的)。
探测报文为预设的报文,其内容即请求接收到的节点发送反馈报文。内容简单,对流量的消耗小。
步骤S302、响应于反馈报文,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。
其中,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态;通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
具体的,监控代理器通过配置命令确定目标虚拟节点所对应的虚拟网络信息,及虚拟网络中的虚拟节点信息,进而可以通过临时生成的虚拟报文发送和接收端口与目标虚拟节点的端口通信,实现类似与同一虚拟网络内的通信节点与目标虚拟节点通信的效果,以便据此判断目标虚拟节点对应待监控链路的状态。
反馈报文为目标虚拟节点在接收到探测报文时,会自动生成的一种报文。目标虚拟节点会根据探测报文的地址(即发送探测报文的监控代理器的端口地址)发送反馈报文。反馈报文的作用是表明收到探测报文,因此与探测报文一样,都是内容很简单的预设报文,以避免消耗多余流量。
监控代理器根据接收到的反馈报文和探测报文的对比(如收发时间、是否存在信息丢失、丢包率等),可以得到目标虚拟节点对应待监测链路的状态信息。
状态信息包括目标虚拟节点对应链路的通信正常与否、时延情况、丢包情况等信息。其中,通信正常与否即需要确定的待监控链路的状态。根据监控代理器与目标虚拟节点通信得到的状态信息,可以确定其他通信节点与目标虚拟节点的通信状态(因为如果监控代理器无法与目标虚拟节点通信时,可以直接认为其他通信节点通常也无法保证与目标虚拟节点正常通信,即目标虚拟节点对应待监控链路的状态为无法正常通信)。
根据本公开实施方式的链路监控方法,通过获取监控服务器发送配置命令,并基于配置命令对应的虚拟网络信息和虚拟节点信息,确定目标虚拟节点的地址,再基于目标虚拟节点的地址,构造并发送探测报文,然后响应于接收到的反馈报文,通过虚拟交换机服务将探测报文转发到设定链路延迟监测端口,并通过链路延迟监测端口获取反馈报文,从而基于反馈报文和探测报文,确定待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。由此,使得监控代理器能够根据配置命令构造并发送探测报文,再接收对应的反馈报文,以对实时接收到的配置命令所指定的虚拟网络中的虚拟节点的监控,从而实现用户对应虚拟网络中动态变化的节点的通信状态进行全面监控并能方便的判断云计算网络中分配给用户的资源,也即是用户对应虚拟网络的网络连通性,以便在用户对应虚拟网络出现异常时,快速有效地定位到出现异常的设备、网关和虚拟节点等,从而加快问题排查速度,节省问题定位时间,提高云计算服务整体利用率。
图4a为本公开一个实施例提供的链路监控方法的流程图。如图4a所示,本实施例提供的链路监控方法包括以下步骤:
步骤S401、获取监控服务器发送配置命令。
其中,配置命令为监控管理器基于设定应用架构生成,监控管理器用于基于获取的待监控的虚拟网络信息和虚拟节点信息生成配置命令。
具体的,配置命令通常是监控管理器在确定云计算网络中的虚拟网络或计算节点发生变化时下发的,以确保监控代理器的监控能够覆盖对应计算节点的所有虚拟节点,避免存在虚拟节点的遗漏。
设定应用架构为用于约束配置命令生成风格的架构,以保证配置命令能适用于监控管理器、监控服务器和监控代理器之间不同接口间的传递时的简洁性和可靠性。具体的应用架构可选择RESTful风格的架构(英文为Representational State Transfer,译为表述性状态转移)或类似用于通过不同接口传递信息的应用架构。
在本公开的一种实施例中,虚拟网络信息包括:虚拟网络对应虚拟私有云信息、虚拟网络对应监控代理器所在计算节点,计算节点对应设备的端口和地址;虚拟节点信息包括虚拟网络中的虚拟节点及虚拟节点的地址,虚拟节点信息通过监控管理器的应用接口得到;计算节点对应设备的端口信息通过分布式协调服务获取得到。
具体的,虚拟网络信息用于监控代理器确定对应计算节点中存在哪些虚拟网络,以便监控代理器根据各个虚拟网络对应的私有云信息实现对虚拟网络内部链路的监测,而不受虚拟网络间互相不能通信的限制,虚拟节点信息用于监控代理器确定目标虚拟节点的信息,以便监控代理器确定每个虚拟网络中所有的待监控链路,并进行监控。
虚拟节点信息为监控管理器通过其应用接口获取虚拟网络总对应的虚拟节点信息(因为每个虚拟网络中包含的虚拟节点信息会在生成虚拟网络时同步生成,并存储,因此监控管理器可以通过对应的接口从数据中心的记录中获取或通过分布式协调服务获取)。类似的,计算节点的端口地址等信息也可以由监控管理器通过分布式协调服务获取。
步骤S402、基于配置命令对应的虚拟网络信息和虚拟节点信息,确定目标虚拟节点的地址。
具体的,根据配置命令中的虚拟网络信息和虚拟节点信息,监控代理器可以确定各个目标虚拟节点和对应的待监控链路。其具体过程是由监控代理器从配置命令对应虚拟网络信息中的虚拟节点及虚拟节点的地址中,依次确定目标虚拟节点及目标虚拟节点的地址,即确定待监控链路的对应地址。
步骤S403、基于目标虚拟节点的地址,构造并发送探测报文。
具体的,对应每个目标虚拟节点的链路,都可以通过向其发送探测报文来确定其链路的状态。
如图4b所示,其为构造并发送探测报文的方法流程图,其具体包括如下流程:
步骤S4031、通过虚拟交换机服务提供的报文构造命令,构造具有设定染色标记的探测报文。
其中,染色标记用于识别探测报文。
具体的,监控代理器配置有虚拟交换机服务,虚拟交换机服务能够提供报文构造命令,自动生成指定种类的报文。
为方便目标虚拟节点快速准确的识别用于链路监测的探测报文,以便快速处理和响应,可以为探测报文添加染色标记,以便目标虚拟节点根据染色标记快速识别探测报文(由于染色标记通常在报文的前部或前端,此时目标虚拟节点在读取到染色标记时,即可以确认报文为探测报文,而不需要进一步读取报文的后续具体内容),进而快速响应,减少占用计算节点的CPU资源,提高识别效率。
步骤S4032、通过虚拟交换机服务提供虚拟通信端口向目标虚拟节点的地址发送探测报文。
具体的,虚拟交换机服务可以提供临时的虚拟通信端口,以发送探测报文,并在接收到目标虚拟节点基于探测报文返回的反馈报文。
步骤S404、响应于接收到的反馈报文,通过虚拟交换机服务将探测报文转发到设定链路延迟监测端口。
其中,链路延迟监测端口设置于监控代理器所在计算节点中。
具体的,目标虚拟节点在接收到探测报文时,会根据探测报文对应的虚拟通信端口的地址直接返回反馈报文,以表明接收到了对应的探测报文。
监控代理器为了判断待监控链路的状态,需要将接收到的反馈报文直接转发到通过虚拟交换机服务配置的链路延迟监测端口,以通过该链路延迟监测端口根据反馈报文和探测报文的对比,确定对应待监控链路的状态。
步骤S405、通过链路延迟监测端口获取反馈报文。
具体的,链路延迟监测端口中内置有对反馈报文进行抓包的程序,以获取反馈报文并解析,从而根据反馈报文和探测报文进行对比。
步骤S406、基于反馈报文和探测报文,确定待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。
具体的,对比反馈报文和探测报文的发送和接收时间,可以确定目标虚拟节点对应待监控链路的延迟,以根据延迟确定待监控链路的状态信息(如是否正常,延迟时间等),进而确定待监控链路的状态。
在本公开的一种实施例中,可以通过定时给目标虚拟节点发送设定数量的探测报文,并根据接收到的反馈报文,确定是否存在丢包情况和丢包率,并将丢包率也作为状态信息的一部分。
步骤S407、若监控代理器在设定时长内未接收到反馈报文,生成异常通知信息。
具体的,若待监控链路并未处于正常状态(如目标虚拟节点异常工况、被删除或出现地址变化等情况),则存在监控代理器(的虚拟通信端口)无法收到反馈报文(或收到反馈报文的时刻与发出探测报文的时刻间的间隔时间过长),此时,就可以认为目标虚拟节点对应的待监控链路存在异常,并生成对应的异常通知信息(此时的异常通知信息可以认为是状态信息的一种类型,因此不需要再单独生成一个状态信息)。
在本公开的一种实施例中,除了生成异常通知信息,监控代理器还会生成一个单独的状态信息,以便监控管理器在生成日志记录时,根据状态信息记录对应的待监控链路的状态。
步骤S408、将异常通知信息发送到交互数据处理应用,以使监控管理器从交互数据处理应用中获取异常通知信息,并生成异常报警和对应的日志记录。
具体的,由于监控管理器通常并不直接监控代理器通信连接,因此监控代理器可以将异常通知信息发送到交互数据处理应用,以便监控管理器从交互数据处理应用处获取异常通知信息,确定出现异常的待监控链路所对应的目标虚拟节点、对应虚拟网络和所在计算节点,并据此生成异常报警,从而方便管理人员快速定位异常所在位置,进行检维修;同时通过生成日志记录,以在后续对计算节点进行维护更新时,根据日志记录进行更准确的分析,以减少链路异常的出现。
步骤S407至步骤S408为与步骤S404至步骤S406相平行的可选步骤,本领域技术人员可以根据实际应用中的场景选择对应步骤执行。
根据本公开实施方式的链路监控方法,通过获取监控服务器发送配置命令,并基于配置命令对应的虚拟网络信息和虚拟节点信息,确定目标虚拟节点的地址,再基于目标虚拟节点的地址,构造并发送探测报文,然后根据是否收到对应反馈报文,确定待监控链路对应的状态。由此,能够有效监测计算节点中所有虚拟节点对应的链路状态,而不受不同虚拟网络间难以相互通信的限制,提升监测准确性和全面性;且监测过程不需要建立单独的虚拟节点,只需要通过虚拟交换机服务生成临时端口即可,显著减小对计算资源的占用和消耗,提升监测效率和实用性。
图5为本公开一个实施例提供的链路监控方法的流程图。如图5所示,本实施例提供的链路监控方法包括以下步骤:
步骤S501、获取监控服务器基于接收到的配置信息重新生成的配置命令。
其中,配置信息基于计算节点的状态变动信息由监控管理器生成。
具体的,配置信息即为进行链路监控所需的数据中心中各个计算节点、虚拟网络、虚拟节点的相关信息。当云计算中心内存在计算节点或虚拟网络的变动时,如果还是基于原有配置命令对各个待监控链路进行监控,就有可能出现异常问题(如增加计算节点后出现未监控到的链路、虚拟网络地址变动后无法对相应虚拟网络进行监控、虚拟节点被删除后其原有对应地址不存在可以监控的链路),因此,需要在这类变动出现时,根据变动对应的状态变动信息,重新生成配置命令。
在本公开的一种实施例中,计算节点的状态节点的状态变动信息包括如下情况:
情况一、虚拟网络中的根节点内新增未有对应哈希子节点的子节点,以使计算节点产生的第一类根节点事件变动信息。
具体的,虚拟网络中包含若干虚拟节点,这些虚拟节点间通常一定关系,如属于同一根节点、分别属于相对应的根节点和子节点等。其中,属于虚拟节点中最高一级的节点为根节点(根节点一般在建立虚拟网络时就先确定,其分配到的计算资源通常也是最多的),在根节点下方则包含有一个或多个子节点(子节点的数量可以根据实际执行的任务而出现变化),有时子节点下面还有更下一级的从属节点。
其中每个根节点和子节点(和从属节点)都有一个对应的端口名,这类端口名通常是一串较长的字符串或指定进制的数组,例如端口名为“532d-1d2e-4f4c-b203-c30aa”,为方便监测各个节点的状态,实际对这些节点的监测通常是对其端口名进行哈希算法运算后,提取部分结果数字作为监测的哈希端口名,具有相同哈希端口名且同一级的节点,可以记为哈希节点,如前述端口名通过哈希计算后的结果可以为“36c……a2”,此时,就可以提取其前两位、前三位或后两位数字作为其哈希端口名,即36、36c或a2。
在同一级的节点较多的时候,具有相同哈希端口名的节点就会较多,也即是同一哈希节点对应的节点有多个,若这些节点为从属于同一根节点的子节点,则这些子节点对应的哈希节点可以记为哈希子节点。
链路监控系统通过配置的分布式协调服务可以监控这些根节点和哈希子节点的状态变化,以应对节点、端口的增加、删除等情况。由于哈希子节点对应的子节点的变化也会导致哈希子节点的变化,因此相比于直接监控根节点和子节点,监控根节点及其哈希子节点,能够显著减小计算量,同时保证监测效果。
当根节点下方新增了一个没有对应哈希子节点的子节点时,根节点通常会产生用于记录节点事件变更的通知信息(并生成对应的哈希子节点),也即是第一类根节点事件变动信息(这类信息中通常包含对应子节点端口名和新增的哈希子节点的端口名)。此时,分布式协调服务采集到这类信息后,就能使监控管理器确定计算节点中存在状态变动及具体的变动情况。
情况二、虚拟网络中的根节点内新增已有对应哈希子节点的子节点,以使计算节点产生的子节点变动信息。
具体的,而若根节点中新增的子节点能够直接对应已有的哈希子节点,此时哈希子节点会产生对应的通知信息(通常包含对应子节点端口名),以告知某个根节点下方的哈希子节点中存在新增子节点。
情况三、虚拟网络中的根节点内删除子节点且该子节点对应哈希子节点不再包含子节点,以使计算节点产生的哈希子节点变动信息。
具体的,在根节点内删除了子节点,且导致其对应的哈希子节点不再与根节点内的任何子节点相对应时,通常就会删除这个哈希子节点,并生成对应的哈希子节点变动信息(通常会记录删除的子节点、哈希子节点的端口名)。
情况四、虚拟网络中的根节点内删除子节点且该子节点对应哈希子节点包含有至少一个子节点,以使计算节点产生的第二类根节点变动信息。
具体的,如果根节点内的子节点删除一个之后,其对应哈希子节点还与根节点内的至少一个子节点相对应,则可以保留该子节点,并通过哈希子节点产生对应的通知信息(包含对应被删除的子节点端口名)。
步骤S502、向与目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文。
具体的,在根据变化后的配置信息生成的配置命令,能够确保监控代理器准确覆盖计算节点中的所有待监控链路,从而保证监测的全面性和可靠性。
步骤S503、响应于反馈报文,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。
其中,待监控链路的状态用于表示与目标虚拟节点通信的状态。
具体的,本步骤与图3所示的对应步骤内容相同,此处不再赘述。
根据本公开实施方式的链路监控方法,通过获取监控服务器基于接收到的配置信息重新生成的配置命令,并基于配置命令向对应的待监控链路发送探测报文,以根据接收到的反馈报文确定待监控链路的状态。由此,使得监控服务器能够确保覆盖计算节点中所有虚拟节点和对应的链路,而不会受虚拟节点的变化的影响,从而保证对数据中心所有节点监控的全面性和可靠性。
图6为本公开一个实施例提供的链路监控方法的流程图。本实施例所示的链路监控方法应用于监控管理器。如图6所示,本实施例提供的链路监控方法包括以下步骤:
步骤S601、获取待监控的虚拟网络信息。
具体的,监控管理器会获取数据中心中记录的计算节点的配置信息,并通过分布式协调服务获取数据中心的各个计算节点和对应虚拟网络的虚拟网络信息(这些虚拟网络信息即是待监控的虚拟网络信息),以基于这些信息,确定需要监测的待监控链路,生成并发送对应的配置命令,以实现对数据中心的各个链路的实时监控。
在本公开的一种实施例中,虚拟网络信息包括虚拟网络对应虚拟私有云信息、虚拟网络对应监控代理器所在计算节点,计算节点对应设备的端口和地址。
具体的,监控管理器获取的虚拟网络信息为分布式协调服务得到的最新的数据中心中各个虚拟网络的对应信息。
当数据中心的任意虚拟网络发生变化(如虚拟节点的变化、虚拟网络的删除或新建)时,分布式协调服务能够获取对应虚拟网络的变化相关信息,并基于这些变化相关信息更新虚拟网络信息,以便监控管理器获取到的虚拟网络信息为最新状态,以保证对数据中心各个节点和链路的有效监控,进而保证数据中心整体的管理效果。
在本公开的一种实施例中,在获取待监控的虚拟网络信息后,还可以通过分布式协调服务获取虚拟网络对应的计算节点对应设备的端口信息。
具体的,在获取到待监控的虚拟网络信息之后,监控管理器还会继续通过分布式协调服务监听各个计算节点端口,以确定是否有新的虚拟网络(或虚拟网络内的虚拟节点)的变动信息,以据此及时更新待监控的虚拟网络信息。
步骤S602、基于虚拟网络信息,通过设定的应用接口获取虚拟网络信息对应虚拟网络中的虚拟节点信息。
具体的,由于待监控的虚拟网络信息通常仅包含存在一场的虚拟网络和所在计算节点的信息,而不会包含虚拟网络内部的节点的具体信息(如仅记录计算节点A01中的虚拟网络00f1中的哈希子节点00对应增加了一个新的子节点,而不需给出该子节点的具体地址及虚拟网络00f1中其他虚拟节点的信息),因此,还需要监控管理器进一步获取具体的虚拟节点信息(即虚拟网络00f1中包含的所有虚拟节点信息)。
在本公开的一种实施例中,虚拟节点信息包括虚拟网络中的虚拟节点及虚拟节点的地址。
具体的,监控管理器获取可以通过与数据中心通信的应用接口,获取数据中心中记录的虚拟节点的配置信息。
步骤S603、基于虚拟节点信息和虚拟网络信息,生成设定应用架构的配置命令,并发送到监控服务器,以使监控服务器将配置命令转发到对应的监控代理器。
其中,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中。
具体的,根据需要得到的虚拟节点信息和虚拟网络信息,监控管理器就可以生成对应的配置命令,并通过监控服务器发送给监控代理器,以实现对待监控链路的监控。监控代理器对待监控链路的状态的监控,可以参考图3所示实施例中的相关内容,此处不再赘述。
在本公开的一种实施例中,配置命令中包含的虚拟节点信息和虚拟网络信息可以是数据中心中全部虚拟网络和虚拟节点的相关信息,以保证监测的全面性;也可以是需要更新的部分虚拟网络和虚拟节点的相关信息,以提升数据传递的效率,同时保证监控效果。
根据本公开实施方式的链路监控方法,通过获取待监控的虚拟网络信息和虚拟节点信息,并据此生成和发送配置命令。由此,实现根据实时更新的最新的虚拟网络信息确定待监控链路,从而保证在虚拟网络出现变动之后,也能实施保证对变动后的虚拟网络的全面覆盖和有效监控,从而保证对数据中心网络管理的有效性和可靠性。
图7为本公开一个实施例提供的链路监控方法的流程图。本实施例所示的链路监控方法应用于监控服务器。如图7所示,本实施例提供的链路监控方法包括以下步骤:
步骤S701、响应于接收到的配置命令,通过目标协议将配置命令转发到对应的计算节点上的监控代理器。
其中,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中;监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
具体的,监控代理器通常与监控服务器配置于不同设备,且监控服务器通常需要对应多个监控代理器(并向这些多个监控代理器同时或不同时的发送配置命令)。因此,监控服务器向监控代理器转发配置命令时,需要通过预先确定的目标协议,以实现在不同设备间传递配置命令的效果。监控代理器对待监控链路的状态的监控,可以参考图3所示实施例中的相关内容,此处不再赘述。
在本公开的一种实施例中,目标协议可以为RPC协议(英文全名为RemoteProcedure Call,即远程过程调用协议)或类似远程服务调用的协议,以实现传递配置命令而不需要对应调整不同设备的底层技术的效果,从而在监控服务器和监控代理器进行分别调整和配置的时候,仍能保证配置命令传递的有效性,而不需要在一侧设备进行更新后,必须对另一侧设备进行更新。
根据本公开实施方式的链路监控方法,通过接收到的配置命令,通过目标协议将配置命令转发到对应的计算节点上的监控代理器。由此,实现对应在监控管理器和监控代理器之间传递配置命令的效果,从而使得单个监控管理器能够对各个计算节点的监控代理器进行统一管理,进而保证数据中心整体管理的有效性和可靠性。
示例性介质
在介绍了本公开示例性实施方式的方法之后,接下来,参考图8对本公开示例性实施方式的存储介质进行说明。
参考图8所示,描述了根据本公开的实施方式的用于实现上述方法的程序产品80,其可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本公开的程序产品不限于此。
所述程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质。
可以以一种或多种程序设计语言的任意组合来编写用于执行本公开公开操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备。
示例性装置
在介绍了本公开示例性实施方式的介质之后,接下来,参考图9至图11对本公开示例性实施方式的链路监控装置进行说明,其实现原理和技术效果与前述对应方法的实施例类似,在此不再赘述。其中,如图9所示的链路监控装置应用于监控代理器,用于实现上述图3至图5所示的方法实施例中的链路监控方法。
本公开提供的链路监控装置900,包括:
发送模块910,用于响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器设置于待监控链路所在的计算节点中;
处理模块920,用于响应于反馈报文,确定目标虚拟节点对应的待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
在本公开的一种示例性实施例中,发送模块910具体用于:获取监控服务器发送配置命令,配置命令为监控管理器基于设定应用架构生成,监控管理器用于基于获取的待监控的虚拟网络信息和虚拟节点信息生成配置命令;基于配置命令对应的虚拟网络信息和虚拟节点信息,确定目标虚拟节点的地址;基于目标虚拟节点的地址,构造并发送探测报文。
在本公开的一种示例性实施例中,发送模块910具体包括:虚拟网络信息包括:虚拟网络对应虚拟私有云信息、虚拟网络对应监控代理器所在计算节点,计算节点对应设备的端口和地址;虚拟节点信息包括虚拟网络中的虚拟节点及虚拟节点的地址,虚拟节点信息通过监控管理器的应用接口得到;计算节点对应设备的端口信息通过分布式协调服务获取得到。
在本公开的一种示例性实施例中,发送模块910具体用于:从配置命令对应虚拟网络信息中的虚拟节点及虚拟节点的地址中,确定目标虚拟节点及目标虚拟节点的地址。
在本公开的一种示例性实施例中,发送模块910具体用于:通过虚拟交换机服务提供的报文构造命令,构造具有设定染色标记的探测报文,染色标记用于识别探测报文;通过虚拟交换机服务提供虚拟通信端口向目标虚拟节点的地址发送探测报文。
在本公开的一种示例性实施例中,处理模块920具体用于:响应于接收到的反馈报文,通过虚拟交换机服务将探测报文转发到设定链路延迟监测端口,链路延迟监测端口设置于监控代理器所在计算节点中;通过链路延迟监测端口获取反馈报文;基于反馈报文和探测报文,确定待监控链路的状态信息,以根据待监控链路的状态信息确定待监控链路的状态。
在本公开的一种示例性实施例中,发送模块910具体用于:获取监控服务器基于接收到的配置信息重新生成的配置命令,配置信息基于计算节点的状态变动信息由监控管理器生成;向与目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文。
在本公开的一种示例性实施例中,发送模块910具体包括:计算节点的状态节点的状态变动信息包括:虚拟网络中的根节点内新增未有对应哈希子节点的子节点,以使计算节点产生的第一类根节点事件变动信息;或者,虚拟网络中的根节点内新增已有对应哈希子节点的子节点,以使计算节点产生的子节点变动信息;或者,虚拟网络中的根节点内删除子节点且该子节点对应哈希子节点不再包含子节点,以使计算节点产生的哈希子节点变动信息;或者,虚拟网络中的根节点内删除子节点且该子节点对应哈希子节点包含有至少一个子节点,以使计算节点产生的第二类根节点变动信息。
在本公开的一种示例性实施例中,发送模块910还用于:在响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取目标虚拟节点基于探测报文回复的反馈报文之后,若监控代理器在设定时长内未接收到反馈报文,生成异常通知信息;将异常通知信息发送到交互数据处理应用,以使监控管理器从交互数据处理应用中获取异常通知信息,并生成异常报警和对应的日志记录。
接下来,如图10所示的链路监控装置应用于监控管理器,用于实现上述图6所示的方法实施例中的链路监控方法。
本公开提供的链路监控装置1000,包括:
第一获取模块1010,用于获取待监控的虚拟网络信息;
第二获取模块1020,用于基于虚拟网络信息,通过设定的应用接口获取虚拟网络信息对应虚拟网络中的虚拟节点信息;
发送模块1030,用于基于虚拟节点信息和虚拟网络信息,生成设定应用架构的配置命令,并发送到监控服务器,以使监控服务器将配置命令转发到对应的监控代理器,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中。
在本公开的一种示例性实施例中,第二获取模块1020具体包括:虚拟网络信息包括虚拟网络对应虚拟私有云信息、虚拟网络对应监控代理器所在计算节点,计算节点对应设备的端口和地址;虚拟节点信息包括虚拟网络中的虚拟节点及虚拟节点的地址。
在本公开的一种示例性实施例中,第一获取模块1010还用于:在获取待监控的虚拟网络信息之后,通过分布式协调服务获取虚拟网络对应的计算节点对应设备的端口信息。
接下来,如图11所示的链路监控装置应用于监控服务器,用于实现上述图7所示的方法实施例中的链路监控方法。
本公开提供的链路监控装置1100,包括:
处理模块1110,用于响应于接收到的配置命令,通过目标协议将配置命令转发到对应的计算节点上的监控代理器,配置命令中包括待监控链路所在的计算节点的地址和待监控链路对应目标虚拟节点的地址,目标虚拟节点部署于计算节点中,监控代理器用于监控虚拟节点信息中的目标虚拟节点对应待监控链路的状态,待监控链路的状态用于表示通信节点与目标虚拟节点通信的状态,通信节点用于表示与目标虚拟节点存在通信连接关系的虚拟节点。
示例性计算设备
在介绍了本公开示例性实施方式的方法、介质和装置之后,接下来,参考图12对本公开示例性实施方式的计算设备进行说明。
图12显示的计算设备1200仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,计算设备1200以通用计算设备的形式表现。计算设备1200的组件可以包括但不限于:上述至少一个处理单元1201、上述至少一个存储单元1202,连接不同系统组件(包括处理单元1201和存储单元1202)的总线1203。
总线1203包括数据总线、控制总线和地址总线。
存储单元1202可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)12021和/或高速缓存存储器12022,可以进一步包括非易失性存储器形式的可读介质,例如只读存储器(ROM)12023。
存储单元1202还可以包括具有一组(至少一个)程序模块12024的程序/实用工具12025,这样的程序模块12024包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
计算设备1200也可以与一个或多个外部设备1204(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口1205进行。并且,计算设备1200还可以通过网络适配器12012与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图12所示,网络适配器12012通过总线1203与计算设备1200的其它模块通信。应当理解,尽管图中未示出,可以结合计算设备1200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了供应链策略确定装置和对象评分模型训练装置的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
此外,尽管在附图中以特定顺序描述了本公开方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本公开的精神和原理,但是应该理解,本公开并不限于所公开的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本公开旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。
Claims (10)
1.一种链路监控系统,其特征在于,所述系统包括:
相互通讯连接的监控管理器、监控服务器和监控代理器,以及与所述监控管理器、监控代理器通讯连接的交互数据处理应用;
所述监控管理器用于向所述监控服务器发送配置命令,以使得所述监控服务器将所述配置命令转发到对应的监控代理器,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中;
所述监控代理器用于接收所述监控服务器发送的配置命令,对所在的计算节点中的目标虚拟节点对应待监控链路的状态进行监控,并将监控得到的监控数据发送到所述交互数据处理应用中,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点;
所述监控管理器还用于从所述交互数据处理应用中获取所述监控数据。
2.一种链路监控方法,其特征在于,应用于监控代理器,所述方法包括:
响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取所述目标虚拟节点基于所述探测报文回复的反馈报文,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中,所述监控代理器设置于所述待监控链路所在的计算节点中;
响应于所述反馈报文,确定所述目标虚拟节点对应的待监控链路的状态信息,以根据所述待监控链路的状态信息确定所述待监控链路的状态,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,所述通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点。
3.根据权利要求2所述的链路监控方法,其特征在于,所述响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取所述目标虚拟节点基于所述探测报文回复的反馈报文,包括:
获取监控服务器发送配置命令,所述配置命令为所述监控管理器基于设定应用架构生成,所述监控管理器用于基于获取的待监控的虚拟网络信息和虚拟节点信息生成所述配置命令;
基于所述配置命令对应的虚拟网络信息和虚拟节点信息,确定所述目标虚拟节点的地址;
基于所述目标虚拟节点的地址,构造并发送所述探测报文。
4.一种链路监控方法,其特征在于,应用于监控管理器,所述方法包括:
获取待监控的虚拟网络信息;
基于所述虚拟网络信息,通过设定的应用接口获取虚拟网络信息对应虚拟网络中的虚拟节点信息;
基于所述虚拟节点信息和虚拟网络信息,生成设定应用架构的配置命令,并发送到监控服务器,以使所述监控服务器将所述配置命令转发到对应的监控代理器,所述监控代理器用于监控所述虚拟节点信息中的目标虚拟节点对应待监控链路的状态,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,所述通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中。
5.一种链路监控方法,其特征在于,应用于监控服务器,所述方法包括:
响应于接收到的配置命令,通过目标协议将所述配置命令转发到对应的计算节点上的监控代理器,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中,所述监控代理器用于监控所述虚拟节点信息中的目标虚拟节点对应待监控链路的状态,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,所述通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点。
6.一种计算机可读存储介质,包括:所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求2至3中任一项所述的链路监控方法;和/或,所述计算机执行指令被处理器执行时用于实现如权利要求4所述的链路监控方法;和/或,所述计算机执行指令被处理器执行时用于实现如权利要求5所述的链路监控方法。
7.一种链路监控装置,其特征在于,应用于监控代理器,所述装置包括:
发送模块,用于响应于接收到的配置命令,向目标虚拟节点的地址发送探测报文,以获取所述目标虚拟节点基于所述探测报文回复的反馈报文,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中,所述监控代理器设置于所述待监控链路所在的计算节点中;
处理模块,用于响应于所述反馈报文,确定所述目标虚拟节点对应的待监控链路的状态信息,以根据所述待监控链路的状态信息确定所述待监控链路的状态,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,所述通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点。
8.一种链路监控装置,其特征在于,应用于监控管理器,所述装置包括:
第一获取模块,用于获取待监控的虚拟网络信息;
第二获取模块,用于基于所述虚拟网络信息,通过设定的应用接口获取虚拟网络信息对应虚拟网络中的虚拟节点信息;
发送模块,用于基于所述虚拟节点信息和虚拟网络信息,生成设定应用架构的配置命令,并发送到监控服务器,以使所述监控服务器将所述配置命令转发到对应的监控代理器,所述监控代理器用于监控所述虚拟节点信息中的目标虚拟节点对应待监控链路的状态,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,所述通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中。
9.一种链路监控装置,其特征在于,应用于监控服务器,所述装置包括:
处理模块,用于响应于接收到的配置命令,通过目标协议将所述配置命令转发到对应的计算节点上的监控代理器,所述配置命令中包括待监控链路所在的计算节点的地址和所述待监控链路对应目标虚拟节点的地址,所述目标虚拟节点部署于所述计算节点中,所述监控代理器用于监控所述虚拟节点信息中的目标虚拟节点对应待监控链路的状态,所述待监控链路的状态用于表示通信节点与所述目标虚拟节点通信的状态,所述通信节点用于表示与所述目标虚拟节点存在通信连接关系的虚拟节点。
10.一种计算设备,包括:至少一个处理器;
以及与至少一个处理器通信连接的存储器;
其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使计算设备执行如权利要求2至3中任一项所述的链路监控方法;和/或,以使计算设备执行如权利要求4所述的链路监控方法;和/或,以使计算设备执行如权利要求5所述的链路监控方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310761194.6A CN116582465A (zh) | 2023-06-26 | 2023-06-26 | 链路监控方法、介质、装置和计算设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310761194.6A CN116582465A (zh) | 2023-06-26 | 2023-06-26 | 链路监控方法、介质、装置和计算设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116582465A true CN116582465A (zh) | 2023-08-11 |
Family
ID=87543344
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310761194.6A Pending CN116582465A (zh) | 2023-06-26 | 2023-06-26 | 链路监控方法、介质、装置和计算设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116582465A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118483976A (zh) * | 2024-07-15 | 2024-08-13 | 北京和利时控制技术有限公司 | 集散控制系统、交换机环网监测方法、装置和存储介质 |
-
2023
- 2023-06-26 CN CN202310761194.6A patent/CN116582465A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118483976A (zh) * | 2024-07-15 | 2024-08-13 | 北京和利时控制技术有限公司 | 集散控制系统、交换机环网监测方法、装置和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110036599B (zh) | 网络健康信息的编程接口 | |
CN111934922B (zh) | 一种网络拓扑的构建方法、装置、设备、存储介质 | |
CA2835446C (en) | Data analysis system | |
CN111835588B (zh) | 一种带内网络遥测承载流选取方法及系统 | |
US11392873B2 (en) | Systems and methods for simulating orders and workflows in an order entry and management system to test order scenarios | |
US8533279B2 (en) | Method and system for reconstructing transactions in a communication network | |
CN112187491B (zh) | 服务器的管理方法、装置和设备 | |
CN105991361A (zh) | 一种云计算平台中云服务器的监控方法和监控系统 | |
JP5560936B2 (ja) | 構成情報取得方法、仮想プローブおよび構成情報取得制御装置 | |
US20140337471A1 (en) | Migration assist system and migration assist method | |
US11218391B2 (en) | Methods for monitoring performance of a network fabric and devices thereof | |
CN111338893A (zh) | 进程日志处理方法、装置、计算机设备以及存储介质 | |
CN116582465A (zh) | 链路监控方法、介质、装置和计算设备 | |
CN110247812A (zh) | 一种多集群管理方法、装置、系统及相关组件 | |
JP2013222313A (ja) | 障害連絡効率化システム | |
CN113946559A (zh) | 数据处理方法、目标数据库系统及数据处理系统 | |
WO2024149297A1 (zh) | 容器网络抓包处理方法、装置、设备及可读存储介质 | |
CN108599978B (zh) | 一种云监控方法和装置 | |
CN111817865A (zh) | 一种监控网管设备的方法及监控系统 | |
CN115987827B (zh) | 一种设备监测方法、装置、电子设备及可读介质 | |
CN109951313B (zh) | 一种Hadoop云平台的监控装置及方法 | |
CN115333967B (zh) | 数据上报方法、系统、设备及存储介质 | |
Levin et al. | Network Monitoring in Federated Cloud Environment | |
CN115086160A (zh) | 一种基于SaaS平台的日志采集方法、终端代理、设备 | |
CN115934464A (zh) | 一种信息化平台监控采集系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information | ||
CB02 | Change of applicant information |
Address after: 310052 Room 301, Building No. 599, Changhe Street Network Business Road, Binjiang District, Hangzhou City, Zhejiang Province Applicant after: Hangzhou NetEase Shuzhifan Technology Co.,Ltd. Address before: 310052 Room 301, Building No. 599, Changhe Street Network Business Road, Binjiang District, Hangzhou City, Zhejiang Province Applicant before: HANGZHOU LANGHE TECHNOLOGY Ltd. |