CN116248479A - 网络路径探测方法、装置、设备及存储介质 - Google Patents

网络路径探测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116248479A
CN116248479A CN202211712266.XA CN202211712266A CN116248479A CN 116248479 A CN116248479 A CN 116248479A CN 202211712266 A CN202211712266 A CN 202211712266A CN 116248479 A CN116248479 A CN 116248479A
Authority
CN
China
Prior art keywords
flow
network
message
alarm
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211712266.XA
Other languages
English (en)
Inventor
单江华
侯叶飞
张洪钏
庞海烨
程超
杜少博
韦青力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianyi Cloud Technology Co Ltd
Original Assignee
Tianyi Cloud Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianyi Cloud Technology Co Ltd filed Critical Tianyi Cloud Technology Co Ltd
Priority to CN202211712266.XA priority Critical patent/CN116248479A/zh
Publication of CN116248479A publication Critical patent/CN116248479A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/12Network monitoring probes
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/50Reducing energy consumption in communication networks in wire-line communication networks, e.g. low power modes or reduced link rate

Abstract

本发明实施例提供了一种网络路径探测方法、装置、设备及存储介质,包括:根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备,基于流量探测规则,扩展报文的IPoption字段,进行流量路径探测,获取报文流经的网络设备及端口信息,生成流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,根据流量路径还原结果,匹配预设告警规则进行故障告警。本发明通过扩展IPoption字段,能够同时进行公有云内不同租户的流量路径探测,基于多元组的流量探测规则,生成流量路径拓扑信息对租户业务实时监测,当有流量中断故障时触发告警,及时确定故障问题,提升用户体验。

Description

网络路径探测方法、装置、设备及存储介质
技术领域
本发明涉及网络通信技术领域,特别涉及一种网络路径探测方法、装置、设备及存储介质。
背景技术
随着云计算技术的不断发展,云服务应用场景越来越丰富,作为云计算发展重要支撑的云网络,如何通过流量探测及时发现问题,并精准定位问题显得非常的重要,对用户使用体验的提升也起到关键性的作用,云网络流量探测指的是对数据流进行监测,包括出数据、入数据的速度、总流量,因此,网络流量探测本质上是对网络通信数据包进行管理与控制。
目前,常用的流量路径探测方式包括硬件探针、基于流量镜像协议分析、基于SNMP的流量监测技术等,然而,针对公有云资源池承载租户多,转发节点多,涉及underlay和overlay多种不同的转发设备的特点,采用硬件探针进行网络流量探测需要串接专门的网络流量硬件设备,会增加云资源池新建成本,还无法做到全网流量监测;基于流量镜像协议分析方法只针对单条链路,同样无法满足全网流量监测的需要;基于SNMP的流量监测只能收集一些设备及端口的流量信息,也无法满足云网络上针对不同租户的业务流量路径实时监测的需要,基于此,做为云运营商无法提前发现网络路径故障,经常需要等到客户报障后再根据客户的业务逐一排查进行问题的定位,影响用户体验。
发明内容
本发明实施例的目的在于提供一种网络路径探测方法、装置、设备及存储介质,解决现有技术无法满足云网络上针对不同租户的业务流量路径实时监测的需要的问题,以实现云网络的实时路径探测,快速精准定位不同租户的网络故障的效果,具体技术方案如下:
在本发明实施的第一方面,首先提供了一种网络路径探测方法,所述方法包括:
根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备;
基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测;
获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果;
根据所述流量路径还原结果,匹配预设告警规则进行故障告警。
可选的,所述根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备,包括:
根据所述网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,其中,所述多元组信息包括源IP、目的IP、源端口、目的端口;
根据流量流经的源端口和目的端口,对公有云内各租户配置所述流量探测规则;
通过网络配置协议或网络安全协议将所述流量探测规则下发至所述网络设备。
可选的,所述基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测,包括:
在所述报文的IP option字段中添加公有云内各租户VIN、所述流量探测规则的ID和报文序列号SN;
根据扩展后的所述报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测。
可选的,所述根据扩展后的报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测,包括:
根据扩展后的所述报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;
其中,所述东西向流量的流量标记点包括入云报文的接入点和客户虚机点,所述南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
可选的,所述根据扩展后的报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测之后,还包括:
记录所述报文的报文序列号SN,确定是否存在丢包;
在未丢包的情况下,根据当前处理的报文与上一次接收的报文的序列号差值,对当前处理的报文进行计数,存储为流量统计信息;
若统计的报文序列号SN至预设阈值,将所述报文序列号SN存储为历史流量统计信息。
可选的,所述获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,包括:
根据周期获取的每条流量探测规则对应的流量统计信息,确定报文流量路径;
根据所述报文流量路径,确定报文流经的起始网络设备信息;
基于网络设备及端口间的连接关系,关联所述报文流量路径的中间设备信息,生成每条流量探测规则对应的流量路径拓扑图。
可选的,所述获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,包括:
获取所述报文流经的网络设备及端口的流量统计信息,其中,所述流量统计信息包括网络设备及端口接收到的报文数量;
根据所述流量统计信息,生成预设时间段内网络设备及端口的报文转发情况,确定流量路径还原结果。
可选的,所述根据所述流量路径还原结果,匹配预设告警规则进行故障告警,包括:
根据所述流量路径还原结果,查询流量路径的流量统计信息;
根据所述流量路径的流量统计信息,匹配预设告警规则;
在匹配所述预设告警规则的情况下,确定告警类型,其中,所述告警类型包括产生告警和恢复告警;
若确定告警类型为所述产生告警,触发告警上报进行故障告警;
若确定告警类型为所述恢复告警,查询告警上报列表,发送告警信息进行故障告警。
在本发明实施的第二方面,还提供了一种网络路径探测装置,所述装置包括:
网络拓扑信息模块,用于根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备;
流量路径探测模块,用于基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测;
流量路径还原模块,用于获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果;
故障告警模块,用于根据所述流量路径还原结果,匹配预设告警规则进行故障告警。
可选的,所述网络拓扑信息模块包括:
匹配信息子模块,用于根据所述网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,其中,所述多元组信息包括源IP、目的IP、源端口、目的端口;
配置规则子模块,用于根据流量流经的源端口和目的端口,对公有云内各租户配置所述流量探测规则;
发送规则子模块,用于通过网络配置协议或网络安全协议将所述流量探测规则下发至所述网络设备。
可选的,所述流量路径探测模块包括:
处理报文子模块,用于在所述报文的IP option字段中添加公有云内各租户VIN、所述流量探测规则的ID和报文序列号SN;
探测路径子模块,用于根据扩展后的所述报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测。
可选的,所述探测路径子模块包括:
流量标记单元,用于根据扩展后的所述报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;
其中,所述东西向流量的流量标记点包括入云报文的接入点和客户虚机点,所述南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
可选的,所述流量路径探测模块还包括:
记录报文子模块,用于记录所述报文的报文序列号SN,确定是否存在丢包;
第一存储子模块,用于在未丢包的情况下,根据当前处理的报文与上一次接收的报文的序列号差值,对当前处理的报文进行计数,存储为流量统计信息;
第二存储子模块,用于若统计的报文序列号SN至预设阈值,将所述报文序列号SN存储为历史流量统计信息。
可选的,所述流量路径还原模块包括:
确定路径子模块,用于根据周期获取的每条流量探测规则对应的流量统计信息,确定报文流量路径;
确定信息子模块,用于根据所述报文流量路径,确定报文流经的起始网络设备信息;
生成子模块,用于基于网络设备及端口间的连接关系,关联所述报文流量路径的中间设备信息,生成每条流量探测规则对应的流量路径拓扑图。
可选的,所述流量路径还原模块包括:
获取信息子模块,用于获取所述报文流经的网络设备及端口的流量统计信息,其中,所述流量统计信息包括网络设备及端口接收到的报文数量;
确定结果子模块,用于根据所述流量统计信息,生成预设时间段内网络设备及端口的报文转发情况,确定流量路径还原结果。
可选的,所述故障告警模块包括:
查询信息子模块,用于根据所述流量路径还原结果,查询流量路径的流量统计信息;
匹配告警子模块,用于根据所述流量路径的流量统计信息,匹配预设告警规则;
确定告警子模块,用于在匹配所述预设告警规则的情况下,确定告警类型,其中,所述告警类型包括产生告警和恢复告警;
第一告警子模块,用于若确定告警类型为所述产生告警,触发告警上报进行故障告警;
第二告警子模块,用于若确定告警类型为所述恢复告警,查询告警上报列表,发送告警信息进行故障告警。
在本发明实施的第三方面,还提供了一种通信设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
所述处理器,用于读取存储器中的程序实现执行上述第一方面任一所述的网络路径探测方法;
在本发明实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的网络路径探测方法。
本发明实施例提供的网络路径探测方法,根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备,基于流量探测规则,扩展报文的IP option字段,进行流量路径探测,获取报文流经的网络设备及端口信息,生成流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,根据流量路径还原结果,匹配预设告警规则进行故障告警。本发明通过扩展IP option字段,能够同时进行公有云内不同租户的流量路径探测,基于多元组的流量探测规则,生成流量路径拓扑信息对租户业务实时监测,且无需新增硬件探针设备,降低成本,当有流量中断故障时触发告警,及时确定故障问题,提升用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1为本发明实施例提供的一种网络路径探测方法的步骤流程图;
图2是图1中本发明实施例提供的网络路径探测方法的步骤101的方法流程图;
图3是图1中本发明实施例提供的网络路径探测方法的步骤102的方法流程图;
图4是图1中本发明实施例提供的网络路径探测方法的步骤103的方法流程图;
图5是图1中本发明实施例提供的网络路径探测方法的步骤104的方法流程图;
图6是本发明实施例提供的一种网络路径探测方法的应用场景示意图;
图7是图1所示的本申请实施例提供的网络路径探测的方法中报文的示意图;
图8是本发明实施例提供的一种网络路径探测装置的结构示意图;
图9是本发明实施例提供的一种通信设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各个实施例的划分是为了描述方便,不应对本发明的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
参照图1,示出了本发明实施例提供的一种网络路径探测方法的步骤流程图,所述方法可以包括:
步骤101,根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备。
在本申请实施例中,基于云网络的多租户、overlay与underlay协同、控制面与业务面分离等自身特点,为实现在云网络资源池进行全网各租户的流量路径探测,快速定位云网络故障,本实施例中用户可以根据业务要求,通过管理平台添加预先配置的流量探测规则,管理平台根据预先录入的各网络设备对应的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备。
需要说明的是,本实施例中,管理平台与SDN控制系统建立通信连接,管理平台是具有集成工具的综合软件套件,用来监控和控制云计算资源,管理平台作为由数据库和服务器组成的虚拟机(VM)部署到现有的云环境中,服务器与应用程序编程接口通信,以连接数据库和云中保存的虚拟资源,该数据库收集有关虚拟基础架构如何运行的信息,并将分析结果发送到显示界面,运营人员可以在其中分析云性能。SDN控制器是软件定义网络(Software Defined Network,SDN)中主要以集中控制器统一控制overlay网络组网中的应用程序,负责流量控制以确保智能网络。
例如:如图6所示的流量探测场景示意图,云计算网络中租户多,通过对各网络设备及端口进行流量标记、采集流量统计信息,管理平台分析实现公有云网络探测功能。具体的,管理平台根据云主机信息,查找对应的计算节点,根据已录入的网络拓扑信息,查找对应流量所流经的物理设备及端口,生成对应的流量探测规则下发到对应设备上。
本实施例中,通过管控平台根据录入的网络拓扑,自动配置流量探测规则,将预先配置的流量探测规则下发至网络设备,操作简单,简化配置流程。
步骤102,基于流量探测规则,扩展报文的IP option字段,进行流量路径探测。
需要说明的是,现有技术中一些常用的链路探测方式,例如:ping、trace,一般是运维手动触发进行,无法做到实时的租户流量路径探测,因此,本发明,基于流量探测规则,扩展IP option字段,在保持现有资源池网络拓扑不做改变的情况下,实现实时业务流量流经路径的探测。
具体的,参照图7所示的报文信息,其中,Type用于复制到所有片段中,Length代表IP option总长度,单位为字节,IP option字段长度设置为0-31,Rule ID表示配置的流量探测规则的ID;需要说明的是,VNI是租户对应的VxLAN Id,在同一个公有云资源池内,每个租户的VNI均不相同,用来区分不同租户的流量统计,每个租户最大能配置65536条流量探测规则;Sequence number是报文序列号SN,对于不同的Rule ID标记报文,则报文序列号SN会加1,当统计的报文序列号SN增加到预设阈值0xFFFFFFFF后则回滚到初始值0x00000000重新进行统计。
本实施例中,基于流量探测规则,扩展报文的IP option字段,通过将租户的VNI添加到报文中,可以极大的简化流量统计规则的配置,添加流量探测规则的ID可支持不同租户多业务的并发流量路径探测需求,添加报文序列号SN可用于支持统计丢包的情况。
进一步地,根据扩展后的报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;其中,东西向流量的流量标记点包括入云报文的接入点和客户虚机点,南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
本实施例中,报文主要是针对东西向流量和南北向流量进行探测,其中,东西向流量是数据中心内部服务器之间交互的流量,南北向流量是数据中心外部用户和内部服务器之间交互的流量。东西向流量的流量标记点在入云报文的接入点和客户虚机点进行标记;南北向流量的流量标记点为bleaf入端口、专线接入POP入端口、云主机对应的虚拟交互软件等。由于云内网络存在vxlan的封装,可以启用vxlan封装,复制内层IP OPTION的值到vxlan的外层报文头上,极大的简化流量统计的难度,提高报文转发效率。
步骤103,获取报文流经的网络设备及端口信息,生成流量探测规则对应的流量路径拓扑图,确定流量路径还原结果。
需要说明的是,在本申请实施例中,管理平台获取报文流经的网络设备及端口信息,根据流量探测规则,输出报文从探测节点到目标IP的拓扑信息,完成探测节点到目标IP的流量探测,生成流量探测规则对应的流量路径拓扑图,根据流量路径拓扑图能够确定流量路径还原结果。
具体的,管控平台根据每条探测规则对应的流量统计信息,分析流量转发的路径,提取有报文流经的网络设备及端口信息,找到起始设备信息,最后根据设备不同端口之间的连接关系,将中间设备信息关联上,如果不全的则补全;生成每条流量探测规则对应的流量路径拓扑图,针对集群或主备转发节点做流量统计的聚合,通过流量路径拓扑图展示每个转发节点接收到的报文数量,可以还原近段时间内的流量转发情况,确定流量路径还原结果。
步骤104,根据流量路径还原结果,匹配预设告警规则进行故障告警。
需要说明的是,本实施例中,根据流量路径还原结果,查询流量路径的流量统计信息,根据流量路径的流量统计信息,匹配预设告警规则;其中,预设告警规则是通过设置云主机告警规则,用户自定义监控目标与通知策略,以便于及时了解云网络运行状况,从而起到预警作用。本实施例中对预设告警规则的确定方式不作具体限定。
具体的,在匹配预设告警规则的情况下,确定告警类型,其中,告警类型包括产生告警和恢复告警,若确定告警类型为产生告警,则触发告警上报进行故障告警,若确定告警类型为恢复告警,查询告警上报列表,发送告警信息进行故障告警。需要说明的是,当流量统计信息显示报文数据中断或丢包时,产生告警;当流量路径探测成功,则上报恢复告警。管理平台根据流量路径还原的结果,匹配告警规则,根据匹配结果判断是否要进行告警还是恢复告警,查询对应的告警通知组,并发通知到相关方,针对致命的告警会持续通知,直到告警恢复为止。
本实施例中,通过资源池全网各设备的流量统计信息,分析实际流经路径,快速定位网络故障,运维人员可通过管理平台图型化展示的流量路径,直观的发现问题。
本发明实施例提供的网络路径探测方法,根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备,基于流量探测规则,扩展报文的IP option字段,进行流量路径探测,获取报文流经的网络设备及端口信息,生成流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,根据流量路径还原结果,匹配预设告警规则进行故障告警。本发明通过扩展IP option字段,能够同时进行公有云内不同租户的流量路径探测,基于多元组的流量探测规则,生成流量路径拓扑信息对租户业务实时监测,且无需新增硬件探针设备,降低成本,当有流量中断故障时触发告警,及时确定故障问题,提升用户体验。
进一步地,参照图2,图2是图1中本发明实施例提供的网络路径探测方法的步骤101的方法流程图,步骤101包括:
步骤1011,根据网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,其中,多元组信息包括源IP、目的IP、源端口、目的端口;
步骤1012,根据流量流经的源端口和目的端口,对公有云内各租户配置流量探测规则;
步骤1013,通过网络配置协议或网络安全协议将流量探测规则下发至网络设备。
需要说明的是,上述步骤1011-1013中,当网络设备和服务端建立一个TCP连接时通过四元组来确定唯一的TCP连接,根据网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,本实施例以四元组为例进行说明,其中,四元组信息包括源IP、目的IP、源端口、目的端口,根据流量流经的源端口和目的端口,对公有云内各租户配置流量探测规则,通过网络配置协议或网络安全协议将流量探测规则下发至网络设备。
用户可根据业务要求,通过管控平台添加流量探测规则,匹配四元组以选择云主机及要探测的业务,可以设定探测时间段,探测包数等,管理平台与SDN控制系统通信,根据VPCID和云主机信息,实时查找对应的计算节点;根据已录入的网络拓扑信息,查找对应流量所流经的物理设备及端口,生成对应的流量探测规则和流量统计规则,通过netconf或SSH方式下发到对应设备上。
需要说明的是,网络配置协议(Network ConfigurationProtocol)为管理平台和网络设备之间通信提供了一套协议,对远端设备的配置进行下发、修改等操作,SSH(SecureShell,安全外壳)是一种网络安全协议,通过加密和认证机制实现安全的访问和文件传输等业务,本实施例中,管理平台通过网络配置协议或网络安全协议将流量探测规则下发至网络设备。
本发明实施例提供的网络路径探测方法,相对于现有技术,无需新增硬件探针设备,也无需单独发送探测报文,降低成本,提高公网带宽利用率,通过管理平台根据录入的网络拓扑信息,生成配置流量探测规则,简化配置流程,
进一步地,参照图3,图3是图1中本发明实施例提供的网络路径探测方法的步骤102的方法流程图,步骤102包括:
步骤1021,在报文的IP option字段中添加公有云内各租户VIN、流量探测规则的ID和报文序列号SN;
需要说明的是,在本申请实施例中,通过扩展IP option字段为SN+VNI+ID,可以同时进行不同租户业务流量路径探测,互不干扰,实现overlay与underlay的流量探测协同。
步骤1022,根据扩展后的报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测。
进一步地,步骤1022可以包括:根据扩展后的报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;
其中,东西向流量的流量标记点包括入云报文的接入点和客户虚机点,南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
本实施例中,东西向流量的流量标记点在入云报文的接入点和客户虚机点进行标记;南北向流量的流量标记点为bleaf入端口、专线接入POP入端口、云主机对应的虚拟交互软件等。由于云内网络存在vxlan的封装,可以启用vxlan封装,复制内层IP OPTION的值到vxlan的外层报文头上,极大的简化流量统计的难度,提高报文转发效率。
进一步地,参照图4,图4是图1中本发明实施例提供的网络路径探测方法的步骤103的方法流程图,步骤103包括:
步骤1031,根据周期获取的每条流量探测规则对应的流量统计信息,确定报文流量路径。
步骤1032,根据报文流量路径,确定报文流经的起始网络设备信息。
步骤1033,基于网络设备及端口间的连接关系,关联报文流量路径的中间设备信息,生成每条流量探测规则对应的流量路径拓扑图。
需要说明的是,管理平台根据周期获取的每条探测规则对应的流量统计信息,分析流量转发的路径,先提取有对应报文流经的设备及端口信息,再找到起始设备信息,最后根据网络设备及端口间的连接关系,将中间设备信息关联上,如果不全的则补全,生成每条流量探测规则对应的流量路径拓扑图。针对集群或主备转发节点做流量统计的聚合,并展示每个转发节点接收到的报文数量,根据历史统计信息,可以还原近段时间内的流量转发情况。
在一些实施例中,所述根据扩展后的报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测之后,还包括:
记录报文的报文序列号SN,确定是否存在丢包;
在未丢包的情况下,根据当前处理的报文与上一次接收的报文的序列号差值,对当前处理的报文进行计数,存储为流量统计信息;
若统计的报文序列号SN至预设阈值,将报文序列号SN存储为历史流量统计信息。
需要说明的是,公有云资源池上的所有网络设备、虚拟转发设备均默认开启基于IP option流量统计功能,在流量统计时,可采用掩码的方式,记录统计到的报文序列号SN,用于判断是否存在丢包的情况,当报文序列号SN为0xffffffff时,表示需要重新计数。为了解决报文序列号SN=0xffffffff后报文丢弃的情况,根据当前处理的报文与上一次收到的报文之间的序列号SN之间的差值,用以判断此报文是否为新的一个序列的包,避免流量统计有误。若统计的报文序列号SN至预设阈值,将报文序列号SN存储为历史流量统计信息,其中,本实施例中预设阈值可以是根据IPoption字段中的SN长度确定,在此不再赘述。
进一步地,参照图5,图5是图1中本发明实施例提供的网络路径探测方法的步骤104的方法流程图,步骤104包括:
步骤1041,根据流量路径还原结果,查询流量路径的流量统计信息;
步骤1042,根据流量路径的流量统计信息,匹配预设告警规则;
步骤1043,在匹配预设告警规则的情况下,确定告警类型,其中,告警类型包括产生告警和恢复告警;
步骤1044,若确定告警类型为产生告警,触发告警上报进行故障告警;
步骤1045,若确定告警类型为恢复告警,查询告警上报列表,发送告警信息进行故障告警。
需要说明的是,在步骤1041-1045中,管理平台根据流量路径还原的结果去匹配告警规则,根据匹配结果判断是否要进行告警还是恢复告警,查询对应的告警通知组,并发通知到相关方。
具体的,本实施例中,根据流量路径还原结果,查询流量路径的流量统计信息,匹配预设告警规则,在匹配预设告警规则的情况下,确定告警类型,其中,告警类型包括产生告警和恢复告警,若确定告警类型为产生告警,则触发告警上报进行故障告警,若确定告警类型为恢复告警,查询告警上报列表,发送告警信息进行故障告警。即当流量统计信息显示报文数据中断或丢包时,产生告警;当流量路径探测成功,则上报恢复告警。管理平台根据流量路径还原的结果,匹配告警规则,根据匹配结果判断是否要进行告警还是恢复告警,查询对应的告警通知组,并发通知到相关方,针对致命的告警会持续通知,直到告警恢复为止。
本发明实施例中通过资源池全网各设备的流量统计信息,分析实际流经路径,快速定位网络故障,运维人员可通过管理平台图型化展示的流量路径,直观的发现问题,当有流量中断故障时触发告警,及时确定故障问题,提升用户体验。
参照图8,示出了本发明实施例提供的网络路径探测装置的结构示意图,所述装置可以包括:
网络拓扑信息模块201,用于根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备;
流量路径探测模块202,用于基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测;
流量路径还原模块203,用于获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果;
故障告警模块204,用于根据所述流量路径还原结果,匹配预设告警规则进行故障告警。
进一步的,所述网络拓扑信息模块201包括:
匹配信息子模块,用于根据所述网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,其中,所述多元组信息包括源IP、目的IP、源端口、目的端口;
配置规则子模块,用于根据流量流经的源端口和目的端口,对公有云内各租户配置所述流量探测规则;
发送规则子模块,用于通过网络配置协议或网络安全协议将所述流量探测规则下发至所述网络设备。
进一步的,所述流量路径探测模块202包括:
处理报文子模块,用于在所述报文的IP option字段中添加公有云内各租户VIN、所述流量探测规则的ID和报文序列号SN;
探测路径子模块,用于根据扩展后的所述报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测。
进一步的,所述探测路径子模块包括:
流量标记单元,用于根据扩展后的所述报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;
其中,所述东西向流量的流量标记点包括入云报文的接入点和客户虚机点,所述南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
进一步的,所述流量路径探测模块202还包括:
记录报文子模块,用于记录所述报文的报文序列号SN,确定是否存在丢包;
第一存储子模块,用于在未丢包的情况下,根据当前处理的报文与上一次接收的报文的序列号差值,对当前处理的报文进行计数,存储为流量统计信息;
第二存储子模块,用于若统计的报文序列号SN至预设阈值,将所述报文序列号SN存储为历史流量统计信息。
进一步的,所述流量路径还原模块203包括:
确定路径子模块,用于根据周期获取的每条流量探测规则对应的流量统计信息,确定报文流量路径;
确定信息子模块,用于根据所述报文流量路径,确定报文流经的起始网络设备信息;
生成子模块,用于基于网络设备及端口间的连接关系,关联所述报文流量路径的中间设备信息,生成每条流量探测规则对应的流量路径拓扑图。
进一步的,所述流量路径还原模块203包括:
获取信息子模块,用于获取所述报文流经的网络设备及端口的流量统计信息,其中,所述流量统计信息包括网络设备及端口接收到的报文数量;
确定结果子模块,用于根据所述流量统计信息,生成预设时间段内网络设备及端口的报文转发情况,确定流量路径还原结果。
进一步的,所述故障告警模块204包括:
查询信息子模块,用于根据所述流量路径还原结果,查询流量路径的流量统计信息;
匹配告警子模块,用于根据所述流量路径的流量统计信息,匹配预设告警规则;
确定告警子模块,用于在匹配所述预设告警规则的情况下,确定告警类型,其中,所述告警类型包括产生告警和恢复告警;
第一告警子模块,用于若确定告警类型为所述产生告警,触发告警上报进行故障告警;
第二告警子模块,用于若确定告警类型为所述恢复告警,查询告警上报列表,发送告警信息进行故障告警。
本发明实施例提供的网络路径探测装置,根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备,基于流量探测规则,扩展报文的IP option字段,进行流量路径探测,获取报文流经的网络设备及端口信息,生成流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,根据流量路径还原结果,匹配预设告警规则进行故障告警。本发明通过扩展IP option字段,能够同时进行公有云内不同租户的流量路径探测,基于多元组的流量探测规则,生成流量路径拓扑信息对租户业务实时监测,且无需新增硬件探针设备,降低成本,当有流量中断故障时触发告警,及时确定故障问题,提升用户体验。
本发明实施例还提供了一种通信设备,如图9所示,包括处理器301、通信接口302、存储器303和通信总线304,其中,处理器301,通信接口302,存储器303通过通信总线304完成相互间的通信,
存储器303,用于存放计算机程序;
处理器301,用于执行存储器303上所存放的程序时,可以实现如下步骤:
根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至网络设备,基于流量探测规则,扩展报文的IP option字段,进行流量路径探测,获取报文流经的网络设备及端口信息,生成流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,根据流量路径还原结果,匹配预设告警规则进行故障告警。
上述终端提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口用于上述终端与其他设备之间的通信。
存储器可以包括随机存取存储器(RandomAccess Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的网络路径探测方法。
在本发明提供的又一实施例中,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的网络路径探测方法。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

Claims (15)

1.一种网络路径探测方法,其特征在于,所述方法包括:
根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备;
基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测;
获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果;
根据所述流量路径还原结果,匹配预设告警规则进行故障告警。
2.根据权利要求1所述的网络路径探测方法,其特征在于,所述根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备,包括:
根据所述网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,其中,所述多元组信息包括源IP、目的IP、源端口、目的端口;
根据流量流经的源端口和目的端口,对公有云内各租户配置所述流量探测规则;
通过网络配置协议或网络安全协议将所述流量探测规则下发至所述网络设备。
3.根据权利要求1所述的网络路径探测方法,其特征在于,所述基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测,包括:
在所述报文的IP option字段中添加公有云内各租户VIN、所述流量探测规则的ID和报文序列号SN;
根据扩展后的所述报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测。
4.根据权利要求3所述的网络路径探测方法,其特征在于,所述根据扩展后的报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测,包括:
根据扩展后的所述报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;
其中,所述东西向流量的流量标记点包括入云报文的接入点和客户虚机点,所述南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
5.根据权利要求4所述的网络路径探测方法,其特征在于,所述根据扩展后的报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测之后,还包括:
记录所述报文的报文序列号SN,确定是否存在丢包;
在未丢包的情况下,根据当前处理的报文与上一次接收的报文的序列号差值,对当前处理的报文进行计数,存储为流量统计信息;
若统计的报文序列号SN至预设阈值,将所述报文序列号SN存储为历史流量统计信息。
6.根据权利要求1所述的网络路径探测方法,其特征在于,所述获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,包括:
根据周期获取的每条流量探测规则对应的流量统计信息,确定报文流量路径;
根据所述报文流量路径,确定报文流经的起始网络设备信息;
基于网络设备及端口间的连接关系,关联所述报文流量路径的中间设备信息,生成每条流量探测规则对应的流量路径拓扑图。
7.根据权利要求6所述的网络路径探测方法,其特征在于,所述获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果,包括:
获取所述报文流经的网络设备及端口的流量统计信息,其中,所述流量统计信息包括网络设备及端口接收到的报文数量;
根据所述流量统计信息,生成预设时间段内网络设备及端口的报文转发情况,确定流量路径还原结果。
8.根据权利要求1所述的网络路径探测方法,其特征在于,所述根据所述流量路径还原结果,匹配预设告警规则进行故障告警,包括:
根据所述流量路径还原结果,查询流量路径的流量统计信息;
根据所述流量路径的流量统计信息,匹配预设告警规则;
在匹配所述预设告警规则的情况下,确定告警类型,其中,所述告警类型包括产生告警和恢复告警;
若确定告警类型为所述产生告警,触发告警上报进行故障告警;
若确定告警类型为所述恢复告警,查询告警上报列表,发送告警信息进行故障告警。
9.一种网络路径探测装置,其特征在于,所述装置包括:
网络拓扑信息模块,用于根据预先录入的网络拓扑信息,查找网络设备及端口信息,将预先配置的流量探测规则下发至所述网络设备;
流量路径探测模块,用于基于所述流量探测规则,扩展报文的IP option字段,进行流量路径探测;
流量路径还原模块,用于获取所述报文流经的网络设备及端口信息,生成所述流量探测规则对应的流量路径拓扑图,确定流量路径还原结果;
故障告警模块,用于根据所述流量路径还原结果,匹配预设告警规则进行故障告警。
10.根据权利要求9所述的网络路径探测装置,其特征在于,所述网络拓扑信息模块包括:
匹配信息子模块,用于根据所述网络拓扑信息的网络设备,匹配多元组信息,确定流量流经的源端口和目的端口,其中,所述多元组信息包括源IP、目的IP、源端口、目的端口;
配置规则子模块,用于根据流量流经的源端口和目的端口,对公有云内各租户配置所述流量探测规则;
发送规则子模块,用于通过网络配置协议或网络安全协议将所述流量探测规则下发至所述网络设备。
11.根据权利要求9所述的网络路径探测装置,其特征在于,所述流量路径探测模块包括:
处理报文子模块,用于在所述报文的IP option字段中添加公有云内各租户VIN、所述流量探测规则的ID和报文序列号SN;
探测路径子模块,用于根据扩展后的所述报文,确定配置流量标记的网络设备,并行对配置流量标记的网络设备进行流量路径探测。
12.根据权利要求11所述的网络路径探测装置,其特征在于,所述探测路径子模块包括:
流量标记单元,用于根据扩展后的所述报文对东西向流量和南北向流量进行流量标记,确定配置流量标记的网络设备;
其中,所述东西向流量的流量标记点包括入云报文的接入点和客户虚机点,所述南北向流量的流量标记点包括专线接入端口、云主机对应的虚拟交互软件。
13.根据权利要求9所述的网络路径探测装置,其特征在于,所述流量路径探测模块还包括:
记录报文子模块,用于记录所述报文的报文序列号SN,确定是否存在丢包;
第一存储子模块,用于在未丢包的情况下,根据当前处理的报文与上一次接收的报文的序列号差值,对当前处理的报文进行计数,存储为流量统计信息;
第二存储子模块,用于若统计的报文序列号SN至预设阈值,将所述报文序列号SN存储为历史流量统计信息。
14.一种通信设备,其特征在于,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
所述处理器,用于读取存储器中的程序实现如权利要求1-8中任意一项所述网络路径探测方法中的步骤。
15.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1-8中任意一项所述网络路径探测方法中的步骤。
CN202211712266.XA 2022-12-29 2022-12-29 网络路径探测方法、装置、设备及存储介质 Pending CN116248479A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211712266.XA CN116248479A (zh) 2022-12-29 2022-12-29 网络路径探测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211712266.XA CN116248479A (zh) 2022-12-29 2022-12-29 网络路径探测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116248479A true CN116248479A (zh) 2023-06-09

Family

ID=86626859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211712266.XA Pending CN116248479A (zh) 2022-12-29 2022-12-29 网络路径探测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116248479A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116455680A (zh) * 2023-06-19 2023-07-18 卓望数码技术(深圳)有限公司 云平台的tcp全流量采集和聚合方法、系统及计算机设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116455680A (zh) * 2023-06-19 2023-07-18 卓望数码技术(深圳)有限公司 云平台的tcp全流量采集和聚合方法、系统及计算机设备
CN116455680B (zh) * 2023-06-19 2023-10-13 卓望数码技术(深圳)有限公司 云平台的tcp全流量采集和聚合方法、系统及计算机设备

Similar Documents

Publication Publication Date Title
JP7108674B2 (ja) 故障根本原因決定方法及び装置並びにコンピュータ記憶媒体
US8583779B2 (en) Root cause analysis approach with candidate elimination using network virtualization
EP1999890B1 (en) Automated network congestion and trouble locator and corrector
US20160359695A1 (en) Network behavior data collection and analytics for anomaly detection
CN112787841B (zh) 故障根因定位方法及装置、计算机存储介质
WO2022083540A1 (zh) 故障恢复预案确定方法、装置及系统、计算机存储介质
US8274911B2 (en) Network monitoring system and path extracting method
WO2021018309A1 (zh) 报文传输路径确定方法、装置及系统、计算机存储介质
WO2021169290A1 (zh) 配置性能探测指示信息的方法及相关设备
US11509552B2 (en) Application aware device monitoring correlation and visualization
EP3222004B1 (en) Diagnostic testing in networks
CN111030873A (zh) 一种故障诊断方法及装置
JP2005285040A (ja) ネットワーク監視システム及びその方法、プログラム
CN111147371B (zh) 处理路由事件记录表项的方法、网络设备和控制设备
US20130042020A1 (en) Quick Network Path Discovery
CN114915561B (zh) 网络拓扑图生成方法和装置
US11032124B1 (en) Application aware device monitoring
CN116248479A (zh) 网络路径探测方法、装置、设备及存储介质
CN110071843B (zh) 一种基于流路径分析的故障定位方法及装置
KR100964392B1 (ko) 망 관리에서의 장애 관리 시스템 및 그 방법
WO2019001101A1 (zh) 路由路径分析方法及设备
JP2019145893A (ja) トポロジ決定装置、トポロジ決定方法、トポロジ決定プログラムおよび通信システム
US11438237B1 (en) Systems and methods for determining physical links between network devices
JP2004086522A (ja) 通信ネットワーク監視システム
US10756951B2 (en) Network incident identification based on characterizing relationships between interfaces and events as graphical component relationships

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 100007 room 205-32, floor 2, building 2, No. 1 and No. 3, qinglonghutong a, Dongcheng District, Beijing

Applicant after: Tianyiyun Technology Co.,Ltd.

Address before: 100093 Floor 4, Block E, Xishan Yingfu Business Center, Haidian District, Beijing

Applicant before: Tianyiyun Technology Co.,Ltd.