CN117938714A

CN117938714A - 网络链路故障检测方法、装置、设备及可读存储介质

Info

Publication number: CN117938714A
Application number: CN202410153630.6A
Authority: CN
Inventors: 张新常; 朱效民; 耿光刚; 延志伟; 刘庆良
Original assignee: Shandong Normal University
Current assignee: Shandong Normal University
Priority date: 2024-02-01
Filing date: 2024-02-01
Publication date: 2024-04-26

Abstract

本发明涉及一种网络链路故障检测方法、装置、设备及可读存储介质，属于计算机网络技术领域，其方法包括：获取网络链路的拓扑图和网络链路探测延迟时间；根据所述网络链路探测延迟时间，确定所述拓扑图对应的拓展链路数量阈值；根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，每个所述目标分割图对应所述网络链路中的一个子网络链路；对于每个所述目标分割图，根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果；基于各个所述探测结果和预设网络监控策略，对所述网络链路进行故障检测。本方案具有降低控制器负载，从而提高控制器性能的效果。

Description

网络链路故障检测方法、装置、设备及可读存储介质

技术领域

本发明涉及计算机网络技术领域，尤其涉及一种网络链路故障检测方法、装置、设备及可读存储介质。

背景技术

近年来，随着互联网技术的快速发展，远程会诊服务得到了广泛应用。在基于互联网的远程会诊服务中，可靠的网络传输是保障服务质量的关键因素之一。网络链路故障检测作为网络管理的重要任务，对于保障网络的正常运行至关重要。在远程会诊环境中，由于需要在极短时间内恢复故障，因此链路故障检测尤为重要。

然而，在传统网络环境下，链路故障检测存在诸多困难。传统网络采用分布式架构，缺乏全局拓扑视野，导致链路故障检测的效率和准确性受到限制。

软件定义网络(SDN)作为一种转发与控制功能分离的新型网络模式，具有全局拓扑视野和灵活的链路测量机制，因此能够有效地对网络链路故障进行检测。但是，当需要快速对链路故障进行检测时，SDN控制器需要频繁发送查询消息，频繁的查询会导致软件定义网络控制器的高资源消耗，从而导致控制器负载过重，严重影响控制器性能。

发明内容

本发明所要解决的技术问题是：降低控制器负载，从而提高控制器性能。

本发明解决上述技术问题的技术方案如下：

第一方面，本申请提供一种网络链路故障检测方法，采用如下的技术方案：

一种网络链路故障检测方法，包括：

获取网络链路的拓扑图和网络链路探测延迟时间，所述拓扑图中的每个节点表示所述网络链路中的各个网络设备，所述网络链路探测延迟时间为在进行网络链路故障检测时，从发送探测数据包到接收到响应数据包所需要的传输时间；

根据所述网络链路探测延迟时间，确定所述拓扑图对应的拓展链路数量阈值；

根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，每个所述目标分割图对应所述网络链路中的一个子网络链路，对于每个所述子网络链路，所述子网络链路中的网络链路的数量不大于所述拓展链路数量阈值；

对于每个所述目标分割图，根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果；

基于各个所述探测结果和预设网络监控策略，对所述网络链路进行故障检测。

本发明的有益效果是：通过分割网络链路的拓扑图，将其分割为多个目标分割图，每个目标分割图对应网络链路中的一个子网络链路，并为每个子网络链路配置探测器，可以并行地对整个网络链路进行链路故障探测，缩短故障检测时间；通过将大型网络分割成多个较小的子网络，可以降低网络管理和监控的复杂性；通过将故障检测任务分散到各个探测器中执行，软件定义网络的控制器仅在探测器探测到子网络链路故障时，才对其进行定位、故障分析等，控制器根据需要选择性地关注特定的子网络链路或故障事件，从而极大的减轻了控制器的处理负载，提高软件定义网络中控制器的性能。

在上述技术方案的基础上，本发明还可以做如下改进。

进一步，所述根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，包括：

S21，基于所述拓扑图和预设节点选取规则在所述拓扑图中选取目标节点；

S22，基于所述目标节点和所述拓展链路数量阈值，从所述拓扑图中确定一个目标分割图，所述多个目标分割图包括该一个目标分割图；

S23，根据所述一个目标分割图对应的链路，对所述拓扑图进行分割，得到新的拓扑图，所述新的拓扑图为未分割前的拓扑图删除所述一个目标分割图之后对应得到的拓扑图；

S24，判断所述新的拓扑图是否满足预设的分割条件；

S25，若满足所述分割条件，则执行所述步骤S21至所述步骤S25，直至所述新的拓扑图不满足所述分割条件，得到多个目标分割图。

采用上述进一步方案的有益效果是：通过拓展链路数据阈值和目标节点确定一个目标分割图，并根据一个目标分割图对应的链路，对所述拓扑图进行分割，确保在拓扑图分割过程中考虑网络链路的实际性能，便于合理地分配网络资源；通过对拓扑图进行分割，将大型复杂的网络划分为多个较小、易于管理的网络，从而简化网络故障检测的复杂性，降低网络管理的难度。由于目标分割图更小、更易于管理，因此在故障发生后，可以更快速地定位和修复故障。

进一步，所述基于所述拓扑图和预设节点选取规则在所述拓扑图中选取目标节点，包括：

对于所述拓扑图中的每一节点，基于最远路径算法计算所述节点到每个其它节点的最短路径长度，对于每个所述其它节点，所述其它节点为所述拓扑图中除了所述节点之外的节点；

对于所述每一节点，将所述节点对应的各个最短路径长度相加，得到所述节点的边缘度量值；

比较各个所述节点的边缘度量值，选取边缘度量值最大的节点作为目标节点。

采用上述进一步方案的有益效果是：通过根据最远路径算法计算每个节点到每个其它节点的最短路径长度，并累加得到边缘度量值，可以更全面地评估节点在网络中的重要性和位置。选取边缘度量值最大的节点作为目标节点，确保了选取的节点具有代表性且所选的节点具有更好的连通性，便于后续多拓扑图进行分割。

进一步，所述基于所述目标节点和所述拓展链路数量阈值，从所述拓扑图中确定一个目标分割图，包括：

S31，将与所述目标节点相连的一个节点作为扩展节点；

S32，将所述目标节点和所述扩展节点之间链路作为扩展链路；

S33，将所述网络链路中删除所述扩展链路后所对应的链路作为目标链路，判断所述目标链路是否连通；

S34，若所述目标链路连通，则将所述目标节点、所述拓展节点和所述扩展链路对应的拓扑图作为当前子图；

S35，判断所述当前子图中的链路数量是否等于所述拓展链路数量阈值；

S36，若所述当前子图中的链路数量不等于所述拓展链路数量阈值，则将与所述目标节点相连的另一个节点作为扩展节点，执行所述S32至S36的步骤；

S37，若所述当前子图中的链路数量等于所述拓展链路数量阈值，则将所述当前子图作为目标分割图。

采用上述进一步方案的有益效果是：通过判断删除扩展链路是否会导致拓扑图不连通，确保在确定一个目标分割图的过程中不会破坏网络的连通性，保证分割后的子网络的连通性；通过判断当前子图中的链路数量是否等于拓展链路数量阈值，来控制目标分割图的规模，使得网络链路故障检测更为适用和精准。另外，该方法可以根据实际的网络环境和需求，通过调整拓展链路数量阈值来适应不同的网络规模和复杂性，具有更好的灵活性和可扩展性。

进一步，所述根据所述一个目标分割图对应的链路，对所述拓扑图进行分割，得到新的拓扑图,包括：

将所述拓扑图中与所述一个目标分割图对应的链路相同的链路作为待删除链路，并从所述拓扑图中移除所述待删除链路，得到处理后的拓扑图；

判断所述处理后的拓扑图中是否存在孤立节点；其中，所述孤立节点为不与任一节点相连的节点；

若存在孤立节点，则移除所述孤立节点，得到新的拓扑图；

若不存在孤立节点，则将所述处理后的拓扑图作为所述新的拓扑图。

采用上述进一步方案的有益效果是：通过检查和处理孤立节点，可以确保新的拓扑图的连通性，便于后续继续对新的拓扑图进行分割。

进一步，对于每个所述目标分割图，所述根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果，包括：

在所述目标分割图中选取任一节点作为起始节点；

在所述起始节点的连接位置配置至少一个探测器；

基于预设图论算法和所述起始节点确定所述目标分割图对应的欧拉回路，所述欧拉回路为所述目标分割图中至少一个所述探测器的探测路径；

基于软件定义网络的灵活流匹配机制将所述欧拉回路部署至所述目标分割图中；

将所述目标分割图的欧拉回路发送至对应的至少一个探测器，以使所述至少一个探测器按照所述目标分割图的欧拉回路进行链路故障探测，得到探测结果。

采用上述进一步方案的有益效果是：通过为子网络链路配置探测器，并利用欧拉回路进行探测，可以确保子网络中的每一条链路都被有效地监测，从而实现全面的故障检测覆盖，欧拉回路提供了一种高效的路径规划方法，使得探测器能够按照一种最优或近似最优的路径进行探测，降低了探测的复杂性和开销。

进一步，所述基于各个所述探测结果和预设网络监控策略，对所述网络链路进行故障检测，包括：

若在各个探测器的探测结果中，有至少一个结果为探测故障，则获取探测故障对应的探测器发送的故障探测请求消息，所述故障探测请求消息中包括用于标识子网络链路的标识信息；

根据所述故障探测请求消息中的标识信息，确定所述标识信息对应的子网络链路，并将所述子网络链路作为待分析子网络链路；

向所述待分析子网络链路中的起点交换机发送诊断信息，以使所述起点交换机向终点交换机发送通知消息；其中，所述通知消息用于通知所述终点交换机向软件定义网络的电子设备发送响应数据包；

若在预设时间内接收到终点交换器发送的响应数据包，则基于所述响应数据包的内容检测所述待分析子网络链路健康状态；

若在所述预设时间内未接收到交换器发送的响应数据包，则执行预设次数的所述向所述待分析子网络链路中的起点交换机发送诊断信息，以使所述起点交换机向终点交换机发送通知消息的步骤；

在所述预设次数之后，若在所述预设时间内仍未接收到交换器发送的响应数据包，则确定所述待分析子网络链路存在故障。

采用上述进一步方案的有益效果是：在探测器探测到某个子网络链路出现问题时，探测器向软件定义网络的控制器发送故障探测请求消息，软件定义网络的控制器根据故障探测请求消息对指定的子网络链路进行分析，实现了对特定链路的针对性检测和分析，无需对整个网络进行分析，降低了控制器的处理负载。通过向起点交换机发送诊断信息并触发终点交换机发送响应数据包，建立了一种主动的诊断机制，快速发现和定位故障。通过预设次数的重复检测机制，可以降低由于网络波动或其他暂时性因素导致的误报或漏报率，提高了故障检测的准确性以及增强了系统的鲁棒性。

第二方面，本申请提供一种网络链路故障检测装置，采用如下的技术方案：

一种网络链路故障检测装置，包括：

获取模块，用于获取网络链路的拓扑图和网络链路探测延迟时间，所述拓扑图中的每个节点表示各个设备，所述网络链路探测延迟时间为在进行网络链路故障检测时，从发送探测数据包到接收到响应数据包所需要的传输时间；

确定模块，用于根据所述网络链路探测延迟时间，确定所述拓扑图对应的拓展链路数量阈值；

分割模块，用于根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，每个所述目标分割图对应所述网络链路中的一个子网络链路，对于每个所述子网络链路，所述子网络链路中的网络链路的数量不大于所述拓展链路数量阈值；

配置模块，用于对于每个所述目标分割图，根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果；

故障检测模块，用于基于各个所述探测结果和预设网络监控策略，对所述网络链路进行故障检测。

本发明的有益效果是：通过分割模块分割网络链路的拓扑图，将其分割为多个目标分割图，每个目标分割图对应网络链路中的一个子网络链路，通过配置模块为每个子网络链路配置探测器，可以并行地对整个网络链路进行链路故障探测，缩短故障检测时间；该网络链路故障检测装置通过将大型网络分割成多个较小的子网络，可以降低网络管理和监控的复杂性；通过将故障检测任务分散到各个探测器中执行，软件定义网络的控制器仅在探测器探测到子网络链路故障时，才对其进行定位、故障分析等，控制器根据需要选择性地关注特定的子网络链路或故障事件，从而极大的减轻了控制器的处理负载，提高软件定义网络中控制器的性能。

第三方面，本申请提供一种电子设备，采用如下技术方案:

一种电子设备，包括存储器和处理器，所述存储器上存储有能够被处理器加载并执行第一方面任一项所述的网络链路故障检测方法的计算机程序。

本发明的有益效果是：处理器执行存储器中存储的网络链路故障检测方法，通过将故障检测任务分散到各个探测器中执行，软件定义网络的控制器仅在探测器探测到子网络链路故障时，才对其进行定位分析，控制器根据需要选择性地关注特定的子网络链路或故障事件，从而极大的减轻了控制器的处理负载，提高软件定义网络中控制器的性能。

第四方面，本申请提供一种计算机可读存储介质，采用如下技术方案：

一种计算机可读存储介质，存储有能够被处理器加载并执行第一方面任一项所述的网络链路故障检测方法的计算机程序。

本发明的有效果是：处理器加载并执行计算机可读存储介质中存储的计算机程序，电子设备根据探测器发送的结果对网络建立进行故障检测，软件定义网络的控制器仅在探测器探测到子网络链路故障时，才对其进行定位分析，控制器根据需要选择性地关注特定的子网络链路或故障事件，从而极大的减轻了控制器的处理负载，提高软件定义网络中控制器的性能。

附图说明

图1为本申请实施例的软件定义网络示意图；

图2为本申请实施例的网络链路故障检测方法的流程示意图；

图3为本申请实施例的步骤S21～S25的流程示意图；

图4为本申请实施例的网络链路的拓扑图的示意图；

图5为本申请实施例的拓扑图进行第一次分割过程的示意图；

图6为本申请实施例的拓扑图进行第二次分割过程的示意图；

图7为本申请实施例的拓扑图进行第三次分割过程的示意图；

图8为本申请实施例的目标分割图中的欧拉回路的示意图；

图9为本申请实施例的网络链路故障检测装置的结构框图；

图10为本申请实施例的一种电子设备的结构框图。

具体实施方式

以下结合附图对本申请作进一步详细说明。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，如无特殊说明，一般表示前后关联对象是一种“或”的关系。

如图1所示，软件定义网络(SND)，是一种新型网络创新架构，是网络虚化的一种实现方式，可通过软件编程的形式定义和控制网络。软件定义网络包括控制平面和数据平面。其中，控制平面主要负责网络的逻辑控制和决策，包括路由计算、流量调度、安全策略等；数据平面主要负责网络流量的转发和处理，根据控制平面的指令执行相应的动作。

本申请实施例提供一种在软件定义网络架构中的网络链路故障检测方法，该网络链路故障检测方法可由电子设备执行，该电子设备可以为服务器，也可以为移动终端设备，其中服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器；移动终端设备可以是笔记本电脑、台式计算机等，但不局限于此。

下面结合说明书附图对本申请实施例作进一步详细描述。如图2所示，所述方法的主要流程包括步骤S1～S5：

步骤S1，获取网络链路的拓扑图和网络链路探测延迟时间，所述拓扑图中的每个节点表示所述网络链路中的各个网络设备，所述网络链路探测延迟时间为在进行网络链路故障检测时，从发送探测数据包到接收到响应数据包所需要的传输时间；

在本申请实施方式中，拓扑图为软件定义网络中各个节点和它们之间的连接关系进行可视化表示的一种图形。拓扑图包括多个节点和多条链路，节点表示网络链路中的各个网络设备，如路由器、交换机、服务器等。链路表示网络链路中各个网络设备之间的连接路径和层次关系。

网络链路探测延迟时间是指在进行网络链路故障检测时，从发送探测数据包到接收到响应数据包所需要的传输时间，该延迟时间可以提供关于网络性能和链路状态。网络链路探测延迟时间由电子设备的控制器触发，控制器可使用基于ICMP ping命令的探测工具并配置探测参数，启动探测工具在整个网络链路中进行探测从而获取接收的响应数据包和未接收成功的数据包信息，根据接收的响应数据包和未接收成功的数据包信息计算整个网络链路的网络链路探测延迟时间。

步骤S2，根据所述网络链路探测延迟时间，确定所述拓扑图对应的拓展链路数量阈值；

在本申请实施方式中，可以根据历史经验数据建立网络探测延迟时间和拓展链路数量阈值之间关系的数据模型，将网络探测延迟时间输入至数学模型中，输出拓展链路数量阈值。从而确保在拓扑图分割过程中考虑网络链路的实际性能，便于合理地分配网络资源。

步骤S3，根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，每个所述目标分割图对应所述网络链路中的一个子网络链路，对于每个所述子网络链路，所述子网络链路中的网络链路的数量不大于所述拓展链路数量阈值；

在本申请实施方式中，由于在大型网络中，控制器需要对整个网络中的故障进行监管，其管理和监控较为复杂，使得控制器负载过重，所以对拓扑图进行分割，将大型复杂的网络划分为多个较小、易于管理的子网络。

具体的，如图3所示，步骤S3包括如下子步骤：

步骤S21，基于所述拓扑图和预设节点选取规则在所述拓扑图中选取目标节点；

在本申请实施方式中，首先，对于所述拓扑图中的每一节点，基于最远路径算法计算所述节点到每个其它节点的最短路径长度，对于每个所述其它节点，所述其它节点为所述拓扑图中除了所述节点之外的节点；

需要说明的是，拓扑图中的每一个节点预先设置有初始值；最远路径算法可以为Dijkstra算法或Floyd-Warshall算法，但并不局限于此。

其次，对于所述每一节点，将所述节点对应的各个最短路径长度相加，得到所述节点的边缘度量值；其中，边缘度量值代表该节点在网络链路中的“中心性”或“边缘性”，“中心性”指节点在网络链路中的“中心”位置，“边缘性”指节点在网络链路中的“边缘”位置，边缘度量值越大表示该节点越远离网络中的其他节点。

最后，比较各个所述节点的边缘度量值，选取边缘度量值最大的节点作为目标节点。

通过根据最远路径算法计算每个节点到每个其它节点的最短路径长度，并累加得到边缘度量值，可以更全面地评估节点在网络中的重要性和位置。选取边缘度量值最大的节点作为目标节点，确保了选取的节点具有代表性且所选的节点具有更好的连通性，便于后续多拓扑图进行分割。

在本申请实施方式中，具体的，步骤S22包括如下子步骤：

步骤S31，将与所述目标节点相连的一个节点作为扩展节点；

步骤S32，将所述目标节点和所述扩展节点之间链路作为扩展链路；

步骤S33，将所述网络链路中删除所述扩展链路后所对应的链路作为目标链路，判断所述目标链路是否连通；

步骤S34，若所述目标链路连通，则将所述目标节点、所述拓展节点和所述扩展链路对应的拓扑图作为当前子图；

步骤S35，判断所述当前子图中的链路数量是否等于所述拓展链路数量阈值；

步骤S36，若所述当前子图中的链路数量不等于所述拓展链路数量阈值，则将与所述目标节点相连的另一个节点作为扩展节点，执行所述S32至S36的步骤，直到当前子图中的链路数量等于所述拓展链路数量阈值；

步骤S37，若所述当前子图中的链路数量等于所述拓展链路数量阈值，则将所述当前子图作为目标分割图。

步骤S38,若所述目标链路连通,则不将在步骤S31中选取的节点作为拓展节点，将与所述目标节点相连的另一个节点作为扩展节点，执行步骤S32至S34直至满足目标链路连通。

需要说明的是，上述步骤执行的前提是与当前子图中目标节点相连的节点的数量不小于设定值的情况下执行的，设定值与拓展链路数量阈值相同。如果与目标节点相连的节点的数量小于设定值时，即，没有足够多的与目标节点相连接的节点作为扩展节点，使得当前子图中的链路数量可能小于所述拓展链路数量阈值，此时，在无法对当前子图在进行拓展的情况下，需要将当前子图作为目标分割图，那么，目标分割图中的链路数量可能小于所述拓展链路数量阈值。

图4示出了网络链路的拓扑图分割的示意图，图5示出了网络链路的拓扑图进行第一分割过程的示意图，基于图4和图5，进一步举例说明上述步骤S22中的子步骤过程。

如图4和图5所示，假设设置的拓展链路阈值为8条，那么需要分割的目标分割图的有向链路为8条。附图4中的一条物理链路对应两条有向链路，为简洁起见仅仅画出了物理链路。假设节点S1为目标节点，接下来根据目标节点和拓展链路数量阈值，从所述拓扑图中确定一个目标分割图的过程如下：

首先确定与目标节点S1相连的节点S2为拓展节点，节点S1到节点S2之间的边为拓展链路，之后确定删除该拓展链路不会导致拓扑图中剩余的链路不连通，那么可以扩展节点S1到节点S2，并将节点S1、节点S2和节点S1到节点S2之间拓展链路对应的拓扑图作为当前子图，以上当前子图扩展不断进行至当前子图中包含的边的数量到达了4后停止扩展，如图5中的分割目标分割图，并将边的数量为4的当前子图作为目标分割图。

通过判断删除扩展链路是否会导致拓扑图不连通，确保在确定目标分割图的过程中不会破坏网络的连通性，保证分割后的子网络的连通性；通过判断当前子图中的链路数量是否等于拓展链路数量阈值，来控制目标分割图的规模，使得故障检测更为适用和精准。

步骤S23，根据所述一个目标分割图对应的链路，对所述拓扑图进行分割，得到新的拓扑图，所述新的拓扑图为未分割前的拓扑图删除所述一个目标分割图之后对应得到的拓扑图；

在本申请实施方式中，确定好一个目标分割图后需要对网络链路拓扑进行分割，将拓扑图分割成一个目标分割图和新的拓扑图，之后进行对新的拓扑图继续分割，直至将网络链路的拓扑图分割成多得目标分割图。

具体的，根据所述一个目标分割图对应的链路，对所述拓扑图进行分割，得到新的拓扑图，包括：

首先，将所述拓扑图中与所述一个目标分割图对应的链路相同的链路作为待删除链路，并从所述拓扑图中移除所述待删除链路，得到处理后的拓扑图；

其次，判断所述处理后的拓扑图中是否存在孤立节点；其中，所述孤立节点为不与任一节点相连的节点；

若存在孤立节点，则移除所述孤立节点，得到新的拓扑图；若不存在孤立节点，则将所述处理后的拓扑图作为所述新的拓扑图。确保后续操作都是基于最新的拓扑图进行的。

需要说明的是，上述提到的移除待删除链路均为拓扑图中的物理链路，并不是实际的网络链路，上述提到移除孤立节点也是拓扑图中的物理节点，并不是实际的网络节点。

下面继续以步骤S22中例子的对步骤S23中的子步骤进行举例说明。如图4和图5所示，将图4中的拓扑图分割为图5中的目标分割图和新的拓扑图。按照步骤S1023中，根据确定的一个目标分割图确定图4中拓扑图需要删除的链路为节点S1到节点S2之间的链路、节点S2到节点S4之间的链路、节点S1到节点S3之间的链路和节点S3到节点S4之间的链路。删除链路后，拓扑图的结构发生了改变，因为节点S1没有与其相连的链路，所以节点S1为孤立节点，继续在拓扑图中将节点S1删除，得到如图5中一个目标分割图和新的拓扑图。

步骤S24，判断所述新的拓扑图是否满足预设的分割条件；

在本申请实施方式中，分割条件为新的拓扑图中的链路数量大于拓展链路阈值。

步骤S25，若满足所述分割条件，则执行所述步骤S21至所述步骤S25，直至所述新的拓扑图不满足所述分割条件，得到多个目标分割图。

图6示出了示出了网络链路的拓扑图进行第二分割过程的示意图，图7示出了网络链路的拓扑图进行第三分割过程的示意图。

下面以步骤S22和步骤S24中的例子继续进行举例说明。如图4和图5所示，根据确定的一个目标分割图对图4中的拓扑图进行分割，在第一次图分割后，将拓扑图分割如图5所示一个目标分割图和新的拓扑图。

如图5、图6和图7所示，因为新的拓扑图中的链路数量大于拓展链路阈值，所以接着对图5中新的拓扑图按照步骤S22方式确定一个目标分割图，并根据步骤S23中的方式根据一个目标分割图对应的链路，对新的拓扑图继续进行第二次图分割，将拓扑图分割成图6所示的两个目标分割图和一个新的拓扑图。并以此类推，直至新的新的拓扑图不满足预设的分割条件后，拓扑图无法再进行分割，经过第三次图分割后，将拓扑图分割成如图6所示的四个目标分割图，拓扑图分割完成，拓扑图分割成四个目标分割图。

通过拓展链路数据阈值和目标节点确定一个目标分割图，并根据一个目标分割图对应的链路，对所述拓扑图进行分割，确保在拓扑图分割过程中考虑网络链路的实际性能，便于合理地分配网络资源；通过对拓扑图进行分割，将大型复杂的网络划分为多个较小、易于管理的网络，从而简化网络故障检测的复杂性，降低网络管理的难度。由于目标分割图更小、更易于管理，因此在故障发生后，可以更快速地定位和修复故障。

步骤S4，对于每个所述目标分割图，根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果；

在本申请实施方式中，对于每个所述目标分割图，首先在所述目标分割图中选取任一节点作为起始节点，该起始节点为后续探测器部署和探测的基准；之后在所述起始节点的连接位置配置至少一个探测器；

之后基于预设图论算法和所述起始节点确定所述目标分割图对应的欧拉回路，图8为一个目标分割图中的欧拉回路的示意图，所述欧拉回路为所述目标分割图中至少一个所述探测器的探测路径，其中，预设图论算法可以是基尔霍夫的电路定律或Fleury的算法；之后基于软件定义网络的灵活流匹配机制将所述欧拉回路部署至所述目标分割图中；最后将所述目标分割图的欧拉回路发送至对应的至少一个探测器，以使所述至少一个探测器按照所述目标分割图的欧拉回路进行链路故障探测，得到探测结果。

需要说明的是，由于存在目标分割图中节点相同的情况，本申请实时例中，选择起始节点时优先选取未被其它目标分割图选取的节点。

进一步地，对于任一所述目标分割图对应的每个所述探测器，所述探测器通过以下步骤按照所述目标分割图的欧拉回路进行链路故障探测，以下步骤包括：

基于预设时间周期和所述欧拉回路向目标分割图对应的子网络链路发送至少一个探测数据包；

若在预设时间内未接收到子网络链路中网络设备发送的至少一个响应数据包，则向软件定义网络的电子设备发送故障探测请求消息；其中，所述故障探测请求消息包括子网络链路的标识信息，以便软件定义网络控制器能够准确定位故障链路。

在本申请实施方式中，预设时间周期为5ms，发送探测数据包的数量为3个，各个探测器每5ms沿着探测路径发送3个探测数据包。预设时间根据目标分割图中链路数量确定。

通过为子网络链路配置探测器，并利用欧拉回路进行探测，可以确保子网络中的每一条链路都被有效地监测，从而实现全面的故障检测覆盖，欧拉回路提供了一种高效的路径规划方法，使得探测器能够按照一种最优或近似最优的路径进行探测，降低了探测的复杂性和开销。

步骤S5，基于每个探测器对子网络链路进行链路故障探测的结果和预设网络监控策略对所述网络链路进行故障检测。

在本申请实施方式中，电子设备接收探测器发送的故障探测请求消息，根据故障探测请求消息和预设网络监控策略对所述网络链路进行故障检测。若电子设备未接收到探测器发送的故障探测请求消息，则不进行故障检测。

可选的，步骤S5包括如下子步骤：

步骤S41，若在各个探测器的探测结果中，有至少一个结果为探测故障，则获取探测故障对应的探测器发送的故障探测请求消息，所述故障探测请求消息中包括用于标识子网络链路的标识信息；

步骤S42，根据所述故障探测请求消息中的标识信息，确定所述标识信息对应的子网络链路，并将所述子网络链路作为待分析子网络链路；

步骤S43，向所述待分析子网络链路中的起点交换机发送诊断信息，以使所述起点交换机向终点交换机发送通知消息；其中，所述通知消息用于通知所述终点交换机向软件定义网络的电子设备发送响应数据包；

步骤S44，若在预设时间内接收到终点交换器发送的响应数据包，则基于所述响应数据包的内容检测所述待分析子网络链路健康状态；

步骤S45，若在所述预设时间内未接收到交换器发送的响应数据包，则执行预设次数的所述向所述待分析子网络链路中的起点交换机发送诊断信息，以使所述起点交换机向终点交换机发送通知消息的步骤；

步骤S46，在所述预设次数之后，若在所述预设时间内仍未接收到交换器发送的响应数据包，则确定所述待分析子网络链路存在故障。

在本申请实施方式中，预设次数设置为三次。

在探测器探测到某个子网络链路出现问题时，探测器向软件定义网络的控制器发送故障探测请求消息，软件定义网络的控制器根据故障探测请求消息对指定的子网络链路进行分析，实现了对特定链路的针对性检测和分析，无需对整个网络进行分析，降低了控制器的处理负载。通过向起点交换机发送诊断信息并触发终点交换机发送响应数据包，建立了一种主动的诊断机制，快速发现和定位故障。通过预设次数的重复检测机制，可以降低由于网络波动或其他暂时性因素导致的误报或漏报率，提高了故障检测的准确性以及增强了系统的鲁棒性。

本方法通过分割网络链路的拓扑图，将其分割为多个目标分割图，每个目标分割图对应网络链路中的一个子网络链路，并为每个子网络链路配置探测器，可以并行地对整个网络链路进行链路故障探测，缩短故障检测时间；通过将大型网络分割成多个较小的子网络，可以降低网络管理和监控的复杂性；通过将故障检测任务分散到各个探测器中执行，软件定义网络的控制器仅在探测器探测到子网络链路故障时，才对其进行定位、故障分析等，控制器根据需要选择性地关注特定的子网络链路或故障事件，从而极大的减轻了控制器的处理负载，提高软件定义网络中控制器的性能。

图9为本申请实施例的网络链路故障检测装置200的结构框图。

如图9所示，网络链路故障检测装置200主要包括：

获取模块201，用于获取网络链路的拓扑图和网络链路探测延迟时间，所述拓扑图中的每个节点表示各个设备，所述网络链路探测延迟时间为在进行网络链路故障检测时，从发送探测数据包到接收到响应数据包所需要的传输时间；

确定模块202，用于根据所述网络链路探测延迟时间，确定所述拓扑图对应的拓展链路数量阈值；

分割模块203，用于根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，每个所述目标分割图对应所述网络链路中的一个子网络链路，对于每个所述子网络链路，所述子网络链路中的网络链路的数量不大于所述拓展链路数量阈值；

配置模块204，用于对于每个所述目标分割图，根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果；

故障检测模块205，用于基于各个所述探测结果和预设网络监控策略，对所述网络链路进行故障检测。

作为本申请实施例的一种可选实施方式，分割模块203包括：

选取子模块，用于基于所述拓扑图和预设节点选取规则在所述拓扑图中选取目标节点；

确定子模块，用于基于所述目标节点和所述拓展链路数量阈值，从所述拓扑图中确定一个目标分割图，所述多个目标分割图包括该一个目标分割图；

分割子模块，用于根据所述一个目标分割图对应的链路，对所述拓扑图进行分割，得到新的拓扑图，所述新的拓扑图为未分割前的拓扑图删除所述一个目标分割图之后对应得到的拓扑图；

判断子模块，用于判断所述新的拓扑图是否满足预设的分割条件；

若是，则依次执行选取子模块、确定子模块、分割子模块和判断子模块，直至将所述拓扑图分割成多个目标分割图。

在本可选实施方式中，选取子模块具体用于：

在本可选实施方式中，确定子模块具体用于执行以下步骤：

S31，将与所述目标节点相连的一个节点作为扩展节点；

在本可选实施方式中，分割子模块具体用于：

若存在孤立节点，则移除所述孤立节点，得到新的拓扑图；

作为本申请实施例的一种可选实施方式，配置模块204具体用于：

对于每个所述目标分割图，在所述目标分割图中选取任一节点作为起始节点；

在所述起始节点的连接位置配置至少一个探测器；

作为本申请实施例的一种可选实施方式，故障检测模块205具体用于：

在一个例子中，以上任一装置中的模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个专用集成电路(application specificintegratedcircuit，ASIC)，或，一个或多个数字信号处理器(digital signal processor，DSP)，或，一个或者多个现场可编程门阵列(field programmable gate array，FPGA)，或这些集成电路形式中至少两种的组合。

再如，当装置中的模块可以通过处理元件调度程序的形式实现时，该处理元件可以是通用处理器，例如中央处理器(central processing unit，CPU)或其它可以调用程序的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，SOC)的形式实现。

在本申请中可能出现的对各种消息/信息/设备/网元/系统/装置/动作/操作/流程/概念等各类客体进行了赋名，可以理解的是，这些具体的名称并不构成对相关客体的限定，所赋名称可随着场景，语境或者使用习惯等因素而变更，对本申请中技术术语的技术含义的理解，应主要从其在技术方案中所体现/执行的功能和技术效果来确定。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的模块及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

图10为本申请实施例一种电子设备300的结构框图。

如图10所示，电子设备300包括处理器301和存储器302，还可以进一步包括信息输入/信息输出(I/O)接口303以及通信组件304中的一种或多种。

其中，处理器301用于控制电子设备300的整体操作，以完成上述的网络链路故障检测方法中的全部或部分步骤；存储器302用于存储各种类型的数据以支持在电子设备300的操作，这些数据例如可以包括用于在该电子设备300上操作的任何应用程序或方法的指令，以及应用程序相关的数据。该存储器302可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，例如静态随机存取存储器(Static Random Access Memory，SRAM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory，EEPROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory，EPROM)、可编程只读存储器(Programmable Read-Only Memory，PROM)、只读存储器(Read-OnlyMemory，ROM)、磁存储器、快闪存储器、磁盘或光盘中的一种或多种。

I/O接口303为处理器301和其他接口模块之间提供接口，上述其他接口模块可以是键盘，鼠标，按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件304用于测试电子设备300与其他设备之间进行有线或无线通信。无线通信，例如Wi-Fi，蓝牙，近场通信(NearField Communication，简称NFC)，2G、3G或4G，或它们中的一种或几种的组合，因此相应的该通信组件304可以包括：Wi-Fi部件，蓝牙部件，NFC部件。

通信总线305可包括一通路，在上述组件之间传送信息。通信总线305可以是PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(ExtendedIndustry Standard Architecture，扩展工业标准结构)总线等。通信总线305可以分为地址总线、数据总线、控制总线等。

电子设备300可以被一个或多个应用专用集成电路(ApplicationSpecificIntegrated Circuit，简称ASIC)、数字信号处理器(Digital Signal Processor，简称DSP)、数字信号处理设备(Digital Signal Processing Device，简称DSPD)、可编程逻辑器件(Programmable Logic Device，简称PLD)、现场可编程门阵列(Field ProgrammableGate Array，简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述实施例给出的网络链路故障检测方法。

电子设备300可以包括但不限于数字广播接收器、PDA(个人数字助理)、PMP(便携式多媒体播放器)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端，还可以为服务器等。

下面对本申请实施例提供的计算机可读存储介质进行介绍，下文描述的计算机可读存储介质与上文描述的网络链路故障检测方法可相互对应参照。

本申请还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，计算机程序被处理器执行时实现上述的网络链路故障检测方法的步骤。

该计算机可读存储介质可以包括：U盘、移动硬盘、只读存储器(Read-OnlyMemory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解，本申请中所涉及的申请范围，并不限于上述技术特征的特定组合而成的技术方案，同时也应涵盖在不脱离前述申请构思的情况下，由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中申请的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims

1.一种网络链路故障检测方法，其特征在于，包括：

2.根据权利要求1所述的一种网络链路故障检测方法，其特征在于，所述根据所述拓展链路数量阈值，对所述拓扑图进行分割，得到多个目标分割图，包括：

S24，判断所述新的拓扑图是否满足预设的分割条件；

3.根据权利要求2所述的一种网络链路故障检测方法，其特征在于，所述基于所述拓扑图和预设节点选取规则在所述拓扑图中选取目标节点，包括：

4.根据权利要求2所述的一种网络链路故障检测方法，其特征在于，所述基于所述目标节点和所述拓展链路数量阈值，从所述拓扑图中确定一个目标分割图，包括：

S31，将与所述目标节点相连的一个节点作为扩展节点；

5.根据权利要求2所述的一种网络链路故障检测方法，其特征在于，所述根据所述一个目标分割图对应的链路，对所述拓扑图进行分割，得到新的拓扑图,包括：

若存在孤立节点，则移除所述孤立节点，得到新的拓扑图；

6.根据权利要求1所述的一种网络链路故障检测方法，其特征在于，对于每个所述目标分割图，所述根据所述目标分割图为对应的子网络链路配置至少一个探测器，以使所述至少一个探测器对子网络链路进行链路故障探测，得到探测结果，包括：

在所述目标分割图中选取任一节点作为起始节点；

在所述起始节点的连接位置配置至少一个探测器；

7.根据权利要求1所述的一种网络链路故障检测方法，其特征在于，所述基于各个所述探测结果和预设网络监控策略，对所述网络链路进行故障检测，包括：

8.一种网络链路故障检测装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括处理器，所述处理器与存储器耦合；

所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行如权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，包括计算机程序或指令，当所述计算机程序或指令在计算机上运行时，使得所述计算机执行如权利要求1-7任一项所述的方法。