CN103166809A

CN103166809A - 一种监测站点的部署方法及装置

Info

Publication number: CN103166809A
Application number: CN2011104214472A
Authority: CN
Inventors: 曾彬; 郭振兴; 黎文伟; 张大方
Original assignee: China Mobile Group Hunan Co Ltd
Current assignee: China Mobile Group Hunan Co Ltd
Priority date: 2011-12-15
Filing date: 2011-12-15
Publication date: 2013-06-19

Abstract

本发明公开了一种监测站点的部署方法及装置，用以解决对度数较小节点的故障无法准确监测和定位的问题。所述监测站点的部署方法，包括：部署首个监测站点，将独立路径数量达到预设数量的节点从被管理网络的节点集合中移除；确认已部署监测站点的数量小于或等于预设的监测站点部署数量上限且节点集合不为空时，从节点集合中选取满足预设条件的非监测站点节点作为弱连接点；否则，监测站点部署完成；如果各弱连接点对应的其他可用监测节点的交集不为空，从交集中选取一个节点部署为下一个监测站点，以及将独立路径数量达到预设数量的节点从节点集合中移除，并返回上一步；如果交集为空，监测站点部署完成。

Description

一种监测站点的部署方法及装置

技术领域

本发明涉及网络安全技术领域，尤其涉及一种监测站点的部署方法及装置。

背景技术

故障管理作为网络管理系统的重要组成部分，是维护网络可靠性、保障网络正常运行的关键。而故障定位作为故障管理的一个核心功能，发挥着重要的作用。目前，从计算机科学的不同领域中派生出的故障定位方法主要包括被动监听故障定位方法和主动探测故障定位方法。采用被动监听故障定位方法的网络管理系统，无法在用户感知到故障之前监测和定位故障，且可能由于被监测设备的告警信息的延迟或丢失而无法快速准确地定位故障，无法满足日益复杂的网络需求。采用主动探测故障定位方法的网络管理系统，使用主动探测的方法对被监测设备进行探测，通过分析返回的探测结果实现故障管理，具有主动、高效及自适应的特性，能以很小的代价尽早地获得网络及系统故障、服务失败、性能衰退等症状，从而为根源故障的分析提供依据。在主动探测故障定位方法中，首要的是确定监测站点的部署。监测站点的部署会对故障定位的能力、探测的有效性以及监测站点的配置开销造成很大影响，是故障管理中至关重要的环节。

针对故障管理中监测站点的部署问题，现有技术中的解决方法分为针对单故障点的监测站点部署方法和针对多故障点的监测站点部署方法。

针对单故障的监测站点部署方法，假设网络中同时发生故障的链路数量最多为1，在监测站点发送的探测能够覆盖所有链路的前提下，通过部署最小的监测站点集合监测和定位网络中发生的单个链路故障。其基本思想描述如下：被管理网络可以抽象成为一个无向图G＝(V，E)，其中V＝{v₁，v₂，...，v_i}表示无向图中顶点的集合，代表网络中节点v_i的集合，E＝{e₁，e₂，...e_i}表示无向图中边的集合，代表网络中链路e_i的集合。边e_k是由无序节点对(v_i，v_j)构成，且v_i和v_j为边e_k的端点。若(v_i，v_j)∈E则称v_i为v_j的邻接点。节点v_i的度数用D(v_i)表示，节点的度数是指与该节点邻接的节点数。p_s，t＝(s，v₁，v₂，...v_i，t)表示一次探测中数据包从源节点s经过v₁，v₂，...v_i到目标节点t所经历的路径。

基于主动探测的单故障定位方法，首先在网络中选择一些节点部署为具有探测能力的监测站点，然后监测站点s向网络中被监测节点d沿着探测路径P_s，d发送探针包进行探测，根据返回的探测结果分析、定位网络中的故障节点。在不考虑网络噪声的情况下认为，当一个探测成功时，该探测经过的所有节点均正常工作；反之，当一个探测失败时，该探测经过的所有节点均可能是故障节点。如图1所示的网络拓扑中，节点4被部署为监测站点，若要监测节点1的故障情况，则节点1为被监测节点，需发送一个到节点1的探针包进行探测，若探测成功，说明节点1正常工作；若探测失败，因探针包发送路径没有经过其他节点，此时可以直接判定节点1是故障节点。同理，若要监测节点6的故障情况，则节点6为被监测节点，需要向节点6发送一个经过节点5的探针包，若探测成功，说明节点1、5、6均正常工作；反之，节点5、6均可能发生故障，也就是说，节点5、6至少有一个发生故障，但不能确定具体是哪个节点发生故障。

针对多故障的监测站点部署方法，一种简单的解决方法是为网络中每一个节点指定一个邻接点部署为监测站点，但该方法需要部署的监测站点较多，开销较大，很少在实际中运用。现有技术中提供了一种基于k条独立路径(k-path)的监测站点部署方法，支持网络中多故障定位。该方法在目前监测站点部署方法中较为经典。该方法假设当网络中的每个节点都具有从监测站点集合发出的k条独立路径时，只要有一条独立路径无故障，节点都可以被有效监测，并且监测站点集合发出的探测能对网络中同时发生的k个故障进行定位。

如图2所示的网络拓扑中，给出节点6的故障能够被准确监测和定位的场景，节点1、3、7被部署为监测站点。如果节点2、4均发生故障，那么监测节点6的故障时，只能依赖于监测站点7的探测。若节点8正常工作，则节点6的故障可以被监测站点7准确监测；反之，若节点8发生故障，则节点6的故障将无法被监测和定位。

从图2可知，节点6的故障能够被准确监测和定位的场景具有如下特点：

①监测站点到节点6有三条不同的探测路径。

②被管理网络中的故障数量不大于三个。

若将该场景推广到网络中的所有节点，那么网络中的每一个节点都可以保证被准确监测和定位。

当监测站点发送的探针包探测失败时，被监测节点有的可以直接判定为故障节点(例如图1的节点1)，而有的却不可以直接判定为故障节点(例如图1的节点6)。根据网络中被监测节点和监测站点的位置关系，探测失败可以分为如下两种情况：

第一种情况、被监测节点为监测站点的邻接点。在该情况下一次探测就可以直接定位出故障节点。

第二种情况、被监测节点不是监测站点的邻接点。在该情况下探测路径中的节点可能出现一个或多个、甚至全部故障，一次探测将无法定位此类故障。

对于第二种情况，一次探测失败只能说明网络中有故障发生，并不能确定网络中有多少个故障以及哪些节点发送故障。若要准确定位全部故障节点，必须发送更多的探针包进行探测，但这种方法不一定可行。假设图1中节点1、3、5均出现故障情况，虽然节点1、5均可以被准确定位，但节点3的故障却无法被定位。这类问题的解决只能依赖于部署更多的监测站点以增加对网络中故障的定位能力。但过多的监测站点又会增加部署开销。一种理想的监测站点部署方案就是，部署最少的监测站点且通过部署的监测站点能够准确定位网络中的多个故障。因此如何在网络中部署一系列监测站点，使得通过部署的监测站点发送的探测能够准确定位网络中的多个故障，且部署的监测站点数量最少，成为监测站点部署需要解决的问题。

目前针对多故障定位的k-path监测站点部署方法，若要实现对网络中不大于k个故障的准确定位，只需为每一个被监测节点选取k条独立路径即可。但实际网络中大量存在的D(v_i)＜k的节点v_i，因度数的限制无法选取到k条独立路径，因此上述方法并不适用于D(v_i)＜k的节点。因此，在实际网络拓扑中，k-path监测站点部署方法将受到很大影响。特别是当网络中同时发生的故障数量较大时，其对度数小于k的节点的故障监测和定位能力较差。因此，在实际网络拓扑中，该方法的有效性受到大量存在的度数小于k的节点的极大制约。

发明内容

本发明实施例提供一种监测站点的部署方法及装置，用以解决对度数较小节点的故障无法准确监测和定位的问题。

本发明实施例提供的监测站点的部署方法，包括：

部署首个监测站点，并基于当前部署的监测站点，将独立路径数量达到预设数量的节点从被管理网络的节点集合中移除；

确认已部署监测站点的数量小于或等于预设的监测站点部署数量上限且节点集合不为空时，从节点集合中选取满足预设条件的非监测站点节点作为弱连接点，并确定每一个弱连接点对应的其他可用监测节点；否则，监测站点部署完成；

确定各弱连接点对应的其他可用监测节点的交集，如果所述交集不为空，从所述交集中选取一个节点部署为下一个监测站点，以及基于当前部署的监测站点，将独立路径数量达到预设数量的节点从节点集合中移除，并返回上一步；如果所述交集为空，监测站点部署完成。

本发明实施例提供的监测站点的部署装置，包括第一部署单元、处理单元、第一控制单元、选取单元、第二控制单元和第二部署单元，其中：

所述第一部署单元，用于部署首个监测站点，并触发所述处理单元；

所述处理单元，用于基于当前部署的监测站点，将独立路径数量达到预设数量的节点从节点集合中移除，并触发所述第一控制单元；

所述第一控制单元，用于确认已部署监测站点的数量小于或等于预设的监测站点部署数量上限且节点集合不为空时，触发所述选取单元，否则，监测站点部署完成；

所述选取单元，用于从节点集合中选取满足预设条件的非监测站点节点作为弱连接点，并确定每一个弱连接点对应的其他可用监测节点；

所述第二控制单元，用于确定各弱连接点对应的其他可用监测节点的交集，如果所述交集不为空，触发所述第二部署单元，如果所述交集为空，监测站点部署完成；

所述第二部署单元，用于从所述交集中选取一个节点部署为下一个监测站点，并触发所述处理单元。

本发明实施例提供的监测站点的部署方法及装置，根据弱连接点选取独立路径，能够快速确定下一个监测站点的最优部署位置，可以在部署较少监测站点的情况下准确监测和定位网络中的多个故障，解决了对度数较小节点的故障无法准确监测和定位的问题，提高了故障的监测和定位能力，并减少了执行时间。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

此处所说明的附图用来提供对本发明的进一步理解，构成本发明的一部分，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。在附图中：

图1为现有技术中单故障定位方法的故障监测和定位示意图；

图2为现有技术中单故障定位方法的故障监测和定位示意图；

图3为本发明实施例中k-path监测站点部署方法示意图；

图4a为本发明实施例中D(v_i)＜k节点的监测站点部署示意图；

图4b为本发明实施例中D(v_i)＜k节点的监测站点部署优化示意图；

图5为本发明实施例中监测站点的部署方法流程图；

图6a为本发明实施例中例子一的监测站点部署流程示意图；

图6b为本发明实施例中例子二的监测站点部署流程示意图；

图7为本发明实施例中监测站点的部署装置框图；

图8为本发明实施例中AS级拓扑产生器生成的40个节点网络拓扑示意图；

图9为本发明实施例中各方法执行时间比较示意图；

图10为本发明实施例中各方法部署的监测站点数量比较示意图；

图11为本发明实施例中各方法部署的监测站点的故障定位能力比较示意图。

具体实施方式

以下结合说明书附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明，并且在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

在介绍本发明实施例提供的监测站点的部署方法及装置之前，对现有技术中k-path监测站点部署方法的实现原理进行简要分析。

首先，对独立路径的概念进行说明。

独立路径的选取是k-path监测站点部署方法的关键，但实际网络中动态路由环境使得独立路径的选取较为困难，因此需要对网络的动态路由环境加以限定以便选取独立路径。为了便于获取监测站点到不同节点的独立路径，网络中数据包或探针包的选路必须满足如下条件：

①监测站点和被监测节点之间的数据包选路唯一且固定，不会随着时间的变化而变化，即保持探测路径的一致性。

②转发节点在接收到某一特定被监测节点的数据包后，不管该数据包来自哪个监测站点，其转发的下一跳都是固定不变的(这一特性符合传统IP路由模型)。

满足上述条件的路由模型具有探测路径一致、静态选路等特性，在此称之为一致IP路由模型。显然，在一致IP路由模型中，若两个不同的监测站点对同一被监测节点的探测路径中有一个节点重复，那么该两条探测路径中重复节点的所有后续节点均相同。

定义独立路径如下：若P_s，t＝(s，v₁，v₂，...v_i，t)中t的上一节点v_i表示为f(p_s，t)，对于同一被监测节点t的不同探测路径p_u，t、p_s，t，若f(p_u，t)≠f(p_s，t)，则称路径p_u，t和p_s，t是相互独立的，路径p_u，t、p_s，t称为监测站点到被监测节点t的独立路径，简称为被监测节点t的独立路径。被监测节点t的独立路径数量用NP(t)表示。

由独立路径的定义可以看出，被监测节点t有多少条独立路径就对应有多少个监测站点可对其探测。

假设网络中被监测节点最多同时发生k个故障(本发明实施例中可以将k称为被管理网络故障数量上限)，用NS表示不是监测站点邻接点的被监测节点，可得如下结论：当且仅当监测站点集合到NS中每一个节点都存在有k条独立路径时监测站点集合可以定位网络中任意k个非监测站点节点的故障。

下面给出该结论的证明过程，采用反证法进行证明。

该结论的必要性证明如下：

若监测站点集合到NS中每一个节点都存在有k条独立路径，不失一般性，假设监测站点集合不可以定位非监测站点节点v的故障。若假设成立，v要么是某一监测站点的邻接点，要么v∈NS。若v是某一监测站点的邻接点，那么v的故障可以通过其相邻的监测站点直接探测；若v∈NS，即v既不是监测站点又不是监测站点的邻接点，因为网络中被监测节点最多同时发生k个故障，除故障节点v外，网络中最多还能有k-1个非监测站点节点发生故障，因此监测站点集合到v存在的k条独立路径中，至多k-1条独立路径中有节点出现故障(k-1次探测均失败)，但至少还剩余一条无故障独立路径可以对节点v的故障进行探测。假设不成立，因此若监测站点集合到NS中每一个节点都存在有k条独立路径，则监测站点集合可以定位网络中任意k个非监测站点节点的故障。

该结论的充分性证明如下：

假设监测站点集合可以定位网络中任意k个非监测站点节点的故障，但监测站点集合到NS中有些节点没有存在k条独立路径。考虑具有k-1条独立路径的节点u∈NS发生故障的情况，如果节点u发生故障，那么网络中最多还有k-1个故障发生，若这k-1个故障均发生在u对应的k-1条独立路径上，将会导致节点u的故障无法被监测站点监测和定位，因此假设不成立。

由上述结论可以看出，为实现网络中不大于k个节点的故障定位，只需为NS中每一个节点选取k条独立路径即可(即可以被k个监测站点探测)。考虑到监测站点本身可能出现故障的情况，单个监测站点的故障也要置于整个监测站点集合的监测之下，因此，监测站点自身及其邻接点也需要获取k条独立路径。

如图3所示的网络拓扑中，假设被监测网络故障数量最大为2。节点4有四个邻接点应部署为监测站点，因此节点1、2、5、6均无需再获取两条独立路径。剩余的节点3、7、8、9，若选取节点6为监测站点，那么节点7、9是其邻接点，无需获取两条独立路径，而不是监测站点邻接点的节点3、8均已有两条独立路径。这样整个网络故障都可以被准确监测和定位。

本发明实施例针对现有技术中的k-path监测站点部署方法对度数较小节点的故障无法准确监测和定位的问题，提供了相应的解决方案，提高了故障的监测和定位能力，并减少了执行时间。在保证高故障监测率的同时，通过设定监测站点的故障率低于非监测站点节点的故障率，从而降低了监测站点的独立路径数量要求，进一步减少了监测站点的数量，且具有较好的故障定位能力。

为实现上述目的，本发明在节点覆盖约束条件下，以最小化监测站点数量为目标，提供了一种支持多故障定位的监测站点部署方法。

对本发明实施例提供的监测站点的部署方法的实现原理进行详细说明。

首先介绍度数小于k的节点的处理及监测站点部署的优化原理。

若要实现对网络中不大于k个故障的准确监测和定位，假设网络中被监测节点最多同时发生k个故障，用NS表示不是监测站点邻接点的被监测节点，只需为NS中每一个节点选取k条独立路径即可。但实际网络中大量存在的D(v_i)＜k的节点v_i，因度数的限制无法找取到k条独立路径，因此上述方法并不适用于D(v_i)＜k的节点，下面给出此类节点的处理方法及基于该方法的监测站点部署优化方案：

(1)节点v_i满足：D(v_i)＝NP(v_i)，即节点的独立路径数量和其度数相等。

(2)为监测站点在网络中能够发生的故障数量指定一个小于k的上限k_b(k_b＜k)。事实上，如果对监测站点加以额外的资源保障，例如采取电源冗余、磁盘阵列等方式，其发生故障的概率可以大大降低。

通过限定监测站点能够发生的最大故障数量为k_b(本发明实施例中可以将k_b称为监测站点故障数量上限)，对于那些无法选取k条独立路径的节点v_i(D(v_i)＜k)只要有k_b+1个邻接点是监测站点或者有k_b+1条独立路径，v_i也可以被准确探测。此外，由结论“当且仅当监测站点集合到NS中每一个节点都存在有k条独立路径时监测站点集合可以定位网络中任意k个非监测站点节点的故障”可知：k_b的设定可以减少监测站点所需的独立路径数量(只需k_b个)，利用这一特性可以避免那些为保证监测站点本身的k条独立路径而部署的监测站点，从而减少了监测站点的部署数量。

如图4a所示，网络中k＝3，k_b＝1(网络中最多有3个故障同时发生，其中监测站点最多1个，非监测站点节点最多2个)。图4a中将节点3、4、6、8部署为监测站点，可以实现对整个网络中任意不多于3个故障的准确定位(节点1、3、4、6、8有三条独立路径，节点2、5、7、9有两条独立路径)。虽然节点2、5、7、9只有两条独立路径，但他们都有两个监测站点作为邻接点，因此可以保证被准确探测。如果节点2的邻接点3、4均部署为监测站点，即使节点3发生故障，还有节点4可以对节点2进行探测。而优化后的监测站点集合可以剔除监测站点6。如图4b所示，将节点3、4、8部署为监测站点也可以实现对整个网络故障的准确探测。通过预设监测站点故障数量上限为1，那么部署为监测站点的节点3、4、8只要选取到一条独立路径即可，因此节点6不再部署为监测站点，虽然这样使得节点7、9不再有两个监测站点作为邻接点，但节点7、9均有两条独立路径使得他们也可以被准确探测。如果对网络中3个故障节点4、6、7进行监测和定位，监测站点3、8均可以向节点4发送探测，且探测所经过的中间节点1、2无故障发生。因此监测站点3、8都可以准确定位节点4的故障；同理，节点6的故障可以被节点8定位；节点7的故障可以被节点3定位。

如图5所示，本发明实施例提供的监测站点的部署方法，包括如下步骤：

S501、部署首个监测站点，并基于当前部署的监测站点，将独立路径数量达到预设数量的节点从被管理网络的节点集合中移除；

具体实施中，可以指定被管理网络的任一节点为首个监测站点，在这种情况下，将指定的节点部署为首个监测站点；如果未指定首个监测站点，一般从被管理网络的节点集合中选取度数最高的节点部署为首个监测站点。

S502、确认已部署监测站点的数量小于或等于预设的监测站点部署数量上限且节点集合不为空时，从节点集合中选取满足预设条件的非监测站点节点作为弱连接点，并确定每一个弱连接点对应的其他可用监测节点；否则，监测站点部署完成；

具体实施中，所述预设条件包括：预设的被管理网络故障数量上限与节点的独立路径数量之差为1，或者节点的度数与节点的独立路径数量之差为1。根据弱连接点的下一条独立路径确定该弱连接点对应的其他可用监测节点。

S503、确定各弱连接点对应的其他可用监测节点的交集，如果确定出的交集不为空，从确定出的交集中选取一个节点部署为下一个监测站点，以及基于当前部署的监测站点，将独立路径数量达到预设数量的节点从节点集合中移除，并返回上一步即S502；如果确定出的交集为空，监测站点部署完成。

具体实施中，从交集中选取一个节点部署为下一个监测站点时，如果各弱连接点对应的其他可用监测节点的交集包括一个节点，则将该节点部署为下一个监测站点；如果各弱连接点对应的其他可用监测节点的交集包括至少两个节点，则从该至少两个节点中选取重复次数最高的一个节点部署为下一个监测站点。

所述的将独立路径数量达到预设数量的节点从节点集合中移除，具体包括如下两种情况：

情况一、如果节点为监测站点、且独立路径数量达到预设的监测站点故障数量上限或者节点的度数，则将该节点从节点集合中移除；

情况二、如果节点(包括监测站点和非监测站点节点)的独立路径数量达到预设的被管理网络故障数量上限或者节点的度数，则将该节点从节点集合中移除，可以理解，监测站点故障数量上限小于被管理网络故障数量上限。

下面进行详细说明本发明实施例提供的监测站点的部署方法。

本发明实施例提供了一个基于贪婪策略的启发式算法以解决监测站点的部署问题。该算法依据弱连接点求取独立路径，能够快速确定部署下一个监测站点的最优部署位置，并通过预设部署为监测站点的节点需选取的独立路径数量为k_b，减少部署的监测站点数量。

下面给出弱连接点的定义。在独立路径选取过程中，满足如下条件k-NP(v_i)＝1或D(v_i)-NP(v_i)＝1的节点v_i称为弱连接点。

弱连接点待选取的独立路径数量较少这一特征可以极大缩小下一个监测站点最优部署位置的范围。下面的算法根据监测站点部署过程中大量出现的弱连接点来选取监测站点集合。首个监测站点的部署位置若未指定，则选取度数最高的节点部署为首个监测站点。

该算法定义：V表示被管理网络中所有节点的集合，

表示被管理网络中所有弱连接点的集合，PS表示已部署监测站点的集合，l表示监测站点部署数量上限；

初始化变量：PS＝φ，

输入参数值：k、k_b、l；

输出变量：PS；

具体步骤包括：

当PS中元素数量小于l且V≠φ，执行如下循环操作：

由界定函数从V中选取

；

由目标函数根据

确定下一个监测站点的最优部署位置并添加到集合PS中；

由重置函数移除V中独立路径数量达到预设数量的节点；

返回：PS。

下面对各函数分别进行介绍。

(1)界定函数

界定函数以被管理网络的节点集合V为参数，主要功能是在每次迭代运算之后，获取新的弱连接点，供目标函数使用。求解方法如下：

(2)目标函数

目标函数以

为输入参数，根据每一个弱连接点的下一个独立路径确定其对应监测站点的可用部署位置ns。然后取其交集rs＝{v_mn，...}，其中m代表交集中的第m个元素，n代表该元素的重复次数。若rs为空，证明所有网络节点均已找到满足条件的k条独立路径，即V为空，PS选取结束。若rs唯一，则PS＝PS+rs；否则选取n最大的元素作为下一个监测站点的最优部署位置，即PS＝PS+v_mmax(n)。求解方法如下：

(3)重置函数

重置函数根据当前部署的监测站点，为节点v_i添加新的独立路径，对于独立路径数量达到预设数量的节点将从V中移除。求解方法如下：

监测站点部署位置的选择问题是个NP-hard问题，但是利用本发明实施例提出的算法可得到1个近似最优解的监测站点部署位置集合，并且该算法执行时间较快。

为了更好地了解本发明实施例提供的监测站点的部署方法，举例进行说明。

图6a为k＝2，k_b＝1，rs唯一的情况，首先将度数最高的节点1部署为监测站点，因为节点7为叶子节点(度数为1的节点)，其对应的唯一一条独立路径p_1，7＝(1，3，6，7)已经选取，因此从V中删去。通过界定函数确定节点2、4为弱连接点。通过目标函数确定能够监测节点2的其他监测站点的可用部署位置即节点2的其他可用监测节点为{3，6}，节点4的其他可用监测节点为{5，6}；取交集rs＝6，节点6选取为下一个监测站点。运行重置函数，V＝φ，流程结束。最终确定PS＝{1，6}。

图6b为k＝3，k_b＝2，rs为多个元素的情况，选取度数最高的节点4部署为首个监测站点，弱连接点为节点2、5、7、9，各若连接点对应的其他可用监测节点分别为{3，7}、{8，9}、{2，3}、{1，5，8}。交集rs＝(3，8)，且重复次数均为1次，此时可以选取任一节点作为下一监测站点，此处选取节点3，节点2、7的两条独立路径已经选取，从V中剔除。继续循环，V中确定出新的弱连接点为节点1、5、6、8、9，通过目标函数易得rs＝8。运行重置函数，V＝φ，流程结束。最终确定PS＝{3，4，8}。此外，通过k_b＝2的限定，可以得出节点7、9即使没有3条独立路径也可以被准确探测。

基于同一技术构思，本发明实施例还提供了一种监测站点的部署装置，由于该监测站点的部署装置解决问题的原理与监测站点的部署方法相似，因此该装置的实施可以参见方法的实施，重复之处不再赘述。

如图7所示，本发明实施例提供的监测站点的部署装置，包括第一部署单元701、处理单元702、第一控制单元703、选取单元704、第二控制单元705和第二部署单元706，其中：

第一部署单元701，用于部署首个监测站点，并触发处理单元702；

处理单元702，用于基于当前部署的监测站点，将独立路径数量达到预设数量的节点从节点集合中移除，并触发第一控制单元703；

第一控制单元703，用于确认已部署监测站点的数量小于或等于预设的监测站点部署数量上限且节点集合不为空时，触发选取单元704，否则，监测站点部署完成；

选取单元704，用于从节点集合中选取满足预设条件的非监测站点节点作为弱连接点，并确定每一个弱连接点对应的其他可用监测节点；

第二控制单元705，用于确定各弱连接点对应的其他可用监测节点的交集，如果确定出的交集不为空，触发第二部署单元706，如果确定出的交集为空，监测站点部署完成；

第二部署单元706，用于从确定出的交集中选取一个节点部署为下一个监测站点，并触发处理单元702。

具体实施中，选取单元704，具体用于从节点集合中选取预设的被管理网络故障数量上限与独立路径数量之差为1，或者度数与独立路径数量之差为1的非监测站点节点作为弱连接点；以及，根据弱连接点的下一条独立路径确定该弱连接点对应的其他可用监测节点。

具体实施中，第二部署单元706，具体用于如果各弱连接点对应的其他可用监测节点的交集包括一个节点，则将该节点部署为下一个监测站点；如果各弱连接点对应的其他可用监测节点的交集包括至少两个节点，则从该至少两个节点中选取重复次数最高的一个节点部署为下一个监测站点。

具体实施中，处理单元702，具体用于如果节点为监测站点、且独立路径数量达到预设的监测站点故障数量上限或者节点的度数，则将该节点从节点集合中移除；如果节点的独立路径数量达到预设的被管理网络故障数量上限或者节点的度数，则将该节点从节点集合中移除，其中，监测站点故障数量上限小于被管理网络故障数量上限。

具体实施中，第一部署单元701，具体用于将指定的节点部署为首个监测站点，或者从被管理网络的节点集合中选取度数最高的节点部署为首个监测站点。

在保证高故障监测率的同时，通过设定监测站点的故障率低于非监测站点节点的故障率，从而降低了监测站点的独立路径数量要求，进一步减少了监测站点的数量，且具有较好的故障定位能力。

本发明实施例提供的监测站点的部署方法通过实验验证了可行性，实验采用AS(自治域)级拓扑产生器生成模拟网络拓扑图。AS级拓扑产生器可以利用较长时间段内大量的BGP数据确定拓扑度量值，可信性很高，能较准确的模拟真实网络情况，是网络仿真试验中常用的拓扑生成工具。

通过AS级拓扑产生器生成的不同规模的网络拓扑图，使用程序语言(例如C语言)对本发明实施例提供的方法进行仿真实现，并将该方法与k-path监测站点部署方法在执行时间和监测站点部署情况两个方面分别进行比较。鉴于通过穷举算法可以得到最优解，因此试验中应加入穷举算法的对比，但是限于穷举算法的计算复杂度较高，无法在大型网络中应用，本发明实施例中加入了基于随机算法的监测站点部署方法作为参考。最后加入了采用k-path监测站点部署方法和发明实施例提供的方法部署的监测站点在实际网络结构中的故障定位能力的比较。

使用AS级拓扑产生器生成点规模从40～500的8张网络拓扑图，得到的网络拓扑图中边数与节点数以及平均节点度数的对应关系如表1所示。

表1

节点数量/个	边数/条	节点平均度数
			40	52	2.600
80	112	2.681
			150	211	2.735
220	309	2.772
			290	413	2.800
360	509	2.827
			430	619	2.835
500	721	2.856

由表1可知，虽然节点的平均度数随着网络规模的扩大呈现逐渐增长的趋势，但节点的平均度数仍然较小(平均节点度数小于3)。并且从图8也可以看出，除极少数具有较大度数的节点外，其他节点的度数大多小于3，难以满足对网络拓扑中节点的平均度数为6，甚至达到9的要求。因此，在实际网络拓扑中，k-path监测站点部署方法将受到很大影响。特别是当网络中同时发生的故障数较大时，其对度数小于k的节点故障定位能力较差。

从图9所示的实验结果中可以看出，当网络节点规模为20个节点时，三种方法运行时间差别不大，但当网络节点规模达到40个节点及以上时，发明实施例提供的方法运行时间已明显短于k-path监测站点部署方法，并且该两个方法的运行时间之差随着网络规模的扩大越来越大。

从图10所示的实验结果中可以看出，当网络规模越大时，部署的监测站点数量越多。但随着监测站点数量的增加，发明实施例提供的方法将会避免更多为保证监测站点本身的k条独立路径而部署的监测站点，从而部署的监测站点最少。

在相同网络规模下，随机指定网络中的k个故障(100次)，每次分别根据基于随机算法的监测站点部署方法、k-path监测站点部署方法和发明实施例提供的方法分别部署的监测站点发送探针包进行探测，然后统计三种方法部署的监测站点每次成功定位的故障数量和k的比值(被准确定位出的故障数量占总故障数量的百分比)，最后通过分别求取统计的100个比值的平均值(平均百分比)，来考察两种方法部署的监测站点对网络故障的定位能力，具体实验结果请参见图11。随着k值的增大，三种方法部署的监测站点能够准确定位出的故障个数的平均百分比均有下降趋势。这是因为网络中大量的叶子节点的故障，在其唯一的一条独立路径中出现故障节点后，将变的不可探测。此外，随机算法因部署有较多的监测站点，因此故障定位能力较高。而对于k-path监测站点部署方法和发明实施例提供的方法，当k值小于网络中节点平均度数值时，不难看出两种方法部署的监测站点对整个网络的故障均有较高的探测能力。但当k取值大于节点的平均度数时，k-path监测站点部署方法部署的监测站点的故障定位能力已明显不如发明实施例提供的方法。

本领域的技术人员应该明白，本发明的实施例可提供为方法、装置、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、装置和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例、以及落入本发明范围的所有变更和修改。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种监测站点的部署方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述预设条件包括：预设的被管理网络故障数量上限与节点的独立路径数量之差为1，或者节点的度数与节点的独立路径数量之差为1。

3.如权利要求2所述的方法，其特征在于，所述弱连接点对应的其他可用监测节点根据该弱连接点的下一条独立路径确定。

4.如权利要求2所述的方法，其特征在于，所述从交集中选取一个节点部署为下一个监测站点，具体包括：

如果各弱连接点对应的其他可用监测节点的交集包括一个节点，则将该节点部署为下一个监测站点；

如果各弱连接点对应的其他可用监测节点的交集包括至少两个节点，则从该至少两个节点中选取重复次数最高的一个节点部署为下一个监测站点。

5.如权利要求1至4任一所述的方法，其特征在于，所述将独立路径数量达到预设数量的节点从节点集合中移除，具体包括：

如果节点为监测站点、且独立路径数量达到预设的监测站点故障数量上限或者节点的度数，则将该节点从节点集合中移除；

如果节点的独立路径数量达到预设的被管理网络故障数量上限或者节点的度数，则将该节点从节点集合中移除，所述监测站点故障数量上限小于被管理网络故障数量上限。

6.如权利要求1至4任一所述的方法，其特征在于，还包括：

将指定的节点部署为首个监测站点，或者从被管理网络的节点集合中选取度数最高的节点部署为首个监测站点。

7.一种监测站点的部署装置，其特征在于，包括第一部署单元、处理单元、第一控制单元、选取单元、第二控制单元和第二部署单元，其中：

8.如权利要求7所述的装置，其特征在于，

所述选取单元，具体用于从节点集合中选取预设的被管理网络故障数量上限与独立路径数量之差为1，或者度数与独立路径数量之差为1的非监测站点节点作为弱连接点。

9.如权利要求8所述的装置，其特征在于，

所述获取单元，具体用于根据弱连接点的下一条独立路径确定该弱连接点对应的其他可用监测节点。

10.如权利要求8所述的装置，其特征在于，

所述第二部署单元，具体用于如果各弱连接点对应的其他可用监测节点的交集包括一个节点，则将该节点部署为下一个监测站点；如果各弱连接点对应的其他可用监测节点的交集包括至少两个节点，则从该至少两个节点中选取重复次数最高的一个节点部署为下一个监测站点。

11.如权利要求7至10任一所述的装置，其特征在于，

所述处理单元，具体用于如果节点为监测站点、且独立路径数量达到预设的监测站点故障数量上限或者节点的度数，则将该节点从节点集合中移除；如果节点的独立路径数量达到预设的被管理网络故障数量上限或者节点的度数，则将该节点从节点集合中移除，所述监测站点故障数量上限小于被管理网络故障数量上限。

12.如权利要求7至10任一所述的装置，其特征在于，

所述第一部署单元，具体用于将指定的节点部署为首个监测站点，或者从被管理网络的节点集合中选取度数最高的节点部署为首个监测站点。