CN102404137A - 一种IP网络下基于业务流QoS监测的故障定位方法 - Google Patents

一种IP网络下基于业务流QoS监测的故障定位方法 Download PDF

Info

Publication number
CN102404137A
CN102404137A CN2011102277956A CN201110227795A CN102404137A CN 102404137 A CN102404137 A CN 102404137A CN 2011102277956 A CN2011102277956 A CN 2011102277956A CN 201110227795 A CN201110227795 A CN 201110227795A CN 102404137 A CN102404137 A CN 102404137A
Authority
CN
China
Prior art keywords
qos
node
sla
monitoring
territory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102277956A
Other languages
English (en)
Inventor
孙建
张梅琴
张顺颐
王攀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JIANGSU XINWANG TEC TECHNOLOGY CO LTD
Original Assignee
JIANGSU XINWANG TEC TECHNOLOGY CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JIANGSU XINWANG TEC TECHNOLOGY CO LTD filed Critical JIANGSU XINWANG TEC TECHNOLOGY CO LTD
Priority to CN2011102277956A priority Critical patent/CN102404137A/zh
Publication of CN102404137A publication Critical patent/CN102404137A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种IP网络下基于业务流QoS监测的故障定位方法,该方法基于一种业务流的分布式QoS监测框架,由中心服务器,QoS聚集服务器,业务流数据库以及遍布于各个网络节点之上的QoS监测器所组成。本方法根据各个QoS性能指标(如带宽、时延、抖动,丢包率等)在同一个业务流传输过程中自身具有的相关性和QoS故障的传播性等特点,通过一种自适应的修正算法,从而确定真正影响SLA降级的故障源。

Description

一种IP网络下基于业务流QoS监测的故障定位方法
技术领域
本发明属于网络管理领域,为在各种提供QoS保证的IP网络中的SLA(Service Level Agreement)服务等级协议的实施进行业务流级别的QoS监测以及故障定位,从而能够通知网管系统进行资源分配的调整,以保证网络的服务质量水平。 
背景技术
随着Internet和IP网络的迅猛发展,越来越多的应用业务开始通过IP网络来实现传输。但是,IP网络提供的是“尽力而为(Best Effort)”的服务,没有QoS(Quality of Service)的保证。因此,业务流量在传输过程中很容易由于网络的拥塞而产生抖动、延迟、丢包等现象。而目前的应用业务中,实时业务的比重越来越大。实时性业务的一个很大特点就是数据传输量大,对抖动、丢包和延迟等QoS性能参数敏感,如:VoIP、视频点播和视频会议等。 
由于上述原因,网络提供商除了积极的提供各种内容丰富网络服务外,更加关注于对所提供的网络服务的质量QoS的保证和评价。各大网络提供商纷纷向各个级别的客户(如企业用户,政府机构甚至是家庭用户等)提供QoS和安全性保证,与此同时这些客户也有迫切的希望加入到对网络服务管理和质量评价中来,至此SLA(Service Level Agreement)服务等级协议在各大国际标准化组织的积极策动下应运而生。SLA服务等级协议规定了网络提供商在各个网络域内所应该提供的最低、最高和平均状况下的网络性能指标。因此,为了实现SLA就要求网络提供商能够实时的掌握当前运行网络的性能,及时的获得网络中各个域的QoS性能参数(如抖动、延迟和带宽等)。在获得这些SLA中规定的网络性能参数,我们可以对网络运行的可靠性、有效性进行实时的监测。 
从实际意义上讲,目前各个运营商都在积极建设自己的SLA评价和监测体系,实现SLA的首要也是最难解决的一个问题就是对服务技术指标的实时监测。如果在某个时间内,QoS服务质量没有达到所签订SLA协议的要求,就要定位出现故障的网络节点,通知网管系统对故障节点进行资源再分配,从而使故障节点的QoS指标达到SLA协议所要求的最低标准。除此之外,为了避免网管系统频繁操作所带来的巨大开销,在每次对网络故障定位的同时,所消耗的网络带宽和其它资源不易过大,否则沉重的监测和定位开销会给本来负载很重的网络系统带来更多的载荷。 
发明内容
本发明设计了一种IP网络下基于业务流QoS监测的故障定位方法,其中采用了一种基于业务流的分布式QoS监测框架,利用业务传输过程中自身具有的相关性和QoS故障的传播性 等特点得到一种自适应的修正算法,从而确定真正影响SLA降级的故障源。 
技术方案: 
基于业务流的分布式QoS监测框架包括中心服务器,QoS聚集服务器,业务流数据库以及遍布于各个网络节点之上的QoS监测器: 
中心服务器:中心服务器从全网的观点出发,负责管理各个监测域,直接管辖每个监测域中的QoS聚集服务器,并具有全局分析的能力。 
聚集QoS服务器:负责管理并协调本域内的各个监测器的监测行为,听从中心服务器的监控请求进而有选择的启用本域内的监测器,并能够从各个监测器中获取对路由节点的QoS性能监测数据并进行分析。 
业务流数据库:每一个聚集QoS服务器均维护一个业务流数据库。初始化,本地业务流数据库均向所在域内的网络节点上的监测器进行注册,当监测器监测到某个业务流时,以自己的地址以及业务流ID向RTANS登记,生成此业务的动态路径信息表。 
QoS监测器:由各个监测域的QoS聚集服务器直接管辖,一般部署与路由节点之上,主要完成对本地网络性能信息的管理和获取,并有处理数据的功能。 
本文中基于业务流QoS监测的故障定位的设计方法如下: 
监测框架初始化 
中心服务器从全网的观点出发管理各个监控域,各个监控域的QoS聚集服务器负责本域内的所有QoS监测器;每个监测域维持一个业务流数据库。每个本地业务流数据库均向所在域内的网络路由节点上的QoS监测器进行注册,当监测器监测到某个业务流时,以自己的地址和业务流ID向业务流数据库进行登记,生成此业务流的业务流表。 
端到端的的SLA性能测量: 
每隔一个时间片进行一次端到端的的SLA性能测量,若满足SLA合同中的规定中的服务质量请求,则表明业务流运行正常;时间片的大小可以根据SLA定义时的要求或用户需求而调整,终端用户在感到到故障时也可以直接向中心服务器申请SLA性能测量。 
动态业务路径查询: 
当发现业务流SLA性能指标不满足时,中心服务器向各个域中的聚集QoS服务器发送业务流ID,本地聚集QoS服务器查询本地业务流服务器获取业务流在本域内的途径节点信息并发送给中心服务器,中心服务器进行综合并获取该业务的动态路径信息表。 
QoS性能数据收集与综合评判: 
1)中心服务器根据业务的动态路径信息表向所有包括路径节点的监控域的聚集QoS服务 器发送路由节点监测申请,本地的聚集QoS服务器控制对属于本地的路由节点的监测器发送监测申请。 
2)中心服务器收集各个监控域的聚集QoS服务器传上来的QoS性能指标数据,并进行综合计算业务路径的综合QoS评价向量,判断是否满足SLA要求,如果满足则表示业务流运行正常。 
故障节点定位: 
1)计算业务流途经路径中的每一个路由节点的节点QoS评价值,并与SLA要求进行比较,找出其中不符合要求的节点,称为疑似故障节点。 
2)对于每个疑似故障节点,依次寻找出其直接前驱和后继疑似故障节点进行相关性分析,对节点评价值进行修正,如果修正后的值仍然不满足SLA要求,则确定其为故障节点。 
附图说明
图1为基于业务流的分布式QoS监测框架图。 
图2为基于业务流QoS监测的故障定位方法流程图。 
具体实施方式
下面结合实例对本发明作进一步的描述,但该实例不应理解为对本发明的限制。 
QoS监测框架的实现与通信机制: 
将网络整个网络根据地理位置划分成几个监测域,每个监测域内设置一个QoS聚集服务器,负责本域内QoS性能数据的整合分析,并关联域内唯一一个业务流数据库服务器。每一个网络路由节点都都配置了一个监测模块,负责监测本地网络性能信息的管理和获取。每当有监测模块发现有新的业务流通过路由节点时,QoS监测模块将本路由节点地址以及业务流ID(如五元组:源目的地址,源目的端口,协议类型)向业务流数据库登记,如果本业务流ID已经在已经登记在业务流数据库中,则在该业务流ID的表中中增加一条表项记录,否则在数据库中新建一个此业务流的动态路径信息表。 
聚集QoS服务器与各路由节点上的监测模块,中心服务器与聚集服务器之间的通信采用SNMP协议的提供的Get/Set操作来实现。 
综合QoS评价计算: 
Path表示一个业务流给定的传输路径,其中pij表示在第i个域内的第j个网络节点: 
1)时延: Delay ( Path ) = Σ i = 1 N Σ j = 1 M i D ( p ij ) ;
2)抖动: Jitter ( Path ) = Max { D ( Σ j = 1 M j p ij ) } - Min { D ( D ( Σ k = 1 M k p sk ) ;
3)丢包率: Loss ( Path ) = 1 - Π i = 1 N Π j = 1 M j ( 1 - L ( p ij ) ) ;
4)带宽:Width(Path)=Min{Width(pi)}. 
对于一个确定路径的业务流,由本地监测器监测的QoS性能数据经由聚集QoS服务器汇总到中心服务器得到的QoS统计数据可以由一个矩阵表示: 
Figure BSA00000554062200043
其中xij表示业务流途径的第i个路由节点的第j个QoS性能参数的值。通过此QoS参数矩阵以及上面时延、抖动、丢包率、带宽的公式,可以计算出综合QoS评价向量 
Figure BSA00000554062200044
Jitter(Path),Loss(Path),Width(Path)>T,再与业务路径的SLA要求进行比较。 
节点QoS评价计算: 
我们可以获取每个QoS参数的SLA违例最小(大)值 
Figure BSA00000554062200045
以及SLA合同规定的最大(小)值 
Figure BSA00000554062200046
则第i个节点上的第j个QoS参数的适合度情况可以表示为 (xij满足大于约束)或 
Figure BSA00000554062200048
(xij满足小于约束) 
接下来对业务流途径的第i个节点的所有QoS参数进行综合评价: 
节点评价值Qi=b1gi1+b2gi2+…bngin, 
其中b1到bn为n个QoS参数对应的权重因子,b1+b2+…+bn=1。 
节点相关性分析和修正函数: 
业务流中的任意两个节点i,j,如果i,j之间有s个网络节点,则i,j节点之间的相关 性因子 ζ ij = ρ ij ( s + 1 ) ( s + 2 ) , 其中 
ρ ij = E { [ Q i - E ( Q i ) ] [ Q j - E ( Q j ) ] } E { [ Q i - E ( Q i ) ] } E { [ Q j - E ( Q j ) ] } , 其中E(Qi)=η1,E(Qj)=η2分别为i节点和节点上SLA合同规定的违例故障限值。 
这样我们可以对中心服务器计算出来的节点评价值进行修正:对于某一个违例故障节点k,找出其直接前驱故障节点i,直接后继故障节点j,并分别计算节点k与i,j的相关性因子,对k的节点评价值Qk进行如下的修正: 
Qk /=Qi(1+β1ζik)(1+β2ζkj),其中β1=β2=0.1. 
将Qk /与SLA合同中规定的服务等级ηk相比较,若仍不能满足SLA要求,则确定其为故障发生点。 

Claims (5)

1.一种IP网络下基于业务流QoS监测的故障定位方法,该方法是基于一种业务流的分布式QoS监测框架,包括中心服务器,QoS聚集服务器,业务流数据库以及遍布于各个网络节点之上的QoS监测器。该方法的具体步骤如下:
A.初始化阶段,中心服务器从全网的观点出发管理各个监控域,各个监控域的QoS聚集服务器负责本域内的所有QoS监测器;每个监测域维持一个业务流数据库;
B.根据IP网络业务在SLA定义时的要求,周期性或根据用户申请进行端到端的SLA性能测量。对于不符合SLA服务质量要求的业务流,中心服务器通过各个监测域中的业务流数据库动态产生该业务的动态路径信息表;
C.中心服务器通过各个监测域中的QoS聚集服务器收集动态路径信息表中的各节点的当前QoS性能指标,并通过计算得到路径的综合QoS评价向量(由延迟,抖动,丢包率,带宽等性能值组成),判断是否满足SLA要求;
D.如果SLA要求仍然不满足,则计算路径每个节点的节点QoS评价值,对其中不满足SLA要求的疑似故障节点参考其直接疑似前驱和直接疑似后继故障节点进行修正,得到修正后的节点QoS评价值再与SLA要求进行比较,以确定是否为故障节点。
2.根据权利要求1所述的方法,其特征在于,步骤A包括:
A.每个监控域有且只有一个QoS聚集服务器,管理本域内的所有QoS监测器,每个QoS监测器都负责一个路由节点的监测,一般直接部署在路由节点上;各个聚集服务器都被全网唯一的中心服务器所支配;
B.初始化阶段,每个本地业务流数据库均向所在域内的网络节点上的QoS监测器进行注册,当监测器监测到某个业务流时,以自己的地址和业务流ID向业务流数据库进行登记,生成此业务流的业务流表。
3.根据权利要求2所述的方法,其特征在于,步骤B包括:
A.每隔一个时间片进行一次端到端的的SLA性能测量,若满足SLA合同中的规定中的服务质量请求,则表明业务流运行正常;时间片的大小可以根据SLA定义时的要求或用户需求而调整,终端用户在感到到故障时也可以直接向中心服务器申请SLA性能测量;
B.当发现业务流SLA性能指标不满足时,中心服务器向各个域中的QoS聚集服务器发送业务流ID,本地QoS聚集服务器查询本地业务流服务器获取业务流在本域内的途径节点信息并发送给中心服务器,中心服务器进行综合并获取该业务的动态路径信息表。
4.根据权利要求1所述的方法,其特征在于,步骤C包括:
A.中心服务器根据业务的动态路径信息表向所有包括路径节点的监控域的QoS聚集服务器发送路由节点监测申请,本地的QoS聚集服务器控制对属于本地的路由节点的监测器发送 监测申请;
B.中心服务器收集各个监控域的QoS聚集服务器传上来的QoS性能指标数据,并进行综合计算业得到务路径上的综合QoS评价向量,与SLA规定中的要求进行比较,如果满足则表示业务流运行正常,否则执行权利要求1中步骤D。
5.根据权利要求1所述的方法,其特征在于,步骤D包括:
A.计算业务流途经路径中的每一个路由节点的节点QoS评价值,并与SLA要求进行比较,找出其中不符合要求的节点,称为疑似故障节点。
B.对于每个疑似故障节点,依次寻找出其直接前驱和直接后继疑似故障节点进行相关性分析,对节点评价值进行修正,如果修正后的值仍然不满足SLA要求,则确定其为故障节点。 
CN2011102277956A 2011-08-09 2011-08-09 一种IP网络下基于业务流QoS监测的故障定位方法 Pending CN102404137A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102277956A CN102404137A (zh) 2011-08-09 2011-08-09 一种IP网络下基于业务流QoS监测的故障定位方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102277956A CN102404137A (zh) 2011-08-09 2011-08-09 一种IP网络下基于业务流QoS监测的故障定位方法

Publications (1)

Publication Number Publication Date
CN102404137A true CN102404137A (zh) 2012-04-04

Family

ID=45885953

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102277956A Pending CN102404137A (zh) 2011-08-09 2011-08-09 一种IP网络下基于业务流QoS监测的故障定位方法

Country Status (1)

Country Link
CN (1) CN102404137A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013178121A1 (zh) * 2012-09-18 2013-12-05 中兴通讯股份有限公司 基于业务的通信网络评估方法和装置
CN103746834A (zh) * 2013-12-25 2014-04-23 华为技术有限公司 传送网业务路径搜索方法和相关设备及通信系统
CN104717158A (zh) * 2015-03-02 2015-06-17 中国联合网络通信集团有限公司 一种调整带宽调度策略的方法及装置
CN108390790A (zh) * 2018-03-16 2018-08-10 迈普通信技术股份有限公司 路由设备故障诊断方法及装置
CN110138600A (zh) * 2019-04-28 2019-08-16 北京大米科技有限公司 一种提示信息输出方法、装置、存储介质及服务器
CN110430236A (zh) * 2019-06-29 2019-11-08 华为技术有限公司 一种部署业务的方法以及调度装置
CN111158727A (zh) * 2019-12-31 2020-05-15 上海能塔智能科技有限公司 Ota升级的处理方法、装置、电子设备与存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002030042A2 (en) * 2000-10-06 2002-04-11 Nortel Networks Limited Monitoring quality of service in packet-based communications
CN1725718A (zh) * 2005-04-04 2006-01-25 杭州华为三康技术有限公司 网络服务质量测试方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002030042A2 (en) * 2000-10-06 2002-04-11 Nortel Networks Limited Monitoring quality of service in packet-based communications
CN1725718A (zh) * 2005-04-04 2006-01-25 杭州华为三康技术有限公司 网络服务质量测试方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏航: "网络Qos监测模型和故障定位方法研究", 《中国优秀硕士学位论文全文数据库 信息科技辑》, no. 09, 15 September 2010 (2010-09-15), pages 5 - 26 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013178121A1 (zh) * 2012-09-18 2013-12-05 中兴通讯股份有限公司 基于业务的通信网络评估方法和装置
US9769033B2 (en) 2012-09-18 2017-09-19 Zte Corporation Service-based communication network evaluation method and device
CN103746834A (zh) * 2013-12-25 2014-04-23 华为技术有限公司 传送网业务路径搜索方法和相关设备及通信系统
CN103746834B (zh) * 2013-12-25 2018-05-04 华为技术有限公司 传送网业务路径搜索方法和相关设备及通信系统
CN104717158A (zh) * 2015-03-02 2015-06-17 中国联合网络通信集团有限公司 一种调整带宽调度策略的方法及装置
CN108390790A (zh) * 2018-03-16 2018-08-10 迈普通信技术股份有限公司 路由设备故障诊断方法及装置
CN110138600A (zh) * 2019-04-28 2019-08-16 北京大米科技有限公司 一种提示信息输出方法、装置、存储介质及服务器
CN110430236A (zh) * 2019-06-29 2019-11-08 华为技术有限公司 一种部署业务的方法以及调度装置
CN110430236B (zh) * 2019-06-29 2020-11-03 华为技术有限公司 一种部署业务的方法以及调度装置
WO2021000694A1 (zh) * 2019-06-29 2021-01-07 华为技术有限公司 一种部署业务的方法以及调度装置
US11838389B2 (en) 2019-06-29 2023-12-05 Huawei Cloud Computing Technoloiges Co., Ltd. Service deployment method and scheduling apparatus
CN111158727A (zh) * 2019-12-31 2020-05-15 上海能塔智能科技有限公司 Ota升级的处理方法、装置、电子设备与存储介质

Similar Documents

Publication Publication Date Title
US11316755B2 (en) Service enhancement discovery for connectivity traits and virtual network functions in network services
CN102404137A (zh) 一种IP网络下基于业务流QoS监测的故障定位方法
EP3039817B1 (en) Determination and use of link performance measures
US8503315B2 (en) Data network monitoring system and method for determining service quality measure
KR100689430B1 (ko) 디지털 홈 서비스에서 하이브리드 모니터링을 통한 동적서비스 품질 매핑 장치 및 방법
US7668966B2 (en) Data network controller
US8565218B2 (en) Flow path discovery in network to guarantee multiple metric QoS constraints
US10075390B2 (en) Communications network using a tunnel to connect two network nodes
US8780716B2 (en) System and method for service assurance in IP networks
US7929440B2 (en) Systems and methods for capacity planning using classified traffic
CN102498696A (zh) 数据网络的使用监管
WO2011144041A2 (zh) 服务质量检测的方法、监控中心、监测探针和系统
Khairi et al. Novel QoE monitoring and management architecture with eTOM for SDN-based 5G networks: SLA verification scenario
Bao et al. QoE collaborative evaluation method based on fuzzy clustering heuristic algorithm
Qin et al. Optimizing routing and server selection in intelligent SDN-based CDN
Mehaoua et al. Service-driven inter-domain QoS monitoring system for large-scale IP and DVB networks
CN106686034A (zh) Cdn调度增强方法、装置及系统
EP3318014B1 (en) Local and demand driven qos models
Dasgupta et al. Dynamic traffic engineering for mixed traffic on international networks: Simulation and analysis on real network and traffic scenarios
Zhou et al. A new method for end-to-end available bandwidth estimation
Shimokawa et al. SDN-based time-domain error correction for in-network video QoE estimation in wireless networks
Tunc et al. Fixed-point analysis of a network of routers with persistent TCP/UDP flows and class-based weighted fair queuing
Sidibé et al. Service monitoring system for dynamic service adaptation in multi-domain and heterogeneous networks
Sidibe et al. QoS monitoring for end-to-end heterogeneous networks configurations management
Lehrieder et al. RCFT: A termination method for simple PCN-based flow control

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120404