CN105591768B - 故障检测方法及装置 - Google Patents
故障检测方法及装置 Download PDFInfo
- Publication number
- CN105591768B CN105591768B CN201410564306.XA CN201410564306A CN105591768B CN 105591768 B CN105591768 B CN 105591768B CN 201410564306 A CN201410564306 A CN 201410564306A CN 105591768 B CN105591768 B CN 105591768B
- Authority
- CN
- China
- Prior art keywords
- business function
- bfd
- function node
- message
- opposite end
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 70
- 238000000034 method Methods 0.000 claims abstract description 20
- 230000003993 interaction Effects 0.000 claims abstract description 18
- 238000012545 processing Methods 0.000 claims description 16
- 230000004888 barrier function Effects 0.000 claims description 5
- 230000005540 biological transmission Effects 0.000 claims description 5
- 238000005538 encapsulation Methods 0.000 claims description 3
- 230000004913 activation Effects 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 description 15
- 238000005516 engineering process Methods 0.000 description 13
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 11
- 238000012360 testing method Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 3
- 238000007689 inspection Methods 0.000 description 2
- ABEXEQSGABRUHS-UHFFFAOYSA-N 16-methylheptadecyl 16-methylheptadecanoate Chemical compound CC(C)CCCCCCCCCCCCCCCOC(=O)CCCCCCCCCCCCCCC(C)C ABEXEQSGABRUHS-UHFFFAOYSA-N 0.000 description 1
- 241000764238 Isis Species 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000005417 image-selected in vivo spectroscopy Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012739 integrated shape imaging system Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L45/00—Routing or path finding of packets in data switching networks
- H04L45/28—Routing or path finding of packets in data switching networks using route fault recovery
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/06—Management of faults, events, alarms or notifications
- H04L41/0654—Management of faults, events, alarms or notifications using network fault recovery
- H04L41/0663—Performing the actions predefined by failover planning, e.g. switching to standby network elements
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Health & Medical Sciences (AREA)
- Cardiology (AREA)
- General Health & Medical Sciences (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明公开了一种故障检测方法及装置,在上述方法中,在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建BFD会话;通过与对端业务功能节点之间的BFD控制报文交互执行连通性故障检测。根据本发明提供的技术方案,实现了在业务功能路径上的业务功能实例之间进行连通性检测。
Description
技术领域
本发明涉及通信领域,具体而言,涉及一种故障检测方法及装置。
背景技术
业务功能链(Service Function Chaining,简称为SFC)是目前正在研究和标准化的一种网络技术。自从数据中心网络向叠加(Overlay)网络发展以后,网络边缘成为了虚拟网络与物理网络的分界点,其中,网络边缘可能为服务器(Server)或者架顶式(ToR)交换机,以及可能为网关(Gateway)。然而Overlay技术无法解决所有问题,在数据中心内还是存在很多中间件(Middleware),例如:防火墙/负载均衡器等,这些设备都是基于用户业务来处理的,如果通过隧道而穿越这些设备,显然是不行的。
数据中心的这种部署模型,要求虚拟防火墙/负载均衡器可以在网络中任意部署,也就是与网络拓扑无关;其缺陷在于:如果将流量能够灵活地通过虚拟防火墙/负载均衡器进行处理,那么将会产生虚拟防火墙/负载均衡器等新型中间件,这些虚拟防火墙/负载均衡器部署在网络的边缘,可以由标准服务器来实现。
相关技术中将虚拟防火墙/负载均衡器/网关等业务处理功能称为业务功能(Service Function),而流量经过一系列的Service Function的处理,便会形成ServiceFunction Chaining,即业务功能链。
目前,相关技术中的SFC框架基本可以分为如下组件:
1.业务叠加(Service Overlay),即各个网络边缘节点需要通信的Overlay技术;
2.通用业务控制平面(Generic Service Control Plane,简称为GSCP),即为形成Service Function Chaining的控制器;
3.业务分类(Service Classification),即需要进行流识别,然后对特定的流进行特定的Service Function Chaining处理;
4.控制平面元数据(Dataplane Metadata),其为SFC框架的一大特色,元数据(Metadata)允许各个边缘业务处理节点能够互相交换信息,从而达到特定的业务处理目的。
5.业务功能路径(service function path,简称为SFP),图1是根据相关技术的业务功能路径的示意图。如图1所示,SFP是从分类器开始,再经过若干业务功能实例,最终达到目的地的一条业务处理路径。
6.业务功能转发器(Service Function Forwarder,简称为SFF),数据报文在业务功能链的各个节点之间传递,会在数据帧以外封装一层业务功能报文头(Network ServiceHeader,简称为NSH)。这个报文头会被业务功能节点上的业务功能转发器组件进行解析、封装和解封装。
综上而述,SFC是一项将网络设备业务功能和转发分离开来的技术,其实现了业务功能的独立运算和处理,提升了网络设备的转发性能。
为了保护关键应用,网络中会设计有一定的冗余备份链路,当网络发生故障时就要求网络设备能够快速检测出故障并将流量切换至备份链路以加快网络收敛速度。目前,有些链路通过硬件检测机制来实现快速故障检测。但是,某些链路(例如:以太网链路)则不具备这样的检测机制。此时,应用就要依靠上层协议自身的机制来进行故障检测,上层协议的检测时间都在1秒以上,这样的故障检测时间对某些应用来说是不能容忍的。某些路由协议例如:开放式最短路径优先(OSPF)、链路状态路由协议(ISIS)虽然具有快速招呼(FastHello)功能来加快检测速度,但是检测时间也只能达到1秒的精度,而且Fast Hello功能只是针对本协议的,无法为其它协议提供快速故障检测。
双向转发检测(Bidirectional Forwarding Detection,简称为BFD)协议就是在这种背景下产生的,其提供了一个通用的标准化的与介质无关和协议无关的快速故障检测机制。BFD在两台网络设备上建立会话,用来检测网络设备间的双向转发路径,为上层应用服务。BFD本身并没有邻居发现机制,而是依赖被服务的上层应用通知其邻居信息以建立会话。会话建立后会周期性地快速发送BFD报文,如果在检测时间内没有接收到BFD报文,则认为该双向转发路径发生了故障,通知被服务的上层应用进行相应的处理。
然而,在现有的SFC技术中缺乏一种针对业务功能链中各个业务功能实例之间的基于BFD连通性故障检测机制。
发明内容
本发明实施例提供了一种故障检测方法及装置,以至少解决相关技术中缺乏一种针对业务功能链中各个业务功能实例之间的基于BFD连通性故障检测机制的问题。
根据本发明的一个方面,提供了一种故障检测方法。
根据本发明实施例的故障检测方法包括:在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建BFD会话;通过与对端业务功能节点之间的BFD控制报文交互执行连通性故障检测。
优选地,通过BFD控制报文交互执行连通性故障检测包括:在定时器规定的预设时长内接收来自于对端业务功能节点的BFD控制报文,其中,BFD控制报文中携带有第一业务功能实例的识别号;在根据识别号确定本端业务功能节点管理域内与该识别号对应的第一业务功能实例处于激活状态的情况下,保持BFD会话的开启状态并对定时器进行重置。
优选地,在根据识别号确定第一业务功能实例处于激活状态之前,还包括:从BFD控制报文获取BFD控制报文中BFD的状态字段当前为开启状态。
优选地,通过BFD控制报文交互执行连通性故障检测包括:在定时器规定的预设时长内等待对端业务功能节点发送的BFD控制报文;如果在预设时长内未接收到BFD控制报文,则关闭BFD会话并执行业务功能路径切换操作,同时告知对端业务功能节点发生链路故障。
优选地,通过BFD控制报文交互执行连通性故障检测包括:在确定本端业务功能节点管理域内的第一业务功能实例发生故障或者已经被关闭的情况下,关闭BFD会话,并对BFD控制报文进行配置,其中,将BFD控制报文中BFD的状态字段设置为关闭状态并且在BFD控制报文内封装第二业务功能实例的识别号;向对端业务功能节点发送BFD控制报文。
优选地,创建BFD会话包括:在本端业务功能节点管理域内增加BFD功能模块;由第一业务功能实例所在的本端业务功能节点将BFD会话创建信息通知给BFD功能模块,其中,BFD会话创建信息用于BFD功能模块创建BFD会话,BFD会话创建信息包括以下至少之一:第一业务功能实例的识别号、第二业务功能实例的识别号、本端业务功能节点的标识信息以及对端业务功能节点的标识信息。
根据本发明的另一方面,提供了一种故障检测装置。
根据本发明实施例的故障检测装置包括:建立模块,用于在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建BFD会话;检测模块,用于通过与对端业务功能节点之间的BFD控制报文交互执行连通性故障检测。
优选地,检测模块包括:接收单元,用于在定时器规定的预设时长内接收来自于对端业务功能节点的BFD控制报文,其中,BFD控制报文中携带有第一业务功能实例的识别号;第一执行单元,用于在根据识别号确定本端业务功能节点管理域内与该识别号对应的第一业务功能实例处于激活状态的情况下,保持BFD会话的开启状态并对定时器进行重置。
优选地,检测模块还包括:获取单元,用于从BFD控制报文获取BFD控制报文中BFD的状态字段当前为开启状态。
优选地,检测模块包括:处理单元,用于在定时器规定的预设时长内等待对端业务功能节点发送的BFD控制报文;第二执行单元,用于如果在预设时长内未接收到BFD控制报文,则关闭BFD会话并执行业务功能路径切换操作,同时告知对端业务功能节点发生链路故障。
优选地,检测模块包括:配置单元,用于在确定本端业务功能节点管理域内的第一业务功能实例发生故障或者已经被关闭的情况下,关闭BFD会话,并对BFD控制报文进行配置,其中,将BFD控制报文中BFD的状态字段设置为关闭状态并且在BFD控制报文内封装第二业务功能实例的识别号;发送单元,用于向对端业务功能节点发送BFD控制报文。
优选地,建立模块包括:增加单元,用于在本端业务功能节点管理域内增加BFD功能模块;通知单元,用于由第一业务功能实例所在的本端业务功能节点将BFD会话创建信息通知给BFD功能模块,其中,BFD会话创建信息用于BFD功能模块创建BFD会话,BFD会话创建信息包括以下至少之一:第一业务功能实例的识别号、第二业务功能实例的识别号、本端业务功能节点的标识信息以及对端业务功能节点的标识信息。
通过本发明实施例,采用在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建BFD会话;通过与对端业务功能节点之间的BFD控制报文交互执行连通性故障检测,解决了相关技术中缺乏一种针对业务功能链中各个业务功能实例之间的基于BFD连通性故障检测机制的问题,进而实现了在业务功能路径上的业务功能实例之间进行连通性检测。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据相关技术的业务功能路径的示意图;
图2是根据本发明实施例的故障检测方法的流程图;
图3是根据本发明优选实施例的在BFD控制报文中配置业务功能实例的识别号的示意图;
图4是根据本发明优选实施例第一业务功能实例所在的业务功能节点作为BFD控制报文接收端的流程图;
图5是根据本发明优选实施例第一业务功能实例所在的业务功能节点作为BFD控制报文发送端的流程图;
图6是根据本发明优选实施例一的基于业务功能实例1与业务功能实例2的业务功能路径进行连通性检测的示意图;
图7是根据本发明优选实施例二的基于业务功能实例1与业务功能实例2的业务功能路径进行连通性检测的示意图;
图8是根据本发明实施例的故障检测装置的结构框图;
图9是根据本发明优选实施例的故障检测装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
图2是根据本发明实施例的故障检测方法的流程图。如图2所示,该方法可以包括以下处理步骤:
步骤S202:在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建BFD会话;
步骤S204:通过与对端业务功能节点之间的BFD控制报文交互执行连通性故障检测。
相关技术中缺乏一种针对业务功能链中各个业务功能实例之间的基于BFD连通性故障检测机制。采用如图2所示的方法,在两个业务功能实例之间建立业务功能路径以及创建双向转发检测BFD会话,通过在两个业务功能实例之间进行BFD控制报文交互以实现连通性故障检测,由此解决了相关技术中缺乏一种针对业务功能链中各个业务功能实例之间的基于BFD连通性故障检测机制的问题,进而实现了在业务功能路径上的业务功能实例之间进行连通性检测。
优选地,在步骤S204中,通过BFD控制报文交互执行连通性故障检测可以包括以下操作:
步骤S1:在定时器规定的预设时长内接收来自于对端业务功能节点的BFD控制报文,其中,BFD控制报文中携带有第一业务功能实例的识别号;
步骤S2:在根据识别号确定本端业务功能节点管理域内与该识别号对应的第一业务功能实例处于激活状态的情况下,保持BFD会话的开启状态并对定时器进行重置。
优选地,在步骤S2,根据识别号确定第一业务功能实例处于激活状态之前,还可以包括以下步骤:
步骤S3:从BFD控制报文中获取BFD控制报文中BFD的状态字段当前为开启状态。由此可以确定在第二业务功能节点上的第二业务功能实例并未发生异常或者被关闭,因此,在同时确定本端业务功能节点管理域内的第一业务功能实例同样处于激活状态(即未发生异常或者未被关闭)的情况下,可以继续保持BFD会话。
在优选实施例中,图3是根据本发明优选实施例的在BFD控制报文中配置业务功能实例的识别号的示意图。如图3所示,BFD在会话建立及定时器协商完成后,各个业务功能节点会以协商后的间隔发送BFD控制报文并在BFD控制报文可选部分增加目的业务功能实例的识别号。各个业务功能节点当接收到BFD控制报文,并且该BFD控制报文中的目的业务功能实例的识别号所代表的业务功能实例处于激活状态时,就会重置检测时间定时器,保持会话UP状态。
优选地,在步骤S204中,通过BFD控制报文交互执行连通性故障检测可以包括以下步骤:
步骤S4:在定时器规定的预设时长内等待对端业务功能节点发送的BFD控制报文;
步骤S5:如果在预设时长内未接收到BFD控制报文,则关闭BFD会话并执行业务功能路径切换操作,同时告知对端业务功能节点发生链路故障。
在优选实施例中,当发生业务功能节点之间的链路故障时,各个业务功能节点在检测时间内没有接收到BFD控制报文,BFD会话会迁移到关闭状态,并且通知相关应用,告知对端链路发生故障,进而关闭会话并通知管理模块进行SFP路径切换等措施。
图4是根据本发明优选实施例第一业务功能实例所在的业务功能节点作为BFD控制报文接收端的流程图。如图4所示,该流程可以包括以下处理步骤:
步骤S402:在定时器规定的预设时长内等待对端业务功能节点发送的BFD控制报文,判断是否在预设时长内接收到上述BFD控制报文;如果是,则继续执行步骤S404;如果否,则转到步骤S408;
步骤S404:在定时器规定的预设时长内接收到对端业务功能节点发送的BFD控制报文;
步骤S406:判断BFD控制报文中BFD的状态字段是否被设置为关闭状态;如果是,则继续执行步骤S408;否则,转到步骤S412;
步骤S408:BFD会话会迁移到关闭状态,关闭会话;
步骤S410:通知管理模块进行SFP路径切换等措施;流程结束;
步骤S412:当BFD控制报文中的目的业务功能实例的识别号所代表的业务功能实例处于激活状态时,则重置检测时间定时器,保持会话UP状态;流程结束。
优选地,在步骤S204中,通过BFD控制报文交互执行连通性故障检测可以包括以下操作:
步骤S6:在确定本端业务功能节点管理域内的第一业务功能实例发生故障或者已经被关闭的情况下,关闭BFD会话,并对BFD控制报文进行配置,其中,将BFD控制报文中BFD的状态字段设置为关闭状态并且在BFD控制报文内封装第二业务功能实例的识别号;
步骤S7:向对端业务功能节点发送BFD控制报文。
在优选实施例中,当其中一个业务功能节点的业务功能实例发生故障或关闭时,该业务功能节点关闭会话,并在发送BFD控制报文时会在BFD的状态(Sta)字段填入本地当前的会话状态,并将该状态设置为关闭(down),封装目的业务功能实例的识别号,并发送到对端业务功能节点。对端业务功能节点接收到该BFD控制报文后,关闭会话并通知管理模块进行SFP路径切换等措施。
图5是根据本发明优选实施例第一业务功能实例所在的业务功能节点作为BFD控制报文发送端的流程图。如图5所示,该流程可以包括以下处理步骤:
步骤S502:判断自身内部的第一业务功能实例是否发生故障或者已经被关闭;如果是,则继续执行步骤S504;否则,转到步骤S508;
步骤S504:在确定自身内部的第一业务功能实例发生故障或者已经被关闭的情况下,关闭BFD会话;
步骤S506:将BFD控制报文中BFD的状态字段设置为关闭状态;
步骤S508:向对端业务功能节点发送BFD控制报文;流程结束。
优选地,在步骤S202中,创建BFD会话可以包括以下步骤:
步骤S7:在本端业务功能节点管理域内增加BFD功能模块;
步骤S8:由第一业务功能实例所在的本端业务功能节点将BFD会话创建信息通知给BFD功能模块,其中,BFD会话创建信息用于BFD功能模块创建BFD会话,BFD会话创建信息可以包括但不限于以下至少之一:
(1)第一业务功能实例的识别号;
(2)第二业务功能实例的识别号;
(3)本端业务功能节点的标识信息;
(4)对端业务功能节点的标识信息。
在优选实施例中,在需要BFD检测的两个业务功能实例之间形成对等实体,并进行相关的BFD协议配置以及SFP和BFD联动绑定。当一条新的SFP建立且该SFP包含上述两个业务功能实例时,业务功能实例所在的业务功能节点可以将两个业务功能实例和业务功能路径的信息通告给BFD。
上述信息可以包括但不限于:源业务功能实例的识别号、目的业务功能实例的识别号、业务功能路径、源业务功能节点的互联网协议(IP)地址以及目的业务功能节点的IP地址。
上述源业务功能节点的IP地址是指上述业务功能实例之一,其所在的业务功能节点的IP地址;上述目的业务功能节点IP地址是指对端业务功能实例所在的业务功能节点的IP地址。
进一步的,BFD根据接收到的邻居信息建立会话,会话信息可以包括但不限于:源业务功能实例的识别号、目的业务功能实例的识别号、源业务功能节点的IP地址、目的业务功能节点的IP地址。
下面将结合图6和图7所示的优选实施方式对上述优选实施过程作进一步的描述。
在通常情况下,业务功能实例之间的连通性故障往往由以下两种原因造成:
原因一、业务功能节点的链路故障,即业务功能节点之间的物理或者虚拟链路发生故障;
原因二、业务功能实例发生故障或关闭,即业务功能节点之间的链路也许是完好的,但是由于人为主动关闭业务功能实例、业务功能实例挂起、进程崩溃等原因所导致的业务功能实例无法正常运行。
图6是根据本发明优选实施例一的基于业务功能实例1与业务功能实例2的业务功能路径进行连通性检测的示意图。如图6所示,在业务功能实例1和业务功能实例2之间建立基于BFD连通性检测的机制,在稳定运行一段时间之后,节点1发生网卡损坏从而导致链路故障。具体可以包括以下处理步骤:
步骤一、业务功能实例1所在的业务功能节点1和业务功能实例2所在的业务功能节点2上配置BFD检测机制并且配置联动SFC;
步骤二、在包含业务功能实例1→业务功能实例2的SFP创建之后,业务功能实例1通知业务功能节点1的BFD模块请求创建会话,同时,业务功能实例2通知业务功能节点2的BFD模块也请求创建会话;
步骤三、BFD成功创建基于上述两个业务功能实例之间的会话,业务功能实例1的识别号为1000,业务功能实例2的识别号为2000,以及业务功能节点1的IP地址为192.168.1.1,业务功能节点2的IP地址为192.178.1.1;
步骤四、业务功能节点1检查业务功能实例1进程正常运行,定时周期向业务功能节点2发送BFD控制报文并封装可选项业务功能实例2的识别号为2000;业务功能节点2检查业务功能实例2进程正常运行,定时周期向业务功能节点1发送BFD控制报文并封装可选项业务功能实例1识别号为1000;
步骤五、业务功能节点1在配置的时间内接收到对方发送过来的BFD控制报文,发现识别号是1000的业务功能实例运行正常,复位定时器并保持会话活跃状态;业务功能节点2在配置的时间内接收到对方发送过来的BFD控制报文,发现识别号为2000的业务功能实例运行正常,复位定时器并保持会话活跃状态;
步骤六、业务功能节点1发生链路故障;
步骤七、业务功能节点2在配置的时间内无法接收到对方发送过来的BFD控制报文,因此,关闭会话,并通知相关应用进行SFP路径切换。
图7是根据本发明优选实施例二的基于业务功能实例1与业务功能实例2的业务功能路径进行连通性检测的示意图。如图7所示,在业务功能实例1和业务功能实例2之间建立基于BFD连通性检测的机制,并在稳定运行一段时间之后,操作员手动关闭业务功能实例2。具体可以包括以下处理步骤:
步骤一、业务功能实例1所在的业务功能节点1和业务功能实例2所在的业务功能节点2上配置BFD检测机制并且配置联动SFC;
步骤二、在包含业务功能实例1→业务功能实例2的SFP创建之后,业务功能实例1通知业务功能节点1的BFD模块请求创建会话,同时,业务功能实例2通知业务功能节点2的BFD模块也请求创建会话;
步骤三、BFD成功创建基于上述两个业务功能实例之间的会话,业务功能实例1的识别号为1000,业务功能实例2的识别号为2000,以及业务功能节点1的IP地址为192.168.1.1,业务功能节点2的IP地址为192.178.1.1;
步骤四、业务功能节点1检查业务功能实例1进程正常运行,定时周期向业务功能节点2发送BFD控制报文并封装可选项业务功能实例2的识别号为2000;业务功能节点2检查业务功能实例2进程正常运行,定时周期向业务功能节点1发送BFD控制报文并封装可选项业务功能实例1识别号为1000;
步骤五、业务功能节点1在配置的时间内接收到对方发送过来的BFD控制报文,发现识别号是1000的业务功能实例运行正常,复位定时器并保持会话活跃状态;业务功能节点2在配置的时间内接收到对方发送过来的BFD控制报文,发现识别号为2000的业务功能实例运行正常,复位定时器并保持会话活跃状态;
步骤六、操作员手动关闭业务功能实例2;
步骤七、业务功能节点2检查业务功能实例2进程被关闭,于是将BFD控制报文的状态(sta)字段设置为关闭,并发送至业务功能节点1,同时关闭会话;
步骤八、业务功能节点1在配置的时间内接收到对方发送过来的BFD控制报文,但是该报文的状态(sta)字段的值已经被设置为关闭;
步骤九、业务功能节点1关闭会话,并通知相关应用进行SFP路径切换。
图8是根据本发明实施例的故障检测装置的结构框图。如图8所示,该故障检测装置可以包括:建立模块10,用于在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建BFD会话;检测模块20,用于通过与对端业务功能节点之间的BFD控制报文交互执行连通性故障检测。
采用如图8所示的装置,解决了相关技术中缺乏一种针对业务功能链中各个业务功能实例之间的基于BFD连通性故障检测机制的问题,进而实现了在业务功能路径上的业务功能实例之间进行连通性检测。
优选地,如图9所示,检测模块20可以包括:接收单元200,用于在定时器规定的预设时长内接收来自于对端业务功能节点的BFD控制报文,其中,BFD控制报文中携带有第一业务功能实例的识别号;第一执行单元202,用于在根据识别号确定本端业务功能节点管理域内与该识别号对应的第一业务功能实例处于激活状态的情况下,保持BFD会话的开启状态并对定时器进行重置。
优选地,如图9所示,检测模块20可以包括:获取单元204,用于从BFD控制报文中获取BFD控制报文中BFD的状态字段当前为开启状态。
优选地,如图9所示,检测模块20可以包括:处理单元206,用于在定时器规定的预设时长内等待对端业务功能节点发送的BFD控制报文;第二执行单元208,用于如果在预设时长内未接收到BFD控制报文,则关闭BFD会话并执行业务功能路径切换操作,同时告知对端业务功能节点发生链路故障。
优选地,如图9所示,检测模块20可以包括:配置单元210,用于在确定本端业务功能节点管理域内的第一业务功能实例发生故障或者已经被关闭的情况下,关闭BFD会话,并对BFD控制报文进行配置,其中,将BFD控制报文中BFD的状态字段设置为关闭状态并且在BFD控制报文内封装第二业务功能实例的识别号;发送单元212,用于向对端业务功能节点发送BFD控制报文。
优选地,如图9所示,建立模块10可以包括:增加单元100,用于在本端业务功能节点管理域内增加BFD功能模块;通知单元102,用于由第一业务功能实例所在的本端业务功能节点将BFD会话创建信息通知给BFD功能模块,其中,BFD会话创建信息用于BFD功能模块创建BFD会话,BFD会话创建信息可以包括但不限于以下至少之一:第一业务功能实例的识别号、第二业务功能实例的识别号、本端业务功能节点的标识信息以及对端业务功能节点的标识信息。
从以上的描述中,可以看出,上述实施例实现了如下技术效果(需要说明的是这些效果是某些优选实施例可以达到的效果):采用本发明实施例所提供的技术方案,提供了一种SFC与BFD检测技术联动的方式,实现了在业务功能节点之间进行故障检测。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种故障检测方法,其特征在于,包括:
在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建双向转发检测BFD会话;
通过与所述对端业务功能节点之间的BFD控制报文交互执行连通性故障检测;
通过所述BFD控制报文交互执行连通性故障检测包括:
在定时器规定的预设时长内接收来自于所述对端业务功能节点的所述BFD控制报文,其中,所述BFD控制报文中携带有所述第一业务功能实例的识别号;
在根据所述识别号确定所述本端业务功能节点管理域内与该识别号对应的第一业务功能实例处于激活状态的情况下,保持所述BFD会话的开启状态并对所述定时器进行重置。
2.根据权利要求1所述的方法,其特征在于,在根据所述识别号确定所述第一业务功能实例处于所述激活状态之前,还包括:
从所述BFD控制报文获取所述BFD控制报文中BFD的状态字段当前为开启状态。
3.根据权利要求1所述的方法,其特征在于,通过所述BFD控制报文交互执行连通性故障检测包括:
在定时器规定的预设时长内等待所述对端业务功能节点发送的所述BFD控制报文;
如果在所述预设时长内未接收到所述BFD控制报文,则关闭所述BFD会话并执行业务功能路径切换操作,同时告知所述对端业务功能节点发生链路故障。
4.根据权利要求1所述的方法,其特征在于,通过所述BFD控制报文交互执行连通性故障检测包括:
在确定所述本端业务功能节点管理域内的所述第一业务功能实例发生故障或者已经被关闭的情况下,关闭所述BFD会话,并对所述BFD控制报文进行配置,其中,将所述BFD控制报文中BFD的状态字段设置为关闭状态并且在所述BFD控制报文内封装所述第二业务功能实例的识别号;
向所述对端业务功能节点发送所述BFD控制报文。
5.根据权利要求1所述的方法,其特征在于,创建所述BFD会话包括:
在所述本端业务功能节点管理域内增加BFD功能模块;
由所述第一业务功能实例所在的本端业务功能节点将BFD会话创建信息通知给所述BFD功能模块,其中,所述BFD会话创建信息用于所述BFD功能模块创建所述BFD会话,所述BFD会话创建信息包括以下至少之一:所述第一业务功能实例的识别号、所述第二业务功能实例的识别号、本端业务功能节点的标识信息以及所述对端业务功能节点的标识信息。
6.一种故障检测装置,其特征在于,包括:
建立模块,用于在本端业务功能节点管理域内的第一业务功能实例与对端业务功能节点管理域内的第二业务功能实例之间所建立的业务功能路径上创建双向转发检测BFD会话;
检测模块,用于通过与所述对端业务功能节点之间的BFD控制报文交互执行连通性故障检测;
所述检测模块包括:
接收单元,用于在定时器规定的预设时长内接收来自于所述对端业务功能节点的所述BFD控制报文,其中,所述BFD控制报文中携带有所述第一业务功能实例的识别号;
第一执行单元,用于在根据所述识别号确定所述本端业务功能节点管理域内与该识别号对应的第一业务功能实例处于激活状态的情况下,保持所述BFD会话的开启状态并对所述定时器进行重置。
7.根据权利要求6所述的装置,其特征在于,所述检测模块还包括:
获取单元,用于从所述BFD控制报文获取所述BFD控制报文中BFD的状态字段当前为开启状态。
8.根据权利要求6所述的装置,其特征在于,所述检测模块包括:
处理单元,用于在定时器规定的预设时长内等待所述对端业务功能节点发送的所述BFD控制报文;
第二执行单元,用于如果在所述预设时长内未接收到所述BFD控制报文,则关闭所述BFD会话并执行业务功能路径切换操作,同时告知所述对端业务功能节点发生链路故障。
9.根据权利要求6所述的装置,其特征在于,所述检测模块包括:
配置单元,用于在确定所述本端业务功能节点管理域内的所述第一业务功能实例发生故障或者已经被关闭的情况下,关闭所述BFD会话,并对所述BFD控制报文进行配置,其中,将所述BFD控制报文中BFD的状态字段设置为关闭状态并且在所述BFD控制报文内封装所述第二业务功能实例的识别号;
发送单元,用于向所述对端业务功能节点发送所述BFD控制报文。
10.根据权利要求6所述的装置,其特征在于,所述建立模块包括:
增加单元,用于在所述本端业务功能节点管理域内增加BFD功能模块;
通知单元,用于由所述第一业务功能实例所在的本端业务功能节点将BFD会话创建信息通知给所述BFD功能模块,其中,所述BFD会话创建信息用于所述BFD功能模块创建所述BFD会话,所述BFD会话创建信息包括以下至少之一:所述第一业务功能实例的识别号、所述第二业务功能实例的识别号、本端业务功能节点的标识信息以及所述对端业务功能节点的标识信息。
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410564306.XA CN105591768B (zh) | 2014-10-21 | 2014-10-21 | 故障检测方法及装置 |
US15/519,069 US20170244625A1 (en) | 2014-10-21 | 2014-11-24 | Method and Device for Fault Detection |
EP14894164.4A EP3211832B1 (en) | 2014-10-21 | 2014-11-24 | Fault detection method and device |
ES14894164T ES2731352T3 (es) | 2014-10-21 | 2014-11-24 | Método y dispositivo de detección de fallos |
PCT/CN2014/092067 WO2015184739A1 (zh) | 2014-10-21 | 2014-11-24 | 故障检测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410564306.XA CN105591768B (zh) | 2014-10-21 | 2014-10-21 | 故障检测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105591768A CN105591768A (zh) | 2016-05-18 |
CN105591768B true CN105591768B (zh) | 2019-11-29 |
Family
ID=54766010
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410564306.XA Expired - Fee Related CN105591768B (zh) | 2014-10-21 | 2014-10-21 | 故障检测方法及装置 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20170244625A1 (zh) |
EP (1) | EP3211832B1 (zh) |
CN (1) | CN105591768B (zh) |
ES (1) | ES2731352T3 (zh) |
WO (1) | WO2015184739A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10374922B2 (en) * | 2016-02-24 | 2019-08-06 | Cisco Technology, Inc. | In-band, health-based assessments of service function paths |
CN106130819B (zh) * | 2016-07-04 | 2019-10-25 | 锐捷网络股份有限公司 | Vtep异常的检测方法及装置 |
EP3534573A4 (en) * | 2016-10-27 | 2020-07-29 | Nec Corporation | CHAIN CONSTRUCTION DEVICE, TEST DEVICE, TEST SYSTEM, METHOD AND RECORDING MEDIUM |
US10333829B2 (en) | 2016-11-30 | 2019-06-25 | Futurewei Technologies, Inc. | Service function chaining and overlay transport loop prevention |
CN109428814B (zh) * | 2017-09-04 | 2022-12-02 | 中兴通讯股份有限公司 | 一种组播流量传输方法、相关设备和计算机可读存储介质 |
US10771312B2 (en) * | 2018-02-28 | 2020-09-08 | Zte Corporation | Failure detection in a data network |
CN110808873B (zh) * | 2019-10-21 | 2022-02-22 | 锐捷网络股份有限公司 | 一种检测链路故障的方法及装置 |
CN111934939B (zh) * | 2020-09-17 | 2021-02-02 | 北京搜狐新媒体信息技术有限公司 | 一种网络节点故障检测方法、装置及系统 |
CN112702202B (zh) * | 2020-12-23 | 2023-01-20 | 南方电网数字电网研究院有限公司 | 电表通信链路故障恢复方法、装置和计算机设备 |
CN114697373B (zh) * | 2020-12-30 | 2024-05-03 | 华为技术有限公司 | 一种用于会话保护的方法及系统 |
CN113132159B (zh) * | 2021-04-08 | 2023-04-25 | 北京马赫谷科技有限公司 | 存储集群节点故障的处理方法、设备及存储系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425942A (zh) * | 2008-12-09 | 2009-05-06 | 华为技术有限公司 | 一种实现双向转发检测的方法、装置及系统 |
CN101697626A (zh) * | 2009-10-30 | 2010-04-21 | 中兴通讯股份有限公司 | 基于双向转发检测协议的通信故障检测方法及系统 |
CN101771577A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种为双向lsp建立双向转发检测的方法、系统及设备 |
WO2014040448A1 (zh) * | 2012-09-11 | 2014-03-20 | 南京南瑞继保电气有限公司 | 静止变频器系统输出变压器变频差动保护方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8082340B2 (en) * | 2006-01-30 | 2011-12-20 | Cisco Technology, Inc. | Technique for distinguishing between link and node failure using bidirectional forwarding detection (BFD) |
US7860981B1 (en) * | 2006-09-29 | 2010-12-28 | Juniper Networks, Inc. | Systems and methods for IP session keepalive using BFD protocols |
-
2014
- 2014-10-21 CN CN201410564306.XA patent/CN105591768B/zh not_active Expired - Fee Related
- 2014-11-24 WO PCT/CN2014/092067 patent/WO2015184739A1/zh active Application Filing
- 2014-11-24 ES ES14894164T patent/ES2731352T3/es active Active
- 2014-11-24 EP EP14894164.4A patent/EP3211832B1/en not_active Not-in-force
- 2014-11-24 US US15/519,069 patent/US20170244625A1/en not_active Abandoned
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101425942A (zh) * | 2008-12-09 | 2009-05-06 | 华为技术有限公司 | 一种实现双向转发检测的方法、装置及系统 |
CN101771577A (zh) * | 2008-12-31 | 2010-07-07 | 华为技术有限公司 | 一种为双向lsp建立双向转发检测的方法、系统及设备 |
CN101697626A (zh) * | 2009-10-30 | 2010-04-21 | 中兴通讯股份有限公司 | 基于双向转发检测协议的通信故障检测方法及系统 |
WO2014040448A1 (zh) * | 2012-09-11 | 2014-03-20 | 南京南瑞继保电气有限公司 | 静止变频器系统输出变压器变频差动保护方法 |
Also Published As
Publication number | Publication date |
---|---|
US20170244625A1 (en) | 2017-08-24 |
EP3211832A4 (en) | 2017-08-30 |
ES2731352T3 (es) | 2019-11-15 |
EP3211832B1 (en) | 2019-03-20 |
EP3211832A1 (en) | 2017-08-30 |
WO2015184739A1 (zh) | 2015-12-10 |
CN105591768A (zh) | 2016-05-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105591768B (zh) | 故障检测方法及装置 | |
CN104735001B (zh) | 软件定义网络中的链路发现方法、装置及系统 | |
CN105610710B (zh) | 交换结构系统上部署的标准协议验证机制的方法和装置 | |
EP2544409B1 (en) | Generic monitoring packet handling mechanism for OpenFlow 1.1 | |
US11025537B2 (en) | Multiple RSTP domain separation | |
CN102823205B (zh) | 聚合来自接入域的数据业务 | |
CN106982149A (zh) | 基于sdn的报文镜像方法及网络流量监控管理系统 | |
EP2911355B1 (en) | Method and device for flow path negotiation in link aggregation group | |
CN105376154A (zh) | 渐进式mac地址学习 | |
CN105515816B (zh) | 检测层次信息的处理方法及装置 | |
CN105706393A (zh) | 在链路聚合组中支持操作者命令的方法和系统 | |
CN103139075B (zh) | 一种报文传输方法和设备 | |
US11601335B2 (en) | Methods and systems for neighbor-acknowledged graceful insertion/removal protocol | |
WO2014132967A1 (ja) | 通信システム、スイッチ、制御装置、制御用チャネルの構築方法及びプログラム | |
Irawati et al. | Link aggregation control protocol on software defined network | |
WO2015094040A1 (en) | Method and control node for handling data packets | |
US8953605B1 (en) | Methods and apparatus for a handshake protocol in a LAG-based multipath switch fabric for multipath OAM | |
CN105471613A (zh) | 一种临时通道的建立方法、设备和系统 | |
CN108833272A (zh) | 一种路由管理方法和装置 | |
CN106100960B (zh) | 跨存储区域网络Fabric互通的方法、装置及系统 | |
WO2015154423A1 (zh) | 跨域业务处理方法、装置及系统 | |
US9479439B1 (en) | Methods and apparatus for load balancing VLAN traffic | |
CN105519058B (zh) | 控制器、服务节点和数据包转发方法 | |
CN105577579A (zh) | 业务功能链中协议报文的处理方法、系统及业务功能节点 | |
JP5733473B2 (ja) | インターワーク装置、方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20191129 Termination date: 20201021 |
|
CF01 | Termination of patent right due to non-payment of annual fee |