CN102035676A - 基于arp协议交互的链路故障检测与恢复的方法和设备 - Google Patents

基于arp协议交互的链路故障检测与恢复的方法和设备 Download PDF

Info

Publication number
CN102035676A
CN102035676A CN2010105769093A CN201010576909A CN102035676A CN 102035676 A CN102035676 A CN 102035676A CN 2010105769093 A CN2010105769093 A CN 2010105769093A CN 201010576909 A CN201010576909 A CN 201010576909A CN 102035676 A CN102035676 A CN 102035676A
Authority
CN
China
Prior art keywords
arp
alive
keep
module
route
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2010105769093A
Other languages
English (en)
Other versions
CN102035676B (zh
Inventor
于立元
吴小祥
刘冬梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN201010576909.3A priority Critical patent/CN102035676B/zh
Priority to EP11847498.0A priority patent/EP2642691A4/en
Priority to US13/991,805 priority patent/US9276898B2/en
Priority to PCT/CN2011/071082 priority patent/WO2012075731A1/zh
Publication of CN102035676A publication Critical patent/CN102035676A/zh
Application granted granted Critical
Publication of CN102035676B publication Critical patent/CN102035676B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/09Mapping addresses
    • H04L61/10Mapping addresses of different types
    • H04L61/103Mapping addresses of different types across network layers, e.g. resolution of network layer into physical layer addresses or address resolution protocol [ARP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0805Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
    • H04L43/0811Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/10Active monitoring, e.g. heartbeat, ping or trace-route
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/22Alternate routing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L45/00Routing or path finding of packets in data switching networks
    • H04L45/28Routing or path finding of packets in data switching networks using route fault recovery
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2101/00Indexing scheme associated with group H04L61/00
    • H04L2101/60Types of network addresses
    • H04L2101/618Details of network addresses
    • H04L2101/622Layer-2 addresses, e.g. medium access control [MAC] addresses
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L61/00Network arrangements, protocols or services for addressing or naming
    • H04L61/58Caching of addresses or names

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Cardiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明涉及一种基于ARP协议交互的链路故障检测与恢复的方法和设备。该方法包括:为本端与对端的网络设备配置IP地址和掩码、策略路由或静态路由模块、ARP模块;策略路由或静态路由模块,定时查询下一跳对应的地址解析协议(ARP)条目是否存在,若存在,则链路可用;反之,则通知ARP模块对下一跳保活;ARP模块进行下一跳保活处理,并在对下一跳保活后,通知策略路由或静态路由模块,判断链路是否可用。本发明方法和设备,解决了应用策略路由、静态路由后无法进行链路检测或开启BFD检测后,导致配置复杂、系统开销大的问题。

Description

基于ARP协议交互的链路故障检测与恢复的方法和设备
技术领域
本发明涉及数据通讯领域,尤其涉及一种基于地址解析协议即ARP协议交互的链路故障检测与恢复的方法和设备。
背景技术
静态路由是指由网络管理员手工配置的路由信息。当网络的拓扑结构或链路的状态发生变化时,网络管理员需要手工去修改路由表中相关的静态路由信息。静态路由信息在缺省情况下是私有的,不会传递给其他的路由器。当然,网管员也可以通过对路由器进行设置使之成为共享的。
策略路由是一种比基于目标网络进行路由更加灵活的数据包路由转发机制,应用了策略路由,路由器将通过路由图决定如何对需要路由的数据包进行处理,路由图决定了一个数据包的下一跳转发路由器。应用策略路由,必须要指定策略路由使用的路由图,并且要创建路由图。一个路由图由很多条策略组成,每个策略都定义了1个或多个的匹配规则和对应操作。一个接口应用策略路由后,将对该接口接收到的所有包进行检查,不符合路由图任何策略的数据包将按照通常的路由转发进行处理,符合路由图中某个策略的数据包就按照该策略中定义的操作进行处理。
ECMP(Equal-CostMultipathRouting,等价多路径),存在多条不同链路到达同一目的地址的网络环境中,如果使用传统的路由技术,发往该目的地址的数据包只能利用其中的一条链路,其它链路处于备份状态或无效状态,并且在动态路由环境下相互的切换需要一定时间,而等价或等值多路径路由协议可以在该网络环境下同时使用多条链路,不仅增加了传输带宽,并且可以无时延无丢包地备份失效链路的数据传输。ECMP最大的特点是实现了等价或等值情况下,多路径负载均衡和链路备份的目的,策略路由和静态路由基本上都支持ECMP功能。
ARP(Address Resolution Protocol,地址解析协议),即把机器的Intemet地址转换成物理地址。IP数据包在互联网中传播时要通过一个个物理网络,并且,IP数据包到目的网络时要通过最后一个物理网络把数据包送给目的主机,而数据通过物理网络时需要机器的物理地址,数据报传输使用的是机器的IP地址,因此,要有一种机制来把机器的IP地址转换成物理地址。
静态路由和策略路由都是基于配置的,不会主动发送报文,理论上当路由出接口(链路对应的本端的物理端口)从down到up后就可以使用此条链路。然而实际上路由出接口up并不代表链路可用:
比如,在本端和对端使用一层或二层设备连接时,利用路由出接口状态检测下一跳是否可用的方法,就无法检测下一跳的连通性,当路由出接口up而链路异常时,ECMP就使用此链路,会导致选择此链路的流量全部被丢弃。另外,路由出接口up、链路正常,但是未能立刻学习到对端的转发信息(如:ARP),也会导致在学习到转发信息前的这段时间内发送的流量丢失。
这就需要用一种基于IP报文能够检测链路状态的协议来检测物理链路的状态并能够和静态路由、策略路由联动,CN200710187500.0(基于双向转发链路进行故障检测与链路恢复方法)提供了一种基于BFD(BidirectionalForwarding Detection,双向转发检测)检测物理链路的方法。BFD支持快速检测链路状态,报文发送间隔最小3.3ms,在快速故障检测方面有天然的优势。在故障恢复方面,BFD发送单播IP报文触发ARP学习,保证了BFD检测链路故障恢复时,流量能够在链路正常转发。
但是,使用BFD检测链路状态也有一些缺点:需要配置检测参数,配置检测参数必须和路由的下一跳一致,多个下一跳要对应多个BFD检测;需要周期发送BFD报文,检测时间越短占用的系统开销越大。
发明内容
本发明要解决的技术问题是提供一种基于ARP协议交互的链路故障检测与恢复的方法和设备,解决了应用策略路由、静态路由后无法进行链路检测或开启BFD检测后,导致配置复杂、系统开销大的问题。
为解决以上技术问题,本发明提供了一种基于ARP协议交互的链路故障检测与恢复的方法,该方法包括:
为本端与对端的网络设备配置IP地址和掩码、策略路由或静态路由模块、ARP模块;
策略路由或静态路由模块,定时查询下一跳对应的地址解析协议(ARP)条目是否存在,若存在,则链路可用;反之,则通知ARP模块对下一跳保活;
ARP模块进行下一跳保活处理,并在对下一跳保活后,通知策略路由或静态路由模块,判断链路是否可用。
进一步地,策略路由或静态路由模,以轮询的方式对配置的路由条目的下一跳进行扫描。
进一步地,每次扫描的个数≤100。
进一步地,所述ARP模块进行下一跳保活处理的步骤包括:所述ARP模块判断需要保活的下一跳对应的ARP条目是否存在,若所述ARP条目存在,则正常返回,若不存在,生成对应的不可用waiting条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目。
进一步地,所述ARP模块对下一跳保活,所依据的老化时间和老化报文发送间隔的获取方法是:
选择所述策略路由或静态路由模块,通知所述ARP模块对下一跳保活时,携带的老化时间和老化报文发送间隔或路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔或上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔。
进一步地,所述ARP模块老化时间超时后,发送单播ARP请求报文,若收到ARP应答,更新动态ARP条目,若未收到ARP应答,间隔3秒再次发送单播ARP请求报文,发送三次未收到ARP应答报文,则删除动态ARP。
为解决以上技术问题,本发明提供了一种基于ARP协议交互的链路故障检测与恢复的设备,该设备包括:
配置装置,用于为本端与对端的网络设备配置IP地址和掩码;
策略路由或静态路由装置,用于定时查询下一跳对应的地址解析协议(ARP)条目是否存在,若存在,则链路可用;反之,则通知ARP装置对下一跳保活;
ARP装置,用于对下一跳进行保活处理,并在对下一跳保活后,通知策略路由或静态路由装置,判断链路是否可用。
进一步地,策略路由或静态路由装置,以轮询的方式对配置的路由条目的下一跳进行扫描,每次扫描的个数≤100。
进一步地,所述ARP装置对下一跳进行保活处理时,先判断需要保活的下一跳对应的ARP条目是否存在,若所述ARP条目存在,则正常返回,若不存在,再生成对应的不可用waiting条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目。
进一步地,所述ARP装置,对下一跳保活,所依据的老化时间和老化报文发送间隔的获取方法是:
所述策略路由或静态路由装置,通知ARP装置对下一跳保活时,携带的老化时间和老化报文发送间隔或路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔或上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔。
进一步地,所述ARP装置,在老化时间超时后,发送单播ARP请求报文,若收到ARP应答,更新动态ARP条目,若未收到ARP应答,间隔3秒再次发送单播ARP请求报文,发送三次未收到ARP应答报文,则删除动态ARP。
与现有技术相比,采用本发明方法,克服了现有技术中应用策略路由、静态路由后无法进行链路检测或开启BFD检测后导致配置复杂、系统开销大的问题,提出一种基于ARP协议交互的链路故障检测与恢复的方法,实现路由保活的目的。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是本发明应用环境的组网示意图;
图2是应用本发明的设备结构图;
图3是应用本发明的路由保活机制流程图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,以下结合附图对本发明进行进一步详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
本发明实施例中的技术方案如下:
一种基于ARP协议交互的链路故障检测与恢复的方法,包括:
为本端与对端的网络设备配置IP地址和掩码、策略路由或静态路由模块、ARP模块;
策略路由或静态路由模块,定时查询下一跳对应的地址解析协议ARP条目是否存在,若存在,则链路可用;反之,则通知ARP模块对下一跳保活;
ARP模块进行下一跳保活处理,并在对下一跳保活后,通知策略路由或静态路由模块,判断链路是否可用。
进一步地,策略路由或静态路由模,以轮询的方式对配置的路由条目的下一跳进行扫描。
进一步地,每次扫描的个数≤100。
进一步地,所述ARP模块进行下一跳保活处理的步骤包括:所述ARP模块判断需要保活的下一跳对应的ARP条目是否存在,若所述ARP条目存在,则正常返回,若不存在,生成对应的不可用waiting条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目。
进一步地,ARP模块对下一跳保活,所依据的老化时间和老化报文发送间隔的获取方法是:
选择所述策略路由或静态路由模块,通知所述ARP模块对下一跳保活时,携带的老化时间和老化报文发送间隔或路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔或上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔。
进一步地,ARP模块老化时间超时后,发送单播ARP请求报文,若收到ARP应答,更新动态ARP条目,若未收到ARP应答,间隔3秒再次发送单播ARP请求报文,发送三次未收到ARP应答报文,则删除动态ARP。
本发明实施例还提供了一种设备,技术方案如下:
配置装置,用于为本端与对端的网络设备配置IP地址和掩码;
策略路由或静态路由装置,用于定时查询下一跳对应的地址解析协议ARP条目是否存在,若存在,则链路可用;反之,则通知ARP装置对下一跳保活;
ARP装置,用于对下一跳进行保活处理,并在对下一跳保活后,通知策略路由或静态路由装置,判断链路是否可用。
进一步地,策略路由或静态路由装置,以轮询的方式对配置的路由条目的下一跳进行扫描,每次扫描的个数≤100。
进一步地,ARP装置对下一跳进行保活处理时,先判断需要保活的下一跳对应的ARP条目是否存在,若所述ARP条目存在,则正常返回,若不存在,再生成对应的不可用waiting条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目。
进一步地,ARP装置,对下一跳保活,所依据的老化时间和老化报文发送间隔的获取方法是:
所述策略路由或静态路由装置,通知所述ARP装置对下一跳保活时,携带的老化时间和老化报文发送间隔或路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔或上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔。
进一步地,所述ARP装置,在老化时间超时后,发送单播ARP请求报文,若收到ARP应答,更新动态ARP条目,若未收到ARP应答,间隔3秒再次发送单播ARP请求报文,发送三次未收到ARP应答报文,则删除动态ARP。
为了实现上述发明目的,本发明具体的技术方案如下:
为本端和对端的网络设备三层接口配置IP地址和掩码;
为本端和对端的网络设备配置策略路由或静态路由,下一跳是直连对端设备的三层口的IP地址或开启ARP代理功能;
策略路由或静态路由模块开启定时器定时查询下一跳对应的可用ARP条目是否存在,如果可用ARP条目存在,则认为链路可用,如果可用ARP条目不存在,则认为链路不可用并通知ARP模块对下一跳保活;
通过ARP报文交互,ARP模块生成、更新、删除可用的ARP条目后,立即回调通知策略路由或静态路由模块判断链路是否可用。
具体实现如下:
本端和对端的网络设备之间不能用三层设备连接,只能用一层或二层设备连接;
可以在三层接口上配置多个IP地址和掩码,网段不能冲突;
生成三层接口IP地址和掩码对应的直连路由;
生成三层接口IP地址对应的固有ARP。
策略路由或静态路由的下一跳是直连对端设备三层口的IP地址时,以对端三层口的IP地址为目的IP发送ARP请求,对端直接回应,不用开启ARP代理;
策略路由或静态路由的下一跳不是直连对端设备三层口的IP地址,对端必须开启ARP代理功能,才会回应ARP应答报文;
生成三层接口IP地址对应的固有ARP。
策略路由或静态路由模块在初始化后就开启周期定时器;
策略路由或静态路由模块以轮询的方式对配置的路由条目的下一跳进行扫描,每次扫描的个数固定,个数范围可调节,但是个数不宜大于100个;
判断下一跳对应的可用ARP条目是否存在,如果可用ARP条目存在,则认为下一跳对应的链路可用,否则不可用;
策略路由或静态路由模块通知ARP模块对下一跳保活,ARP模块判断需要保活的下一跳对应的可用ARP条目是否存在,如果可用ARP条目存在,则正常返回,如果可用ARP条目不存在,生成对应的waiting(不可用)条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目,具体实现复用ARP老化流程;
尽量不要静态配置下一跳对应的ARP条目,因为静态ARP条目也属于可用的ARP条目,静态ARP条目的优先级高于动态ARP条目的优先级,链路正常时,学习到的动态ARP条目不会覆盖静态ARP条目,链路异常时,静态ARP条目不会删除,可用的ARP条目仍然存在,这样就实现不了基于ARP协议交互的链路故障检测与恢复。
ARP模块生成、更新、删除可用的ARP条目后,使用回调函数机制通知注册的业务模块,提高了功能的扩展性;
ARP模块生成、更新、删除可用的ARP条目后,立即回调通知策略路由或静态路由模块处理,避免了路由条目过多时,轮询时间过长,不能及时得到响应;
ARP模块对下一跳保活生成的动态ARP条目设置路由保活属性,我们称之为路由保活条目,路由保活条目的老化时间范围在1秒-65535秒之间,路由保活条目的老化报文发送间隔,范围在1秒-30秒之间,如果配置的老化时间和老化报文发送间隔在秒级,检测链路down的时间也就是秒级;
路由保活条目的老化时间和老化报文发送间隔获取方法是:首先,优先选择在路由通知ARP模块对下一跳保活时路由模块带下来的老化时间和老化报文发送间隔,其次,路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔,最后,上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔;
ARP模块生成路由保活条目后,默认情况下按照三层接口配置的普通老化时间老化,老化时间超时后,发送单播ARP请求报文,如果收到ARP应答,更新动态ARP条目,如果未收到ARP应答,间隔3秒再次发送单播ARP请求报文,最多发送三次,发送三次未收到ARP应答报文,删除动态ARP;
ARP模块在初始化后就开启老化周期定时器;
ARP模块以轮询的方式对路由保活ARP条目进行扫描,每次扫描的个数固定,个数范围可调节,但是个数不宜大于100个。
图1是本发明基于ARP协议交互的链路故障检测与恢复应用组网示意图,如图所示:路由器1上的千兆1/1、千兆1/2和路由器2上的千兆1/1、千兆1/2分别相连。路由器1和路由器2之间的数据流同时经过链路1和链路2按照负荷分担模式进行接收和转发,一部分流量从上面的路径(链路1)转发;一部分流量从下面的路径(链路2)转发。当链路1(或链路2)发生故障时,ECMP重新计算负荷分担,流量从链路2(或链路1)转发;当链路1(或链路2)故障恢复时,ECMP重新计算负荷分担,流量从链路1和链路2转发,这样就有效地实现了ECMP链路冗余保护。
通过ARP请求和应答报文是否能够交互判断链路是否发生故障、是否故障恢复。从网络OSI分层层次来看,这种检测可以检测路由器1的网路层到链路层再到物理层,路由器2的物理层到链路层再到网络层的连通性,反之亦然。从实际应用角度看,这种检测可以检测路由器的直连三层接口的IP地址配置是否正确、路由配置是否正确、设备的协议层面是否正常运行、转发层面是否正常运行、路由器1和路由器2之间连接两台设备的物理链路连接是否正常。静态路由和策略路由支持ECMP功能的场景只是应用通过ARP请求和应答报文是否能够正常交互判断链路是否发生故障、是否故障恢复的方法的一种场景,实际应用时,可以根据具体组网灵活应用ARP检测链路的方法。
图2是本发明基于ARP协议交互的链路故障检测与恢复功能的设备结构图,包括:
步骤201,配置装置,用于根据组网配置必须的配置参数和满足组网性能的性能参数,配置装置包括:
配置三层接口IP地址和掩码;
配置ARP功能;
配置策略路由或静态路由老化时间和老化报文发送间隔;
配置三层接口下路由保活属性条目老化时间和老化报文发送间隔;
三层接口下配置的普通动态条目老化时间和老化报文发送间隔;
实际上使用默认的路由保活属性条目老化时间和老化报文发送间隔配置,完全能够满足大部分组网需求,此时就不用为此功能新增任何参数配置。
步骤202,定时器装置,用于按照设定的定时器时间定时通知策略路由模块、静态路由模块、ARP模块;
定时器装置包括:
策略路由或静态路由定时器,负责定时查询下一跳对应的可用ARP条目是否存在,进而判断下一跳是否可用;
ARP定时器负责定时通知老化装置。
步骤203,发送、接收处理装置,用于封装和解析ARP报文协议数据部分的硬件地址类型、软件地址类型、硬件地址长度、软件地址长度、操作类型、源MAC、源IP、目的MAC、目的IP和ARP报文二层头的目的MAC、源MAC、协议类型,用于把ARP报文发送到网络中或从网络接收并处理;
步骤204,老化装置,用于遍历ARP条目,针对单个动态ARP定时发送ARP请求,收到对端的ARP应答后更新动态ARP条目,发送三次仍未收到ARP应答后,删除动态ARP条目;
老化装置包括:
老化时间定时器超时后,以轮询的方式对路由保活ARP条目进行扫描,每次扫描的个数固定,个数范围可调节,但是个数不宜大于100个。
路由保活ARP条目老化时间超时后,以策略路由或静态路由的路由保活下一跳为目的IP发送单播ARP请求报文;
收到ARP应答,更新动态ARP条目;
未收到ARP应答,间隔3秒再次发送单播ARP请求报文,最多发送三次;
发送三次未收到ARP应答报文,删除动态ARP。
步骤205,模块交互装置,用于策略路由或静态路由模块通知ARP模块对下一跳保活和ARP模块通知策略路由或静态路由模块判断链路是否可用;
模块交互装置包括:
策略路由或静态路由模块查询下一跳对应的可用ARP条目是否存在;
可用ARP条目不存在,通知ARP模块对下一跳保活;
ARP模块生成、更新、删除可用的ARP条目后,回调通知策略路由或静态路由模块判断链路是否可用。
步骤206,表项管理装置,用于提供ARP条目生成、更新、删除、查询及ARP路由保活属性管理。
图3是本发明基于ARP协议交互的链路故障检测与恢复功能的路由保活机制流程图,包括:
步骤301,路由下一跳保活,用于指定需要保活的下一跳;
步骤302,路由下一跳保活定时器,用于定时超时触发查询需要保活的下一跳对应的路由保活ARP条目是否存在并可用,不存在或不可用就停止流量发送并通知ARP模块,存在并可用就可以使用此链路发送、接收流量;
步骤303,针对三层接口下的下一跳保活,用于ARP模块获取路由模块通知的需要保活的下一跳、三层出接口、老化参数;
步骤304,判断路由保活ARP条目是否存在,如果不存在转步骤S305,如果存在转步骤S308;
步骤305,生成路由保活属性的waiting(不可用)状态的ARP条目并使用需要保活的下一跳作为目的IP发送广播ARP请求;
步骤306,判断是否收到对端的ARP应答,如果未收到ARP应答转结束,如果收到ARP应答转步骤S307;
步骤307,生成ARP和MAC表项(三层交换机上需要生成MAC表项,路由器上不需要生成MAC表项),直连的两台设备的二三层转发表项路由、ARP、MAC均存在,物理链路也正常连接,流量可以正常转发;
步骤308,需要路由保活的下一跳对应的ARP条目存在,设置路由保活属性(当需要删除路由保活下一跳对应的ARP条目时,直接清除路由保活属性即可,动态ARP条目会自动老化删除);
步骤309,ARP老化定时器,用于触发ARP老化,遍历可用的ARP条目,针对每个条目判断老化参数配置是否满足老化条件,满足老化条件,开始老化,不满足,跳过;
步骤310,判断ARP条目对应的MAC是否存在,如果不存在,转步骤S315,如果存在,转步骤S311;
步骤311,由于此时的ARP条目的目的MAC已知,所以只需要发送单播的ARP请求,不需要发送广播的ARP请求,减小网路负担。
步骤312,判断是否收到对端的ARP应答,如果未收到ARP应答并且老化三次,转步骤S314,如果收到ARP应答转步骤S313;
步骤313,更新ARP和MAC表项;
步骤314,老化三次未收到ARP应答,删除动态ARP条目
步骤315,快速老化不关心当前动态ARP条目的ARP老化时间是否超时,立刻发送ARP请求报文,开始老化;
步骤316,ARP模块生成、更新、删除可用的ARP条目后,立即回调通知策略路由或静态路由模块处理。
综上所述,本发明在基于ARP协议交互基础上,复用并改进ARP老化流程,通过路由保活机制实现路由保活的目的,解决了现有技术中应用策略路由、静态路由后无法进行链路检测或开启BFD检测后导致配置复杂、系统开销大的问题。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。
当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (11)

1.一种基于ARP协议交互的链路故障检测与恢复的方法,其特征在于,该方法包括:
为本端与对端的网络设备配置IP地址和掩码、策略路由或静态路由模块、ARP模块;
策略路由或静态路由模块,定时查询下一跳对应的地址解析协议(ARP)条目是否存在,若存在,则链路可用;反之,则通知ARP模块对下一跳保活;
ARP模块进行下一跳保活处理,并在对下一跳保活后,通知策略路由或静态路由模块,判断链路是否可用。
2.如权利要求1所述的方法,其特征在于:策略路由或静态路由模,以轮询的方式对配置的路由条目的下一跳进行扫描。
3.如权利要求2所述的方法,其特征在于:每次扫描的个数≤100。
4.如权利要求1所述的方法,其特征在于:所述ARP模块进行下一跳保活处理的步骤包括:所述ARP模块判断需要保活的下一跳对应的ARP条目是否存在,若所述ARP条目存在,则正常返回,若不存在,生成对应的不可用waiting条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目。
5.如权利要求1所述的方法,其特征在于:所述ARP模块对下一跳保活,所依据的老化时间和老化报文发送间隔的获取方法是:
选择所述策略路由或静态路由模块,通知所述ARP模块对下一跳保活时,携带的老化时间和老化报文发送间隔或路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔或上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔。
6.如权利要求5所述的方法,其特征在于:所述ARP模块老化时间超时后,发送单播ARP请求报文,若收到ARP应答,更新动态ARP条目,若未收到ARP应答,间隔3秒再次发送单播ARP请求报文,发送三次未收到ARP应答报文,则删除动态ARP。
7.一种基于ARP协议交互的链路故障检测与恢复的设备,其特征在于,该设备包括:
配置装置,用于为本端与对端的网络设备配置IP地址和掩码;
策略路由或静态路由装置,用于定时查询下一跳对应的地址解析协议(ARP)条目是否存在,若存在,则链路可用;反之,则通知ARP装置对下一跳保活;
ARP装置,用于对下一跳进行保活处理,并在对下一跳保活后,通知策略路由或静态路由装置,判断链路是否可用。
8.如权利要求7所述的设备,其特征在于:策略路由或静态路由装置,以轮询的方式对配置的路由条目的下一跳进行扫描,每次扫描的个数≤100。
9.如权利要求7所述的设备,其特征在于:所述ARP装置对下一跳进行保活处理时,先判断需要保活的下一跳对应的ARP条目是否存在,若所述ARP条目存在,则正常返回,若不存在,再生成对应的不可用waiting条目并使用需要保活的下一跳作为目的IP发送ARP请求,收到对端的ARP应答后更新为可用的动态ARP条目。
10.如权利要求7所述的设备,其特征在于:所述ARP装置,对下一跳保活,所依据的老化时间和老化报文发送间隔的获取方法是:
所述策略路由或静态路由装置,通知ARP装置对下一跳保活时,携带的老化时间和老化报文发送间隔或路由模块未设置参数时,选择三层接口下配置的路由保活属性条目老化时间和老化报文发送间隔或上述两种情况均不能获取时,选择三层接口下配置的普通动态条目老化时间和老化报文发送间隔。
11.如权利要求10所述的设备,其特征在于:所述ARP装置,在老化时间超时后,发送单播ARP请求报文,若收到ARP应答,更新动态ARP条目,若未收到ARP应答,间隔3秒再次发送单播ARP请求报文,发送三次未收到ARP应答报文,则删除动态ARP。
CN201010576909.3A 2010-12-07 2010-12-07 基于arp协议交互的链路故障检测与恢复的方法和设备 Active CN102035676B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN201010576909.3A CN102035676B (zh) 2010-12-07 2010-12-07 基于arp协议交互的链路故障检测与恢复的方法和设备
EP11847498.0A EP2642691A4 (en) 2010-12-07 2011-02-18 Method and device for link fault detecting and recovering based on arp interaction
US13/991,805 US9276898B2 (en) 2010-12-07 2011-02-18 Method and device for link fault detecting and recovering based on ARP interaction
PCT/CN2011/071082 WO2012075731A1 (zh) 2010-12-07 2011-02-18 基于arp交互的链路故障检测与恢复的方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010576909.3A CN102035676B (zh) 2010-12-07 2010-12-07 基于arp协议交互的链路故障检测与恢复的方法和设备

Publications (2)

Publication Number Publication Date
CN102035676A true CN102035676A (zh) 2011-04-27
CN102035676B CN102035676B (zh) 2014-08-13

Family

ID=43888043

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010576909.3A Active CN102035676B (zh) 2010-12-07 2010-12-07 基于arp协议交互的链路故障检测与恢复的方法和设备

Country Status (4)

Country Link
US (1) US9276898B2 (zh)
EP (1) EP2642691A4 (zh)
CN (1) CN102035676B (zh)
WO (1) WO2012075731A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801612A (zh) * 2012-07-06 2012-11-28 武汉虹信通信技术有限责任公司 一种更新交换芯片上主机路由信息的改进方法及系统
CN102801614A (zh) * 2012-07-17 2012-11-28 杭州华三通信技术有限公司 一种等价路由的收敛方法和网络设备
CN102904818A (zh) * 2012-09-27 2013-01-30 北京星网锐捷网络技术有限公司 一种arp信息表项更新方法及装置
CN103117930A (zh) * 2013-02-07 2013-05-22 华为技术有限公司 静态路由配置的检测方法和装置
CN103490969A (zh) * 2013-09-17 2014-01-01 烽火通信科技股份有限公司 实现vpws冗余保护快速收敛的系统及方法
JP2015050560A (ja) * 2013-08-30 2015-03-16 Kddi株式会社 通信装置、通信方法および通信プログラム
CN106713145A (zh) * 2015-07-28 2017-05-24 中兴通讯股份有限公司 一种实现链路状态报文刷新的方法及装置
CN108289044A (zh) * 2017-01-10 2018-07-17 阿里巴巴集团控股有限公司 数据转发方法、确定静态路由的链路状态方法及网络设备
CN109218177A (zh) * 2017-07-03 2019-01-15 中兴通讯股份有限公司 域外链路检测方法及装置、存储介质和计算机设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103905268B (zh) * 2012-12-28 2017-08-29 华为技术有限公司 Gre链路检测方法、主控板、装置及通信防护系统
US20150350043A1 (en) * 2013-01-23 2015-12-03 Telefonaktiebolaget L M Ericsson (Publ) Methods and arrangements for checking connectivity and detecting connectivity failure
KR102137097B1 (ko) 2014-08-21 2020-07-23 삼성전자주식회사 소모 전류 저감 방법 및 이를 지원하는 전자 장치
CN108123875B (zh) * 2016-11-29 2021-11-05 中兴通讯股份有限公司 一种双向转发检测方法及装置
CN109617905B (zh) * 2018-12-29 2022-04-08 新华三技术有限公司 多播攻击的处理方法、装置和实现装置
US10938772B2 (en) 2019-02-25 2021-03-02 Ambit Microsystems (Shanghai) Ltd. Access device for analysis of physical links and method thereof
CN110912760B (zh) * 2019-12-30 2022-11-01 杭州迪普科技股份有限公司 链路状态检测方法和装置
US11140122B1 (en) * 2021-01-19 2021-10-05 Charter Communications Operating. LLC Centralized layer 1 to layer 2 mapping engine
CN113364678B (zh) * 2021-06-18 2023-01-10 北京奇艺世纪科技有限公司 数据传输系统、方法、装置、电子设备和计算机可读介质
CN113259706B (zh) * 2021-06-28 2022-06-17 北京新唐思创教育科技有限公司 直播处理方法、装置、电子设备以及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070147395A1 (en) * 2003-12-19 2007-06-28 Huawei Technologies Co., Ltd. Method for selecting egresses of a multi-isp local area network
CN101026567A (zh) * 2007-01-29 2007-08-29 华为技术有限公司 地址转发表项的保活方法及系统
CN101030890A (zh) * 2007-04-10 2007-09-05 杭州华为三康技术有限公司 一种灵活组网的方法以及相关路由设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6304546B1 (en) * 1996-12-19 2001-10-16 Cisco Technology, Inc. End-to-end bidirectional keep-alive using virtual circuits
US7430164B2 (en) * 1998-05-04 2008-09-30 Hewlett-Packard Development Company, L.P. Path recovery on failure in load balancing switch protocols
US7007101B1 (en) * 2001-11-09 2006-02-28 Radisys Microware Communications Software Division, Inc. Routing and forwarding table management for network processor architectures
KR20030096692A (ko) * 2002-06-17 2003-12-31 주식회사 케이티 서브넷에서의 링크 장애 제어 장치 및 방법
US7415028B1 (en) * 2003-02-11 2008-08-19 Network Equipment Technologies, Inc. Method and system for optimizing routing table changes due to ARP cache invalidation in routers with split plane architecture
KR100652964B1 (ko) * 2005-08-25 2006-12-01 삼성전자주식회사 듀얼스택 네트워크 기기 및 그 브로드캐스트 방법
WO2007088358A1 (en) * 2006-02-03 2007-08-09 British Telecommunications Public Limited Company Method of operating a network
EP1892883A1 (en) * 2006-08-23 2008-02-27 Thomson Telecom Belgium Method and device for identifying and selecting an interface to access a network
US8055759B2 (en) 2006-09-18 2011-11-08 Tropos Networks, Inc. Determination of link qualities between an access point and a plurality of clients
US20100039956A1 (en) * 2007-05-21 2010-02-18 Huawei Technologies Co., Ltd. Method and system for performing keep-alive monitoring on subscriber sessions
CN101170459B (zh) 2007-11-28 2010-07-14 中兴通讯股份有限公司 基于双向转发链路进行故障检测与链路恢复的方法
CN101695036B (zh) * 2009-11-05 2012-04-18 杭州华三通信技术有限公司 一种irf链路的检测方法及装置
CN101771618B (zh) 2010-03-11 2014-04-09 中兴通讯股份有限公司 一种分组传送网络接入环中主机路由可达的方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070147395A1 (en) * 2003-12-19 2007-06-28 Huawei Technologies Co., Ltd. Method for selecting egresses of a multi-isp local area network
CN101026567A (zh) * 2007-01-29 2007-08-29 华为技术有限公司 地址转发表项的保活方法及系统
CN101030890A (zh) * 2007-04-10 2007-09-05 杭州华为三康技术有限公司 一种灵活组网的方法以及相关路由设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
19970331 S. Alexander et al DHCP Options and BOOTP Vendor Extensions , *
S. ALEXANDER ET AL: "DHCP Options and BOOTP Vendor Extensions", <IETF RFC 2132> *

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102801612B (zh) * 2012-07-06 2015-04-22 武汉虹信通信技术有限责任公司 一种更新交换芯片上主机路由信息的改进方法及系统
CN102801612A (zh) * 2012-07-06 2012-11-28 武汉虹信通信技术有限责任公司 一种更新交换芯片上主机路由信息的改进方法及系统
CN102801614B (zh) * 2012-07-17 2016-04-27 杭州华三通信技术有限公司 一种等价路由的收敛方法和网络设备
CN102801614A (zh) * 2012-07-17 2012-11-28 杭州华三通信技术有限公司 一种等价路由的收敛方法和网络设备
CN102904818A (zh) * 2012-09-27 2013-01-30 北京星网锐捷网络技术有限公司 一种arp信息表项更新方法及装置
CN102904818B (zh) * 2012-09-27 2015-11-25 北京星网锐捷网络技术有限公司 一种arp信息表项更新方法及装置
CN103117930A (zh) * 2013-02-07 2013-05-22 华为技术有限公司 静态路由配置的检测方法和装置
CN103117930B (zh) * 2013-02-07 2016-01-27 华为技术有限公司 静态路由配置的检测方法和装置
JP2015050560A (ja) * 2013-08-30 2015-03-16 Kddi株式会社 通信装置、通信方法および通信プログラム
CN103490969A (zh) * 2013-09-17 2014-01-01 烽火通信科技股份有限公司 实现vpws冗余保护快速收敛的系统及方法
CN103490969B (zh) * 2013-09-17 2016-07-06 烽火通信科技股份有限公司 实现vpws冗余保护快速收敛的系统及方法
CN106713145A (zh) * 2015-07-28 2017-05-24 中兴通讯股份有限公司 一种实现链路状态报文刷新的方法及装置
CN108289044A (zh) * 2017-01-10 2018-07-17 阿里巴巴集团控股有限公司 数据转发方法、确定静态路由的链路状态方法及网络设备
CN108289044B (zh) * 2017-01-10 2021-10-15 阿里巴巴集团控股有限公司 数据转发方法、确定静态路由的链路状态方法及网络设备
CN109218177A (zh) * 2017-07-03 2019-01-15 中兴通讯股份有限公司 域外链路检测方法及装置、存储介质和计算机设备

Also Published As

Publication number Publication date
WO2012075731A1 (zh) 2012-06-14
US9276898B2 (en) 2016-03-01
EP2642691A4 (en) 2018-01-24
CN102035676B (zh) 2014-08-13
US20130272111A1 (en) 2013-10-17
EP2642691A1 (en) 2013-09-25

Similar Documents

Publication Publication Date Title
CN102035676B (zh) 基于arp协议交互的链路故障检测与恢复的方法和设备
CN101170459B (zh) 基于双向转发链路进行故障检测与链路恢复的方法
CN102148677B (zh) 一种更新地址解析协议表项的方法及核心交换机
EP2533475B1 (en) Method and system for host route reachability in packet transport network access ring
US9100266B2 (en) SoftRouter protocol failovers
EP3373547B1 (en) Method for realizing disaster tolerance backup
CN100450039C (zh) 快速收敛端到端业务的方法和装置
CN101860492A (zh) 快速切换的方法、装置和系统
US20080225699A1 (en) Router and method of supporting nonstop packet forwarding on system redundant network
CN101164307A (zh) 主备网关设备状态切换后业务恢复的方法及网关设备
JP5764820B2 (ja) 伝送システムおよび伝送システムの制御方法
CN102638389A (zh) 一种trill网络的冗余备份方法及系统
US20080101362A1 (en) Method and device for making uplink standby
CN101072154B (zh) 以太环网切换方法
CN105162704A (zh) Overlay网络中组播复制的方法及装置
CN101060533B (zh) 一种提高vgmp协议可靠性的方法、系统及装置
CN102291455A (zh) 分布式集群处理系统及其报文处理方法
CN101562576B (zh) 一种路由发布方法和设备
CN102255757A (zh) 一种链路切换方法及其装置
CN102413031A (zh) 一种rpr故障保护方法及其设备
CN108989200A (zh) 数据包转发方法、装置和系统
CN100488201C (zh) 一种基于路由的链路备份方法
CN104125079B (zh) 一种确定双机热备份配置信息的方法及装置
CN102014035A (zh) 基于以太环网的组网方法及装置
CN101917414A (zh) Bgp分类网关设备及利用该设备实现网关功能的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant