CN110505104A - 一种故障处理方法、装置、网络设备及存储介质 - Google Patents

一种故障处理方法、装置、网络设备及存储介质 Download PDF

Info

Publication number
CN110505104A
CN110505104A CN201910892113.XA CN201910892113A CN110505104A CN 110505104 A CN110505104 A CN 110505104A CN 201910892113 A CN201910892113 A CN 201910892113A CN 110505104 A CN110505104 A CN 110505104A
Authority
CN
China
Prior art keywords
stacking
data link
state
member device
track
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910892113.XA
Other languages
English (en)
Other versions
CN110505104B (zh
Inventor
徐光建
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New H3C Security Technologies Co Ltd
Original Assignee
New H3C Security Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New H3C Security Technologies Co Ltd filed Critical New H3C Security Technologies Co Ltd
Priority to CN201910892113.XA priority Critical patent/CN110505104B/zh
Publication of CN110505104A publication Critical patent/CN110505104A/zh
Application granted granted Critical
Publication of CN110505104B publication Critical patent/CN110505104B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/44Star or tree networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4641Virtual LANs, VLANs, e.g. virtual private networks [VPN]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/14Session management
    • H04L67/141Setup of application sessions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]

Abstract

本申请提供一种故障处理方法及装置,包括:星型堆叠系统中的主成员设备监测所述主成员设备与备成员设备之间的堆叠数据链路,其中,所述堆叠数据链路关联有Track项;若监测到所述堆叠数据链路故障,则将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态;在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。使用本申请提供的方法,可以解决因为成员设备的堆叠数据链路故障而造成VCFC控制器与主成员设备之间无法建立TCP连接的问题。

Description

一种故障处理方法、装置、网络设备及存储介质
技术领域
本申请涉及通信领域,尤其涉及一种故障处理方法、装置、网络设备及存储介质。
背景技术
堆叠是指一台以上的物理设备组合起来共同工作。支持堆叠的多台物理设备通过堆叠形成堆叠系统,将多台物理设备堆叠成堆叠系统的堆叠方式有多种,比如环形堆叠、链形堆叠和星形堆叠等。
其中,星形堆叠方式是指多台物理设备中承载的VNF(Virtual NetworkFunction,虚拟网络功能)通过与自身直连的交换机堆叠为星型堆叠系统。如图1所示,VNF101和VNF102通过与自身连接的交换机堆叠成星型堆叠系统。
具体地,VNF101分别与SW(Switch,交换机)101和SW102相连,VNF102分别与SW103和SW104相连。SW101和SW103之间配置有堆叠链路,SW102与SW104之间配置有堆叠链路。
在星型堆叠系统中,上述多个物理设备可被称为该堆叠系统的成员设备。成员设备通常包括:主成员设备和备成员设备。主成员设备用于与堆叠系统外的VCFC(VirtualConverged Framework Controller,虚拟融合架构控制器)控制器交互,备成员设备可用于保存主成员设备备份来的数据等。
在基于星形堆叠方式堆叠出的虚拟设备中,主成员设备和备成员设备之间的链路可包括堆叠控制链路和堆叠数据链路。主、备成员设备可通过堆叠控制链路交互与堆叠相关的控制报文。主成员设备可通过堆叠数据链路向备成员设备同步VCFC控制器下发的数据、TCP连接状态等。
发明内容
有鉴于此,本申请提供一种故障处理方法、装置、网络设备及存储介质。
根据本申请的第一方面,提供一种故障处理方法,所述方法应用于星型堆叠系统中的主成员设备,所述方法包括:
监测所述主成员设备与备成员设备之间的堆叠数据链路,其中,所述堆叠数据链路关联有Track项;
若监测到所述堆叠数据链路故障,则将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态;
在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
可选的,所述方法还包括:
若监测到故障的堆叠数据链路恢复正常,则将该堆叠数据链路关联的Track项由所述Negative状态修改为Positive状态;
在确定堆叠数据链路关联的Track项为Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
可选的,在所述星型堆叠系统发生分裂后,所述方法还包括:
根据VCFC控制器发送的第一TCP协议报文,向所述VCFC控制器发送针对所述第一TCP协议报文的第一响应报文;
或者,若接收到VCFC控制器发送第二TCP协议报文时,则将本地存储的TCP连接状态更新为与所述第二TCP协议报文对应的TCP连接状态,并向所述VCFC控制器返回针对该第二TCP协议报文的第二响应报文。
可选的,在堆叠合并后,所述方法还包括:
若接收到VCFC控制器发送的第三TCP协议报文,则将本地存储的TCP连接状态更新为与所述第三TCP协议报文对应的TCP连接状态,并向所述星型堆叠系统的备成员设备备份更新后的TCP连接状态;
在接收到所述备成员设备返回的备份成功消息后,向所述VCFC控制器返回针对第三TCP协议报文的第三响应报文。
根据本申请的第二方面,提供一种故障处理装置,所述装置应用于星型堆叠系统中的主成员设备,所述主成员设备包括:接口管理模块、Track模块和堆叠模块;
所述接口管理模块,用于监测所述主成员设备与备成员设备之间的堆叠数据链路,若监测到所述堆叠数据链路故障,则通知所述Track模块所述堆叠数据链路故障;其中,所述堆叠数据链路关联有Track项;
所述Track模块,用于将所述堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态,并通知所述堆叠模块所述Track项处于Negative状态;
所述堆叠模块,用于在确定所述Track项处于Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
可选的,所述接口管理模块,还用于若监测到所述堆叠数据链路故障恢复正常,则通知所述Track模块所述堆叠数据链路故障恢复正常;
所述Track模块,用于将所述Track项由所述Negative状态修改为Positive状态,并向所述堆叠模块通知所述Track项处于Positive状态;
所述堆叠模块,用于在确定所述Track项处于Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
可选的,所述装置还包括:
第一发送模块,用于在所述星型堆叠系统发生分裂后,根据VCFC控制器发送的第一TCP协议报文,向所述VCFC控制器发送针对所述第一TCP协议报文的第一响应报文;或者,若接收到VCFC控制器发送第二TCP协议报文时,则将本地存储的TCP连接状态更新为与所述第二TCP协议报文对应的TCP连接状态,并向所述VCFC控制器返回针对该第二TCP协议报文的第二响应报文。
可选的,所述装置还包括:
第二发送模块,在堆叠合并后,用于堆叠合并后,若接收到VCFC控制器发送的第三TCP协议报文,则将本地存储的TCP连接状态更新为与所述第三TCP协议报文对应的TCP连接状态,并向所述星型堆叠系统的备成员设备备份更新后的TCP连接状态;在接收到所述备成员设备返回的备份成功消息后,向所述VCFC控制器返回针对第三TCP协议报文的第三响应报文。
根据本申请的第三方面,提供一种网络设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使执行上述故障处理方法。
根据本申请的第四方面,提供一种机器可读存储介质,所述机器可读存储介质存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器执行上述故障处理方法。
由上述描述可知,星型堆叠系统中的主成员设备在监测到该主成员设备与备成员设备之间的堆叠数据链路故障时,可将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态,并在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
由于发生了堆叠分裂,使得VCFC控制器向主成员设备发送用于建立连接的TCP协议报文时,主成员设备可直接向VCFC控制器回复该TCP协议报文的响应报文,而无需将该TCP协议报文对应的TCP连接状态同步给备成员设备后,才向该VCFC控制器返回该TCP协议报文的响应报文,此时,VCFC控制器可建立与主成员设备之间的TCP连接,以解决因为主、备成员设备之间的堆叠数据链路故障而造成VCFC控制器与主成员设备之间无法建立TCP连接的问题。
附图说明
图1是本申请一示例性实施例示出的一种星型堆叠组网的示意图;
图2是本申请一示例性实施例示出的一种故障处理方法的流程图;
图3是本申请一示例性实施例示出的一种主成员设备的示意图;
图4是本申请一示例性实施例示出的一种主成员设备的硬件结构图;
图5是本申请一示例性实施例示出的一种故障处理装置的框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
参见图1,图1是本申请一示例性实施例示出的一种星型堆叠组网的示意图。
星型堆叠组网包括:基于星型堆叠方式堆叠的星型堆叠系统、以及VCFC控制器。VCFC控制器与该星型堆叠系统之间建立有TCP(Transmission ControlProtocol,传输控制协议)连接。
1)VCFC控制器
VCFC控制器用于管理星型堆叠系统。VCFC控制器可以通过TCP连接向星型堆叠系统下发用于指导星型堆叠系统转发报文的流表,通过TCP连接向星型堆叠系统下发配置信息,与星型堆叠系统之间交互TCP(Transmission Control Protocol传输控制协议)协议报文来与星型堆叠系统建立TCP连接。其中,该TCP连接可以是Openflow连接(一种基于TCP的网络连接),也可以是其他基于TCP的网络连接。这里只是示例性地说明,不进行具体地限定。
2)星型堆叠系统
星型堆叠系统可由多台物理设备所承载的VNF通过与自身直连的交换机堆叠成星型堆叠系统。这些物理设备可以称之为成员设备。
通常,多个成员设备具有角色。比如在多个成员设备中,有一个主成员设备和多个备成员设备。主成员设备可以向备成员设备同步数据,在主成员设备故障时,还可以由备成员设备接替主成员设备进行工作。
而上文所述的VCFC控制器与星型堆叠系统之间的TCP连接是VCFC控制器与主成员设备的TCP连接。VCFC控制器通过该TCP连接向主成员设备下发数据,主成员设备可将该数据同步给备成员设备。
此外,成员设备与自身相连的交换机之间至少配置有堆叠数据链路和堆叠控制链路。
其中,堆叠控制链路用于交互与堆叠相关的协议报文,比如交互多台成员设备之间的保活报文(比如Hello报文等)。
堆叠数据链路用于实现多台物理设备之间的数据同步等,比如主成员设备可通过堆叠数据链路将VCFC向星型堆叠系统下发的数据同步给备成员设备,主成员设备将TCP连接状态同步给备成员设备等。
例如,如图1所示,VNF101和VNF102通过与自身连接的交换机堆叠成星型堆叠系统。
具体地,VNF101分别与SW101和SW102相连,VNF102分别与SW103和SW104相连。SW101和SW103之间配置有堆叠链路,SW102与SW104之间配置有堆叠链路。
其中,VNF101和VNF102之间链路包括:堆叠数据链路和堆叠控制链路。
例如,如图1所示,链路1012和链路1022共同构成了VNF101和VNF102之间的堆叠数据链路。
链路1011和链路1021共同构成了VNF101和VNF102之间的堆叠控制两路。
假设,VNF101为主成员设备,VNF102为备成员设备。
当VNF101向VNF102发送协议报文时,VNF101可通过堆叠控制链路将该协议报文发送至VNF102。
当VNF101向VNF102同步数据报文时,VNF101可通过堆叠数据链路将该数据报文发送至VNF102。
其中,VNF101向VNF102同步数据报文可以通过TCP NSR(Nonstop Routing,不间断路由)的方式来实现数据报文的同步,当然也可以通过其他方式来实现数据报文的同步,这里不进行具体地限定。
现有的VCFC控制器与星型堆叠系统建立TCP连接的方式是,VCFC控制器向星型堆叠系统中的VNF101发送用于建立TCP连接的TCP协议报文。
星型堆叠系统中的VNF101接收到该TCP协议报文后,可将本地保存的TCP连接状态更新为与该TCP协议报文对应的TCP连接状态。然后,VNF101可将更新后的TCP连接状态通过堆叠数据链路同步给VNF102。VNF102收到该更新后的TCP连接状态后,可保存该TCP连接状态,并通过堆叠数据链路向VNF101返回备份成功的响应消息。VNF101在收到VNF102返回的备份成功的响应消息后,可向VCFC控制器返回该TCP协议报文的响应报文。
然而,当VNF102的堆叠数据链路故障时,VCFC控制器向星型堆叠系统发送TCP协议报文。星型堆叠系统中的VNF101接收到该TCP协议报文后,可将本地保存的TCP连接状态更新为与该TCP协议报文对应的状态。然后,VNF101可将更新后的TCP连接状态通过堆叠数据链路同步给VNF102。但由于VNF102的堆叠数据链路故障,VNF102无法收到该更新的TCP连接状态,也无法向VNF101回复备份成功的响应消息。由于VNF101无法收到VNF102回复的备份成功的响应消息,所以VNF101不会向VCFC控制器返回该TCP协议报文的响应报文。
由于VCFC控制器无法收到VNF101发送的该TCP协议报文的响应报文,所以VCFC控制器向VNF101重传该TCP协议报文。在该TCP协议报文的重传超时后,VCFC控制器仍收不到VNF101回复的该TCP协议报文的响应报文,VCFC控制器与VNF101之间的TCP连接状态处于震荡状态,无法建立TCP连接,影响现有的业务性能。
有鉴于此,本申请提出了一种故障处理方法,主成员设备在监测到该主成员设备与备成员设备之间的堆叠数据链路故障时,可将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态,并在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
由于发生了堆叠分裂,使得VCFC控制器向主成员设备发送用于建立连接的TCP协议报文时,主成员设备可直接向VCFC控制器回复该TCP协议报文的响应报文,而无需将该TCP协议报文对应的TCP连接状态同步给备成员设备后,才向该VCFC控制器返回该TCP协议报文的响应报文,此时,VCFC控制器可建立与主成员设备之间的TCP连接,以防止因为成员设备的堆叠数据链路故障而造成VCFC控制器与主成员设备之间无法建立TCP连接的问题。
仍以图1为例,当VNF101在监测到VNF102的堆叠数据链路故障时,阻塞VNF102的堆叠控制链路的接口,致使星型堆叠系统发生分裂。当星型堆叠系统发生分裂后,若VNF101接收到VCFC控制器发送的TCP报文后可以将保存的TCP连接状态更新为与该TCP协议报文对应的状态,并直接向VCFC控制器返回该TCP协议报文的响应报文,而VNF101不需要再将更新后的TCP连接状态同步给VNF102。所以即使VNF102的数据堆叠链路故障,也不影响VCFC控制器收到VNF101返回的TCP协议报文的响应报文。因此VCFC控制器与VNF101之间可以建立TCP连接,所以可以防止因为成员设备的堆叠数据链路故障而造成VCFC控制器与VNF101之间的TCP连接无法建立的问题。
下面对本申请提供的故障处理方法进行详细地说明。
参见图2,图2是本申请一示例性实施例示出的一种故障处理方法的流程图,该方法可应用在星型堆叠系统中的主成员设备,该方法可包括如下所示步骤。
步骤201:主成员设备监测所述主成员设备与备成员设备之间的堆叠数据链路。其中,所述堆叠数据链路关联有Track项。
如图3所示,在本申请实施例中,上述主成员设备包括:接口管理模块、Track模块和堆叠模块。
接口管理模块可以监测所述主成员设备与备成员设备之间的堆叠链路的状态,比如接口管理模块可监测主成员设备与备成员设备之间的堆叠数据链路的状态、堆叠控制链路状态。
堆叠模块,可用于阻塞或者激活主成员设备和备成员设备之间的堆叠控制链路,以触发星型堆叠系统发生堆叠分裂或者堆叠合并。
Track模块,与接口管理模块对接,与堆叠模块对接。接口管理模块通过Track模块实现接口管理模块向堆叠模块通知主成员设备和备成员设备之间的堆叠数据链路故障或者故障恢复正常。
在实现时,在Track模块中预配置有与主成员设备和备成员设备之间的堆叠数据链路关联的Track项。每个Track项可至少包括:Positive状态和Negative状态。
其中,Positive状态表示该Track项关联的堆叠数据链路处于正常状态。
Negative状态表示该Track项关联的堆叠数据链路处于故障状态。
当然,Track项还可包括其他状态,比如NotReady状态等。
在主成员设备监测主成员设备与备成员设备之间的堆叠数据链路时,主成员设备中的接口管理模块可以监测主成员设备与备成员设备之间的堆叠数据链路。
步骤202:主成员设备若监测到所述堆叠数据链路故障,则将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态。
步骤203:主成员设备在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
在实现时,当主成员设备的接口管理模块监测到主成员设备与备成员设备之间的堆叠数据链路故障时,接口管理模块可通知Track模块。
Track模块在被通知主成员设备与备成员设备之间的堆叠数据链路故障时,可以将与该堆叠数据链路关联的Track项由Positive状态更新为Negative状态,并通知该堆叠模块Track项处于Negative状态。
堆叠模块在确定Track项处于Negative状态时,阻塞该堆叠数据链路所对应的堆叠控制链路。
堆叠模块通过如下方式来阻塞该堆叠控制链路:
例如,堆叠模块可停止向堆叠控制链路发送Hello报文,停止向堆叠控制链路发送detect报文等,来阻塞该堆叠控制链路。
当然,堆叠模块还可以通过阻塞堆叠控制链路的接口来阻塞该堆叠控制链路,这里只是对阻塞堆叠控制链路进行示例性地说明,不对其进行具体地限定。
需要说明的是,在星型堆叠系统中,主、备成员设备定时交互Hello报文,若主、备成员设备可接收到彼此发送的Hello报文则维持该星型堆叠系统的堆叠。当主成员设备或备成员设备接收不到对方发送的Hello报文时,就会触发该星型堆叠系统发生堆叠分裂。
在本申请实施例中,由于堆叠模块阻塞主、备成员设备之间的堆叠数据链路所对应的堆叠控制链路,所以主、备成员设备无法收到对方的Hello报文。所以,星型堆叠系统发生分裂。
当然,星型堆叠系统发生分裂的具体过程可以参见现有的星型堆叠系统发生分裂的技术,这里不再赘述。
在星型堆叠系统发生分裂后,
一方面,若主成员设备在堆叠系统发生分裂前接收到VCFC控制器发送的用于建立TCP连接的第一TCP协议报文,并将本地储存的TCP连接状态更新为与该TCP协议报文对应的TCP连接状态,那么在该堆叠系统发生分裂后,主成员设备可根据VCFC控制器发送的第一TCP协议报文,向VCFC控制器返回该第一TCP协议报文的第一响应报文。
另一方面,若主成员设备在堆叠系统发生堆叠分裂后接收到VCFC控制器发送的用于建立TCP连接的第二TCP协议报文,则将本地存储的TCP连接状态更新为与所述第二TCP协议报文对应的TCP连接状态,并向所述VCFC控制器返回针对该第二TCP协议报文的第二响应报文。
由上述描述可知,星型堆叠系统中的主成员设备在监测到该主成员设备与备成员设备之间的堆叠数据链路故障时,可将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态,并在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
由于发生了堆叠分裂,使得VCFC控制器向主成员设备发送用于建立连接的TCP协议报文时,主成员设备可直接向VCFC控制器回复该TCP协议报文的响应报文,而无需将该TCP协议报文对应的TCP连接状态同步给备成员设备后,才向该VCFC控制器返回该TCP协议报文的响应报文,此时,VCFC控制器可建立与主成员设备之间的TCP连接,以解决因为主、备成员设备之间的堆叠数据链路故障而造成VCFC控制器与主成员设备之间无法建立TCP连接的问题。
此外,在本申请实施例中,若主成员设备监测到故障的堆叠数据链路恢复正常,则将该堆叠数据链路关联的Track项由所述Negative状态修改为Positive状态,并在确定堆叠数据链路关联的Track项为Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
在实现时,若该主成员设备的接口管理模块监测到故障的堆叠数据链路恢复正常,则通知上述Track模块故障的堆叠数据链路恢复正常。
Track模块将与该堆叠数据链路关联的Track项由Negative状态修改为Positive状态,并向所述堆叠模块通知所述Track项处于Positive状态。堆叠模块在确定Track项处于Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
其中,堆叠模块“激活该堆叠数据链路所对应的堆叠控制链路”的具体方式可包括:向该堆叠数据链路发送Hello报文、Detect报文等。
当然,堆叠模块还可通过开启堆叠控制链路的接口来激活该堆叠数据链路所对应的堆叠控制链路,这里只是对激活该堆叠数据链路所对应的堆叠控制链路进行示例性地说明,不对其进行具体地限定。
需要说明的是,由于激活该堆叠数据链路所对应的堆叠控制链路,主、备成员设备可以收到对方发送的Hello报文,所以可以执行堆叠合并。
其中,堆叠合并可采用现有的堆叠合并方式,这里不再赘述。
在本申请实施例中,在堆叠合并后,若主成员设备接收到VCFC控制器发送的用于建立TCP连接的第三TCP协议报文,则将本地储存的TCP连接状态更新为与该第三TCP协议报文对应的状态,并向所述星型堆叠系统的备成员设备备份更新后的TCP连接状态。
备成员设备在接收到该更新后的TCP连接状态后,可向该主成员设备返回备份成功消息。
主成员设备在接收到该备成员设备返回的备份成功消息后,可向VCFC控制器返回针对第三TCP协议报文的第三响应报文。
需要说明的是,上述TCP连接状态包括:initial(初始)状态、listen(监听)状态和establish(建立)状态。TCP连接状态的初始状态为initial状态。
上述用于建立TCP连接的TCP协议报文(包括上述第一TCP协议报文、和下文所述的第二TCP协议报文和第三TCP协议报文)包括:TCP三次握手中的SYN(synchronize,同步)报文和ACK(synchronize acknowledge,同步应答)报文。
上述“主成员设备接收到用于建立TCP连接的TCP协议报文,将本地存储的TCP连接状态更新为与该TCP协议报文对应的TCP连接状态”是指:
当主成员设备接收到的TCP协议报文为SYN报文时,将本地存储的TCP连接状态由initial状态更新为listen状态。
当主成员设备接收到的TCP协议报文为ACK报文时,将本地储存的TCP连接状态由listen状态更新为establish状态。
由上述描述可知,一方面,接口管理模块在监测到主、备成员设备之间的堆叠数据链路的接口故障时,通过Track模块通知所述堆叠模块,使得堆叠模块阻塞该堆叠数据链路对应的堆叠控制链路,以触发该星型堆叠系统发生分裂,从而防止因为主、备成员设备的堆叠数据链路故障而造成VCFC控制器与主成员设备之间的TCP连接无法建立的问题。
另一方面,接口管理模块在监测到故障的堆叠数据链路恢复正常时,通过Track模块通知堆叠模块,使得堆叠模块激活该堆叠数据链路对应的堆叠控制链路,以触发堆叠合并。
下面以星型堆叠系统由成员设备VNF101和VNF102通过星型堆叠方式堆叠而成为例,并结合图1对本申请提供的故障处理方法进行详细地说明。
假设VNF101为主成员设备,VNF102为备成员设备。
VNF101包括:接口管理模块、Track模块和堆叠模块。Track模块包括:VNF101和VNF102之间的堆叠数据链路1关联的Track项1。
假设VCFC控制器与VNF101建立TCP连接。
在建立TCP连接时,VCFC控制器向VNF101发送SYN报文。
假设,在VNF101在未收到VNF101的SYN报文前,VNF101和VNF102之间的堆叠数据链路故障1。
此时,VNF101的接口管理模块监测到堆叠数据链路故障1,接口管理模块可通知Track模块VNF102的堆叠数据链路故障1。Track模块将该与VNF102的堆叠数据链路1关联的Track项1的状态由Positive状态修改为Negative状态,并通知堆叠模块Track项1的状态为Negative状态。堆叠模块在被通知Track项1的状态为Negative状态,可阻塞堆叠数据链路1对应的堆叠控制链路1,以触发星型堆叠系统发生堆叠分裂。
假设在星型堆叠系统发生堆叠分裂后,VNF101接收到VCFC控制器发送的SYN报文,则将本地储存的TCP连接状态由initial状态更新为listen状态,并向VCFC控制器发送SYNACK报文。
假设在VNF101发送SYN ACK报文后,堆叠数据链路1故障恢复正常。
此时,VNF101的接口管理模块监测到堆叠数据链路1故障恢复正常时,接口管理模块可通知Track模块堆叠数据链路1故障恢复。Track模块将与堆叠数据链路1关联的Track项1的状态由Negative状态修改为Positive状态,并通知堆叠模块Track项1的状态为Positive状态。堆叠模块在被通知Track项1的状态为Positive状态,可激活堆叠数据链路1的堆叠控制链路1,执行堆叠合并。
假设在堆叠合并后,VCFC控制器向VNF101发送ACK报文。
VNF101在接收到VCFC控制发送的ACK报文后,将本地储存的TCP连接状态由listen状态更新为establish状态,并将establish状态同步给VNF102。
VNF102在接收到establish状态后,可将本地记录的TCP连接状态由listen状态更新为establish状态,并向VNF101回复同步成功消息。
参见图4,图4是本申请一示例性实施例示出的一种主成员设备的硬件结构图。
该主成员设备包括:通信接口401、处理器402、机器可读存储介质403和总线404;其中,通信接口401、处理器402和机器可读存储介质403通过总线404完成相互间的通信。处理器402通过读取并执行机器可读存储介质403中与故障处理控制逻辑对应的机器可执行指令,可执行上文描述的故障处理方法。
本文中提到的机器可读存储介质403可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:易失存储器、非易失性存储器或者类似的存储介质。具体地,机器可读存储介质403可以是RAM(Radom Access Memory,随机存取存储器)、闪存、存储驱动器(如硬盘驱动器)、固态硬盘、任何类型的存储盘(如光盘、DVD等),或者类似的存储介质,或者它们的组合。
参见图5,图5是本申请一示例性实施例示出的一种故障处理装置的框图,该故障处理装置可应用在星型堆叠系统中的主成员设备上,所述主成员设备包括:接口管理模块、Track模块和堆叠模块;
所述接口管理模块101,用于监测所述主成员设备与备成员设备之间的堆叠数据链路,若监测到所述堆叠数据链路故障,则通知所述Track模块所述堆叠数据链路故障;其中,所述堆叠数据链路关联有Track项;
所述Track模块102,用于将所述堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态,并通知所述堆叠模块所述Track项处于Negative状态;
所述堆叠模块103,用于在确定所述Track项处于Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
可选的,所述接口管理模块101,还用于若监测到所述堆叠数据链路故障恢复正常,则通知所述Track模块所述堆叠数据链路故障恢复正常;
所述Track模块102,用于将所述Track项由所述Negative状态修改为Positive状态,并向所述堆叠模块通知所述Track项处于Positive状态;
所述堆叠模块103,用于在确定所述Track项处于Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
可选的,所述装置还包括:
第一发送模块104,用于在所述星型堆叠系统发生分裂后,根据VCFC控制器发送的第一TCP协议报文,向所述VCFC控制器发送针对所述第一TCP协议报文的第一响应报文;或者,若接收到VCFC控制器发送第二TCP协议报文时,则将本地存储的TCP连接状态更新为与所述第二TCP协议报文对应的TCP连接状态,并向所述VCFC控制器返回针对该第二TCP协议报文的第二响应报文。
可选的,所述装置还包括:
第二发送模块105,在堆叠合并后,用于堆叠合并后,若接收到VCFC控制器发送的第三TCP协议报文,则将本地存储的TCP连接状态更新为与所述第三TCP协议报文对应的TCP连接状态,并向所述星型堆叠系统的备成员设备备份更新后的TCP连接状态;在接收到所述备成员设备返回的备份成功消息后,向所述VCFC控制器返回针对第三TCP协议报文的第三响应报文。上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种故障处理方法,其特征在于,所述方法应用于星型堆叠系统中的主成员设备,所述方法包括:
监测所述主成员设备与备成员设备之间的堆叠数据链路,其中,所述堆叠数据链路关联有Track项;
若监测到所述堆叠数据链路故障,则将该堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态;
在确定堆叠数据链路关联的Track项为Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若监测到故障的堆叠数据链路恢复正常,则将该堆叠数据链路关联的Track项由所述Negative状态修改为Positive状态;
在确定堆叠数据链路关联的Track项为Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
3.根据权利要求1所述的方法,其特征在于,
在所述星型堆叠系统发生分裂后,所述方法还包括:
根据VCFC控制器发送的第一TCP协议报文,向所述VCFC控制器发送针对所述第一TCP协议报文的第一响应报文;
或者,若接收到VCFC控制器发送第二TCP协议报文时,则将本地存储的TCP连接状态更新为与所述第二TCP协议报文对应的TCP连接状态,并向所述VCFC控制器返回针对该第二TCP协议报文的第二响应报文。
4.根据权利要求2所述的方法,其特征在于,在堆叠合并后,所述方法还包括:
若接收到VCFC控制器发送的第三TCP协议报文,则将本地存储的TCP连接状态更新为与所述第三TCP协议报文对应的TCP连接状态,并向所述星型堆叠系统的备成员设备备份更新后的TCP连接状态;
在接收到所述备成员设备返回的备份成功消息后,向所述VCFC控制器返回针对第三TCP协议报文的第三响应报文。
5.一种故障处理装置,其特征在于,所述装置应用于星型堆叠系统中的主成员设备,所述主成员设备包括:接口管理模块、Track模块和堆叠模块;
所述接口管理模块,用于监测所述主成员设备与备成员设备之间的堆叠数据链路,若监测到所述堆叠数据链路故障,则通知所述Track模块所述堆叠数据链路故障;其中,所述堆叠数据链路关联有Track项;
所述Track模块,用于将所述堆叠数据链路关联的Track项的状态由Positive状态更新为Negative状态,并通知所述堆叠模块所述Track项处于Negative状态;
所述堆叠模块,用于在确定所述Track项处于Negative状态时,阻塞所述堆叠数据链路所对应的堆叠控制链路,以触发所述星型堆叠系统发生堆叠分裂。
6.根据权利要求5所述的装置,其特征在于,
所述接口管理模块,还用于若监测到所述堆叠数据链路故障恢复正常,则通知所述Track模块所述堆叠数据链路故障恢复正常;
所述Track模块,用于将所述Track项由所述Negative状态修改为Positive状态,并向所述堆叠模块通知所述Track项处于Positive状态;
所述堆叠模块,用于在确定所述Track项处于Positive状态时,激活该堆叠数据链路所对应的堆叠控制链路,执行堆叠合并。
7.根据权利要求5所述的装置,其特征在于,所述装置还包括:
第一发送模块,用于在所述星型堆叠系统发生分裂后,根据VCFC控制器发送的第一TCP协议报文,向所述VCFC控制器发送针对所述第一TCP协议报文的第一响应报文;或者,若接收到VCFC控制器发送第二TCP协议报文时,则将本地存储的TCP连接状态更新为与所述第二TCP协议报文对应的TCP连接状态,并向所述VCFC控制器返回针对该第二TCP协议报文的第二响应报文。
8.根据权利要求6所述的装置,其特征在于,所述装置还包括:
第二发送模块,在堆叠合并后,用于堆叠合并后,若接收到VCFC控制器发送的第三TCP协议报文,则将本地存储的TCP连接状态更新为与所述第三TCP协议报文对应的TCP连接状态,并向所述星型堆叠系统的备成员设备备份更新后的TCP连接状态;在接收到所述备成员设备返回的备份成功消息后,向所述VCFC控制器返回针对第三TCP协议报文的第三响应报文。
9.一种网络设备,其特征在于,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使执行如权利要求1至4任一项所述方法。
10.一种机器可读存储介质,其特征在于,所述机器可读存储介质存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器执行如权利要求1至4任一项所述方法。
CN201910892113.XA 2019-09-20 2019-09-20 一种故障处理方法、装置、网络设备及存储介质 Active CN110505104B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910892113.XA CN110505104B (zh) 2019-09-20 2019-09-20 一种故障处理方法、装置、网络设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910892113.XA CN110505104B (zh) 2019-09-20 2019-09-20 一种故障处理方法、装置、网络设备及存储介质

Publications (2)

Publication Number Publication Date
CN110505104A true CN110505104A (zh) 2019-11-26
CN110505104B CN110505104B (zh) 2022-05-31

Family

ID=68592191

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910892113.XA Active CN110505104B (zh) 2019-09-20 2019-09-20 一种故障处理方法、装置、网络设备及存储介质

Country Status (1)

Country Link
CN (1) CN110505104B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022267938A1 (zh) * 2021-06-21 2022-12-29 中兴通讯股份有限公司 故障处理方法、堆叠设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329111A1 (en) * 2009-06-26 2010-12-30 H3C Technologies Co., Ltd. Multi-Active Detection Method And Stack Member Device
CN102006184A (zh) * 2010-11-09 2011-04-06 福建星网锐捷网络有限公司 堆叠链路管理方法、装置及网络设备
CN102231703A (zh) * 2011-06-24 2011-11-02 中兴通讯股份有限公司 一种实现虚拟集群交换机跨设备数据转发的方法和设备
CN103856357A (zh) * 2014-03-21 2014-06-11 迈普通信技术股份有限公司 一种堆叠系统故障处理方法及堆叠系统
US20180376383A1 (en) * 2017-06-23 2018-12-27 Apple Inc. Lossless Split Data Bearer for Inter-RAT Dual Connectivity Wireless Device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100329111A1 (en) * 2009-06-26 2010-12-30 H3C Technologies Co., Ltd. Multi-Active Detection Method And Stack Member Device
CN102006184A (zh) * 2010-11-09 2011-04-06 福建星网锐捷网络有限公司 堆叠链路管理方法、装置及网络设备
CN102231703A (zh) * 2011-06-24 2011-11-02 中兴通讯股份有限公司 一种实现虚拟集群交换机跨设备数据转发的方法和设备
CN103856357A (zh) * 2014-03-21 2014-06-11 迈普通信技术股份有限公司 一种堆叠系统故障处理方法及堆叠系统
US20180376383A1 (en) * 2017-06-23 2018-12-27 Apple Inc. Lossless Split Data Bearer for Inter-RAT Dual Connectivity Wireless Device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022267938A1 (zh) * 2021-06-21 2022-12-29 中兴通讯股份有限公司 故障处理方法、堆叠设备及存储介质

Also Published As

Publication number Publication date
CN110505104B (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
CN103731407B (zh) Ike报文协商的方法及系统
US7940650B1 (en) Peer-agnostic TCP socket replication between primary and secondary routing engines
CN101136900B (zh) 一种面向服务的快速透明故障转移装置及实现方法
CN102439903B (zh) 实现容灾备份的方法、设备及系统
CN102510408B (zh) 实现tcp应用主备热倒换的方法
US8462767B2 (en) Internet protocol compliant private branch electronic exchange and a method for redundantly configuring terminal interfaces
US11863370B2 (en) High availability using multiple network elements
CN102223258B (zh) 一种防止bfd会话中断的方法和设备
CN101621819B (zh) 主备切换接口模块、网元系统和链路信息同步检测方法
CN109861867B (zh) 一种mec业务处理方法及装置
CN101764738B (zh) 一种支持tcp协议连接的备份方法及其设备
CN107547366A (zh) 一种报文转发方法和装置
WO2016082412A1 (zh) 实现数据可靠传输的方法、装置及计算机存储介质
EP2874351B1 (en) Control method and device for protecting connectivity between ethernet ring network nodes, and first node
CN103944698A (zh) 一种双机热备方法
CN102025562A (zh) 一种路径检测方法及装置
WO2008014696A1 (fr) Méthode et dispositif pour effectuer un transfert de communications
CN110505104A (zh) 一种故障处理方法、装置、网络设备及存储介质
WO2014177012A1 (zh) 网络事务控制方法及执行方法及网络控制器及转发设备
CN108984195A (zh) 一种软件升级方法及装置
CN101599906B (zh) 端口状态设置的方法及装置
WO2016091094A1 (zh) 一种光传送网的保护倒换方法及装置
CN108270593B (zh) 一种双机热备份方法和系统
KR101358995B1 (ko) 고가용성 관리 방법 및 시스템
EP2945328B1 (en) Method and apparatus for keeping alive l2tp tunnel state

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant