CN108471364B - 一种异常处理方法及装置 - Google Patents

一种异常处理方法及装置 Download PDF

Info

Publication number
CN108471364B
CN108471364B CN201810691549.8A CN201810691549A CN108471364B CN 108471364 B CN108471364 B CN 108471364B CN 201810691549 A CN201810691549 A CN 201810691549A CN 108471364 B CN108471364 B CN 108471364B
Authority
CN
China
Prior art keywords
target
type container
service process
business
target service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810691549.8A
Other languages
English (en)
Other versions
CN108471364A (zh
Inventor
周孟韬
张鸿凌
祁正林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201810691549.8A priority Critical patent/CN108471364B/zh
Publication of CN108471364A publication Critical patent/CN108471364A/zh
Application granted granted Critical
Publication of CN108471364B publication Critical patent/CN108471364B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/12Discovery or management of network topologies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种异常处理方法及装置,该方法包括:触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对所述共享存储空间中的运行数据进行读取;当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述第一目标业务进程进行业务处理。应用本发明实施例可以提高网络设备的可靠性和稳定性。

Description

一种异常处理方法及装置
技术领域
本发明涉及网络通信技术领域,尤其涉及一种异常处理方法及装置。
背景技术
随着数据中心的网络规模越来越大,网络设备的安全性和稳定性的要求也越来越高。
目前,网络设备中业务进程出现异常时,虽然能够通过后台监控程序重启恢复,但仍然会造成网络拓扑震荡。
发明内容
本发明提供一种异常处理方法及装置,以解决网络设备中业务进程异常时会造成网络拓扑震荡的问题。
根据本发明实施例的第一方面,提供一种异常处理方法,应用于网络设备,所述网络设备上搭建有至少一个第一类型容器,以及分别与所述至少一个第一类型容器对应的第二类型容器,所述第一类型容器与对应的第二类型容器运行有相同的业务进程,所述第一类型容器处于活跃状态,所述第二类型容器处于备用状态,该方法包括:
触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对所述共享存储空间中的运行数据进行读取;
当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述第一目标业务进程进行业务处理。
根据本发明实施例的第二方面,提供一种异常处理装置,应用于网络设备,所述网络设备上搭建有至少一个第一类型容器,以及分别与所述至少一个第一类型容器对应的第二类型容器,所述第一类型容器与对应的第二类型容器运行有相同的业务进程,所述第一类型容器处于活跃状态,所述第二类型容器处于备用状态,该装置包括:
读写控制单元,用于触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对所述共享存储空间中的运行数据进行读取;
状态控制单元,用于当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述第一目标业务进程进行业务处理。
应用本发明实施例,通过将网络设备中的业务进程装入容器,并在网络设备上对应各活跃状态的容器创建运行有相同业务进程的备用状态的容器,且保持活跃状态的容器与对应的备用状态的容器的运行数据一致,进而,当活跃状态的容器中的业务进程异常时,由备用状态的容器中的相同业务进程替代该异常业务进程进行业务处理,避免了由于业务异常时重启恢复造成的网络拓扑震荡,提高了网络设备的可靠性和稳定性。
附图说明
图1是本发明实施例提供的一种异常处理方法的流程示意图;
图2是本发明实施例提供的一种具体应用场景的示意图;
图3A是本发明实施例一提供的异常处理方法的流程示意图;
图3B~3C是本发明实施例一提供的异常处理过程的示意图;
图4A是本发明实施例二提供的异常处理方法的流程示意图;
图4B是本发明实施例二提供的异常处理过程的示意图;
图5A是本发明实施例三提供的异常处理方法的流程示意图;
图5B是本发明实施例三提供的异常处理过程的示意图;
图6是本发明实施例提供的一种异常处理装置的结构示意图;
图7是本发明实施例提供的另一种异常处理装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明实施例中的技术方案,并使本发明实施例的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明实施例中技术方案作进一步详细的说明。
请参见图1,为本发明实施例提供的一种异常处理方法的流程示意图,其中,该异常处理方法可以应用于网络设备,如图1所示,该异常处理方法可以包括以下步骤:
需要说明的是,在本发明实施例中,网络设备上可以搭建至少一个用于业务进程运行的容器(本文中称为第一类型容器),以及分别与该至少一个第一类型容器对应的第二类型容器,第一类型容器与对应的第二类型容器运行有相同的业务进程。其中,第一类型业务容器为活跃(Active)状态(本文中可以称为Active容器),第二类型业务容器为备用状态(本文中也可以称为Shadow(影子)容器)。
优选地,第一类型容器与第二类型容器一一对应。
步骤101、触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对该共享存储空间中的运行数据进行读取。
本发明实施例中,目标第一类型容器并不特指某一固定的第一类型容器,而是可以指代网络设备上搭建的任一第一类型容器,本发明实施例后续不再复述。
本发明实施例中,为了保证目标第一类型容器和对应的第二类型容器(本文中称为目标第二类型容器)各业务进程的运行数据一致,当目标第一类型容器中各业务进程产生运行数据时,网络设备可以触发目标第一类型容器将运行数据写入对应的共享存储空间,如Shared(共享的)LMDB(Lightning Memory-Mapped Database,闪电内存映射数据库),并触发目标第二类型容器中相同的业务进程对该共享存储空间中的运行数据进行读取。
例如,网络设备一方面可以向目标第一类型容器发送数据写入指令,目标第一类型容器接收到数据写入指令时,可以触发各业务进程将产生的运行数据写入对应的共享存储空间。
另一方面可以向目标第二类型容器发送数据读取指令,该数据读取指令可以携带共享存储空间的标识信息,目标第二类型容器接收到该数据读取指令时,可以根据该标识信息确定对应的共享存储空间和业务进程,并触发该业务进程对该共享存储空间中的运行数据进行读取。
需要说明的是,在本发明实施例中,所有的协议栈以及业务进程均运行在容器中,内核态不再提供协议栈的应用,只做最基本的IO(Input/output,输入/输出)处理。
此外,初始状态下,活跃状态的第一类型容器中各业务进程均为活跃状态,可以进行共享存储空间的读写,并可以进行转发层面的控制;备用状态的第二类型容器中各业务进程均为备用状态,仅可进行共享存储空间的读,不可以进行共享存储空间的写,也不可以进行转发层面的控制。
步骤102、当监测到目标第一类型容器中的第一目标业务进程异常时,控制目标第二类型容器中相同的第二目标业务进程替代第一目标业务进程进行业务处理。
本发明实施例中,第一目标业务进程并不特指某一固定的业务进程,而是可以指代目标第一类型容器中运行的一个或多个业务进程,本发明实施例后续不再复述。
本发明实施例中,网络设备可以监测目标第一类型容器中各业务进程的状态,以确定是否存在业务进程异常。
由于目标第二类型容器中各业务进程与目标第一类型容器中相同的业务进程具有相同的运行数据,因此,当网络设备监测到目标第一类型容器中的第一目标业务进程异常时,可以控制目标第二类型容器中相同的业务进程(本文中称为第二目标业务进程)替代第一目标业务进程进行业务处理,避免了第一目标业务进程异常时重启恢复造成的网络拓扑震荡。
可见,在图1所示方法流程中,通过将业务进程运行在容器中,并对应各活跃状态的容器创建运行有相同业务进程的备用状态的容器,且保持活跃状态的容器与对应的备用状态的容器的运行数据一致,进而,当活跃状态的容器中的业务进程异常时,由备用状态的容器中的相同业务进程替代该异常业务进程进行业务处理,避免了由于业务异常时重启恢复造成的网络拓扑震荡,提高了网络设备的可靠性和稳定性。
进一步地,在本发明实施例中,考虑到第一类型容器中可以运行单个或多个业务进程,且第一类型容器业务进程异常时,可能包括部分业务进程异常的情况,或全部业务进程均异常的情况,第一类型容器和对应第二类型容器之间可以针对不同的情况采取不同的处理措施来避免网络拓扑震荡,提高异常处理的灵活性。
相应地,在本发明其中一个实施例中,若第一目标业务进程为目标第一类型容器中的全部业务进程,则上述当监测到目标第一类型容器中的第一目标业务进程异常时,控制目标第二类型容器中相同的第二目标业务进程替代目标第一目标业务进程进行业务处理,可以包括:
当监测到目标第二类型容器监测到目标第一类型容器异常时,控制目标第二类型容器切换为活跃状态。
在该实施例中,当第一目标业务进程为目标第一类型容器中的全部业务进程,且目标第一类型容器中的第一目标业务进程异常时,可以确定目标第一类型容器整机异常。
例如,目标第一类型容器中仅运行单个业务进程,且该业务进程异常;或,目标第一类型容器中运行有多个业务进程,且该多个业务进程均异常。
在该实施例中,当网络设备监测到目标第一类型容器整机异常时,可以控制目标第二类型容器切换为活跃状态(由备用状态切换为活跃状态)。
其中,目标第二类型容器切换为活跃状态之后,目标第二类型容器中各业务进程可以进行共享存储空间的读写,并可以进行转发层面控制,从而,可以保证业务正常运行,避免网络拓扑震荡。
需要说明的是,在该实施例中,目标第一类型容器整机异常时,可以通过重启的方式进行异常恢复。当目标第一类型容器恢复完成时,网络设备可以控制目标第一类型容器中的业务进程从共享存储空间中读取运行数据,此时,网络设备可以控制目标第一类型容器切换为活跃状态,并控制目标第二类型容器切换为备用状态;或者,网络设备可以控制目标第一类型容器切换为备用状态,进而,目标第一类型容器可以成为目标第二类型容器的Shadow容器(在该情况下目标第一类型容器可以作为第二类型容器,目标第二类型容器可以作为第一类型容器,并在后续流程中按照步骤101~步骤102中描述的方式进行异常处理),其具体实现在此不做赘述。
在本发明另一种实施例中,若目标第一类型容器中运行有多个业务进程,且第一目标业务进程为目标第一类型容器中的部分业务进程,则上述当监测到目标第一类型容器中的第一目标业务进程异常时,控制目标第二类型容器中相同的第二目标业务进程替代目标第一目标业务进程进行业务处理,可以包括:
当监测到目标第一类型容器中的第一目标业务进程异常时,控制第二目标业务进程切换为活跃状态;
将发往第一目标业务进程的协议报文发送给第二目标业务进程,由第二目标业务进程对该协议报文进行处理。
在该实施例中,当网络设备监测到目标第一类型容器中部分业务进程(目标第一目标业务进程)异常时,网络设备可以控制目标第二类型容器将第二目标业务进程切换为活跃状态。
当网络设备接收到需要发往第一目标业务进程的协议报文时,网络设备可以将该协议报文发送给第二目标业务进程,由第二目标业务进程进行代答。
进一步地,在该实施例中,当网络设备监测到第一目标业务进程恢复完成时,网络设备可以控制第二目标业务进程切换为备用状态,此时,当网络设备再次接收到需要发往第一目标业务进程的协议报文时,网络设备可以将该协议报文发送给第一目标业务进程,由第一目标业务进程进行处理。
需要说明的是,在该实施例中,网络设备控制第二目标业务进程切换为活跃状态之后,还可以预设策略确定是否进行LMDB的读写切换,即是否允许第二目标业务进程进行LMDB的写。例如,当第一目标业务进程的恢复时间(可以由经验确定)超过预设时间阈值时,进行LMDB的读写切换;否则,不进行LMDB的读写切换。
进一步地,在本发明另一个实施例中,当网络设备监测到目标第一类型容器中部分业务进程异常时,网络设备可以参照目标第一类型容器整机异常的处理方式,将目标第二类型容器切换为活跃状态。
在该实施例中,为了避免多个容器中的相同业务进程对转发层面的控制冲突,将目标第二类型容器切换为活跃状态时,还需要将目标第一类型容器切换为备用状态,其具体实现可以在下文中结合具体实例进行说明。
需要说明的是,在该实施例中,若第一目标业务进程为目标第一类型容器中的部分业务进程,则在确定通过切换业务进程状态方式或切换容器状态的方式保证业务可用时,可以根据第一目标业务进程的数量或/和第一目标业务进程的数量与目标第一类型容器中全部业务进程的数量的比例确定。例如,当第一目标业务进程的数量超过预设数量阈值或/和第一目标业务进程的数量与目标第一类型容器中全部业务进程的数量的比例超过预设比例阈值时,通过切换容器状态的方式保证业务可用;否则,通过切换业务进程状态的方式保证业务可用性,其具体实现在此不做赘述。
为了使本领域技术人员更好地理解本发明实施例提供的技术方案,下面结合具体应用场景对本发明实施例提供的技术方案进行说明。
请参见图2,为本发明实施例提供的一种应用场景的示意图,如图2所示,网络设备200上搭建有第一类型容器210和第二类型容器220;第一类型容器210和第二类型容器220中均运行有业务进程1和2(为便于描述,第一类型容器210中的业务进程1和2可以分别称为业务进程211和212,第二类型容器220中的业务进程1和2可以分别称为业务进程221和222)。
其中,初始状态下,第一类型容器210为活跃状态,业务进程211和212均为活跃状态,可以进行共享存储空间(以Shared LMDB230为例)的读写,并可以进行转发层面的控制;第二类型容器220为备用状态,业务进程221和222均为备用状态,不可以进行共享存储空间的写,也不可以进行转发层面的控制。
基于图2所示的应用场景,本发明实施例提供的异常处理方案实现如下:
实施例一
在该实施例中,以业务进程211和212均异常,即第一类型容器210整机异常为例,其异常处理实现流程可以如图3A所示,可以包括以下步骤:
步骤301、网络设备200业务进程211和/或业务进程212向Shared LMDB230写入运行数据,并触发业务进程221和/或业务进程从Shared LMDB230中读取运行数据。
在该实施例中,当网络设备监测到第一类型容器210的业务进程211和/或业务进程212产生运行数据时,网络设备200可以分别向第一类型容器210发送数据写入指令和向第二类型容器发送数据读取指令。
第一类型容器210接收到数据写入指令时,可以触发业务进程211和/或业务进程212将产生的运行数据,如FIB(Forward Information dataBase,转发信息库)、Route(路由)协议栈状态等,写入Shared LMDB230。
第二类型容器210接收到数据读取指令时,可以触发业务进程221和/或业务进程222从Shared LMDB230中读取数据,其示意图可以如图3B所示。
步骤302、当网络设备200监测到第一类型容器210整机异常时,网络设备200控制第二类型容器220切换为活跃状态。
在该实施例中,当网络设备200监测到第一类型容器210整机异常时,网络设备200可以向第二类型容器220发送状态(容器状态)切换指令,指示第二类型容器220切换为活跃状态。
第二类型容器220接收到该状态切换指令时,可以由备用状态切换为活跃状态,其示意图可以图3C所示。此时,由于第二类型容器220中具有第一类型容器210中的全部运行数据,因此,第二类型容器220可以接管第一类型容器210的状态,由第二类型容器220进行转发层面的控制。
其中,进行状态切换时,IO层面仅需进行基本的IO操作即可,其具体实现在此不做赘述。
需要说明的是,在该实施例中,网络设备200控制第二类型容器220切换为活跃状态之后,可以对第一类型容器210进行重启,以实现异常恢复。当第一类型容器210恢复完成时,第一类型容器210可以从Shared LMDB230中读取运行数据,进而,网络设备200可以将第一类型容器210设置活跃状态(此时需要控制第二类型容器220切换为备用状态)或将第一类型容器210设置为备用状态,其具体实现在此不做赘述。
实施例二
在该实施例中,以业务进程211异常为例,其异常处理实现流程可以如图4A所示,可以包括以下步骤:
步骤401、网络设备200触发业务进程211和/或业务进程212向Shared LMDB230写入运行数据,并触发业务进程221和/或业务进程从Shared LMDB230中读取运行数据。
在该实施例中,步骤401的具体实现可以参见步骤301中的相关描述,本发明实施例在此不做赘述。
步骤402、当网络设备200监测到业务进程211异常时,网络设备控制业务进程221切换活跃状态。
在该实施例中,当网络设备200监测到第一类型容器210中的业务进程211异常时,为了避免业务进程211恢复过程中的业务不可用,网络设备200可以控制第二类型容器220中的业务进程212切换为活跃状态,以便由业务进程212在业务进程211的恢复过程中对需要发往业务进程211的协议报文进行代答,其示意图可以如图4B所示。
步骤403、将发往业务进程211的协议报文发送给业务进程221,由业务进程221对该协议报文进行处理。
在该实施例中,网络设备200将业务进程221切换为活跃状态之后,当接收到需要发往业务进程211的协议报文时,网络设备可以将该协议报文发送给业务进程221,由业务进程221对该协议报文进行处理。
其中,由于业务进程221具有和业务进程211相同的运行数据,因此,业务处理不会中断,避免了网络拓扑的震荡。
步骤404、当网络设备200监测到业务进程211恢复完成时,控制业务进程221切换为备用状态。
步骤405、将发往业务进程211的协议报文发送给业务进程211。
在该实施例中,当业务进程211恢复完成时,网络设备200可以控制业务进程221切换为备用状态,此时,当网络设备200再次接收到发往业务进程211的协议报文时,网络设备200可以重新将该协议报文发送给业务进程211,由业务进程211对该协议报文进行处理。
实施例三
在该实施例中,仍以业务进程211异常为例,其异常处理实现流程可以如图5A所示,可以包括以下步骤:
步骤501、网络设备200触发业务进程211和/或业务进程212向Shared LMDB230写入运行数据,并触发业务进程221和/或业务进程从Shared LMDB230中读取运行数据。
在该实施例中,步骤501的具体实现可以参见步骤301中的相关描述,本发明实施例在此不做赘述。
步骤502、当网络设备200监测到业务进程211异常时,网络设备200控制第二类型容器220切换为活跃状态,并将第一类型容器210切换为备用状态。
在该实施例中,当网络设备200监测到业务进程211异常时,网络设备200可以向第二类型容器220发送状态切换指令,指示第二类型容器220切换为活跃状态,并向第一类型容器210发送状态切换指令,指示第一类型容器210切换为备用状态。
第二类型容器220接收到状态切换指令时,可以由备用状态切换为活跃状态。此时,由于第二类型容器220中具有第一类型容器210中的全部运行数据,因此,第二类型容器220可以接管第一类型容器210的状态,由第二类型容器220进行转发层面的控制。
第一类型容器210接收到状态切换指令时,可以由活跃状态切换为备用状态。此时,第一类型容器210中各业务进程(业务进程211和业务进程212)均为备用状态,不能对LMDB进行写,且不能进行转发层面控制,其示意图可以如图5B所示。
步骤503、当网络设备200监测到业务进程211恢复完成时,网络设备200控制第一类型容器210切换为活跃状态,并将第二类型容器220切换为备用状态。
在该实施例中,当业务进程211恢复完成时,如业务进程211重启完成时,网络设备200可以重新将第一类型210切换为活跃状态,并将第二类型容器220切换为备用状态。
通过以上描述可以看出,在本发明实施例提供的技术方案中,通过将网络设备中的业务进程装入容器,并在网络设备上对应各活跃状态的容器创建运行有相同业务进程的备用状态的容器,且保持活跃状态的容器与对应的备用状态的容器的运行数据一致,进而,当活跃状态的容器中的业务进程异常时,由备用状态的容器中的相同业务进程替代该异常业务进程进行业务处理,避免了由于业务异常时重启恢复造成的网络拓扑震荡,提高了网络设备的可靠性和稳定性。
请参见图6,为本发明实施例提供的一种异常处理装置的结构示意图,其中,该异常处理装置可以应用于上述方法实施例中的网络设备,如图6所示,该异常处理装置可以包括:
读写控制单元610,用于触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对该共享存储空间中的运行数据进行读取;
状态控制单元620,用于当监测到目标第一类型容器中的第一目标业务进程异常时,控制目标第二类型容器中相同的第二目标业务进程替代第一目标业务进程进行业务处理。
在可选实施例中,第一目标业务进程为目标第一类型容器中的全部业务进程;
状态控制单元620,具体用于当监测到目标第一类型容器整机异常时,控制目标第二类型容器切换为活跃状态。
在可选实施例中,目标第一类型容器中运行有多个业务进程,且第一目标业务进程为目标第一类型容器中的部分业务进程;
状态控制单元,具体用于当监测到目标第一类型容器中的第一目标业务进程异常时,控制第二目标业务进程切换为活跃状态。
相应地,请一并参见图7,为本发明实施例提供的另一种异常处理装置的结构示意图,如图7所示,在图6所示异常处理装置的基础上,图7所示异常处理装置还可以包括:
报文收发单元630,用于将发往第一目标业务进程的协议报文发送给第二目标业务进程,由第二目标业务进程对协议报文进行处理。
在可选实施例中,状态控制单元620,还用于当监测到第一目标业务进程恢复完成时,控制第二目标业务进程切换为备用状态;
报文收发单元630,还用于将发往第一目标业务进程的协议报文发送给第一目标业务进程。
在可选实施例中,目标第一类型容器中运行有多个业务进程,且第一目标业务进程为目标第一类型容器中的部分业务进程;
状态控制单元620,具体用于当监测到目标第一类型容器中的第一目标业务进程异常时,将目标第一类型容器切换为备用状态,并将目标第二类型容器切换为活跃状态。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
由上述实施例可见,通过将网络设备中的业务进程装入容器,并在网络设备上对应各活跃状态的容器创建运行有相同业务进程的备用状态的容器,且保持活跃状态的容器与对应的备用状态的容器的运行数据一致,进而,当活跃状态的容器中的业务进程异常时,由备用状态的容器中的相同业务进程替代该异常业务进程进行业务处理,避免了由于业务异常时重启恢复造成的网络拓扑震荡,提高了网络设备的可靠性和稳定性。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种异常处理方法,应用于网络设备,所述网络设备上搭建有至少一个第一类型容器,以及分别与所述至少一个第一类型容器对应的第二类型容器,所述第一类型容器与对应的第二类型容器运行有相同的业务进程,所述第一类型容器处于活跃状态,所述第二类型容器处于备用状态,其特征在于,该方法包括:
触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对所述共享存储空间中的运行数据进行读取;
当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述第一目标业务进程进行业务处理。
2.根据权利要求1所述的方法,其特征在于,所述第一目标业务进程为所述目标第一类型容器中的全部业务进程;
所述当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述目标第一目标业务进程进行业务处理,包括:
当监测到所述目标第一类型容器整机异常时,控制所述目标第二类型容器切换为活跃状态。
3.根据权利要求1所述的方法,其特征在于,所述目标第一类型容器中运行有多个业务进程,且所述第一目标业务进程为所述目标第一类型容器中的部分业务进程;
所述当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述目标第一目标业务进程进行业务处理,包括:
当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述第二目标业务进程切换为活跃状态;
将发往所述第一目标业务进程的协议报文发送给所述第二目标业务进程,由所述第二目标业务进程对所述协议报文进行处理。
4.根据权利要求3所述的方法,其特征在于,所述控制所述目标第二类型容器中相同的第二目标业务进程替代所述目标第一目标业务进程进行业务处理之后,还包括:
当监测到所述第一目标业务进程恢复完成时,控制所述第二目标业务进程切换为备用状态;
将发往所述第一目标业务进程的协议报文发送给所述第一目标业务进程。
5.根据权利要求1所述的方法,其特征在于,所述目标第一类型容器中运行有多个业务进程,且所述第一目标业务进程为所述目标第一类型容器中的部分业务进程;
所述当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述目标第一目标业务进程进行业务处理,包括:
当监测到所述目标第一类型容器中的第一目标业务进程异常时,将所述目标第一类型容器切换为备用状态,并将所述目标第二类型容器切换为活跃状态。
6.一种异常处理装置,应用于网络设备,所述网络设备上搭建有至少一个第一类型容器,以及分别与所述至少一个第一类型容器对应的第二类型容器,所述第一类型容器与对应的第二类型容器运行有相同的业务进程,所述第一类型容器处于活跃状态,所述第二类型容器处于备用状态,其特征在于,该装置包括:
读写控制单元,用于触发目标第一类型容器中的业务进程将运行数据写入对应的共享存储空间,并触发对应的目标第二类型容器中的业务进程对所述共享存储空间中的运行数据进行读取;
状态控制单元,用于当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述目标第二类型容器中相同的第二目标业务进程替代所述第一目标业务进程进行业务处理。
7.根据权利要求6所述的装置,其特征在于,所述第一目标业务进程为所述目标第一类型容器中的全部业务进程;
所述状态控制单元,具体用于当监测到所述目标第一类型容器整机异常时,控制所述目标第二类型容器切换为活跃状态。
8.根据权利要求6所述的装置,其特征在于,所述目标第一类型容器中运行有多个业务进程,且所述第一目标业务进程为所述目标第一类型容器中的部分业务进程;
所述状态控制单元,具体用于当监测到所述目标第一类型容器中的第一目标业务进程异常时,控制所述第二目标业务进程切换为活跃状态;
所述装置还包括:
报文收发单元,用于将发往所述第一目标业务进程的协议报文发送给所述第二目标业务进程,由所述第二目标业务进程对所述协议报文进行处理。
9.根据权利要求8所述的装置,其特征在于,
所述状态控制单元,还用于当监测到所述第一目标业务进程恢复完成时,控制所述第二目标业务进程切换为备用状态;
所述报文收发单元,还用于将发往所述第一目标业务进程的协议报文发送给所述第一目标业务进程。
10.根据权利要求6所述的装置,其特征在于,所述目标第一类型容器中运行有多个业务进程,且所述第一目标业务进程为所述目标第一类型容器中的部分业务进程;
所述状态控制单元,具体用于当监测到所述目标第一类型容器中的第一目标业务进程异常时,将所述目标第一类型容器切换为备用状态,并将所述目标第二类型容器切换为活跃状态。
CN201810691549.8A 2018-06-28 2018-06-28 一种异常处理方法及装置 Active CN108471364B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810691549.8A CN108471364B (zh) 2018-06-28 2018-06-28 一种异常处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810691549.8A CN108471364B (zh) 2018-06-28 2018-06-28 一种异常处理方法及装置

Publications (2)

Publication Number Publication Date
CN108471364A CN108471364A (zh) 2018-08-31
CN108471364B true CN108471364B (zh) 2021-05-28

Family

ID=63259966

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810691549.8A Active CN108471364B (zh) 2018-06-28 2018-06-28 一种异常处理方法及装置

Country Status (1)

Country Link
CN (1) CN108471364B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113672363B (zh) * 2021-07-21 2024-02-02 惠州华阳通用电子有限公司 一种多任务异常的恢复方法及存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482829A (zh) * 2009-01-22 2009-07-15 华为技术有限公司 集群系统、处理装置及集群系统冗余方法
CN102349266A (zh) * 2011-08-12 2012-02-08 华为技术有限公司 通信系统中节点设备上配置的服务故障的处理方法及装置
CN103200109A (zh) * 2013-03-22 2013-07-10 杭州华三通信技术有限公司 一种ospf邻居关系管理方法和设备
EP2651075A4 (en) * 2011-01-06 2014-07-30 Huawei Tech Co Ltd SECURITY PROCESS AND DEVICE FOR A TCP CONNECTION
CN106407045A (zh) * 2016-09-29 2017-02-15 郑州云海信息技术有限公司 一种数据灾难恢复方法、系统及服务器虚拟化系统
CN107391313A (zh) * 2017-07-31 2017-11-24 郑州云海信息技术有限公司 一种容器的运行方法及装置
US9946603B1 (en) * 2015-04-14 2018-04-17 EMC IP Holding Company LLC Mountable container for incremental file backups

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101482829A (zh) * 2009-01-22 2009-07-15 华为技术有限公司 集群系统、处理装置及集群系统冗余方法
EP2651075A4 (en) * 2011-01-06 2014-07-30 Huawei Tech Co Ltd SECURITY PROCESS AND DEVICE FOR A TCP CONNECTION
CN102349266A (zh) * 2011-08-12 2012-02-08 华为技术有限公司 通信系统中节点设备上配置的服务故障的处理方法及装置
CN103200109A (zh) * 2013-03-22 2013-07-10 杭州华三通信技术有限公司 一种ospf邻居关系管理方法和设备
US9946603B1 (en) * 2015-04-14 2018-04-17 EMC IP Holding Company LLC Mountable container for incremental file backups
CN106407045A (zh) * 2016-09-29 2017-02-15 郑州云海信息技术有限公司 一种数据灾难恢复方法、系统及服务器虚拟化系统
CN107391313A (zh) * 2017-07-31 2017-11-24 郑州云海信息技术有限公司 一种容器的运行方法及装置

Also Published As

Publication number Publication date
CN108471364A (zh) 2018-08-31

Similar Documents

Publication Publication Date Title
CN110113197A (zh) Sdn控制器配置网络设备的方法和sdn控制器
CN108880898B (zh) 主备容器系统切换方法及装置
CN105468302B (zh) 一种处理数据的方法、装置及系统
CN108027723B (zh) 一种光线路终端及其主、从设备升级的方法
CN111835685B (zh) 一种监控Nginx网络隔离空间的运行状态的方法和服务器
CN109194589B (zh) 一种mdc实现方法及装置
CN109213507A (zh) 一种升级方法及服务器
CN108984195B (zh) 一种软件升级方法及装置
CN113515408A (zh) 一种数据容灾方法、装置、设备及介质
CN106161086B (zh) 主控板重启的控制方法及装置
CN111045811A (zh) 一种任务分配方法、装置、电子设备及存储介质
CN110569124A (zh) 一种任务分配方法和装置
CN104683486B (zh) 分布式系统中处理同步消息的方法、装置、分布式系统
CN108471364B (zh) 一种异常处理方法及装置
CN114553900B (zh) 一种分布式块存储管理系统、方法及电子设备
CN108804129B (zh) 一种软件升级方法及装置
CN109756490B (zh) 一种mdc实现方法及装置
EP4030776A1 (en) Method and apparatus for triggering vomci function from olt to send omci messages
CN112015561B (zh) 用于流式计算服务的方法、装置和系统
JP2005250840A (ja) 耐障害システムのための情報処理装置
KR20150104435A (ko) 라우팅 처리기의 동작 모드 천이 방법
CN112491570A (zh) 一种虚拟网卡链路状态设置方法、装置及存储介质
CN111935337B (zh) 聚合链路的mac地址保活方法、设备和存储介质
JP2009075710A (ja) 冗長化システム
CN113794631B (zh) 一种端口冗余处理方法、装置、设备及机器可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant