CN112804077B - 数据保护方法、控制器、控制面设备和存储介质 - Google Patents

数据保护方法、控制器、控制面设备和存储介质 Download PDF

Info

Publication number
CN112804077B
CN112804077B CN202010504294.7A CN202010504294A CN112804077B CN 112804077 B CN112804077 B CN 112804077B CN 202010504294 A CN202010504294 A CN 202010504294A CN 112804077 B CN112804077 B CN 112804077B
Authority
CN
China
Prior art keywords
protocol processor
main
protocol
standby
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010504294.7A
Other languages
English (en)
Other versions
CN112804077A (zh
Inventor
刘硕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ZTE Corp
Original Assignee
ZTE Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ZTE Corp filed Critical ZTE Corp
Priority to CN202010504294.7A priority Critical patent/CN112804077B/zh
Publication of CN112804077A publication Critical patent/CN112804077A/zh
Application granted granted Critical
Publication of CN112804077B publication Critical patent/CN112804077B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0668Management of faults, events, alarms or notifications using network fault recovery by dynamic selection of recovery network elements, e.g. replacement by the most appropriate element after failure
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/12Avoiding congestion; Recovering from congestion
    • H04L47/125Avoiding congestion; Recovering from congestion by balancing the load, e.g. traffic engineering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请提出一种数据保护方法、控制器、控制面设备和存储介质,该方法包括:从预定的至少两个主协议处理器中获取发生故障的主协议处理器;从正常状态的主协议处理器和预设的一个备协议处理器中,选择可用的协议处理器,并使用所选择的协议处理器备份发生故障的主协议处理器中用户的报文数据。

Description

数据保护方法、控制器、控制面设备和存储介质
技术领域
本申请涉及通信技术领域,具体涉及一种数据保护方法、控制器、控制面设备和存储介质。
背景技术
在控制面和转发面分离(简称为转控分离)的虚拟化宽带远程接入服务器(Broadband Remote Access Server,vBRAS)系统架构中,包括控制面(virtual BRASControl Plane,vBRAS-CP)设备、转发面(virtual BRAS User Plane,vBRAS-UP)设备、以及vBRAS-CP设备与vBRAS-UP设备之间的标准化接口。
在转控分离的vBRAS系统中,控制器(Manage Plane,MP)可以管理多个协议处理器(Protocol Processor,PP)设备,PP设备可以用于管理活动用户的全量信息,并负责将用户信息同步到转发面。当PP损坏或离线,需要将损坏或离线的PP上的用户备份到其它可用的PP资源上。
发明内容
本申请提供一种数据保护方法、控制器、控制面设备和存储介质。
本申请实施例提供一种数据保护方法,包括:从预定的至少两个主协议处理器中获取发生故障的主协议处理器;从正常状态的主协议处理器和预设的一个备协议处理器中,选择可用的协议处理器,并使用所选择的协议处理器备份发生故障的主协议处理器中用户的报文数据。
本申请实施例提供一种控制器,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现本申请实施例中的任意一种数据保护方法。
本申请实施例提供一种控制面设备,包括:负载平衡器,用于接收位于转发面设备的一个或多个转发器所转发的用户,并将每个转发器所转发的用户分流至不同的主协议处理器;多个协议处理器,包括至少两个主协议处理器和一个备协议处理器,多个协议处理器中的每个协议处理器用于与所接收的用户进行报文交互;控制器,用于执行本申请实施例的任意一种数据保护方法。
本申请实施例提供了一种存储介质,存储介质存储有计算机程序,计算机程序被处理器执行时实现本申请实施例中的任意一种数据保护方法。
根据本申请实施例的数据保护方法、控制器和存储介质,区分主PP设备和备PP设备,实现了多个主PP设备和1个备PP设备形成的多对1的PP设备备份,当主PP发生故障时,从其他主PP设备和PP设备中选择一个可用的PP,来实现对该故障PP上用户的保护,从而保证该故障PP上的用户功能不受影响,提高系统的可靠性。
根据本申请实施例的控制面设备,负载平衡器负责用户分流,将用户上线报文投递到不同的PP设备上,PP设备与用户进行报文的交互,当PP设备损坏或者离线,能够将PP设备上的用户备份到其它可用的PP资源上,保证用户功能不受影响,提高系统的可靠性。
关于本申请的以上实施例和其他方面以及其实现方式,在附图说明、具体实施方式和权利要求中提供更多说明。
附图说明
图1示出本申请实施例的转控分离的vBRAS系统的架构示意图。。
图2示出本申请一实施例的数据保护方法的流程示意图。
图3示出本申请实施例的设置主协议处理器和备协议处理器的流程示意图。。
图4示出本申请另一实施例的数据保护方法的详细流程图。。
图5示出本申请实施例的vBRAS-CP系统中PP设备重启后数据恢复过程流程图。
图6示出本申请实施例的vBRAS-CP系统中PP离线后进行用户备份的过程示意图。
图7示出本申请实施例中主PP设备中用户资源释放的过程示意图。
图8示出本申请一实施例的备PP升级为主PP的过程示意图。
图9示出本申请实施例的控制器进行主备倒换后保持槽位状态的过程示意图。
图10示出本发明实施例提供的数据保护装置的结构示意图。
图11示出本申请实施例的控制面设备的结构示意图。
图12示出能够实现根据本发明实施例的方法和装置的计算设备的示例性硬件架构的结构图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下文中将结合附图对本申请的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
本申请实施例提供一种数据保护方法、控制器、控制面设备和存储介质,可以应用与包括转发面vBRAS-UP设备和控制面vBRAS-CP设备的系统,如转控分离的vBRAS系统。下面通过图1描述vBRAS系统的系统架构。
图1示出本申请一实施例的转控分离的vBRAS系统的架构示意图。如图1所示,vBRAS系统中包括转发面vBRAS-UP设备10和控制面vBRAS-CP设备20。在实际应用中,vBRAS系统中vBRAS-CP设备的数量、以及vBRAS-UP设备的数量可以根据实际需要进行设备,对此数量不做限制。
在图1中,转发面vBRAS-UP设备10,表示vBRAS系统中的转发面设备,该转发面设备可以是软件形式的虚拟BRAS-UP设备,如运行于X86服务器的虚拟资源,也可以是硬件形式的物理BRAS-UP设备,如路由器Router或者交换机Switch(SW)等。如图1所示,vBRAS-UP设备20例如可以是一个或多个交换机21,例如交换机vBRAS-UP1、交换机vBRAS-UP2和交换机vBRAS-UP3。在图1中,虚线箭头可以表示设备之间的连接为虚拟连接。
继续参考图1,控制面vBRAS-CP设备20,表示vBRAS系统中的控制面设备,该控制面设备中可以包括控制器MP11、一个多个协议处理器PP例如PP1、PP2、……、PP5,以及负载均衡器(Load Balancer,LB)13。
在图1中,用户设备(图中未示出)可以通过拨号例如个人电脑(PersonalComputer,PC)拨号,将上线报文发送至vBRAS-UP设备10中的各个交换机;各个转发器将接收到的上线报文发送至vBRAS-CP设备20中的LB13,LB13通过报文分发,将接收到的由不同交换机发送的用户的报文数据,分流至不同的PP设备;PP设备与用户进行报文交互,且PP设备管理活动用户的全量信息,并负责将用户信息同步到vBRAS系统的转发面vBRAS-U设备。
在本申请实施例中,转控分离的vBRAS系统借鉴软件定义网络(Software DefinedNetwork,SDN)和网络功能虚拟化(Network Function Virtualization,NFV)的技术思路,结合通信技术(Communication Technology,CT)与信息技术(Information Technology,IT)的技术优势,充分考虑运营商现实场景需求,实现转发和控制分离、控制面虚拟化集中化、转发面虚实共存。由于转控分离vBRAS系统包含控制面vBRAS-CP、转发面vBRAS-UP及控制面和转发面(Control/User,C/U)之间的标准化接口,因此又称为C/U分离vBRAS系统。
在本申请实施例的C/U分离的vBRAS系统中,当PP损坏或离线,需要将损坏或离线的PP上的用户备份到其它可用的PP资源上,以保证用户功能不受影响,提高系统的可靠性。
图2示出本申请实施例的数据保护方法的流程示意图。如图2所示,本申请实施例中的方法可以包括以下步骤。
S110,从预定的至少两个主协议处理器中获取发生故障的主协议处理器。
S120,从正常状态的主协议处理器和预设的一个备协议处理器中,选择可用的协议处理器,并使用所选择的协议处理器备份发生故障的主协议处理器中用户的报文数据。
根据本申请实施例的方法,通过N个主协议处理器和预设的一个备协议处理器,实现PP设备中的用户迁移和用户报文数据的备份,其中,N为大于等于2的整数;当某个主PP设备发生故障时,从其他主PP设备和PP设备中选择一个可用的PP,来实现对该故障PP上用户的保护,从而保证该故障PP上的用户功能不受影响,提高系统的可靠性。
在一个实施例中,备协议处理器的数量可以是大于等于1的整数。由于备协议处理器在主PP设备正常状态下,并不用于与用户进行报文交互,为节省系统资源,提高资源利用率和设备维护成本,备协议处理器的数量可以为1,从而实现PP设备N:1的备份。
在一个实施例中,主协议处理器和备协议处理器,位于转控分离的虚拟化宽带远程接入服务器vBRAS的控制面设备中,且本控制器与每个主协议处理器和备协议处理器之间的连接为虚拟网络连接。
在该实施例中,主协议处理器和备协议处理器可以是软件形式的虚拟资源,在下述实施例的描述中,主协议处理器也可以称为主PP虚机或主PP设备,备协议处理器也可以称为备PP虚机或备PP设备。
在一个实施例中,在步骤S110之前,该方法还可以包括:S10,在本控制器所属系统启动后,基于检测的协议处理器的上电顺序,确定所属系统中的主协议处理器和备协议处理器。
在该实施例中,VBRAS-CP系统在启动时,可以以控制器MP感知到的PP虚机上电的先后顺序来决定主备PP。
在一个实施例中,步骤S10中的基于检测的协议处理器的上电顺序,确定所属系统中的主协议处理器和备协议处理器步骤,具体可以包括如下步骤。
S101,若确定所属系统中正常状态的主协议处理器的数量大于零,以及正常状态的备协议处理器的数量为零,则将检测到的新上电的协议处理器设置为备协议处理器。
在该步骤中,在本控制器所属系统启动后,若确定所属系统中正常状态的主协议处理器的数量为零,则将检测到的首个上电的协议处理器设置为正常状态的主协议处理器;若确定所属系统中正常状态的主协议处理器的数量大于零,以及正常状态的备协议处理器的数量为零,则将检测到的新上电的协议处理器设置为备协议处理器;以及,若确定所属系统中正常状态的备协议处理器的数量大于零,则将检测到的新上电的协议处理器设置为正常状态的主协议处理器。
通过上述步骤,在PP设备逐个启动时,控制器可以根据PP设备的上电顺序确定当前上电启动的控制器是主PP设备还是备PP设备。作为示例,主PP设备和备PP设备的区别包括:主PP设备可以允许用户拨号上线以及与用户进行报文交互,而备PP设备在主PP设备正常状态下,不允许用户拨号上线,以及不允许与用户进行报文交互。
为了便于理解,下面通过图3,描述主协议处理器和备协议处理器的设置流程示意图。图3示出本申请实施例的设置主协议处理器和备协议处理器的流程示意图。如图3所示,设置主协议处理器和备协议处理器的流程具体可以包括如下步骤。
如S201中“新PP设备添加”所示,本控制器检测到所属系统中需要添加新的协议处理器。
在该步骤中,包括vBRAS-CP系统启动后,控制器MP检测到上电启动的协议处理器时,需要将上电启动的协议处理器添加到vBRAS-CP系统中。
如S202中“有可用的主PP设备?”所示,判断本控制器所属系统中是否存在可用的主协议处理器。
在该步骤中,若主协议处理器的状态为正常状态,则判定该主协议处理器是可用的主协议处理器,本控制器所属系统例如可以是控制器MP所属的vBRAS-CP系统。
如S203中“定为主PP设备”所示,若本控制器所属系统中没有可用的主PP,则将当前新上电启动的协议处理器为主协议处理器。
如S204中“有备PP?”所示,若本控制器所属系统中有可用的主PP,则继续判断本控制器所属系统中是否有备协议处理器。
作为一个示例,若判定本控制器所属系统中有可用的备PP,则执行上述步骤S203,若判定本控制器所属系统中无可用的备PP,则执行步骤S205。
作为另一示例,若判定本控制器所属系统中无可用的备PP且该槽位为正常状态时,执行步骤S205。
其中,槽位为正常状态标识槽位状态非PP待重生(Wait Reboot)或槽位状态非待老化(Wait Age)。
如S205中“定为备PP”所示,将当前新上电启动的协议处理器为备协议处理器。
通过上述步骤S201-S205,当PP设备逐个启动时,MP按照上述流程来决策当前上电启动的PP是主PP还是备PP,从而形成图1所示的vBRAS-CP系统中的PP组网,即PP设备的N:1(N个主PP和1个备PP)备份架构。
在该实施例中,vBRAS-CP系统启动后,当第一个PP设备例如PP1上电启动时,MP检测到当前环境没有PP资源可用,这是第一个上电的PP,为优先保证用户上线,此时MP可以将PP1设定为主PP;当第二个PP设备例如PP2上电启动,MP检测到当前环境只有PP1一个主PP,没有备PP,此时MP可以将PP2定为备份PP,用来保护主PP1上的用户数据;当第三个PP设备例如PP3上电启动,MP检测到当前环境有主PP1和备PP2,按照N:1的备份原则,当PP3在启动后,MP可以将PP3定为主PP,可以供用户上线使用;以此类推,接下来上电启动的PP设备均可以设定为主PP。在该实施例中,当所有主PP都故障时,可以将备PP升为主PP,供用户上线使用。
在一个实施例中,步骤S110具体可以包括:S111,在至少两个主协议处理器中,若检测到第一主协议处理器在上电后与本控制器之间的链路发生故障,或者检测到第一主协议处理器离线,则将第一主协议处理器设置为待重生状态;S112,检测第一主协议处理器是否在预定的第一等待时长内重新上电;S113,若第一主协议处理器未在第一等待时长内重新上电,将第一主协议处理器作为发生故障的主协议处理器。
在该实施例中,若第一主协议处理器在预定的第一等待时长内重新上电,则将第一主协议处理器设置为正常状态。
在该实施例中,第一主协议处理器为至少两个主协议处理器中的任一主协议处理器,通过PP设备的待重生状态,可以在现有网络条件不稳定的情况下,抑制PP设备的用户频繁迁移震荡的问题,提高系统稳定性。
在一个实施例中,在步骤S113之后,该方法还可以包括:S114,若正常状态的主协议处理器和备协议处理器的数量均为零,则确定可用的协议处理器数量为零,并将发生故障的主协议处理器设置为待老化状态;S115,检测本控制器所属系统中新上电的协议处理器;S116,若在预定的第二等待时长内,未检测到新上电的协议处理器,则释放第一主协议处理器中的用户所占用的资源。
在一个实施例中,预设的第二等待时长可以大于预设的第一等待时长。作为示例,第一等待时长可以是3分钟、5分钟、7分钟等;第二等待时长例如可以是30分钟、40分钟、45分钟等。第一等待时长和第二等待时长的具体值可以根据实际需要进行自定义设置,本申请实施例不做具体限定。
作为一个示例,当PP设备例如PP1上电时,设置PP1的状态是正常状态;当PP1和MP之间链路发生故障或者PP1重启时,MP感知到PP1离线,将PP1的状态设置为待重生,并等待PP1重新恢复,等待重新恢复的时长为预设的第一等待时长例如3分钟;第一等待时长后,如果PP1还没有重新上电启动,MP可以判定PP1发生故障,需要把PP1上的用户备份到其它PP设备上;如果没有其它正常状态的PP可用,那么MP会把PP1的状态设置为待老化状态,时长为预设的第二等待时长例如为30分钟,在此期间如果系统中增加了新的PP资源,则PP1上的用户依然能够备份到新的PP资源上,如果超过30分钟还没有新PP资源添加,那么PP1上的用户资源会被释放。
在一个实施例中,在步骤S113之后,该方法还可以包括:S117,若正常状态的主协议处理器当前剩余能够容纳用户的数量小于发生故障的主协议处理器中的用户数,且备协议处理器的数量为零,则将发生故障的主协议处理器设置为待老化状态;S118,检测本控制器所属系统中新上电的协议处理器,以及正常状态的主协议处理器剩余能够容纳用户的数量;S119,若在预定的第二等待时长内,正常状态的主协议处理器当前剩余能够容纳用户的数量仍小于发生故障的主协议处理器中的用户数,或者,新上电的协议处理器的数量为零,则释放第一主协议处理器中的用户所占用的资源。
在该实施例中,若正常状态的主协议处理器由于已容纳用户的数量导致不能够继续容纳发生故障的主协议处理器中的用户数,则在第二等待时长内,若正常状态的主协议处理器中存在用户下线,从而能够容纳用户的数量发生故障的主协议处理器中的用户数时,可以对发生故障的主协议处理器中的用户进行备份。
在上述实施例中,通过PP设备的待老化状态,引入垃圾回收方式,防止PP虚机故障长时间离线后,主控MP上该PP对应用户的网络(Internet Protocol,IP)地址、用户会话数等资源的挂死,从而提高资源的利用率。
在本申请实施例中,通过利用正常状态(normal)、待重生状态(wait-reboot)、待老化状态(wait-age)三个状态,实现对PP虚机的状态管理。示例性地,上述状态对运营商客户隐藏或不呈现。
在一个实施例中,步骤S120具体可以包括如下步骤。
S121,从发生故障的主协议处理器的用户中,依次获取与每个指定转发器对应的用户,其中,每个指定转发器是位于转发面设备、且所转发的用户被分流至发生故障的主协议处理器的转发设备。
S122,针对每次获取的用户,将能够容纳当前所获取的用户、用户数最少、且为正常状态的主协议处理器作为可用的协议处理器,并将当前获取的用户的报文数据,备份至可用的协议处理器,并更新可用的协议处理器中的用户数。
S123,若检测到正常状态的主协议处理器均无法容纳当前所获取的用户,或至少两个主协议处理器中的全部主协议处理器发生故障,则将当前所获取的用户的报文数据备份至备协议处理器,并将备协议处理器作为新的主协议处理器。
通过上述S121-S123,实现以主PP中用户对应的转发平面的转发器为粒度,查找与每个转发器对应的用户要前往的目的PP。
在一个实施例中,若正常状态的主协议处理器为零,备协议处理器的数量为1,则方法还包括:S130,将备协议处理器作为新的主协议处理器,以利用新的主协议处理器与所接收的用户进行报文交互。
在该实施例中,若vbras系统中主PP的数量为1,且该唯一的主PP故障,则vbras系统正常状态的主协议处理器为零;或者,若vbras系统中主PP的数量大于1,且所有主PP故障时,则vbras系统中正常状态的主PP为零,此时,可以将备PP升级为主PP,以供用户上线使用。
根据本申请实施例中的数据保护方法,达到了PP虚机宕机、断电、网络故障后,备PP可以在合适的场景下升主并恢复主PP用户数据的效果,保证在线用户不受影响。
在一个实施例中,本控制器为所属系统进行控制器的主备倒换后的主控制器,则方法还包括:S140,记录主备倒换前的主协议处理器和备协议处理器;S141,若检测到主备倒换后所记录的备协议处理器的上电启动时间,早于所记录的主协议处理器的上电启动时间,则保持所记录的备协议处理器的备用状态。
在该实施例中,当vbras系统中存在主PP1和备份PP2时,MP可以对每个PP的主用状态和备用状态进行记录,如果MP进行主备倒换,当前MP称为备用MP,新的主用MP同样记录每个PP的主用状态和备用状态。假如MP主备倒换后被记录为备用状态的PP2先启动,备记录为主用状态的PP1后启动,系统能够保持把PP2判定为备PP,使MP在倒换前后备份PP槽位不发生改变,PP的主用状态和备用状态不因MP主备倒换后,PP的上电启动顺序的影响。
在一个实施例中,若正常状态的主协议处理器为零且备协议处理器的数量为1,则当检测到所记录的主协议处理器在主备倒换期间发生故障时,数据保护方法还包括:S142,将所记录的备协议处理器作为新的主协议处理器,以利用新的主协议处理器与所接收的用户进行报文交互。
在该实施例中,假如在MP主备倒换期间,被记录为主用状态的PP1发生了故障,MP在主备倒换完成后,会自动把备PP2升级成主PP,以供用户上线使用。
图4示出本申请另一实施例的数据保护方法的详细流程图。如图4所示,数据保护方法方法可以包括如下步骤。
S301,在vBRAS-CP系统中,通过控制器MP可以用于管理多个主PP设备和一个备PP设备。
示例性地,主PP设备可以包括4个PP设备,记为:PP1、PP2、PP3和PP4,1个PP是备份PP,记为PP5。LB设备负责报文的分发。应理解,上述主PP设备的数量仅仅是示意性地,实际应用场景中,根据实际需要设定主PP设备的数量。
S302,当vBRAS-CP系统中的PP设备逐个启动时,MP决策逐个启动的PP设备是主PP设备还是备PP设备。
S303,用户拨号上线时,LB设备将接收到的来自各个转发器的用户报文,分流至每个主PP设备。
作为示例,LB设备将转发器vbras-up1、vbras-up2、vbras-up3这三个转发器上线的用户分流到PP1设备。在本申请实施例中,对LB设备的分流方法不做具体限定。
S304,MP检测到PP1离线,将PP1的状态设置为待重生,并对PP1槽位启动预定第一等待时长的定时器,等待PP1重生。
S305,在预定第一等待时长内PP1重启完成,MP重新感知到了PP1的上电,并将PP1的状态置成正常,以及将PP1上的用户从MP同步到PP1。
图5示出本申请实施例的vBRAS-CP系统中PP设备重启后数据恢复过程流程图。图5与图1中相同的标号表示相同的结构。如图5所示,LB设备进行报文分发,并负责用户动态的在PP设备之间负荷分担处理,提供与vBRAS-U之间的接口。当主PP中的PP1设备发生重启操作时,主控MP可以感知到PP1的离线(图中为交叉虚线表示),并将PP1的状态设置为待重生(wait-reboot),对PP1槽位启动预定第一等待时长例如3分钟的定时器,等待PP1重生;若PP1在第一等待时长内重启成功,LB设备可以继续将转发器vbras-up1、vbras-up2、vbras-up3这三个转发器上线的用户分流到PP1设备。
S306,如果在预定第一等待时长内PP1没有重启完成,MP判定PP1发生故障,并将PP1上的用户同步到其它的PP设备。
S307,MP以转发器为粒度,分别为每个转发器对应的用户选择可用的PP设备,将PP1中每个转发器所对应的用户,备份至所选择的PP设备上。
图6示出本申请实施例的vBRAS-CP系统中PP离线后进行用户备份的过程示意图。图6与图1中相同的标号表示相同的结构。如图6所示,若离线的PP1设备超过第一等待时长后还未重新上电启动,则MP判定PP1发生故障,并可以将PP上的用户备份到其他可用的PP。
本申请实施例中,在MP将发生故障的PP1设备上用户迁移到其它PP时,遵循负载分担的原则和算法。MP通过遍历PP1上管理的每个转发器例如vbras-up1、vbras-up2、vbras-up3对应的用户,以转发器为粒度找寻要迁往目的PP虚机。
示例性地,首先,MP可以先为转发器vbras-up1上的用户选择目的PP,在PP2、PP3和PP4中寻找一个正常状态、能够容纳PP中的用户、且在线用户数最少的PP,假设PP2满足条件,用户数最少,MP将vbras-up1上的用户将迁移至PP2。
其次,MP为PP1中与转发器vbras-up2对应的用户寻找目的PP,由于PP2接收了vbras-up1的用户,若此时PP2上的用户数大于PP3上的用户数,PP3为正常状态、能够容纳PP中的用户、且在线用户数最少的PP,则MP将PP1中与转发器vbras-up2对应的用户迁移至PP3。
接着,MP为PP1中与转发器vbras-up3对应的用户寻找目的PP,若PP1中vbras-up3所对应的用户数大于任一其他主PP设备还能够容纳的用户数时,判定其他主PP设备无法容纳PP1中vbras-up3所对应的用户,此时,MP启用备PP5设备,将vbras-up3的用户迁往备份PP5,并将PP5将升级成主PP,PP5不再是备份PP状态,而是作为新的主PP设备,用户可以正常从PP5上线。
在该实施例中,通过计算发生故障的PP虚机上的用户数,结合其它可用PP设备中还可以容纳的用户数进行综合计算,实现故障PP设备上活动用户的负载均衡备份。
在本申请实施例中,在将vBRAS-CP系统中备用PP升级为主PP之后,vBRAS-CP系统中备用PP的数量为0,此时,若MP检测到vBRAS-CP系统中有新上电启动的PP设备,由于此时vBRAS-CP系统中主PP的数量大于等于1,而备PP的数量为0,因此可以将此时新上电启动的PP设备作为备PP设备,以实现vBRAS-CP系统中PP设备N个主PP和1个备PP的PP设置,实现N:1的PP设备备份。
图7示出本申请实施例中主PP设备中用户资源释放的过程示意图。图7与图1中相同的标号表示相同的结构。如图7所示,在一个实施例中,若vbras-cp系统上只有一个PP资源,该PP资源即为主PP,例如PP1。
通过图7可知,当PP1离线超过预设第一等待时长后,MP检测到无可用pp可以用于备份PP1上的用户,则MP可以将PP1状态设置为待老化状态。若PP1设备被设置为待老化状态后,在预设第二等待时长例如30分钟内本控制器所属系统中添加了新的PP资源,则可以将PP1上的用户可以备份到新添加的PP资源;若PP1设备待老化状态超过预设第二等待时长的情况下,本控制器所属系统中仍没有可用的PP用来备份,则MP会释放掉PP1上用户占用的资源。
在该实施例中,在该实施例中,通过设置PP设备的待老化状态,在PP设备发生故障后,若在预定时长内始终没有可用PP用于用户备份,则可以将该发生故障的PP设备中用户占用的资源释放,防止出现PP设备故障长时间离线后,故障PP上用户资源的挂死问题。
图8示出本申请一实施例的备PP升级为主PP的过程示意图。如图8所示,若vbras-cp系统只有一主一备两个PP设备:主PP设备PP1和备PP设备PP2。其中,PP1上没有用户,当PP1离线超过预定第一等待时长后未重生(未重新上电启动),则将PP2从备PP升级成主PP,供用户上线使用。
在该实施例中,通过设置PP设备的待重生状态,在PP设备离线或消失后,在一定的待重生时间,以等待离线或消失的PP设备重新上线,从而可以抑制现网网络条件不稳定的情况下,PP虚机用户频繁迁移带来的系统震荡。
图9示出本申请实施例中控制器进行主备倒换后保持槽位状态的过程示意图。如图9所示,假如vbras-cp系统只有一主一备两个PP:主PP设备PP1和备PP设备PP2。在主备倒换前,当前MP为主用MP并记录下PP1是主PP,PP2是备PP,MP发生主备倒换时,当前主用MP为备用PP,新的主用MP能够记录PP2是备PP,保证主备倒换前后备份PP槽位不变。
在一个实施例中,若MP主备倒换期间,主PP设备PP1发生故障,则MP在主备倒换完成后,会自动把备PP2升级成主PP。
根据本申请实施例中的数据保护方法,通过至少两个主PP设备和一个备PP设备的设置,支持VBRAS-CP上PP设备的备份,当检测到PP设备发生故障,则将PP上的用户备份到其它可用的PP资源上,保证用户功能不受影响,提高系统的可靠性。
下面结合附图,详细介绍根据本发明实施例的数据保护装置。图10示出本发明一实施例提供的数据保护装置的结构示意图。如图10所示,数据保护装置可以包括如下模块。
故障检测模块410,用于从预定的至少两个主协议处理器中获取发生故障的主协议处理器。
用户备份模块420,用于从正常状态的主协议处理器和预设的一个备协议处理器中,选择可用的协议处理器,并使用所选择的协议处理器备份发生故障的主协议处理器中用户的报文数据。
在一个实施例中,至少两个主协议处理器和一个备协议处理器,位于转控分离的虚拟化宽带远程接入服务器vBRAS的控制面设备中,且本控制器与每个主协议处理器和备协议处理器之间连接为虚拟网络连接。
在一个实施例中,数据保护装置还可以包括:主备状态设置模块,用于在本控制器所属系统启动后,基于检测的协议处理器的上电顺序,确定所属系统中的主协议处理器和备协议处理器。
在一个实施例中,主备状态设置模块具体可以用于:按照上电顺序,若确定所属系统中正常状态的主协议处理器的数量为零,则将检测到的首个上电的协议处理器设置为正常状态的主协议处理器;若确定所属系统中正常状态的主协议处理器的数量大于零,以及正常状态的备协议处理器的数量为零,则将检测到的新上电的协议处理器设置为备协议处理器;以及,若确定所属系统中正常状态的备协议处理器的数量大于零,则将检测到的新上电的协议处理器设置为正常状态的主协议处理器。
在一个实施例中,故障检测模块具体可以包括:待重生状态设置单元,用于在至少两个主协议处理器中,若检测到第一主协议处理器在上电后与本控制器之间的链路发生故障,或者检测到第一主协议处理器离线,则将第一主协议处理器设置为待重生状态;上电检测单元,用于检测第一主协议处理器是否在预定的第一等待时长内重新上电;故障检测模块具体还用于若第一主协议处理器未在第一等待时长内重新上电,将第一主协议处理器作为发生故障的主协议处理器。
在一个实施例中,故障检测模块具体可以包括:待老化状态设置单元,用于在将第一主协议处理器作为发生故障的主协议处理器之后,若正常状态的主协议处理器和备协议处理器的数量均为零,将发生故障的主协议处理器设置为待老化状态;上电检测单元,还用于检测本控制器所属系统中新上电的协议处理器;资源释放单元,用于若在预定的第二等待时长内,未检测到新上电的协议处理器,则释放第一主协议处理器中的用户所占用的资源。
在一个实施例中,待老化状态设置单元,还用于若正常状态的主协议处理器当前剩余能够容纳用户的数量小于发生故障的主协议处理器中的用户数,且备协议处理器的数量为零,则将发生故障的主协议处理器设置为待老化状态;上电检测单元,还用于检测检测本控制器所属系统中新上电的协议处理器;用户数检测单元,用于检测正常状态的主协议处理器剩余能够容纳用户的数量;资源释放单元,还用于若在预定的第二等待时长内,正常状态的主协议处理器当前剩余能够容纳用户的数量仍小于发生故障的主协议处理器中的用户数,或者,新上电的协议处理器的数量为零,则释放第一主协议处理器中的用户所占用的资源。
在一个实施例中,用户备份模块具体可以包括:用户获取单元,用于从发生故障的主协议处理器的用户中,依次获取与每个指定转发器对应的用户,其中,每个指定转发器是位于转发面设备、且所转发的用户被分流至发生故障的主协议处理器的转发设备;设备选择单元,用于针对每次获取的用户,将能够容纳当前所获取的用户、用户数最少、且为正常状态的主协议处理器作为可用的协议处理器,将当前获取的用户的报文数据,备份至可用的协议处理器,并更新可用的协议处理器中的用户数;用户备份模块还可以用于若检测到正常状态的主协议处理器均无法容纳当前所获取的用户,或至少两个主协议处理器中的全部主协议处理器发生故障,将当前所获取的用户的报文数据备份至备协议处理器,并将备协议处理器作为新的主协议处理器。
在一个实施例中,数据保护装置还可以包括:备用设备升级模块,用于若正常状态的主协议处理器为零,备协议处理器的数量为1,将备协议处理器作为新的主协议处理器,以利用新的主协议处理器与所接收的用户进行报文交互。
在一个实施例中,本控制器为所属系统进行控制器的主备倒换后的主控制器,数据保护装置还可以包括:控制器主备状态记录模块,用于记录主备倒换前的主协议处理器和备协议处理器;控制器主备状态设置模块,用于若检测到主备倒换后所记录的备协议处理器的上电启动时间,早于所记录的主协议处理器的上电启动时间,则保持所记录的备协议处理器的备用状态。
在一个实施例中,正常状态的主协议处理器为零,备协议处理器的数量为1;在该实施例中,备用设备升级模块,还可以用于当检测到所记录的主协议处理器在主备倒换期间发生故障时将所记录的备协议处理器作为新的主协议处理器,以利用新的主协议处理器与所接收的用户进行报文交互。
根据本申请实施例的数据保护装置,可以通过至少两个主PP设备和一个备PP设备的设置,支持VBRAS-CP上PP设备的备份,当检测到PP设备发生故障,则将PP上的用户备份到其它可用的PP资源上,保证用户功能不受影响,提高系统的可靠性。。
图11是本申请实施例的控制面设备的结构示意图。如图11所示,控制面设备可以包括:负载平衡器510,用于接收位于转发面设备的一个或多个转发器所转发的用户,并将每个转发器所转发的用户分流至不同的主协议处理器;多个协议处理器,(例如协议处理器521、协议处理器522、……、协议处理器52n),包括至少两个主协议处理器和一个备协议处理器,多个协议处理器中的每个协议处理器用于与所接收的用户进行报文交互;控制器530,用于执行上述实施例描述的数据保护方法。
根据本申请实施例的控制面设备,LB负责分流,将用户上线报文投递到不同的PP上,PP与用户进行报文的交互,当PP虚机损坏或者离线,能够将PP上的用户备份到其它可用的PP资源上,保证用户功能不受影响,提高系统的可靠性。
需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
图12示出能够实现根据本发明实施例的方法和装置的计算设备的示例性硬件架构的结构图。
如图12所示,计算设备600包括输入设备601、输入接口602、中央处理器603、存储器604、输出接口605、以及输出设备606。其中,输入接口602、中央处理器603、存储器604、以及输出接口605通过总线610相互连接,输入设备601和输出设备606分别通过输入接口602和输出接口605与总线610连接,进而与计算设备600的其他组件连接。
具体地,输入设备601接收来自外部的输入信息,并通过输入接口602将输入信息传送到中央处理器603;中央处理器603基于存储器604中存储的计算机可执行指令对输入信息进行处理以生成输出信息,将输出信息临时或者永久地存储在存储器604中,然后通过输出接口605将输出信息传送到输出设备606;输出设备606将输出信息输出到计算设备600的外部供用户使用。
在一个实施例中,图12所示的计算设备可以被实现为一种控制器,该控制器可以包括:存储器,被配置为存储程序;处理器,被配置为运行存储器中存储的程序,以执行上述实施例描述的方法。
以上所述,仅为本申请的示例性实施例而已,并非用于限定本申请的保护范围。一般来说,本申请的多种实施例可以在硬件或专用电路、软件、逻辑或其任何组合中实现。例如,一些方面可以被实现在硬件中,而其它方面可以被实现在可以被控制器、微处理器或其它计算装置执行的固件或软件中,尽管本申请不限于此。
本申请的实施例可以通过移动装置的数据处理器执行计算机程序指令来实现,例如在处理器实体中,或者通过硬件,或者通过软件和硬件的组合。计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码。
本申请附图中的任何逻辑流程的框图可以表示程序步骤,或者可以表示相互连接的逻辑电路、模块和功能,或者可以表示程序步骤与逻辑电路、模块和功能的组合。计算机程序可以存储在存储器上。存储器可以具有任何适合于本地技术环境的类型并且可以使用任何适合的数据存储技术实现,例如但不限于只读存储器(ROM)、随机访问存储器(RAM)、光存储器装置和系统(数码多功能光碟DVD或CD光盘)等。计算机可读介质可以包括非瞬时性存储介质。数据处理器可以是任何适合于本地技术环境的类型,例如但不限于通用计算机、专用计算机、微处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、可编程逻辑器件(FGPA)以及基于多核处理器架构的处理器。
通过示范性和非限制性的示例,上文已提供了对本申请的示范实施例的详细描述。但结合附图和权利要求来考虑,对以上实施例的多种修改和调整对本领域技术人员来说是显而易见的,但不偏离本发明的范围。因此,本发明的恰当范围将根据权利要求确定。

Claims (10)

1.一种数据保护方法,其特征在于,所述方法包括:
从预定的至少两个主协议处理器中获取发生故障的主协议处理器;
从正常状态的主协议处理器和预设的一个备协议处理器中,选择可用的协议处理器,并使用所选择的协议处理器备份所述发生故障的主协议处理器中用户的报文数据;其中,所述至少两个主协议处理器和所述一个备协议处理器,为vBRAS系统中的控制面设备中所包括的协议处理器;
在从预定的至少两个主协议处理器中获取发生故障的主协议处理器之前,所述方法还包括:在控制器所属系统启动后,按照上电顺序,若确定所属系统中正常状态的主协议处理器的数量大于零,以及正常状态的备协议处理器的数量为零,则将检测到的新上电的协议处理器设置为备协议处理器。
2.根据权利要求1所述的方法,其特征在于,所述从预定的至少两个主协议处理器中获取发生故障的主协议处理器,包括:
在所述至少两个主协议处理器中,若检测到第一主协议处理器在上电后与控制器之间的链路发生故障,或者检测到所述第一主协议处理器离线,则将所述第一主协议处理器设置为待重生状态;
检测所述第一主协议处理器是否在预定的第一等待时长内重新上电;
若所述第一主协议处理器未在所述第一等待时长内重新上电,将所述第一主协议处理器作为所述发生故障的主协议处理器。
3.根据权利要求2所述的方法,其特征在于,在将所述第一主协议处理器作为所述发生故障的主协议处理器之后,所述方法还包括:
若正常状态的主协议处理器和所述备协议处理器的数量均为零,将所述发生故障的主协议处理器设置为待老化状态;
检测控制器所属系统中新上电的协议处理器;
若在预定的第二等待时长内,未检测到新上电的协议处理器,则释放所述第一主协议处理器中的用户所占用的资源。
4.根据权利要求2所述的方法,其特征在于,在将所述第一主协议处理器作为所述发生故障的主协议处理器之后,所述方法还包括:
若正常状态的主协议处理器当前剩余能够容纳用户的数量小于所述发生故障的主协议处理器中的用户数,且所述备协议处理器的数量为零,则将所述发生故障的主协议处理器设置为待老化状态;
检测控制器所属系统中新上电的协议处理器,以及所述正常状态的主协议处理器剩余能够容纳用户的数量;
若在预定的第二等待时长内,所述正常状态的主协议处理器当前剩余能够容纳用户的数量仍小于所述发生故障的主协议处理器中的用户数,且新上电的协议处理器的数量为零,则释放所述第一主协议处理器中的用户所占用的资源。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述从正常状态的主协议处理器和预设的一个备协议处理器中,选择可用的协议处理器,并使用所选择的协议处理器备份所述发生故障的主协议处理器中用户的报文数据,包括:
从所述发生故障的主协议处理器的用户中,依次获取与每个指定转发器对应的用户,其中,所述每个指定转发器是位于转发面设备、且所转发的用户被分流至所述发生故障的主协议处理器的转发设备;
针对每次获取的所述用户,将能够容纳当前所获取的用户、用户数最少、且为正常状态的主协议处理器作为可用的协议处理器,将当前获取的所述用户的报文数据,备份至所述可用的协议处理器,并更新所述可用的协议处理器中的用户数;
若检测到正常状态的主协议处理器均无法容纳当前所获取的用户,或所述至少两个主协议处理器中的全部主协议处理器发生故障,将当前所获取的用户的报文数据备份至所述备协议处理器,并将所述备协议处理器作为新的主协议处理器。
6.根据权利要求1至4中任一项所述的方法,其特征在于,所述控制器为所属系统进行控制器的主备倒换后的主控制器,则所述方法还包括:
记录主备倒换前的主协议处理器和备协议处理器;
若检测到主备倒换后所记录的备协议处理器的上电启动时间,早于所记录的主协议处理器的上电启动时间,则保持所记录的备协议处理器的备用状态。
7.根据权利要求1至4中任一项所述的方法,其特征在于,
所述至少两个主协议处理器和所述一个备协议处理器,位于转控分离的虚拟化宽带远程接入服务器vBRAS的控制面设备中,且控制器与每个主协议处理器和所述备协议处理器之间连接为虚拟网络连接。
8.一种控制器,包括:
一个或多个处理器;
存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现权利要求1-7中任一项所述的数据保护方法。
9.一种控制面设备,其特征在于,所述控制面设备包括:
负载平衡器,用于接收位于转发面设备的一个或多个转发器所转发的用户,并将每个转发器所转发的用户分流至不同的主协议处理器;
多个协议处理器,包括至少两个主协议处理器和一个备协议处理器,所述多个协议处理器中的每个协议处理器用于与所接收的用户进行报文交互;
控制器,用于执行权利要求1-7中任一项所述的数据保护方法。
10.一种存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所述的数据保护方法。
CN202010504294.7A 2020-06-05 2020-06-05 数据保护方法、控制器、控制面设备和存储介质 Active CN112804077B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010504294.7A CN112804077B (zh) 2020-06-05 2020-06-05 数据保护方法、控制器、控制面设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010504294.7A CN112804077B (zh) 2020-06-05 2020-06-05 数据保护方法、控制器、控制面设备和存储介质

Publications (2)

Publication Number Publication Date
CN112804077A CN112804077A (zh) 2021-05-14
CN112804077B true CN112804077B (zh) 2022-07-15

Family

ID=75806475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010504294.7A Active CN112804077B (zh) 2020-06-05 2020-06-05 数据保护方法、控制器、控制面设备和存储介质

Country Status (1)

Country Link
CN (1) CN112804077B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450469A (zh) * 2015-12-01 2016-03-30 许继电气股份有限公司 一种工业设备中快速通信总线故障检测方法
CN108667695A (zh) * 2017-09-06 2018-10-16 新华三技术有限公司 一种bras转控分离的备份方法和装置
CN109698757A (zh) * 2017-10-20 2019-04-30 中兴通讯股份有限公司 切换主备设备、恢复用户数据的方法、服务器及网络设备
CN110022236A (zh) * 2019-05-30 2019-07-16 新华三技术有限公司 一种报文转发方法及装置
CN110430115A (zh) * 2019-07-25 2019-11-08 新华三大数据技术有限公司 业务恢复方法、系统、网络设备及计算机可读存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100499387C (zh) * 2003-11-28 2009-06-10 中兴通讯股份有限公司 一种通信系统中单板的n+1备份的方法
CN101374075A (zh) * 2008-06-30 2009-02-25 华为技术有限公司 保护组播源的方法、装置和系统
CN101989903B (zh) * 2010-12-03 2013-03-13 国电南瑞科技股份有限公司 综合监控前置通信控制器双机冗余按口切换方法
US9723074B2 (en) * 2011-11-15 2017-08-01 Alcatel Lucent Method and apparatus for in the middle primary backup replication
CN108696417A (zh) * 2017-04-12 2018-10-23 中兴通讯股份有限公司 备份网络中的业务切换方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105450469A (zh) * 2015-12-01 2016-03-30 许继电气股份有限公司 一种工业设备中快速通信总线故障检测方法
CN108667695A (zh) * 2017-09-06 2018-10-16 新华三技术有限公司 一种bras转控分离的备份方法和装置
CN109698757A (zh) * 2017-10-20 2019-04-30 中兴通讯股份有限公司 切换主备设备、恢复用户数据的方法、服务器及网络设备
CN110022236A (zh) * 2019-05-30 2019-07-16 新华三技术有限公司 一种报文转发方法及装置
CN110430115A (zh) * 2019-07-25 2019-11-08 新华三大数据技术有限公司 业务恢复方法、系统、网络设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN112804077A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
EP3210367B1 (en) System and method for disaster recovery of cloud applications
CN102355369B (zh) 虚拟化集群系统及其处理方法和设备
CN107526659B (zh) 用于失效备援的方法和设备
CN102708018B (zh) 一种异常处理方法及系统、代理设备与控制装置
CN108847982B (zh) 一种分布式存储集群及其节点故障切换方法和装置
JP4572250B2 (ja) 計算機切り替え方法、計算機切り替えプログラム及び計算機システム
US20080022148A1 (en) Method and an Apparatus for Controlling Executables Running on Blade Servers
EP3550436A1 (en) Method and apparatus for detecting and recovering fault of virtual machine
CN108199962B (zh) 地址迁移方法、装置、网络设备及可读存储介质
CN105159798A (zh) 一种虚拟机的双机热备方法、双机热备管理服务器和系统
US9992058B2 (en) Redundant storage solution
US9210059B2 (en) Cluster system
CN111460039A (zh) 关系型数据库处理系统、客户端、服务器及方法
CN113630314A (zh) 混合云专线接入网络的灾备方法及装置
CN104503861A (zh) 一种异常处理方法及系统、代理设备与控制装置
CN111654384A (zh) 一种主备切换方法、bras设备及存储介质
CN114422335B (zh) 通信方法、装置、服务器及存储介质
CN112732412B (zh) 一种服务配置文件处理方法、装置、存储介质及电子设备
CN114064217A (zh) 一种基于OpenStack的节点虚拟机迁移方法及装置
CN117240694A (zh) 一种基于keepalived的双机热备主备切换方法、装置及系统
CN112804077B (zh) 数据保护方法、控制器、控制面设备和存储介质
KR20150104435A (ko) 라우팅 처리기의 동작 모드 천이 방법
CN116192885A (zh) 高可用集群架构人工智能实验云平台数据处理方法及系统
CN114124803B (zh) 设备管理方法、装置、电子设备及存储介质
CN115549751A (zh) 遥感卫星地面站监控系统和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant