CN113949623A - Mlag双主异常修复方法、装置、电子设备及存储介质 - Google Patents

Mlag双主异常修复方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN113949623A
CN113949623A CN202111210395.4A CN202111210395A CN113949623A CN 113949623 A CN113949623 A CN 113949623A CN 202111210395 A CN202111210395 A CN 202111210395A CN 113949623 A CN113949623 A CN 113949623A
Authority
CN
China
Prior art keywords
equipment
mlag
role information
master
link
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111210395.4A
Other languages
English (en)
Other versions
CN113949623B (zh
Inventor
聂帮强
郭明权
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Maipu Communication Technology Co Ltd
Original Assignee
Maipu Communication Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Maipu Communication Technology Co Ltd filed Critical Maipu Communication Technology Co Ltd
Priority to CN202111210395.4A priority Critical patent/CN113949623B/zh
Publication of CN113949623A publication Critical patent/CN113949623A/zh
Application granted granted Critical
Publication of CN113949623B publication Critical patent/CN113949623B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0654Management of faults, events, alarms or notifications using network fault recovery
    • H04L41/0663Performing the actions predefined by failover planning, e.g. switching to standby network elements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0823Errors, e.g. transmission errors

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Environmental & Geological Engineering (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本申请提供一种MLAG双主异常修复方法、装置、电子设备及存储介质,方法包括:在keepalive链路恢复时,通过所述keepalive链路接收对端设备的当前角色信息;获取本设备的当前角色信息;若所述对端设备的当前角色信息和所述本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息;若本设备的应选角色信息为从设备,则将本设备切换为所述从设备。上述方案在存在MLAG双主问题时,通过本设备的历史角色信息,实现自动化的角色切换,从而实现MLAG双主异常的自动化修复,降低了人工投入,提高了修复效率,且降低了成本。

Description

MLAG双主异常修复方法、装置、电子设备及存储介质
技术领域
本申请涉及跨设备链路汇聚组技术领域,具体而言,涉及一种MLAG双主异常修复方法、装置、电子设备及存储介质。
背景技术
随着数据中心访问量的逐渐增大以及网络可靠性的要求越来越高,交换机的虚拟技术也在逐步发展。
堆叠技术将多台物理交换机虚拟成为一台虚拟交换机,具有增加带宽、提高可靠性、简化网络拓扑、两台设备可以统一进行管理的优势。
后续发展的MLAG(Multi-Chassis Link Aggregation Group,跨设备链路汇聚组)技术,在堆叠具有的优势的基础上,具有了更高的可靠性(将链路可靠性从单板级提高到了设备级),是当前数据中心中,正在逐渐部署的新技术。
MLAG具有主设备和从设备,主设备和从设备需要通过peer-link(MLAG主设备和从设备之间的直连的二层链路汇聚,用于交互MLAG协议报文及传输数据流量)和keepalive(保活链路,用于MLAG主设备和从设备之间的保活检测,通过三层链路进行通信)来保证协议的建立。在环境稳定时,主设备和从设备之间的MLAG协议报文走二层传输(即通过peer-link(协议通信链路)传输),而keepalive使用三层网络,用于主设备与从设备之间保活。
目前,当peer-link故障后,MLAG协议报文二层传输受阻,从设备上的MLAG端口会Error-Down(此时从设备进入Suspend状态),此时只有主设备(此时是Master-Alone状态,表征设备认为双活系统中仅存在主设备时的状态)上的MLAG端口正常转发流量。
但是,如果在peer-link故障期间,keepalive使用的三层网络出现中断或链路震荡的情况,此时从设备上会收到keepalive的lost(丢失)事件,然后会改变自身状态为Master-Alone状态,从而导致从设备自主切换角色,变为主设备,并会将原本Error-Down的端口恢复为UP状态。这就导致MLAG域内具有两个主设备,MLAG域内原本的主、从设备上的MLAG端口都会参与报文转发,导致流量转发异常,出现“双主”异常。该异常出现后,即使keepalive恢复,以上异常依然存在。
目前,针对MLAG“双主”异常,只能通过人工干预的方式,将出现MLAG域内的从设备重新修改回原有角色。但是这种方式依赖于修复人员的专业水准,修复效率低,且人力成本高。
发明内容
本申请实施例的目的在于提供一种MLAG双主异常修复方法、装置、电子设备及存储介质,用以解决目前对于MLAG“双主”异常只能通过人工干预的方式进行修复,存在修复效率低,且人力成本高的问题。
本申请实施例提供了一种MLAG双主异常修复方法,包括:在keepalive链路恢复时,通过所述keepalive链路接收对端设备的当前角色信息;获取本设备的当前角色信息;若所述对端设备的当前角色信息和所述本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息;若本设备的应选角色信息为从设备,则将本设备切换为所述从设备。
在上述实现过程中,通过在keepalive链路恢复时,利用keepalive链路传输双方的当前角色信息,进而基于双方的当前角色信息,可以快速自动确定是否存在MLAG双主问题,进而在存在MLAG双主问题时,通过本设备的历史角色信息,实现自动化的角色切换,从而实现MLAG双主异常的自动化修复,降低了人工投入,提高了修复效率,且降低了成本。
进一步地,所述根据本设备的历史角色信息,确定本设备的应选角色信息,包括:判断所述当前角色信息的上一角色信息是否表征为从设备;若是,确定本设备的应选角色信息为从设备;否则,确定本设备的应选角色信息为主设备。
在实际应用中,MLAG中,主设备和从设备的角色是相对比较固定的。而在peer-link链路与keepalive链路均异常,从而导致出现MLAG双主异常时,原本的从设备的角色会更新为主设备。那么,在上述实现过程中,只需通过判断当前角色信息的上一角色信息是否表征为从设备,即可有效确定出本设备自身原本的角色,从而可以快速恢复到原有情况,并且不会改变原有的主从设备角色,这就保证了流量一直在MLAG主设备上通信,不会切换到另一台设备上,也就没有切换导致的丢包情况。
进一步地,在根据本设备的历史角色信息,确定本设备的应选角色信息之前,所述方法还包括:确定当前时刻,peer-link链路处于故障状态。
进一步地,若当前时刻,所述peer-link链路处于正常状态,所述方法还包括:则按照预设的协商方式,与所述对端设备进行角色协商;若协商出的本设备对应的角色信息为从设备,则将本设备切换为所述从设备。
在上述实现过程中,当peer-link链路仍处于故障状态时,即通过历史角色信息实现离线角色确定;而在peer-link链路恢复时,则重新进行协商,这样就可以实现对于设备所具有的角色信息更为准确的确定。此外,由于始终采用预设的协商方式来进行角色协商,因此在设备没有发生改变的情况下,每次协商出的角色信息是确定的,从而不会改变原有的主从设备角色,这就保证了流量一直在MLAG主设备上通信,不会切换到另一台设备上,也就没有切换导致的丢包情况。
进一步地,将本设备切换为所述从设备,包括:将本设备的状态修改为Suspend状态,并将本设备的MLAG端口切换为Error-Down状态。
在上述实现过程中,在peer-link链路仍处于故障状态时,此时通过将本设备的状态修改为Suspend状态,并将本设备的MLAG端口切换为Error-Down状态,一方面可以实现角色的有效切换,另一方面通过将本设备的MLAG端口切换为Error-Down状态,可以避免peer-link链路故障状态下,出现流量转发异常。
进一步地,在将本设备的MLAG端口切换为Error-Down状态之前,所述方法还包括:确定本设备的MLAG端口当前处于正常状态;其中,所述MLAG端口被设置为,当所属设备从Suspend状态切换为Master-Alone(单主)状态时,在预设延迟时长达到后将所述MLAG端口恢复为正常状态;所述Master-Alone状态表征设备检测到双活系统中仅存在主设备时的状态。
在上述实现过程中,通过设置设备从Suspend状态切换为Master-Alone时,在预设延迟时长达到后才将MLAG端口恢复为正常状态,这就使得在出现keepalive链路震荡时,由于预设延迟时长的存在,而不会出现频繁地将MLAG端口在Error-Down状态和正常状态之间切换的情况。
进一步地,若当前时刻,所述peer-link链路处于正常状态,所述方法还包括:则按照预设的协商方式,与所述对端设备进行角色协商;若协商出的本设备对应的角色为从设备,则将本设备切换为所述从设备。
在上述实现过程中,由于peer-link链路是负责的MLAG域内主设备和从设备之间的直连的二层链路汇聚,用于交互MLAG协议报文及传输数据流量,因此在peer-link链路处于正常状态时,可以通过peer-link链路,按照预设的协商方式与对端设备进行角色协商,从而快速协商得到本设备与对端设备的角色,解决MLAG双主异常。
进一步地,通过所述keepalive链路接收对端设备的当前角色信息,包括:接收通过所述keepalive链路传来的TLV格式的报文;所述报文的TLV三元组中携带有所述对端设备的当前角色信息。
在上述实现过程中,通过在keepalive链路的tlv字段中,增加当前角色信息,从而很方便地实现了对于MLAG双主异常的确定与修复,无需对现有流程与协议作出大的改进,利于在工业上进行推广。
本申请实施例还提供了一种MLAG双主异常修复装置,包括:接收模块、获取模块、确定模块和切换模块;所述接收模块,用于在keepalive链路恢复时,通过所述keepalive链路接收对端设备的当前角色信息;所述获取模块,用于获取本设备的当前角色信息;所述确定模块,用于若所述对端设备的当前角色信息和所述本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息;所述切换模块,用于若本设备的应选角色信息为从设备,则将本设备切换为所述从设备。
本申请实施例还提供了一种电子设备,包括处理器、存储器及通信总线;所述通信总线用于实现处理器和存储器之间的连接通信;所述处理器用于执行存储器中存储的一个或者多个程序,以实现上述任一种的MLAG双主异常修复方法。
本申请实施例中还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述任一种的MLAG双主异常修复方法。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种MLAG双主异常修复方法的流程示意图;
图2为本申请实施例提供的一种MLAG系统示意图;
图3为本申请实施例提供的一种MLAG设备状态变化示意图;
图4为本申请实施例提供的一种MLAG双主异常修复装置的结构示意图;
图5为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
实施例一:
为了解决目前对于MLAG“双主”异常只能通过人工干预的方式进行修复,存在修复效率低,且人力成本高的问题,本申请实施例中提供了一种MLAG双主异常修复方法。可以参见图1所示,图1为本申请实施例中提供的一种MLAG双主异常修复方法的流程示意图,包括:
S101:在keepalive链路恢复时,通过keepalive链路接收对端设备的当前角色信息。
应理解,参见图2所示,在MLAG技术中,MLAG域内会存在有主设备和从设备,两种设备对外会看作一个整体,为MLAG域外的设备A提供服务。
本申请实施例中所提供的MLAG双主异常修复方法,可以同时应用于MLAG域内的每一个设备上,从而自主实现MLAG双主异常修复。
应理解,MLAG双主异常出现在peer-link链路与keepalive链路均异常的情况下。在此情况下,若keepalive链路与peer-link链路相互均持续异常,此时由于keepalive链路未恢复,在此期间,如想修复MLAG双主异常,则可以通过人工介入的方式进行修复。
但是,在keepalive链路恢复的情况下,在本申请实施例中,可以通过keepalive链路实现MLAG域内两设备间的当前角色信息的相互通知,从而使得各设备得以确定是否出现MLAG双主异常,进而实现自主修复。具体实现过程可继续参见后续过程。
需要注意的是,在本申请实施例中,在keepalive链路恢复时,MLAG域内的各设备可以触发预设的控制程序,从而通过keepalive链路发送TLV(Type-length-value,T字段表示报文类型,L字段表示报文长度,V字段用来存放报文的内容)格式的报文。而在报文的TLV三元组中携带有自身的当前角色信息。这样,通过在keepalive链路的tlv字段中,增加当前角色信息,从而很方便地实现了对于MLAG双主异常的确定与修复,无需对现有流程与协议做出大的改进,利于在工业上进行推广。
应理解,在本申请实施例中,也可以采用其他格式的报文来实现对于当前角色信息的携带,在本申请中不做限制。
还应理解的是,在本申请实施例中,可以采用设备的当前状态信息作为当前角色信息,比如采用Suspend、Master-Alone等状态信息作为当前角色信息,但不作为限制。
其中,Suspend是双活系统peer-link链路故障但keepalive链路正常时,从设备进入的状态。此时设备的所有MLAG端口都会进入Error-Down状态。
而Master-Alone状态是表征设备检测到双活系统中仅存在主设备时的状态。
S102:获取本设备的当前角色信息。
在本申请实施例中,可以获取本设备当前的状态信息从而确定本设备的当前角色信息。比如本设备当前状态为Suspend,即可确定当前角色信息表征为从设备,本设备当前状态为Master-Alone,即可确定当前角色信息表征为主设备。
S103:若对端设备的当前角色信息和本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息。
在本申请实施例中,可以将本设备的当前角色信息与对端设备的当前角色信息进行比对。若不一致,即表明没有出现MLAG双主异常,从而无需进行修复操作。但是,若对端设备的当前角色信息和本设备的当前角色信息均表征为主设备,即表明出现了MLAG双主异常,从而需要进行修复操作。
S104:若本设备的应选角色信息为从设备,则将本设备切换为从设备。
在本申请实施例中,一种可行的实施方式中,可以在确定出现了MLAG双主异常时,可以不去判断peer-link链路是否恢复正常,而是直接根据本设备的历史角色信息,确定本设备的应选角色信息。进而在本设备的应选角色信息为从设备,将本设备切换为从设备。当本设备的应选角色信息为主设备,则不做任何处理。
此外,在本申请实施例的另一种可行实施方式中,也可以在确定出现了MLAG双主异常时,先判断peer-link链路是否恢复正常。
若peer-link链路已恢复正常,则由于peer-link链路是负责的MLAG域内主设备和从设备之间的直连的二层链路汇聚,用于交互MLAG协议报文及传输数据流量,因此,MLAG域内的本设备即可通过peer-link链路,按照预设的协商方式与对端设备进行角色协商,从而协商得到本设备与对端设备的角色。若协商得到本设备的角色为从设备,则将本设备切换为从设备。若协商得到本设备的角色为主设备,则不做任何处理。
若peer-link链路仍处于异常状态,则可以根据本设备的历史角色信息,确定本设备的应选角色信息。进而在本设备的应选角色信息为从设备,将本设备切换为从设备。当本设备的应选角色信息为主设备,则不做任何处理。
需要说明的是,上述预设的协商方式可以采用MLAG域中原本采用的协商方式,以保证进行MLAG双主异常修复后确定出的主设备与从设备满足原本的主从要求。
需要注意的是,在本申请实施例中,一种可行的根据本设备的历史角色信息,确定本设备的应选角色信息的方式可以是:
本设备判断当前角色信息的上一角色信息是否表征为从设备。若是,即确定本设备的应选角色信息为从设备;否则,确定本设备的应选角色信息为主设备。这样,只需通过判断当前角色信息的上一角色信息是否表征为从设备,即可有效确定出本设备自身原本的角色,从而可以快速恢复到原有情况,并且不会改变原有的主从设备角色,这就保证了流量一直在MLAG主设备上通信,不会切换到另一台设备上,也就没有切换导致的丢包情况。
需要注意的是,在本申请实施例中,在确定出本设备为从设备后,若peer-link链路处于故障状态,此时可以将本设备的状态修改为Suspend,并将本设备的MLAG端口切换为Error-Down状态,从而在实现角色的有效切换的同时,通过将本设备的MLAG端口切换为Error-Down状态,避免peer-link链路故障状态下,出现流量转发异常。
在本申请实施例中,在确定出本设备为从设备后,若peer-link链路处于正常状态,此时可以将本设备的状态修改为SLAVE,并按照从设备的业务执行逻辑进行执行,从而实现从主设备到从设备的切换。
需要注意的是,在本申请实施例中,可以对设备的MLAG端口进行延迟设置,将MLAG端口设置为:当所属设备从Suspend状态切换为Master-Alone时,在预设延迟时长达到后才将MLAG端口恢复为正常状态。
这样,当确定出本设备为从设备,且peer-link链路处于故障状态时,如果本设备的MLAG端口处于预设延迟时长内,即无需进行MLAG端口切换为Error-Down状态的操作,从而不会出现频繁地将MLAG端口在Error-Down状态和正常状态之间切换的情况。
需要注意的是,在本申请实施例中,预设延迟时长可以由工程师根据实际经验进行设定。
本申请实施例所提供的MLAG双主异常修复方法,通过在keepalive链路恢复时,利用keepalive链路传输双方的当前角色信息,进而基于双方的当前角色信息,可以快速自动确定是否存在MLAG双主问题,进而在存在MLAG双主问题时,通过本设备的历史角色信息,实现自动化的角色切换,从而实现MLAG双主异常的自动化修复,降低了人工投入,提高了修复效率,且降低了成本。
此外,本申请实施例所提供的MLAG双主异常修复方法,可以不改变原有的主从设备角色,这就保证了流量一直在MLAG主设备上通信,不会切换到另一台设备上,也就没有切换导致的丢包情况。
实施例二:
本实施例在实施例一的基础上,以一种具体的恢复情况为例,为本申请做进一步示例说明。
首先,参见图3所示,假设最初MLAG内主设备和从设备的peer-link链路与keepalive链路均正常,MLAG环境稳定运行。
当MLAG从设备检测到peer-link故障后,MLAG从设备会获取到自己的状态从SLAVE变为Suspend,此时,MLAG从设备会把自身的MLAG端口Error-Down掉,避免出现MLAG双主异常。
当继续检测到keepalive链路出现故障,断开连接时,MLAG从设备会升主(MLAG从设备的状态会从Suspend变为Master-Alone,此时MLAG域内的两台设备上的状态都为Master-Alone状态),然后按照预设延迟时长,延迟对Error-Down的端口恢复(即在预设延迟时长未达到时,不对Error-Down的端口进行恢复)。
在此阶段,因为peer-link和keepalive链路都处于中断状态,可以通过人为干预来检查链路,实现MLAG双主异常修复。
当keepalive链路恢复稳定时,即三层链路重新连接后,keepalive报文恢复了通信,此时:
MLAG域内的两台设备都通过keepalive链路收到了对端是MASTER(即主设备)的第一角色信息(在报文的TLV中携带)。
此后,两台设备均对peer-link链路的状态进行判断:
如果peer-link链路仍处于故障状态,此时判断自身的历史角色信息。如果当前角色信息的上一角色信息是Suspend,即本设备中的状态是从Suspend变为的Master-Alone,即进一步判断自身的MLAG端口是否处于正常状态,若在,就再次将自身的MLAG端口Error-Down掉。如果当前角色信息的上一角色信息是Master-Alone,即本设备中的状态是从MASTER到Master-Alone,则不做处理。
如果peer-link链路已经恢复,则MLAG域内的两台设备通过peer-link链路重新协商主备角色,MLAG组网恢复正常。
通过上述方案,在难免遇到链路故障的情况下,本实施例仅通过一个角色信息,就可以在keepalive震荡恢复后,自动重新进行主从角色确定,然后从设备的端口会再次Error-Down掉,减少了MLAG双主异常导致的流量转发异常,同时减少了人力投入成本。
此外,该机制不会改变原有的主从设备角色,即keepalive震荡恢复后,主从设备角色和震荡前一致,这就保证了流量一直在MLAG主设备上通信,不会切换到另一台设备上,也就没有切换导致的丢包情况。
实施例三:
基于同一发明构思,本申请实施例中还提供了一种MLAG双主异常修复装置400。请参阅图4所示,图4示出了采用图1所示的方法的MLAG双主异常修复装置。应理解,装置400具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。装置400包括至少一个能以软件或固件的形式存储于存储器中或固化在装置400的操作系统中的软件功能模块。具体地:
参见图4所示,装置400应用于MLAG域内的每一个设备上,包括:接收模块401、获取模块402、确定模块403和切换模块404。其中:
所述接收模块401,用于在keepalive链路恢复时,通过所述keepalive链路接收对端设备的当前角色信息;
所述获取模块402,用于获取本设备的当前角色信息;
所述确定模块403,用于若所述对端设备的当前角色信息和所述本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息;
所述切换模块404,用于若本设备的应选角色信息为从设备,则将本设备切换为所述从设备。
在本申请实施例中,所述确定模块403具体用于:判断所述当前角色信息的上一角色信息是否表征为从设备;若是,确定本设备的应选角色信息为从设备;否则,确定本设备的应选角色信息为主设备。
在本申请实施例的一种可行实施方式中,所述确定模块403还用于:在根据本设备的历史角色信息,确定本设备的应选角色信息之前,确定当前时刻,peer-link链路处于故障状态。
在上述可行实施方式的一种可行示例中,所述确定模块403具体用于:将本设备的状态修改为Suspend,并将本设备的MLAG端口切换为Error-Down状态。
在上述可行示例中,所述确定模块403还用于:在将本设备的MLAG端口切换为Error-Down状态之前,确定本设备的MLAG端口当前处于正常状态;其中,所述MLAG端口被设置为,当所属设备从Suspend状态切换为Master-Alone时,在预设延迟时长达到后将所述MLAG端口恢复为正常状态。
在上述可行实施方式中,所述确定模块403还用于,若当前时刻,所述peer-link链路处于正常状态,则按照预设的协商方式,与所述对端设备进行角色协商;所述切换模块404还用于,若协商出的本设备对应的角色为从设备,则将本设备切换为所述从设备。
在本申请实施例中,所述接收模块401具体用于,接收通过所述keepalive链路传来的TLV格式的报文;所述报文的TLV三元组中携带有所述对端设备的当前角色信息。
需要理解的是,出于描述简洁的考量,部分实施例一中描述过的内容在本实施例中不再赘述。
实施例四:
本实施例提供了一种电子设备,参见图5所示,其包括处理器501、存储器502以及通信总线503。其中:
通信总线503用于实现处理器501和存储器502之间的连接通信。
处理器501用于执行存储器502中存储的一个或多个程序,以实现上述实施例一中的MLAG双主异常修复方法。
可以理解,图5所示的结构仅为示意,电子设备还可包括比图5中所示更多或者更少的组件,或者具有与图5所示不同的配置。在本申请实施例中,电子设备可以是交换机等可应用于MLAG域内的设备。
本实施例还提供了一种可读存储介质,如软盘、光盘、硬盘、闪存、U盘、SD(SecureDigital Memory Card,安全数码卡)卡、MMC(Multimedia Card,多媒体卡)卡等,在该可读存储介质中存储有实现上述各个步骤的一个或者多个程序,这一个或者多个程序可被一个或者多个处理器执行,以实现上述实施例一中的MLAG双主异常修复方法。在此不再赘述。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
在本文中,多个是指两个或两个以上。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种MLAG双主异常修复方法,其特征在于,所述方法包括:
在保活keepalive链路恢复时,通过所述keepalive链路接收对端设备的当前角色信息;
获取本设备的当前角色信息;
若所述对端设备的当前角色信息和所述本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息;
若本设备的应选角色信息为从设备,则将本设备切换为所述从设备。
2.如权利要求1所述的MLAG双主异常修复方法,其特征在于,所述根据本设备的历史角色信息,确定本设备的应选角色信息,包括:
判断所述当前角色信息的上一角色信息是否表征为从设备;
若是,确定本设备的应选角色信息为从设备;
否则,确定本设备的应选角色信息为主设备。
3.如权利要求1所述的MLAG双主异常修复方法,其特征在于,在根据本设备的历史角色信息,确定本设备的应选角色信息之前,所述方法还包括:
确定当前时刻,peer-link链路处于故障状态。
4.如权利要求3所述的MLAG双主异常修复方法,其特征在于,将本设备切换为所述从设备,包括:
将本设备的状态修改为Suspend状态,并将本设备的MLAG端口切换为Error-Down状态。
5.如权利要求4所述的MLAG双主异常修复方法,其特征在于,在将本设备的MLAG端口切换为Error-Down状态之前,所述方法还包括:
确定本设备的MLAG端口当前处于正常状态;其中,所述MLAG端口被设置为,当所属设备从Suspend状态切换为单主Master-Alone状态时,在预设延迟时长达到后将所述MLAG端口恢复为正常状态;所述Master-Alone状态表征设备检测到双活系统中仅存在主设备时的状态。
6.如权利要求3所述的MLAG双主异常修复方法,其特征在于,若当前时刻,所述peer-link链路处于正常状态,所述方法还包括:
则按照预设的协商方式,与所述对端设备进行角色协商;
若协商出的本设备对应的角色为从设备,则将本设备切换为所述从设备。
7.如权利要求1-6任一项所述的MLAG双主异常修复方法,其特征在于,通过所述keepalive链路接收对端设备的当前角色信息,包括:
接收通过所述keepalive链路传来的TLV格式的报文;所述报文的TLV三元组中携带有所述对端设备的当前角色信息。
8.一种MLAG双主异常修复装置,其特征在于,包括:接收模块、获取模块、确定模块和切换模块;
所述接收模块,用于在保活keepalive链路恢复时,通过所述keepalive链路接收对端设备的当前角色信息;
所述获取模块,用于获取本设备的当前角色信息;
所述确定模块,用于若所述对端设备的当前角色信息和所述本设备的当前角色信息均表征为主设备,则根据本设备的历史角色信息,确定本设备的应选角色信息;
所述切换模块,用于若本设备的应选角色信息为从设备,则将本设备切换为所述从设备。
9.一种电子设备,其特征在于,包括:处理器、存储器及通信总线;
所述通信总线用于实现处理器和存储器之间的连接通信;
所述处理器用于执行存储器中存储的一个或者多个程序,以实现如权利要求1-7任一项所述的MLAG双主异常修复方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1-7任一项所述的MLAG双主异常修复方法。
CN202111210395.4A 2021-10-18 2021-10-18 Mlag双主异常修复方法、装置、电子设备及存储介质 Active CN113949623B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111210395.4A CN113949623B (zh) 2021-10-18 2021-10-18 Mlag双主异常修复方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111210395.4A CN113949623B (zh) 2021-10-18 2021-10-18 Mlag双主异常修复方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN113949623A true CN113949623A (zh) 2022-01-18
CN113949623B CN113949623B (zh) 2024-04-26

Family

ID=79331172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111210395.4A Active CN113949623B (zh) 2021-10-18 2021-10-18 Mlag双主异常修复方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN113949623B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115250226A (zh) * 2022-07-26 2022-10-28 迈普通信技术股份有限公司 Mlag双主故障恢复方法、装置、系统、介质及设备

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102404146A (zh) * 2011-11-17 2012-04-04 福建星网锐捷网络有限公司 主从切换方法、网络设备及dhcp服务器
CN102957623A (zh) * 2012-11-28 2013-03-06 杭州华三通信技术有限公司 一种边界网关协议邻居的维护方法和设备
CN103944781A (zh) * 2014-04-15 2014-07-23 迈普通信技术股份有限公司 一种防止堆叠系统单边分裂的方法及系统
CN104333470A (zh) * 2014-11-14 2015-02-04 杭州华三通信技术有限公司 故障处理方法和装置
CN108900415A (zh) * 2018-08-31 2018-11-27 华东计算技术研究所(中国电子科技集团公司第三十二研究所) Mlag接口故障下的主从设备切换方法及系统
US20200252331A1 (en) * 2019-01-31 2020-08-06 Dell Products L.P. Automated link aggregation group configuration system
CN111786882A (zh) * 2020-06-30 2020-10-16 中国联合网络通信集团有限公司 一种路由处理方法及装置
CN111865779A (zh) * 2020-07-13 2020-10-30 中国联合网络通信集团有限公司 一种路由同步方法及跨设备链路聚合组
CN111953591A (zh) * 2020-07-17 2020-11-17 新华三技术有限公司 故障处理方法及装置
CN111988213A (zh) * 2020-07-16 2020-11-24 浪潮思科网络科技有限公司 一种在evpn mlag环境下同步vxlan隧道的方法及设备、介质
CN112671642A (zh) * 2021-01-14 2021-04-16 新华三信息安全技术有限公司 一种报文转发方法及设备
CN112737944A (zh) * 2020-12-25 2021-04-30 浪潮思科网络科技有限公司 一种基于bfd的peer-link链路状态检测方法、装置及介质
CN113259235A (zh) * 2021-06-22 2021-08-13 浪潮思科网络科技有限公司 一种基于IPv6的双活路由冗余方法及系统

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102404146A (zh) * 2011-11-17 2012-04-04 福建星网锐捷网络有限公司 主从切换方法、网络设备及dhcp服务器
CN102957623A (zh) * 2012-11-28 2013-03-06 杭州华三通信技术有限公司 一种边界网关协议邻居的维护方法和设备
CN103944781A (zh) * 2014-04-15 2014-07-23 迈普通信技术股份有限公司 一种防止堆叠系统单边分裂的方法及系统
CN104333470A (zh) * 2014-11-14 2015-02-04 杭州华三通信技术有限公司 故障处理方法和装置
CN108900415A (zh) * 2018-08-31 2018-11-27 华东计算技术研究所(中国电子科技集团公司第三十二研究所) Mlag接口故障下的主从设备切换方法及系统
US20200252331A1 (en) * 2019-01-31 2020-08-06 Dell Products L.P. Automated link aggregation group configuration system
CN111786882A (zh) * 2020-06-30 2020-10-16 中国联合网络通信集团有限公司 一种路由处理方法及装置
CN111865779A (zh) * 2020-07-13 2020-10-30 中国联合网络通信集团有限公司 一种路由同步方法及跨设备链路聚合组
CN111988213A (zh) * 2020-07-16 2020-11-24 浪潮思科网络科技有限公司 一种在evpn mlag环境下同步vxlan隧道的方法及设备、介质
CN111953591A (zh) * 2020-07-17 2020-11-17 新华三技术有限公司 故障处理方法及装置
CN112737944A (zh) * 2020-12-25 2021-04-30 浪潮思科网络科技有限公司 一种基于bfd的peer-link链路状态检测方法、装置及介质
CN112671642A (zh) * 2021-01-14 2021-04-16 新华三信息安全技术有限公司 一种报文转发方法及设备
CN113259235A (zh) * 2021-06-22 2021-08-13 浪潮思科网络科技有限公司 一种基于IPv6的双活路由冗余方法及系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LI DING等: "Distributed Intelligence Empowered Data Aggregation and Distribution for Multi-robot Cooperative Communication", 《DISTRIBUTED INTELLIGENCE EMPOWERED DATA AGGREGATION AND DISTRIBUTION FOR MULTI-ROBOT COOPERATIVE COMMUNICATION》 *
罗健;易欣;谢永春;夏安祥;: "Eth-Trunk负载分担在通信类设备上的应用", 通信技术, no. 04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115250226A (zh) * 2022-07-26 2022-10-28 迈普通信技术股份有限公司 Mlag双主故障恢复方法、装置、系统、介质及设备
CN115250226B (zh) * 2022-07-26 2023-11-24 迈普通信技术股份有限公司 Mlag双主故障恢复方法、装置、系统、介质及设备

Also Published As

Publication number Publication date
CN113949623B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
US8886831B2 (en) System and methodology for fast link failover based on remote upstream failures
CN111343019B (zh) 一种重连方法、装置和存储介质
US20070177589A1 (en) Network system and node redundancy method of network system
EP3029883B1 (en) Network protection method and apparatus, next-ring node, and system
CN102857316B (zh) 一种实现源环网保护的方法及系统
CN110278094B (zh) 链路恢复方法及装置、系统、存储介质、电子装置
EP2677702A2 (en) A method and apparatus for load balance
WO2017000096A1 (zh) 一种链路恢复方法和网络设备
CN113949623B (zh) Mlag双主异常修复方法、装置、电子设备及存储介质
CN115589273A (zh) Epa通信系统
CN104468168A (zh) 网络故障恢复方法、控制服务器及交换机
CN109302328B (zh) 一种vxlan网络热备切换方法及系统
CN117459482B (zh) 交换机的重启方法和装置、存储介质及电子装置
US8868967B2 (en) Method and system for connection-error handling of service in an automatically switched optical network
CN109150709B (zh) 一种实现Mux机的方法、设备及系统
CN113645312A (zh) 一种基于erps协议的子环网链路保护方法与装置
CN110875880B (zh) 一种数据传输方法、相关设备、系统及计算机存储介质
CN114095462B (zh) 一种雷达处理机srio通信系统的容错方法及系统
JP5647197B2 (ja) ネットワーク接続装置、ネットワーク制御方法、ネットワーク制御プログラム、およびネットワークシステム
CN111181766B (zh) 一种冗余fc网络系统及其实现交换机动态配置的方法
CN109120520B (zh) 一种故障处理方法和设备
CN111224803B (zh) 一种堆叠系统中多主检测方法及堆叠系统
CN113852514A (zh) 服务不中断的数据处理系统、处理设备切换方法、连接设备
CN115412424B (zh) 一种mlag环境下双主设备检测方法及设备
CN115102897B (zh) 一种基于链路聚合的堆叠分裂保护方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant