CN108599903B - 单板启动控制方法和装置 - Google Patents

单板启动控制方法和装置 Download PDF

Info

Publication number
CN108599903B
CN108599903B CN201810195681.XA CN201810195681A CN108599903B CN 108599903 B CN108599903 B CN 108599903B CN 201810195681 A CN201810195681 A CN 201810195681A CN 108599903 B CN108599903 B CN 108599903B
Authority
CN
China
Prior art keywords
board
mpu
retransmission timer
single board
main mpu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810195681.XA
Other languages
English (en)
Other versions
CN108599903A (zh
Inventor
王剑鸣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou H3C Technologies Co Ltd
Original Assignee
Hangzhou H3C Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou H3C Technologies Co Ltd filed Critical Hangzhou H3C Technologies Co Ltd
Priority to CN201810195681.XA priority Critical patent/CN108599903B/zh
Publication of CN108599903A publication Critical patent/CN108599903A/zh
Application granted granted Critical
Publication of CN108599903B publication Critical patent/CN108599903B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/1607Details of the supervisory signal
    • H04L1/1671Details of the supervisory signal the supervisory signal being transmitted together with control information
    • H04L1/1678Details of the supervisory signal the supervisory signal being transmitted together with control information where the control information is for timing, e.g. time stamps
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/12Arrangements for detecting or preventing errors in the information received by using return channel
    • H04L1/16Arrangements for detecting or preventing errors in the information received by using return channel in which the return channel carries supervisory signals, e.g. repetition request signals
    • H04L1/18Automatic repetition systems, e.g. Van Duuren systems
    • H04L1/1829Arrangements specially adapted for the receiver end
    • H04L1/1848Time-out mechanisms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Debugging And Monitoring (AREA)
  • Communication Control (AREA)

Abstract

本申请单板启动控制方法和装置。本申请中,在集群中增加了信息重传机制、以及待启动的单板自身增加了启动保护机制,通过这两种机制能够降低单板启动失败的概率,进而降低单板所在框比如LCC启动失败的概率。

Description

单板启动控制方法和装置
技术领域
本申请涉及网络通信技术,特别涉及单板启动控制方法和装置。
背景技术
通过光纤将不同框的主控板处理单元(MPU:Main Process Unit,简称主控板)连接起来,构成一个统一的系统(也称集群)。在集群中,一个框的MPU被选举为主用MPU(简称Master),剩余框的MPU为备用MPU(简称Slave)。图1示出了1个中央框(FCC:Fabric CentralChassis)、2个线卡框(LCC:Line Card Chassis)利用光纤相连组成的集群。在图1中,FCC中的MPU、2个LCC中MPU利用光纤通过FCC中控制连接单元(CCU:Control Connection Unit)连接,FCC中的MPU为主用MPU,负责调度CCU、2个LCC中MPU(备用MPU)、以及集群中各框的交换网芯片单元(SFU:Switch Fabric Unit,简称网板)、线卡处理单元(LPU:Line cardProcess Unit,简称接口板)。
备用MPU(其他单板比如SFU或LPU类似,这里以备用MPU为例描述)在启动阶段都要向主用MPU发起注册,在收到主用MPU回复注册确认(通常把这个报文称作ACK报文)后开始正常启动。以图1所示LCC1中的MPU11启动为例描述:
MPU11上电后按照设定周期向主用MPU(图1所示的MPU31)发起注册,直到收到MPU31回复确认。MPU31收到MPU11发起的注册时回复注册确认(ACK报文),当MPU11收到MPU31回复的确认后表示注册成功。MPU31将本地存储的系统资源状态信息发送至MPU11进行备份,当MPU31存储的系统资源状态信息较多时,MPU31会将系统资源状态信息拆分成多份,分次发送给MPU11,当MPU31成功将所有的系统资源状态信息发送至MPU11时,MPU31向MPU11发送备份结束消息,以通知MPU11开始正常启动。
然而在集群中,主用MPU和备用MPU并非在同一框内,而是利用光纤通过CCU连接,这样,就有可能出现如下情况:
情况1:主用MPU(比如上述的MPU31)向备用MPU(比如上述的MPU11)发送某一份系统资源状态信息时发送失败;
情况2:主用MPU(比如上述的MPU31)向备用MPU(比如上述的MPU11)发送备份结束消息时发送失败。
不管出现上述哪种情况,最终会导致备用MPU启动失败,备用MPU所在的框比如LCC也随之启动失败。类似地,其他单板比如SFU或LPU也会出现类似备用MPU启动失败的情况。
发明内容
本申请提供了单板启动控制方法和装置,以降低单板启动失败的概率。
本申请提供的技术方案包括:
一种应用于集群中的单板启动控制方法,该方法应用于集群中的主用主控处理单元MPU,包括:
在指定单板启动过程中,所述指定单板为成功注册至本主用MPU的单板,若检测到本主用MPU向所述指定单板发送用于触使所述指定单板启动的信息失败,则:
检查本地是否存在所述指定单板相关联的重传定时器;
如果否,创建所述指定单板相关联的重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息;
如果是,重置所述重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
一种应用于集群中的单板启动控制方法,该方法应用于集群中已成功注册至主用主控处理单元MPU的单板,包括:
在接收到主用MPU返回的注册确认时创建启动定时器;
检查在所述启动定时器超时时是否已收到来自所述主用MPU发送的用于指示指定单板启动的消息;
若是,则删除所述启动定时器;
若否,自动重启。
一种应用于集群中的单板启动控制装置,该装置应用于集群中的主用主控处理单元MPU,包括:
检测单元,用于在指定单板启动过程中,所述指定单板为成功注册至本主用MPU的单板,检测本主用MPU是否成功向所述指定单板发送用于触使所述指定单板启动的信息;
重传控制单元,用于在所述检测单元检测到本主用MPU向所述指定单板发送用于触使所述指定单板启动的信息失败,则检查本地是否存在所述指定单板相关联的重传定时器,如果否,创建所述指定单板相关联的重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息;如果是,重置所述重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
一种应用于集群中的单板启动控制装置,该装置应用于集群中已成功注册至主用主控处理单元MPU的单板,包括:
接收单元,用于接收主用MPU返回的注册确认;
启动控制单元,用于在所述接收单元接收到所述注册确认时创建启动定时器,检查在所述启动定时器超时时是否已收到来自所述主用MPU发送的用于指示指定单板启动的消息,若是,则删除所述启动定时器,若否,触发所述单板自动重启。
由以上技术方案可以看出,本申请中,在指定单板启动过程中,即使主用MPU检测到向指定单板发送用于触使所述指定单板启动的信息发送失败,则通过重传机制可以保证之前发送失败的信息(触使所述指定单板启动的信息)继续发送,直至发送成功,如此,即可大大降低单板启动失败的概率,进而降低单板所在框比如LCC启动失败的概率;
进一步地,本申请中,待启动的单板通过创建启动定时器,以在长时间(启动定时器超时时间)收不到用于指示指定单板启动的消息时,自动重启,重新注册至主用MPU进行启动,这变相地降低单板启动失败的概率,进而降低单板所在框比如LCC启动失败的概率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
图1为集群结构示意图;
图2为本申请提供的方法流程图;
图3为本申请提供的第一实施例实现流程图;
图4为本申请提供的第二实施例实现流程图;
图5为本申请提供的另一方法流程图;
图6为本申请提供的装置结构示意图;
图7为本申请提供的另一装置结构示意图。
具体实施方式
本申请提供的方法,为了降低单板启动失败的概率,在集群中增加了信息重传机制、以及待启动的单板自身增加了启动保护机制,通过这两种机制能够降低单板启动失败的概率,进而降低单板所在框比如LCC启动失败的概率。
为了使本申请的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述:
参见图2,图2为本申请提供的方法流程图。该流程应用于主用MPU。如图2所示,该流程可包括以下步骤:
步骤201,在指定单板启动过程中,若检测到本主用MPU向所述指定单板发送用于触使所述指定单板启动的信息失败,则执行步骤202。
这里,指定单板为成功注册至本主用MPU的单板,比如为备用MPU、LPU、SFU等,本申请并不具体限定。
当指定单板成功注册至主用MPU,也就意味着指定单板与主用MPU之间可以通信,比如主用MPU向指定单板发送用于触使指定单板启动的信息,但是,在通信过程中,主用MPU发送的用于触使指定单板启动的信息会出现发送失败的情况,因此,本申请中,需要检测主用MPU是否成功向指定单板发送用于触使所述指定单板启动的信息,一旦主用MPU成功向指定单板发送用于触使所述指定单板启动的信息,主用MPU本地会生成一个用于指示发送成功的回执,反之,主用MPU本地会生成一个用于指示发送失败的回执。基于此,主用MPU可以依赖于回执确定是否成功向指定单板发送用于触使所述指定单板启动的信息。
步骤202,检查本地是否存在所述指定单板相关联的重传定时器,如果否,执行步骤203,如果是,执行步骤204。
步骤203,创建所述指定单板相关联的重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
本步骤203是在主用MPU本地未创建所述指定单板相关联的重传定时器的前提下执行的,此时,为了实现上述信息的重传,本步骤203需要创建所述指定单板相关联的重传定时器,以借助重传定时器实现上述信息的重传。
在具体实现时,重传定时器的超时时间可自定义,比如1分钟等。
步骤204,重置所述重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
本步骤204是在主用MPU本地已创建所述指定单板相关联的重传定时器的前提下执行的,基于这个前提,则上述步骤201中主用MPU向指定单板发送用于触使所述指定单板启动的信息(尽管未成功)是在重传定时器超时的前提下执行的,基于此,本步骤204就需要重置重传定时器,等下次再检测到重传定时器超时时再重新向所述指定单板发送所述信息,以保证最终发送成功。需要说明的是,为提高效率,在本申请中,当同一份信息重传次数比较多,达到设定阈值,则可以删除上述重传定时器,不再重传。
至此,完成图2所示流程。
通过图2所示流程可以看出,在本申请中,在指定单板启动过程中,即使主用MPU检测到本主用MPU未成功向指定单板发送用于触使所述指定单板启动的信息,则通过重传机制可以保证之前未成功发送的信息(触使所述指定单板启动的信息)继续发送,直至发送成功,如此,即可大大降低单板启动失败的概率,进而降低单板所在框比如LCC启动失败的概率。
在一个例子中,上述用于触使指定单板启动的信息可为系统资源状态信息。在应用中,当主用MPU将本地存储的所有系统资源状态信息成功发送至指定单板进行备份,则意味着指定单板可以正常启动,因此,系统资源状态信息可以概括为用于触使指定单板启动的信息。下文通过第一实施例描述。
第一实施例:
参见图3,图3为本申请提供的第一实施例实现流程图。如图3所示,该流程可包括以下步骤:
步骤301,在指定单板启动过程中,主用MPU向指定单板发送本地存储的系统资源状态信息(记为系统资源状态信息300)。
如背景技术描述,主用MPU本地存储的系统资源状态信息比较多,无法一次发送给指定单板,基于此种情况,主用MPU会将本地存储的系统资源状态信息拆分为多份,分次发送。假若本步骤301中本次发送的系统资源状态信息记为系统资源状态信息300。
步骤302,主用MPU检测本主用MPU是否成功发送系统资源状态信息300,若否,执行步骤303,若是,执行步骤307。
主用MPU在发送系统资源状态信息300时会调用一个发送接口函数,当发送成功时,发送接口函数会返回一个用于指示发送成功的回执,而当发送失败时,发送接口函数会返回一个用于指示发送失败的回执。主用MPU基于其调用的发送接口函数返回的回执即可确定本主用MPU是否成功发送系统资源状态信息300。
步骤303,检查本地是否存在指定单板相关联的重传定时器,如果否,执行步骤304,如果是,执行步骤305。
步骤304,创建指定单板相关联的重传定时器,并记录系统资源状态信息300的资源标识。之后执行步骤306。
在一个例子中,主用MPU采用链表存储系统资源状态信息,基于此,本步骤304中,系统资源状态信息300的资源标识可为系统资源状态信息300在链表中的索引ID。
步骤305,重置指定单板相关联的重传定时器。之后执行步骤306。
步骤306,在检测到重传定时器超时时根据记录的上述资源标识查找到系统资源状态信息300,重新向指定单板发送系统资源状态信息300,返回步骤302。
需要说明的是,主用MPU本地存储的系统资源状态信息动态变化,在检测到重传定时器超时时,有可能会出现系统资源状态信息300已经不存在了,基于此种情况,此时可判断是否还有未向指定单板发送的系统资源状态信息,如果是,则从未向指定单板发送的系统资源状态信息中获取一份系统资源状态信息并发送,之后返回类似步骤302至步骤306的描述。
步骤307,检查本主用MPU是否已记录了该被成功发送的系统资源状态信息300的资源标识,以及,检查本主用MPU是否已创建了所述指定单板相关联的重传定时器。
步骤308,若检查出本主用MPU已记录了该被成功发送的系统资源状态信息300的资源标识,则删除所述资源标识;若检查出本主用MPU本地已创建了指定单板相关联的重传定时器,则判断该被成功发送的系统资源状态信息300是否为最后一份需要发送的系统资源状态信息,如果是,删除所述重传定时器。
在本步骤308中,若检查出本主用MPU本地已创建了指定单板相关联的重传定时器,且判断该被成功发送的系统资源状态信息300不为最后一份需要发送的系统资源状态信息,则从还未发向指定单板的系统资源状态信息中获取一份系统资源状态信息并发送,之后返回类似步骤302至步骤306的描述。
至此,完成图3所示流程。
通过图3所示流程,能够实现当主用MPU向指定单板发送某份系统资源状态信息失败时,则重传该被发送失败的系统资源状态信息,直至发送成功后才能继续向指定单板发送后续的其他系统资源状态信息,最终保证所有系统资源状态信息成功发送至指定单板,以保证指定单板正常启动,降低单板启动失败的概率。
在另一个例子中,上述用于触使所述指定单板启动的信息可为系统资源状态信息备份完成消息,如前所述,当主用MPU将本地存储的所有系统资源状态信息成功备份至指定单板,则意味着指定单板可以正常启动,因此,系统资源状态信息备份完成消息可以概括为用于触使指定单板启动的信息。下文会通过第二实施例描述。
第二实施例:
参见图4,图4为本申请提供的第二实施例实现流程图。如图4所示,该流程可包括以下步骤:
步骤401,在指定单板启动过程中,主用MPU若成功向指定单板发送本地存储的所有系统资源状态信息,则向指定单板发送系统资源状态信息备份完成消息。
步骤402,主用MPU检测本主用MPU是否成功发送系统资源状态信息备份完成消息,若否,执行步骤403,若是,执行步骤407。
主用MPU在发送系统资源状态信息备份完成消息时会调用一个发送接口函数,当发送成功时,发送接口函数会返回一个用于指示发送成功的回执,而当发送失败时,发送接口函数会返回一个用于指示发送失败的回执。主用MPU基于其调用的发送接口函数返回的回执即可确定本主用MPU是否成功发送系统资源状态信息备份完成消息。
步骤403,检查本地是否存在指定单板相关联的重传定时器,如果否,执行步骤404,如果是,执行步骤405。
步骤404,创建指定单板相关联的重传定时器。之后执行步骤406。
步骤405,重置指定单板相关联的重传定时器。之后执行步骤406。
步骤406,在检测到重传定时器超时时重新向指定单板发送系统资源状态信息备份完成消息,返回步骤402。
步骤407,检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,若是,执行步骤408。
步骤408,删除所述重传定时器。
至此,完成图4所示流程。
通过图4所示流程,能够实现当主用MPU向指定单板发送系统资源状态信息备份完成消息失败时,则重传该系统资源状态信息备份完成消息,直至发送成功,以保证指定单板正常启动,降低单板启动失败的概率。
如背景技术描述,在一个例子中,集群中主用MPU、以及其他各单板比如备份MPU、SFU、LPU利用光纤通过CCU连接的。如此,当CCU发现本地连接某一单板比如上述的指定单板的端口异常(比如Down),则会向主用MPU发送端口异常消息,所述端口异常消息用于指示CCU上连接指定单板的端口异常。而当主用MPU接收到CCU上报的端口异常消息时,基于该端口异常消息检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器指定单板。在应用中,当CCU上连接指定单板的端口异常,则意味着指定单板重启或者指定单板所在框比如LLC重启,此种情况下,即使主用MPU本地已创建了所述指定单板相关联的重传定时器,也没有必要向指定单板重传信息,避免资源浪费。
以上对指定单板启动过程中主用MPC向指定单板发送信息失败时的处理流程进行了描述,下面对指定单板自身的启动保护机制进行描述:
参见图5,图5为本申请提供的另一方法流程图。该流程应用于指定单板。这里,指定单板为成功注册至本主用MPU的单板,比如为备用MPU、LPU、SFU等,本申请并不具体限定。
如图5所示,该流程可包括以下步骤:
步骤501,指定单板在接收到主用MPU返回的注册确认时创建启动定时器。
当指定单板接收到主用MPU返回的注册确认时,也就意味着指定单板与主用MPU之间可以双向通信,指定单板就可以接收主用MPU发送的用于触使指定单板启动的信息,等待系统资源状态信息备份完成(系统资源状态信息备份完成,用于指示指定单板启动)。但是,在通信过程中,主用MPU发送的用于触使指定单板启动的信息可能会出现发送失败,进而导致系统资源状态信息备份无法完成,而为防止指定单板无限期等待系统资源状态信息备份完成,则创建启动定时器。
这里,启动定时器的超时时间可以自定义,比如1分钟、10分钟等。
步骤502,指定单板检查在所述启动定时器超时时是否已收到来自所述主用MPU发送的用于指示指定单板启动的消息;若是,执行步骤503,若否,执行步骤504。
这里,用于指示指定单板启动的消息可为已协商的最后一个系统资源状态信息、或者为系统资源状态信息备份完成消息。
步骤503,指定单板删除所述启动定时器。
本步骤503中,当指定单板在启动定时器超时时间内收到用于指示指定单板启动的消息,则正常启动,而此时的启动定时器没有必要,可以删除。
步骤504,指定单板自动重启。
本步骤504中,当指定单板长时间(启动定时器超时时间)收不到用于指示指定单板启动的消息,则指定单板不再等待,而是自动重启。
至此,完成图5所示流程。
以上对本申请提供的方法进行了描述。下面对本申请提供的装置进行描述:
参见图6,图6为本申请提供的装置结构图。该装置应用于集群中的主用MPU,包括:
检测单元,用于在指定单板启动过程中,所述指定单板为成功注册至本主用MPU的单板,检测本主用MPU是否成功向所述指定单板发送用于触使所述指定单板启动的信息;
重传控制单元,用于在所述检测单元检测到本主用MPU向所述指定单板发送用于触使所述指定单板启动的信息失败,则检查本地是否存在所述指定单板相关联的重传定时器,如果否,创建所述指定单板相关联的重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息;如果是,重置所述重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
作为一个实施例,所述信息为系统资源状态信息;
所述重传控制单元创建指定单板相关联的重传定时器进一步包括:记录所述系统资源状态信息的资源标识;
所述重传控制单元在检测到所述重传定时器超时时重新向所述指定单板发送所述信息包括:在检测到所述重传定时器超时时,依据所述资源标识在本地存储的所有资源状态信息中查找对应的系统资源状态信息,重新向所述指定单板发送查找到的系统资源状态信息。
作为一个实施例,所述重传控制单元进一步在所述检测单元检测到本主用MPU成功向所述指定单板发送所述系统资源状态信息时,检查本主用MPU是否已记录了该被成功发送的所述系统资源状态信息的资源标识,如果是,删除所述资源标识;以及,
检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,若本地已创建了所述指定单板相关联的重传定时器,则判断该被成功发送的系统资源状态信息是否为最后一份需要发送的系统资源状态信息,如果是,删除所述重传定时器。
作为一个实施例,所述信息为系统资源状态信息备份完成消息;
所述重传控制单元进一步在所述检测单元检测到本主用MPU成功向所述指定单板发送所述系统资源状态信息备份完成消息时,检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器。
作为一个实施例,如图6所示,该装置进一步包括:
接收单元,用于接收本主用MPU连接的控制连接单元CCU上报的端口异常消息,所述端口异常消息用于指示所述CCU上连接所述指定单板的端口异常;
作为一个实施例,所述重传控制单元进一步在所述接收单元接收到所述端口异常消息时,检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器。
至此,完成图6所示装置结构图。
参见图7,图7为本申请提供的另一装置结构图。该装置应用于集群中已成功注册至主用MPU的单板,包括:
接收单元,用于接收主用MPU返回的注册确认;
启动控制单元,用于在所述接收单元接收到所述注册确认时创建启动定时器,检查在所述启动定时器超时时是否已收到来自所述主用MPU发送的用于指示指定单板启动的消息,若是,则删除所述启动定时器,若否,触发所述单板自动重启。
作为一个实施例,这里,用于指示指定单板启动的消息可为:系统资源状态信息备份完成消息;或者为已与主用MPU协商的最后一份系统资源状态信息。
至此,完成图7所示的装置结构图。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (12)

1.一种应用于集群中的单板启动控制方法,其特征在于,该方法应用于集群中的主用主控处理单元MPU,集群包括主用MPU和作为备用MPU的指定单板,且各个MPU处于不同框,包括:
在指定单板启动过程中,所述指定单板为成功注册至本主用MPU的单板,若检测到本主用MPU向所述指定单板发送用于触使所述指定单板启动的信息失败,则:
检查本地是否存在所述指定单板相关联的重传定时器;
如果否,创建所述指定单板相关联的重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息;
如果是,重置所述重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
2.根据权利要求1所述的方法,其特征在于,所述信息为待备份的系统资源状态信息;
所述创建指定单板相关联的重传定时器进一步包括:记录所述系统资源状态信息的资源标识;
所述在检测到所述重传定时器超时时重新向所述指定单板发送所述信息包括:在检测到所述重传定时器超时时,依据所述资源标识在本地存储的所有资源状态信息中查找对应的系统资源状态信息,重新向所述指定单板发送查找到的系统资源状态信息。
3.根据权利要求2所述的方法,其特征在于,若检测到本主用MPU成功向所述指定单板发送所述系统资源状态信息,该方法进一步包括:
检查本主用MPU是否已记录了该被成功发送的所述系统资源状态信息的资源标识,如果是,删除所述资源标识;
检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,若本地已创建了所述指定单板相关联的重传定时器,则判断该被成功发送的系统资源状态信息是否为最后一份需要发送的系统资源状态信息,如果是,删除所述重传定时器。
4.根据权利要求1所述的方法,其特征在于,所述信息为系统资源状态信息备份完成消息;
若检测到本主用MPU成功向所述指定单板发送所述系统资源状态信息备份完成消息,该方法进一步包括:检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器。
5.根据权利要求1至4任一所述的方法,其特征在于,该方法进一步包括:
接收本主用MPU连接的控制连接单元CCU上报的端口异常消息,所述端口异常消息用于指示所述CCU上连接所述指定单板的端口异常;
检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器。
6.一种应用于集群中的单板启动控制方法,其特征在于,该方法应用于集群中已成功注册至主用主控处理单元MPU的单板,集群包括主用MPU和作为备用MPU的单板,且各个MPU处于不同框,包括:
在接收到主用MPU返回的注册确认时创建启动定时器;
检查在所述启动定时器超时时是否已收到来自所述主用MPU发送的用于指示单板启动的消息;所述主用MPU基于如下情况向所述单板发送所述消息:所述主用MPU当检测到向所述单板发送所述消息失败时,若检测到本主用MPU未存在相关联的重传定时器,创建所述单板相关联的重传定时器,以在检测到所创建的重传定时器超时时重新向所述单板发送所述消息;若检测到本主用MPU存在相关联的重传定时器,重置所述重传定时器,以在检测到所述重传定时器超时时重新向所述单板发送所述消息;
若是,则删除所述启动定时器;
若否,自动重启。
7.一种应用于集群中的单板启动控制装置,其特征在于,该装置应用于集群中的主用主控处理单元MPU,集群包括主用MPU和作为备用MPU的指定单板,且各个MPU处于不同框,包括:
检测单元,用于在指定单板启动过程中,所述指定单板为成功注册至本主用MPU的单板,检测本主用MPU是否成功向所述指定单板发送用于触使所述指定单板启动的信息;
重传控制单元,用于在所述检测单元检测到本主用MPU向所述指定单板发送用于触使所述指定单板启动的信息失败,则检查本地是否存在所述指定单板相关联的重传定时器,如果否,创建所述指定单板相关联的重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息;如果是,重置所述重传定时器,在检测到所述重传定时器超时时重新向所述指定单板发送所述信息。
8.根据权利要求7所述的装置,其特征在于,所述信息为系统资源状态信息;
所述重传控制单元创建指定单板相关联的重传定时器进一步包括:记录所述系统资源状态信息的资源标识;
所述重传控制单元在检测到所述重传定时器超时时重新向所述指定单板发送所述信息包括:在检测到所述重传定时器超时时,依据所述资源标识在本地存储的所有资源状态信息中查找对应的系统资源状态信息,重新向所述指定单板发送查找到的系统资源状态信息。
9.根据权利要求8所述的装置,其特征在于,所述重传控制单元进一步在所述检测单元检测到本主用MPU成功向所述指定单板发送所述系统资源状态信息时,检查本主用MPU是否已记录了该被成功发送的所述系统资源状态信息的资源标识,如果是,删除所述资源标识;以及,
检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,若本地已创建了所述指定单板相关联的重传定时器,则判断该被成功发送的系统资源状态信息是否为最后一份需要发送的系统资源状态信息,如果是,删除所述重传定时器。
10.根据权利要求7所述的装置,其特征在于,所述信息为系统资源状态信息备份完成消息;
所述重传控制单元进一步在所述检测单元检测到本主用MPU成功向所述指定单板发送所述系统资源状态信息备份完成消息时,检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器。
11.根据权利要求7至10任一所述的装置,其特征在于,该装置进一步包括:
接收单元,用于接收本主用MPU连接的控制连接单元CCU上报的端口异常消息,所述端口异常消息用于指示所述CCU上连接所述指定单板的端口异常;
所述重传控制单元进一步在所述接收单元接收到所述端口异常消息时,检查本主用MPU是否已创建了所述指定单板相关联的重传定时器,如果是,删除所述重传定时器。
12.一种应用于集群中的单板启动控制装置,其特征在于,该装置应用于集群中已成功注册至主用主控处理单元MPU的单板,集群包括主用MPU和作为备用MPU的单板,且各个MPU处于不同框,包括:
接收单元,用于接收主用MPU返回的注册确认;
启动控制单元,用于在所述接收单元接收到所述注册确认时创建启动定时器,检查在所述启动定时器超时时是否已收到来自所述主用MPU发送的用于指示单板启动的消息,若是,则删除所述启动定时器,若否,触发所述单板自动重启;其中,所述主用MPU基于如下情况向所述单板发送所述消息:所述主用MPU当检测到向所述单板发送所述消息失败时,若检测到本主用MPU未存在相关联的重传定时器,创建所述单板相关联的重传定时器,以在检测到所创建的重传定时器超时时重新向所述单板发送所述消息;若检测到本主用MPU存在相关联的重传定时器,重置所述重传定时器,以在检测到所述重传定时器超时时重新向所述单板发送所述消息。
CN201810195681.XA 2018-03-09 2018-03-09 单板启动控制方法和装置 Active CN108599903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810195681.XA CN108599903B (zh) 2018-03-09 2018-03-09 单板启动控制方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810195681.XA CN108599903B (zh) 2018-03-09 2018-03-09 单板启动控制方法和装置

Publications (2)

Publication Number Publication Date
CN108599903A CN108599903A (zh) 2018-09-28
CN108599903B true CN108599903B (zh) 2021-06-29

Family

ID=63625864

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810195681.XA Active CN108599903B (zh) 2018-03-09 2018-03-09 单板启动控制方法和装置

Country Status (1)

Country Link
CN (1) CN108599903B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111817886B (zh) * 2020-06-29 2023-12-26 新华三信息安全技术有限公司 一种获取管理对象数据的方法及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605131A (zh) * 2009-07-17 2009-12-16 杭州华三通信技术有限公司 堆叠系统中的拓扑路径更新方法和堆叠系统及其堆叠设备
CN101853171A (zh) * 2010-05-24 2010-10-06 福建星网锐捷网络有限公司 一种复杂可编程逻辑器件的在线升级方法及装置
CN104464158A (zh) * 2014-12-02 2015-03-25 深圳市泛海三江电子有限公司 一种火灾报警的联动控制方法及系统
CN107666680A (zh) * 2016-07-28 2018-02-06 中兴通讯股份有限公司 启动配置参数处理方法、装置、集中管理单元及接入点

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8737294B2 (en) * 2008-08-11 2014-05-27 Via Telecom Co., Ltd. Apparatus and method for handling RLC retransmission failure according to activation status of security mode

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101605131A (zh) * 2009-07-17 2009-12-16 杭州华三通信技术有限公司 堆叠系统中的拓扑路径更新方法和堆叠系统及其堆叠设备
CN101853171A (zh) * 2010-05-24 2010-10-06 福建星网锐捷网络有限公司 一种复杂可编程逻辑器件的在线升级方法及装置
CN104464158A (zh) * 2014-12-02 2015-03-25 深圳市泛海三江电子有限公司 一种火灾报警的联动控制方法及系统
CN107666680A (zh) * 2016-07-28 2018-02-06 中兴通讯股份有限公司 启动配置参数处理方法、装置、集中管理单元及接入点

Also Published As

Publication number Publication date
CN108599903A (zh) 2018-09-28

Similar Documents

Publication Publication Date Title
CN109274466B (zh) 一种中间件报文传输方法及系统
CN101980171B (zh) 一种软件系统故障自恢复方法及其使用的软件看门狗系统
JP2004032224A (ja) サーバ引継システムおよびその方法
US9430221B2 (en) Device and method for updating firmware of a rackmount server system
CN107517110B (zh) 一种分布式系统中单板配置自恢复方法及装置
JP5343436B2 (ja) 情報管理システム
CN111478796B (zh) 一种ai平台的集群扩容异常处理方法
KR20090091161A (ko) 링크 계층 제어 프로토콜 구현을 위한 방법 및 장치
CN102045187B (zh) 一种利用检查点实现高可用性系统的方法和设备
CN108599903B (zh) 单板启动控制方法和装置
CN113986501A (zh) 实时数据库api无中断调用方法、系统、存储介质及服务器
CN111880947B (zh) 一种数据传输方法及装置
JP2003337717A (ja) オンライントランザクション処理の障害時復旧同期システム
CN107172112B (zh) 一种计算机文件传输方法及装置
CN102073523A (zh) 实现软件版本同步的方法及装置
CN101556542B (zh) 一种成对冗余结构中器件的升级方法及设备
WO2024131009A1 (zh) 芯片间通信方法及存储介质
CN111224803B (zh) 一种堆叠系统中多主检测方法及堆叠系统
JP3837987B2 (ja) リング型ネットワークシステム、情報伝送装置、及びそのアドレス設定方法
US20140153384A1 (en) Electronic device and transmission control method
CN109361586B (zh) 一种CANopen从站的启动方法及其统筹管理器
CN101895980B (zh) 任务同步的方法和设备
CN111417116B (zh) 通过att、读写和异常处理来适配的通信方法及系统
JP7280477B2 (ja) 中継器における通信ログ管理システム、中継器およびホスト装置
CN112262550B (zh) 传送装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant