CN112948180A - 一种基于主控管理的板级热备方法 - Google Patents

一种基于主控管理的板级热备方法 Download PDF

Info

Publication number
CN112948180A
CN112948180A CN202110222210.5A CN202110222210A CN112948180A CN 112948180 A CN112948180 A CN 112948180A CN 202110222210 A CN202110222210 A CN 202110222210A CN 112948180 A CN112948180 A CN 112948180A
Authority
CN
China
Prior art keywords
board card
card
control board
board
message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110222210.5A
Other languages
English (en)
Other versions
CN112948180B (zh
Inventor
鲁邦建
张�林
安海洋
肖维章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hainan Baotong Industry Co
Original Assignee
Hainan Baotong Industry Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hainan Baotong Industry Co filed Critical Hainan Baotong Industry Co
Priority to CN202110222210.5A priority Critical patent/CN112948180B/zh
Publication of CN112948180A publication Critical patent/CN112948180A/zh
Application granted granted Critical
Publication of CN112948180B publication Critical patent/CN112948180B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/18Error detection or correction of the data by redundancy in hardware using passive fault-masking of the redundant circuits
    • G06F11/181Eliminating the failing redundant component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供一种基于主控管理的板级热备方法,热备方法包括下列步骤:主板卡定期向所述控制板卡发送第一指令,所述控制板卡收到第一指令后向所述主板卡反馈握手消息;若所述控制板卡在一定时间内无法接收所述第一指令时,所述控制板卡向所有从板卡发送第二指令确定新的主板卡,新的主板卡根据第二指令向控制板卡发送响应消息;所述控制板卡根据响应消息,切断与旧的主板卡相连的切换开关,打开与新的主板卡相连的切换开关,同时旧的主板卡通过通信总线与新的主板卡实现数据同步。

Description

一种基于主控管理的板级热备方法
技术领域
本发明涉及热备份技术领域,尤其涉及一种基于主控管理的板级热备方法。
背景技术
高可用性是长期运行设备的重要指标,为解决这个问题,在电信级等应用通常采用双机热备方案,这类方案往往需要两台及以上的相同设备,同时还要再增加相应的协调设备,这不级仅增加了成本,同时对于场地空间需要也较单台设备要多。在一些应用场景中,由于受限于使用空间等条件的限制,无法布署双机备份系统,此时系统的可靠性就落到了单机系统上。
发明内容
本发明的目的在于提供一种基于主控管理的板级热备方法,以解决上述背景技术中提出的问题。
本发明是通过以下技术方案实现的:一种基于主控管理的板级热备方法,包括一个控制板卡、若干受控板卡,所述控制板卡将所述受控板卡分成一个主板卡以及n-1个从板卡,n为大于1的自然数,所述主板卡、从板卡均通过切换开关与以太网相连,所述热备方法包括下列步骤:
主板卡定期向所述控制板卡发送第一指令,所述控制板卡收到第一指令后向所述主板卡反馈握手消息;
若所述控制板卡在一定时间内无法接收所述第一指令时,所述控制板卡向所有从板卡发送第二指令确定新的主板卡,新的主板卡根据第二指令向控制板卡发送响应消息;
所述控制板卡根据响应消息,切断与旧的主板卡相连的切换开关,打开与新的主板卡相连的切换开关,同时旧的主板卡通过通信总线与新的主板卡实现数据同步。
优选的,所述热备方法还包括受控板卡注册过程,其受控板卡注册过程包括:
受控板卡向控制板发送初始消息,所述初始消息包括板卡类型及能力参数;
控制板卡收到初始消息后记录相关参数,并将所述受控板卡分成一个主板卡以及n-1个从板卡,所述控制板卡向所述受控板卡发送确认消息,所述确认消息包括受控板卡的主、从情况以及当前为每个受控板卡分配的序号参数;
受控板收到确认消息后,记录下消息中的相关参数,完成受控板卡的注册过程。
优选的,所述控制板卡上设有第一计数器,若在一个第一指令的消息发送周期内,所述控制板卡没有收到第一指令,则第一计数器值加1;
当第一记数器值达到设定值时,所述控制板卡标定该主板卡为异常板卡。
优选的,所述主板卡以及所述从板卡上均设有第二计数器,若所述主板卡在一个消息周期内没有收到握手消息,则第二计数器值加1;
当第二记数器值达到设定值时,所述主板卡向所述控制板卡发送初始化消息重新进行受控板卡注册。
优选的,所述控制板卡标定旧的主板卡为异常板卡时,所述控制板卡随机选择一个现有的从板卡作为新的主板卡,并向所有从板卡发送第二指令,所述第二指令包括被选中的从板卡的序号参数;
被选中的从板卡在收到第二指令后,向控制板卡发送响应消息用以确认收到;
所述控制板卡根据响应消息,切断与旧的主板卡相连的切换开关,打开与新的主板卡相连的切换开关,同时旧的主板卡通过通信总线与新的主板卡实现数据同步。
优选的,若控制板卡在预定时间内为收到响应消息,则所述控制板卡重新选择一个其他从板卡作为新的主板卡。
与现有技术相比,本发明达到的有益效果如下:
本发明提供的一种基于主控管理的板级热备方法,通过在同一台机器增加同类功能单板实现自主热备功能,从而在满足系统高可靠性的前提下,显著减小了双备系统对使用空间的需求,降低了系统的成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的优选实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本专利提供的一种基于主控管理的板级热备方法的流程图;
图2是本专利热备系统控制板和受控板间关系示意图;
图3是本专利受控板间关系统示意图;
图4是本专利热备系统工作过程示意图。
具体实施方式
为了更好理解本发明技术内容,下面提供具体实施例,并结合附图对本发明做进一步的说明。
参见图1至图4,一种基于主控管理的板级热备方法,包括一个控制板卡、若干受控板卡,所述控制板卡将所述受控板卡分成一个主板卡以及n-1个从板卡,n为大于1的自然数,所述主板卡、从板卡均通过切换开关与以太网相连,将需要互为热备的受控板卡外部网口配置成相同的物理地址和相同的IP地址;
所述热备方法包括下列步骤:
步骤101:主板卡定期向所述控制板卡发送第一指令,所述控制板卡收到第一指令后向所述主板卡反馈握手消息;
其第一指令包括Handshake_Req消息,控制板卡收到Handshake_Req消息后,应该立即向应其回送握手响应Handshake_Rsp。
步骤102:若所述控制板卡在一定时间内无法接收所述第一指令时,所述控制板卡向所有从板卡发送第二指令确定新的主板卡,新的主板卡根据第二指令向控制板卡发送响应消息;
所述控制板卡上设有第一计数器,若在一个第一指令的消息发送周期内,所述控制板卡没有收到Handshake_Req消息,则第一计数器值加1,如果收到一个Handshake_Req消息,则该记数器清0,当记数器值达到一个设定时,标定该主板卡为异常板,并且不再响应该该主板卡的Handshake_Req消息;
所述控制板卡标定旧的主板卡为异常板卡时,所述控制板卡随机选择一个现有的从板卡作为新的主板卡,并向所有从板卡发送第二指令,所述第二指令包括Start_Ind消息,其Start_Ind消息中包含被选中的从板卡的序号参数;
被选中的从板卡在收到Start_Ind消息后,从板卡立即进入主板模式,并向控制板发送响应消息Start_Cnf,其它板设置当前主板为新的主板。
步骤103:所述控制板卡根据响应消息Start_Cnf,切断与旧的主板卡相连的切换开关,打开与新的主板卡相连的切换开关,同时旧的主板卡通过通信总线与新的主板卡实现数据同步。
可选的,所述热备方法还包括受控板卡注册过程,其受控板卡注册过程包括:
受控板卡向控制板发送初始消息Register_Req,所述初始消息Register_Req包括板卡类型及能力参数;
控制板卡收到初始消息Register_Req后记录相关参数,并将所述受控板卡分成一个主板卡以及n-1个从板卡,所述控制板卡向所述受控板卡发送确认消息Register_Ack,所述确认消息包括受控板卡的主、从情况以及当前为每个受控板卡分配的序号参数;
受控板收到确认消息Register_Ack后,记录下消息中的相关参数,完成受控板卡的注册过程。
可选的,所述主板卡以及所述从板卡上均设有第二计数器,若所述主板卡在一个消息周期内没有收到握手消息,则第二计数器值加1;
当第二记数器值达到设定值时,所述主板卡向所述控制板卡发送初始化消息重新进行受控板卡注册。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (6)

1.一种基于主控管理的板级热备方法,其特征在于,包括一个控制板卡、若干受控板卡,所述控制板卡将所述受控板卡分成一个主板卡以及n-1个从板卡,n为大于1的自然数,所述主板卡、从板卡均通过切换开关与以太网相连,所述热备方法包括下列步骤:
主板卡定期向所述控制板卡发送第一指令,所述控制板卡收到第一指令后向所述主板卡反馈握手消息;
若所述控制板卡在一定时间内无法接收所述第一指令时,所述控制板卡向所有从板卡发送第二指令确定新的主板卡,新的主板卡根据第二指令向控制板卡发送响应消息;
所述控制板卡根据响应消息,切断与旧的主板卡相连的切换开关,打开与新的主板卡相连的切换开关,同时旧的主板卡通过通信总线与新的主板卡实现数据同步。
2.根据权利要求1所述的一种基于主控管理的板级热备方法,其特征在于,所述热备方法还包括受控板卡注册过程,其受控板卡注册过程包括:
受控板卡向控制板发送初始消息,所述初始消息包括板卡类型及能力参数;
控制板卡收到初始消息后记录相关参数,并将所述受控板卡分成一个主板卡以及n-1个从板卡,所述控制板卡向所述受控板卡发送确认消息,所述确认消息包括受控板卡的主、从情况以及当前为每个受控板卡分配的序号参数;
受控板收到确认消息后,记录下消息中的相关参数,完成受控板卡的注册过程。
3.根据权利要求2所述的一种基于主控管理的板级热备方法,其特征在于,
所述控制板卡上设有第一计数器,若在一个第一指令的消息发送周期内,所述控制板卡没有收到第一指令,则第一计数器值加1;
当第一记数器值达到设定值时,所述控制板卡标定该主板卡为异常板卡。
4.根据权利要求3所述的一种基于主控管理的板级热备方法,其特征在于,所述主板卡以及所述从板卡上均设有第二计数器,若所述主板卡在一个消息周期内没有收到握手消息,则第二计数器值加1;
当第二记数器值达到设定值时,所述主板卡向所述控制板卡发送初始化消息重新进行受控板卡注册。
5.根据权利要求4所述的一种基于主控管理的板级热备方法,其特征在于,所述控制板卡标定旧的主板卡为异常板卡时,所述控制板卡随机选择一个现有的从板卡作为新的主板卡,并向所有从板卡发送第二指令,所述第二指令包括被选中的从板卡的序号参数;
被选中的从板卡在收到第二指令后,向控制板卡发送响应消息用以确认收到;
所述控制板卡根据响应消息,切断与旧的主板卡相连的切换开关,打开与新的主板卡相连的切换开关,同时旧的主板卡通过通信总线与新的主板卡实现数据同步。
6.根据权利要求5所述的一种基于主控管理的板级热备方法,其特征在于,若控制板卡在预定时间内为收到响应消息,则所述控制板卡重新选择一个其他从板卡作为新的主板卡。
CN202110222210.5A 2021-02-28 2021-02-28 一种基于主控管理的板级热备方法 Active CN112948180B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110222210.5A CN112948180B (zh) 2021-02-28 2021-02-28 一种基于主控管理的板级热备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110222210.5A CN112948180B (zh) 2021-02-28 2021-02-28 一种基于主控管理的板级热备方法

Publications (2)

Publication Number Publication Date
CN112948180A true CN112948180A (zh) 2021-06-11
CN112948180B CN112948180B (zh) 2024-03-22

Family

ID=76246716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110222210.5A Active CN112948180B (zh) 2021-02-28 2021-02-28 一种基于主控管理的板级热备方法

Country Status (1)

Country Link
CN (1) CN112948180B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7349960B1 (en) * 2000-05-20 2008-03-25 Ciena Corporation Throttling distributed statistical data retrieval in a network device
CN105357114A (zh) * 2014-08-21 2016-02-24 杭州迪普科技有限公司 一种分布式网络设备
CN105871614A (zh) * 2016-03-31 2016-08-17 国网山西省电力公司信息通信分公司 一种通信设备中板卡的保护方法和装置
CN108008624A (zh) * 2017-12-08 2018-05-08 北京交大思诺科技股份有限公司 抢权逻辑控制单元
CN109462509A (zh) * 2018-12-03 2019-03-12 杭州迪普科技股份有限公司 一种板卡的批量备份的方法和装置
CN110333973A (zh) * 2018-12-28 2019-10-15 锐捷网络股份有限公司 一种多机热备的方法和系统
CN111130886A (zh) * 2019-12-26 2020-05-08 京信通信系统(中国)有限公司 网口切换方法、装置、板卡和网口切换系统
CN112332942A (zh) * 2020-12-02 2021-02-05 天津光电通信技术有限公司 一种光信号汇聚处理设备中主控备份设备及方法
CN112398712A (zh) * 2020-09-29 2021-02-23 卡斯柯信号有限公司 基于can和mlvds双总线的通信板卡主备控制方法

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7349960B1 (en) * 2000-05-20 2008-03-25 Ciena Corporation Throttling distributed statistical data retrieval in a network device
CN105357114A (zh) * 2014-08-21 2016-02-24 杭州迪普科技有限公司 一种分布式网络设备
CN105871614A (zh) * 2016-03-31 2016-08-17 国网山西省电力公司信息通信分公司 一种通信设备中板卡的保护方法和装置
CN108008624A (zh) * 2017-12-08 2018-05-08 北京交大思诺科技股份有限公司 抢权逻辑控制单元
CN109462509A (zh) * 2018-12-03 2019-03-12 杭州迪普科技股份有限公司 一种板卡的批量备份的方法和装置
CN110333973A (zh) * 2018-12-28 2019-10-15 锐捷网络股份有限公司 一种多机热备的方法和系统
CN111130886A (zh) * 2019-12-26 2020-05-08 京信通信系统(中国)有限公司 网口切换方法、装置、板卡和网口切换系统
CN112398712A (zh) * 2020-09-29 2021-02-23 卡斯柯信号有限公司 基于can和mlvds双总线的通信板卡主备控制方法
CN112332942A (zh) * 2020-12-02 2021-02-05 天津光电通信技术有限公司 一种光信号汇聚处理设备中主控备份设备及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
DTR/EE-02035: "Technical Report Environmental Engineering (EE); Power and cooling system control and monitoring guidance", ETSI TR 102 336, no. 1 *
郑云富: "基于热备冗余控制的地铁车辆逻辑控制单元应用研究", 现代城市轨道交通 *

Also Published As

Publication number Publication date
CN112948180B (zh) 2024-03-22

Similar Documents

Publication Publication Date Title
CN101951616B (zh) 无线控制器的切换方法、系统及设备
CN101984573B (zh) 分布式实现lacp标准状态机的方法及系统
CN102571996B (zh) Ip地址分配方法、装置以及网络系统
CN102883355B (zh) 基带处理单元、基带处理板和基带处理板的故障处理方法
CN110275680B (zh) 一种双控双活存储系统
CN102045638B (zh) 一种时间同步的方法和设备
RU2716560C2 (ru) Базовая радиостанция и система связи, содержащая базовую радиостанцию
CN104468521A (zh) 在线迁移方法、装置和系统
CN112416969B (zh) 分布式数据库中的并行任务调度系统
CN110012534A (zh) 设备状态同步方法、装置、设备及计算机可读存储介质
CN113269542A (zh) 区块链系统的共识方法、装置以及存储介质
CN107547112A (zh) 对主从设备之间的频道进行恢复的方法、设备以及系统
CN112491951B (zh) 对等网络中的请求处理方法、服务器及存储介质
CN112948180A (zh) 一种基于主控管理的板级热备方法
CN102917370B (zh) 确定远端机对应的近端机的方法、装置、系统以及远端机
CN102291303B (zh) 一种单板及其确定主备状态的方法
CN110053650B (zh) 一种列车自动运行系统、列车自动运行系统架构及列车自动运行系统的模块管理方法
CN101527643B (zh) 获取堆叠系统信息的方法、系统和主设备
JPH0817394B2 (ja) 時分割多重伝送システムの割込処理方式
CN104243189B (zh) 一种基于同一信道的多设备通信方法及其通信系统
CN101902436A (zh) 板间通信方法、装置及系统
CN102098793B (zh) AIS Class B船载应答机的链路接入方法
CN111464346B (zh) 基于atca架构的主备用控制板同步方法及系统
CN111211927B (zh) 一种资源同步方法及装置
CN1992640B (zh) 一种基于交换机后台的多业务接入单元的数据同步方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant