CN111737062A - 一种备份处理方法、装置及系统 - Google Patents

一种备份处理方法、装置及系统 Download PDF

Info

Publication number
CN111737062A
CN111737062A CN202010591407.1A CN202010591407A CN111737062A CN 111737062 A CN111737062 A CN 111737062A CN 202010591407 A CN202010591407 A CN 202010591407A CN 111737062 A CN111737062 A CN 111737062A
Authority
CN
China
Prior art keywords
controller
converter
state
devices
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010591407.1A
Other languages
English (en)
Inventor
刘超
冯国宝
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Dahua Technology Co Ltd
Original Assignee
Zhejiang Dahua Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Dahua Technology Co Ltd filed Critical Zhejiang Dahua Technology Co Ltd
Priority to CN202010591407.1A priority Critical patent/CN111737062A/zh
Publication of CN111737062A publication Critical patent/CN111737062A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/1608Error detection by comparing the output signals of redundant hardware

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)

Abstract

本发明提供了一种备份处理方法及装置,其中,该方法包括:在预定时间段内未接收到第一控制器的保活信号或接收到第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,所述第一控制器与所述第二控制器相互通信;所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务,可以解决相关技术中通过一个主控控制器控制多个算力卡或芯片解决算力不足的同时,随着算力卡或芯片数量增加,系统可靠性降低且处理能力出现瓶颈的问题。

Description

一种备份处理方法、装置及系统
技术领域
本发明涉及安防领域,具体而言,涉及一种备份处理方法、装置及系统。
背景技术
众所周知,安防领域拥有海量视频图像,录像的人工排查耗时费力,人工智能的出现使得行业从“看得清”向“看得懂”快速迈进,不仅可以节省人力,还大幅提升清晰度和辨识度,有效突破了现有图像数据处理技术瓶颈。于是各大厂商对芯片的算力需求越来越强烈,多数情况下系统中的算力是业务的主要瓶颈。
各大厂商为了提升系统的算力,除了提升芯片本身算力外,通常采用多个算力卡或芯片叠加的方法解决,目前智能服务器、比特币矿机等对算力极其迫切的场景均采用此方案。此时系统中算力卡有数个,而主控CPU只有一个,所有的业务都是经过唯一的CPU处理,如果这个唯一的CPU异常将导致整个系统瘫痪,因此主控CPU的可靠性变得极为重要。同时随着算力卡或芯片数量增加,系统的瓶颈可能会转移到主CPU上。
针对相关技术中通过一个主控控制器控制多个算力卡或芯片解决算力不足的同时,随着算力卡或芯片数量增加,系统的瓶颈可能会转移到主控制器上的问题,尚未提出解决方案。
发明内容
本发明实施例提供了一种备份处理方法、装置及系统,以至少解决相关技术中通过一个主控控制器控制多个算力卡或芯片解决算力不足的同时,随着算力卡或芯片数量增加,系统的瓶颈可能会转移到主控制器上的问题。
根据本发明的一个实施例,提供了一种备份处理系统,包括:第一控制器,第二控制器,转换器,多个设备,其中,所述第一控制器与所述第二控制器互为主备控制器,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信;
所述第一控制器,用于在所述第一控制器处于工作状态的情况下,通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务;
所述第二控制器,用于在预定时间段内未接收到所述第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,确定所述第一控制器发生异常,将所述第一控制器的状态由所述工作状态切换为异常状态,将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态,通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
可选的,在所述转换器为一个且所述第一控制器处于所述工作状态,所述第二控制器处于所述就绪状态或所述协同状态的情况下,所述转换器包括USP端口和NTB端口,所述第一控制器通过所述USP端口与所述转换器连接,所述第二控制器通过所述NTB端口与所述转换器连接;
在所述转换器为一个且所述第一控制器处于所述异常状态,所述第二控制器处于所述工作状态的情况下,所述第一控制器通过所述NTB端口与所述转换器连接,所述第二控制器通过所述USP端口与所述转换器连接。
可选的,在所述转换器包括第一转换器和第二转换器的情况下,所述第一转换器和所述第二转换器均包括USP端口和NTB端口,所述第一控制器、所述第二控制器分别通过主PCIE接口与所述第一转换器、所述第二转换器的USP接口连接,所述第一控制器、所述第二控制器分别通过备PCIE接口与所述第一转换器、所述第二转换器的NTB接口连接。
可选的,所述第一控制器,还用于若检测到所述第一转换器发生异常,从通过所述第一转换器与所述多个设备连接切换到通过所述第二转换器与所述多个设备连接。
可选的,所述第二控制器,还用于在确定所述第一控制器发生异常的情况下,通过所述第一转换器或所述第二转换器与所述多个设备连接。
可选的,所述第二控制器,还用于接收到所述第一控制器的所述保活信号或故障恢复信号,将所述第一控制器的状态由所述异常状态切换为所述就绪状态或所述协同状态。
可选的,所述第一控制器与所述第二控制器之间通过所述转换器通信;或者
所述第一控制器与所述第二控制器之间通过额外总线通信。
可选的,所述设备包括:算力卡、芯片;
所述互联总线包括:PCIe、以太网、USB;
所述转换器包括:PCIe Switch交换设备、网络Switch交换设备、USB Hub交换设备。
根据本发明的另一个实施例,还提供了一种备份处理方法,包括:
在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信,所述第一控制器与所述第二控制器互为主备控制器;
所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状状态或协同态切换为所述工作状态;
所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
可选的,所述方法还包括:
所述第二控制器接收到所述第一控制器的所述保活信号;
所述第二控制器将所述第一控制器的状态由所述异常状态切换为所述就绪状态或所述协同状态。
根据本发明的另一个实施例,还提供了一种备份处理装置,应用于第二控制器,包括:
确定模块,用于在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制且的异常信息的情况下,确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信,所述第一控制器与所述第二控制器互为主备控制器;
第一切换模块,用于将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
处理模块,用于通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
可选的,所述装置还包括:
接收模块,用于接收到所述第一控制器的所述保活信号或故障恢复信号;
第二切换模块,用于将所述第一控制器的状态由所述异常状态切换为所述就绪状态或所述协同状态。
根据本发明的又一个实施例,还提供了一种计算机可读的存储介质,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本发明的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本发明,在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信;所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务,可以解决相关技术中通过一个主控控制器控制多个算力卡或芯片解决算力不足的同时,随着算力卡或芯片数量增加,系统可靠性降低且处理能力出现瓶颈的问题,通过从控制器分担主控制器的处理压力,提高了系统可靠性且避免出现瓶颈。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例的备份处理方法的流程图;
图2是根据本发明实施例的备份处理系统的框图;
图3是根据本发明实施例的双控制器备份处理系统的框图一;
图4是根据本发明实施例的双控制器备份处理方法的流程图;
图5是根据本发明实施例的双控制器备份处理系统的框图二;
图6是根据本发明实施例的双控制器备份处理系统的框图三;
图7是根据本发明实施例的双控制器备份处理系统的框图四;
图8是根据本发明实施例的备份处理装置的框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
实施例1
在本实施例中提供了一种备份处理方法,图1是根据本发明实施例的备份处理方法的流程图,如图1所示,该流程包括如下步骤:
步骤S102,在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信,所述第一控制器与所述第二控制器互为主备控制器,具体的,第一控制器为主控制器,第二控制器为从控制器,当第一控制器异常之后,第一控制器便切换为从控制器,第二控制器切换为主控制器;
本发明实施例中,转换器可以为一个或多个,所述第一控制器与所述第二控制器具体可以通过一个或多个转换器相互通信,也可以通过额外总线相互通信。
步骤S104,所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
本发明实施例中的模式包含主备模式和双活模式,在主备模式时,所述第二控制器的状态由就绪状态切换为所述工作状态,在双活模式时,所述的第二控制器从协同状态切换到工作状态,通过所述转换器接管访问所述第一控制器的多个设备,与所述多个设备协调处理系统业务。
步骤S106,所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
通过上述步骤S102至S106,可以解决相关技术中通过一个主控控制器控制多个算力卡或芯片解决算力不足的同时,随着算力卡或芯片数量增加,系统可靠性降低且处理能力出现瓶颈的问题,通过第二控制器分担第一控制器的处理压力,提高了系统可靠性且避免出现瓶颈。
本发明实施例中,若第一控制器恢复正常,第二控制器接收到第一控制器的保活信号,所述第二控制器将所述第一控制器的状态由所述异常状态切换为所述就绪状态或协同状态。
实施例2
根据本发明的一个实施例,提供了一种备份处理系统,图2是根据本发明实施例的备份处理系统的框图,如图2所示,包括:第一控制器21,第二控制器22,转换器23,多个设备24,其中,所述第一控制器与所述第二控制器互为主备控制器,所述第一控制器21、所述第二控制器22分别与所述转换器23连接,所述转换器23分别与所述多个设备24连接,所述第一控制器21与所述第二控制器22相互通信;
所述第一控制器21,用于在所述第一控制器21处于工作状态的情况下,通过所述转换器23访问所述多个设备24,与所述多个设备24协调处理系统业务;
所述第二控制器22,用于在预定时间段内未接收到所述第一控制器21的保活信号或接收到所述第一控制器21的异常信号的情况下,确定所述第一控制器21发生异常,将所述第一控制器21的状态由所述工作状态切换为异常状态,将所述第二控制器22的状态由就绪状态切换为所述工作状态,通过所述转换器23访问所述多个设备24,与所述多个设备24协调处理系统业务。
可选的,在所述转换器23为一个且所述第一控制器21处于所述工作状态,所述第二控制器22处于所述就绪状态或协同状态的情况下,所述转换器23包括USP端口和NTB端口,所述第一控制器21通过所述USP端口与所述转换器23连接,所述第二控制器22通过所述NTB端口与所述转换器23连接;
在所述转换器23为一个且所述第一控制器21处于所述异常状态,所述第二控制器22处于所述工作状态的情况下,所述第一控制器21通过所述NTB端口与所述转换器23连接,所述第二控制器22通过所述USP端口与所述转换器23连接。
可选的,在所述转换器23包括第一转换器23和第二转换器23的情况下,所述第一转换器23和所述第二转换器23均包括USP端口和NTB端口,所述第一控制器21、所述第二控制器22分别通过主PCIE接口与所述第一转换器23、所述第二转换器23的USP接口连接,所述第一控制器21、所述第二控制器22分别通过备PCIE接口与所述第一转换器23、所述第二转换器23的NTB接口连接。
可选的,所述第一控制器21,还用于若检测到所述第一转换器23发生异常,从通过所述第一转换器23与所述多个设备24连接切换到通过所述第二转换器23与所述多个设备24连接。
可选的,所述第二控制器22,还用于在确定所述第一控制器21发生异常的情况下,通过所述第一转换器23或所述第二转换器23与所述多个设备24连接。
可选的,所述第二控制器22,还用于接收到所述第一控制器21的所述保活信号,将所述第一控制器21的状态由所述异常状态切换为所述就绪状态或所述协同状态。
可选的,所述第一控制器21与所述第二控制器22之间通过所述转换器23通信;或者
所述第一控制器21与所述第二控制器22之间通过额外总线通信。
可选的,所述设备24包括:算力卡、芯片等协处理装置;
所述互联总线包括:PCIe、以太网、USB等;
所述转换器23包括PCIe Switch、网络Switch、USB Hub等交换设备。
下面以第一控制器21为控制器1,第二控制器22为控制器2,转换器23为PCIESWITCH或网络SWITCH,设备24为算力卡/芯片为例,对本发明实施例进行说明。
本发明实施例采用双控制器的方法来解决系统的可靠性和处理能力可能瓶颈的问题,控制器与算力卡/芯片之间的互联通常为PCIE或以太网等协议,以PCIE为例,图3是根据本发明实施例的双控制器备份处理系统的框图一,如图3所示,控制器1和2通过PCIE接口连接到PCIE SWITCH(PCIE开关或交换器,主用作用是将PCLE设备互联,PCIE SWITCH芯片与其识别的通信协议都是PCLE)的两个不同物理口上,其中1个配置为USP(Upstream SwitchPort)口上,另外1个配置为NTB(Non-Transparent Bridg非透明桥)。NTB常用在要求高性能高可靠性的多控制器的场合,用来实现跨节点数据的传输。图4是根据本发明实施例的双控制器备份处理方法的流程图,如图4所示,包括:
步骤S401,设备上电,配置SWITCH;
步骤S402,控制器1为主运行业务;
步骤S403,控制器1和2互发保活信号,之后执行步骤S404和S406;
步骤S404,判断控制器1是否收到控制器2的保活信号,在判断结果为否的情况下,执行步骤S405;在判断结果为是的情况下,返回步骤S403;
步骤S405,控制器2异常告警;
步骤S406,判断控制器2是否接收都控制器1的保活信号,在判断结果为否的情况下,执行步骤S407;在判断结果为是的情况下,返回步骤S403;
步骤S407,切换SWITCH的USP和NTB端口;
步骤S408,控制器2接管业务;
步骤S409,判断控制器2是否接收到控制器1的保活信号,在判断结果为否的情况下,重复步骤S409;在判断结果为是的情况下,执行步骤S410;
步骤S410,控制器1故障恢复,作为备份控制器;
步骤S411,设备正常工作。
在正常情况下,控制器1为主控制器,与之互联的PCIE SWITCH接口配置USP。控制器2为从控制器,与之互联的PCIE SWITCH接口配置NTB。控制器1和2通过SWITCH可以直接进行数据和消息通信,为了系统更加可靠亦可以额外总线(通常为PCIE或网络)互联。此时控制器1和SWITCH下面的n个算力卡/芯片在同一个地址域上,可以直接访问,系统业务由控制器1和n个算力卡/芯片协调完成。控制器2与控制器1通过SWITCH或额外总线实时通信,包括保活信号和实时业务数据。控制器2也可以帮助控制器1分担部分业务,实现整机性能的提升。当控制器2收不到控制器1的保活信号时,认为控制器1出现异常,此时SWITCH上行口配置交换,即与控制器1连接的配置为NTB,与控制器2互联的配置为USP。控制器2上有备份的业务数据,因此可以立刻恢复确保业务连续,做到无缝切换。
PCIE SWITCH可以为单颗芯片,也可以是多颗SWITCH的级联。上图中SWITCH没有备份,通常情况下SWITCH故障率极低,因此常规应用完全可以满足。针对可靠性极高的场景,图5是根据本发明实施例的双控制器备份处理系统的框图二,如图5所示,PCIE SWITCH1与PCIE SWITCH2相互备份,控制器1、2的主PCIE接口分别连接到2个PCIE SWITCH的USP(Upstream Switch Port)口上,备份的PCIE口连接到两个SWITCH的NTB接口上。算力卡/芯片为双端口,1个连接到SWITCH1,另外1个连接到SWITCH1上。在正常情况下,控制器1--SWITCH1--n个算力卡/芯片为主,处于同一个地址域。控制器2—SWITCH2--n个算力卡/芯片为备份,处于另外一个地址域。因此控制器1和2可以同时访问n个算力卡/芯片,业务上可以互相备份实现可靠性或协调处理提高处理能力。控制器1和2之间通过SWITCH1/2可以直接进行数据和消息通信,为了系统更加可靠亦可以额外总线(通常为PCIE或网络)互联,通信数据包括保活信号和实时业务数据。当控制器1发现SWITCH1异常时,将通道切换到SWITCH2,实现业务连续。当控制器2收不到控制器1的保活信号时,认为控制器1出现异常,此时将业务切换到控制器2上,通过控制器2—SWITCH2--n个算力卡/芯片的路径,或者控制器2—SWITCH1--n个算力卡/芯片实现业务连续。
图6是根据本发明实施例的双控制器备份处理系统的框图三,如图6所示,控制器1和2通过NET接口连接到网络SWITCH,网络SWITCH通过NET接口分别与算力卡/芯片1-n连接。
图7是根据本发明实施例的双控制器备份处理系统的框图四,如图7所示,网络SWITCH1与网络SWITCH2相互备份,控制器1、2的主NET接口分别连接到2个网络SWITCH的USP口上,备份的NET口连接到两个SWITCH的NTB接口上。算力卡/芯片为双端口,1个连接到网络SWITCH1,另外1个连接到网络SWITCH1上。
以上互联也可以使用基于IP的网络方案,整个逻辑与PCIE方案相同,省掉了SWITCH上NTB和USP切换的过程,具体逻辑与上述基本相同,在此不再赘述。
实施例3
根据本发明的另一个实施例,还提供了一种备份处理装置,应用于第二控制器,图8是根据本发明实施例的备份处理装置的框图,如图8所示,包括:
确定模块82,用于在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信,所述第一控制器与所述第二控制器互为主备控制器;
第一切换模块84,用于将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
处理模块86,用于通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
可选的,所述装置还包括:
接收模块,用于接收到所述第一控制器的所述保活信号;
第二切换模块,用于将所述第一控制器的状态由所述异常状态切换为所述就绪状态或所述协同状态。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
实施例4
本发明的实施例还提供了一种计算机可读的存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
S1,在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信;
S2,所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
S3,所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
可选地,在本实施例中,上述存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
实施例5
本发明的实施例还提供了一种电子装置,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
可选地,上述电子装置还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
S1,在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信;
S2,所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
S3,所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种备份处理系统,其特征在于,包括:第一控制器,第二控制器,转换器,多个设备,其中,所述第一控制器与所述第二控制器互为主备控制器,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信;
所述第一控制器,用于在所述第一控制器处于工作状态的情况下,通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务;
所述第二控制器,用于在预定时间段内未接收到所述第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,确定所述第一控制器发生异常,将所述第一控制器的状态由所述工作状态切换为异常状态,将所述第二控制器的状态从就绪状态或协同状态切换为所述工作状态,通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
2.根据权利要求1所述的系统,其特征在于,
在所述转换器为一个且所述第一控制器处于所述工作状态,所述第二控制器处于所述就绪状态或所述协同状态的情况下,所述转换器包括USP端口和NTB端口,所述第一控制器通过所述USP端口与所述转换器连接,所述第二控制器通过所述NTB端口与所述转换器连接;
在所述转换器为一个且所述第一控制器处于所述异常状态,所述第二控制器处于所述工作状态的情况下,所述第一控制器通过所述NTB端口与所述转换器连接,所述第二控制器通过所述USP端口与所述转换器连接。
3.根据权利要求1所述的系统,其特征在于,
在所述转换器包括第一转换器和第二转换器的情况下,所述第一转换器和所述第二转换器均包括USP端口和NTB端口,所述第一控制器、所述第二控制器分别通过主PCIE接口与所述第一转换器、所述第二转换器的USP接口连接,所述第一控制器、所述第二控制器分别通过备PCIE接口与所述第一转换器、所述第二转换器的NTB接口连接。
4.根据权利要求3所述的系统,其特征在于,
所述第一控制器,还用于若检测到所述第一转换器发生异常,从通过所述第一转换器与所述多个设备连接切换到通过所述第二转换器与所述多个设备连接。
5.根据权利要求4所述的系统,其特征在于,
所述第二控制器,还用于在确定所述第一控制器发生异常的情况下,通过所述第一转换器或所述第二转换器与所述多个设备连接。
6.根据权利要求1所述的系统,其特征在于,
所述第二控制器,还用于接收到所述第一控制器的所述保活信号或故障恢复信号,将所述第一控制器的状态由所述异常状态切换为所述就绪状态或所述协同状态。
7.根据权利要求1至6中任一项所述的系统,其特征在于,
所述第一控制器与所述第二控制器之间通过所述转换器通信;或者
所述第一控制器与所述第二控制器之间通过额外总线通信。
8.根据权利要求1至6中任一项所述的系统,其特征在于,
所述设备包括:算力卡、芯片;
所述互联总线包括:PCIe、以太网、USB;
所述转换器包括:PCIe Switch交换设备、网络Switch交换设备、USB Hub交换设备。
9.一种备份处理方法,其特征在于,包括:
在预定时间段内未接收到第一控制器的保活信号或接收到所述第一控制器的异常信号的情况下,第二控制器确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信,所述第一控制器与所述第二控制器互为主备控制器;
所述第二控制器将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
所述第二控制器通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
所述第二控制器接收到所述第一控制器的所述保活信号或故障恢复信号;
所述第二控制器将所述第一控制器的状态由所述异常状态切换为所述就绪状态或协同状态。
11.一种备份处理装置,应用于第二控制器,其特征在于,包括:
确定模块,用于在预定时间段内未接收到第一控制器的保活信号或接收到所述主控器的异常信号的情况下,确定所述第一控制器发生异常,其中,所述第一控制器用于在处于工作状态的情况下,通过转换器访问多个设备,与所述多个设备协调处理系统业务,所述第一控制器、所述第二控制器分别与所述转换器连接,所述转换器分别与所述多个设备连接,所述第一控制器与所述第二控制器相互通信;
第一切换模块,用于将所述第一控制器的状态由所述工作状态切换为异常状态,并将所述第二控制器的状态由就绪状态或协同状态切换为所述工作状态;
处理模块,用于通过所述转换器访问所述多个设备,与所述多个设备协调处理系统业务。
12.一种计算机可读的存储介质,其特征在于,所述存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行所述权利要求9或10所述的方法。
13.一种电子装置,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行所述权利要求9或10所述的方法。
CN202010591407.1A 2020-06-24 2020-06-24 一种备份处理方法、装置及系统 Pending CN111737062A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010591407.1A CN111737062A (zh) 2020-06-24 2020-06-24 一种备份处理方法、装置及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010591407.1A CN111737062A (zh) 2020-06-24 2020-06-24 一种备份处理方法、装置及系统

Publications (1)

Publication Number Publication Date
CN111737062A true CN111737062A (zh) 2020-10-02

Family

ID=72651059

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010591407.1A Pending CN111737062A (zh) 2020-06-24 2020-06-24 一种备份处理方法、装置及系统

Country Status (1)

Country Link
CN (1) CN111737062A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948300A (zh) * 2021-01-19 2021-06-11 浙江大华技术股份有限公司 服务器、存算一体设备以及服务器系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013025711A (ja) * 2011-07-25 2013-02-04 Toshiba Corp バックアップ管理システムおよびその管理方法
CN104679610A (zh) * 2015-02-11 2015-06-03 东莞前沿技术研究院 计算机系统的管理方法和装置
WO2016062037A1 (zh) * 2014-10-24 2016-04-28 华为技术有限公司 通过接口卡传输信息、控制器故障处理方法、装置及系统
CN107766181A (zh) * 2017-09-12 2018-03-06 中国电子科技集团公司第五十二研究所 一种基于PCIe非透明桥的双控制器存储高可用子系统
WO2018188313A1 (zh) * 2017-04-12 2018-10-18 中兴通讯股份有限公司 备份网络中的业务切换方法及装置
KR20190089590A (ko) * 2018-01-23 2019-07-31 한국항공우주산업 주식회사 임무컴퓨터 장치 및 그 이중화 방법
CN111107572A (zh) * 2019-12-26 2020-05-05 北京万集科技股份有限公司 一种冗余备份方法及装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013025711A (ja) * 2011-07-25 2013-02-04 Toshiba Corp バックアップ管理システムおよびその管理方法
WO2016062037A1 (zh) * 2014-10-24 2016-04-28 华为技术有限公司 通过接口卡传输信息、控制器故障处理方法、装置及系统
CN104679610A (zh) * 2015-02-11 2015-06-03 东莞前沿技术研究院 计算机系统的管理方法和装置
WO2018188313A1 (zh) * 2017-04-12 2018-10-18 中兴通讯股份有限公司 备份网络中的业务切换方法及装置
CN107766181A (zh) * 2017-09-12 2018-03-06 中国电子科技集团公司第五十二研究所 一种基于PCIe非透明桥的双控制器存储高可用子系统
KR20190089590A (ko) * 2018-01-23 2019-07-31 한국항공우주산업 주식회사 임무컴퓨터 장치 및 그 이중화 방법
CN111107572A (zh) * 2019-12-26 2020-05-05 北京万集科技股份有限公司 一种冗余备份方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨威;李姗;常磊;: "一种航电任务系统的关键节点双机备份机制", 电子测试, no. 04 *
黄晨;汪文明;张义超;岳玮;: "基于国产CPU的并行冗余计算机系统研究", 计算机测量与控制, no. 07 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112948300A (zh) * 2021-01-19 2021-06-11 浙江大华技术股份有限公司 服务器、存算一体设备以及服务器系统

Similar Documents

Publication Publication Date Title
CN101714109B (zh) 双cpu系统主板的控制方法及设备
US3787816A (en) Multiprocessing system having means for automatic resource management
CN103181133B (zh) 基于pcie交换的服务器系统及其倒换方法和设备
CN103559053A (zh) 一种板卡系统及通信接口卡fpga在线升级方法
CN109902014A (zh) 一种服务器系统共享串口的方法、装置、受控终端及存储介质
CN103856357A (zh) 一种堆叠系统故障处理方法及堆叠系统
CN111629344B (zh) 数据传输方法、装置、设备和计算机可读存储介质
US6219801B1 (en) Work inheriting system
CN111684421B (zh) 服务器系统
CN105224489A (zh) 一种硬件设备的集成管理系统
CN111737062A (zh) 一种备份处理方法、装置及系统
CN102495815B (zh) I/o数据访问中断的处理方法和系统以及设备
CN116204448A (zh) 一种多端口固态硬盘及其控制方法、装置、介质、服务器
CN114201439B (zh) 服务器信号识别优化方法、系统及存储介质
CN111858187A (zh) 一种电子设备及业务切换方法、装置
CN105718589A (zh) 访问文件的方法和装置
CN109684136A (zh) 一种灵活配置主控的通信架构系统
CN113742142B (zh) 存储系统管理sata硬盘的方法及存储系统
CN115705267A (zh) 监控采集设备、基于监控采集设备的主备切换方法及系统
CN113407480A (zh) 一种集中式管理的框式交换机
CN101510142B (zh) 存储设备的多输出入接口系统与通信方法
CN111142945A (zh) 一种双余度计算机的主、从通道动态切换方法
CN115086579B (zh) 视频矩阵冗余备份方法、装置、终端设备及存储介质
CN112181705B (zh) 基于多控制器的管理存储控制方法及存储设备
JPH0427239A (ja) Lan接続装置の制御方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination