CN113434354B - 一种总线异常处置方法、装置、电子设备及可读存储介质 - Google Patents

一种总线异常处置方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN113434354B
CN113434354B CN202110991790.4A CN202110991790A CN113434354B CN 113434354 B CN113434354 B CN 113434354B CN 202110991790 A CN202110991790 A CN 202110991790A CN 113434354 B CN113434354 B CN 113434354B
Authority
CN
China
Prior art keywords
bus
data
target
abnormal
condition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110991790.4A
Other languages
English (en)
Other versions
CN113434354A (zh
Inventor
江博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202110991790.4A priority Critical patent/CN113434354B/zh
Publication of CN113434354A publication Critical patent/CN113434354A/zh
Priority to PCT/CN2021/127330 priority patent/WO2023024248A1/zh
Priority to US18/271,658 priority patent/US11995014B2/en
Application granted granted Critical
Publication of CN113434354B publication Critical patent/CN113434354B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/36Handling requests for interconnection or transfer for access to common bus or bus system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2205Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested
    • G06F11/221Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using arrangements specific to the hardware being tested to test buses, lines or interfaces, e.g. stuck-at or open line faults
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2002Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where interconnections or communication control functionality are redundant
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0022Multibus

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种总线异常处置方法、装置、电子设备及计算机可读存储介质,该方法包括:从若干个目标总线上分别获取对应的若干个目标数据;其中,目标总线包括一个主总线和若干个候选总线,主总线对应的目标数据为第一数据;判断第一数据是否满足总线异常条件;总线异常条件为数据总线标志异常条件或数据内容异常条件;若满足总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据;该方法通过更换主总线的身份,选择健康的(即正常的)目标候选总线作为新的主总线,因此可以一直利用正常状态的总线进行通信,保证了各个控制器之间的通信畅通,避免造成上层软件的“脑裂”,保证数据的一致性。

Description

一种总线异常处置方法、装置、电子设备及可读存储介质
技术领域
本申请涉及控制器技术领域,特别涉及一种总线异常处置方法、总线异常处置装置、电子设备及计算机可读存储介质。
背景技术
为了保证数据安全,提高容灾性能,当前已经形成了双控、四控架构设置方案,例如为一框双控、一框四控的设置方案。多个控制器共同处理业务,大大提升了业务性能。此外,在某一个控制器突然宕机后,可以由另外一个控制器接管业务,因此大大提高了数据安全和设备的容灾性能。其中,一框四控,即是一个机箱内有4个控制器主板。为了保证设备能够利用多个控制器向外提供服务,因此需要各个控制器之间进行主控制器选举和数据同步等步骤。当前,控制器之间的通信时常出现异常。若各个控制器之间的通信不畅,则可能会选举出多个主控制器,造成上层软件的“脑裂”,或者可能会造成数据不一致的问题。
发明内容
有鉴于此,本申请的目的在于提供一种总线异常处置方法、总线异常处置装置、电子设备及计算机可读存储介质,避免造成上层软件的“脑裂”,保证数据的一致性。
为解决上述技术问题,本申请提供了一种总线异常处置方法,包括:
从若干个目标总线上分别获取对应的若干个目标数据;其中,所述目标总线包括一个主总线和若干个候选总线,所述主总线对应的所述目标数据为第一数据;
判断所述第一数据是否满足总线异常条件;所述总线异常条件为数据总线标志异常条件或数据内容异常条件;
若满足所述总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据。
可选地,若所述总线异常条件为数据内容异常条件,所述判断所述第一数据是否满足总线异常条件,包括:
判断所述第一数据与目标第二数据是否一致;所述候选总线对应的所述目标数据为第二数据,目标第二数据为所述第二数据中的至少一个;
若不一致,则判断总线变量是否处于异常状态;
若处于所述异常状态,则确定满足所述数据内容异常条件。
可选地,所述总线变量为链路异常变量,所述判断总线变量是否处于异常状态,包括:
对所述主总线监听预设时长,得到监听结果;其中,所述预设时长大于单个帧长;
若所述监听结果为全零或全一,则将所述链路异常变量设置为异常状态,确定所述链路异常变量处于所述异常状态。
可选地,所述总线变量为校验异常变量,所述判断总线变量是否处于异常状态,包括:
对所述第一数据进行目标比特位数量统计,得到统计结果;
若所述统计结果与所述第一数据内的校验数据不匹配,则更新校验异常变量;
若所述校验异常变量大于第一阈值,则确定所述校验异常变量处于所述异常状态。
可选地,所述总线变量为类型异常变量,所述判断总线变量是否处于异常状态,包括:
提取所述第一数据中帧类型字段的类型数据;
若所述类型数据不属于标准类型数据,则更新类型异常变量;
若所述类型异常变量大于第二阈值,则确定所述类型异常变量处于所述异常状态。
可选地,若所述总线异常条件为数据总线标志异常条件,所述判断所述第一数据是否满足总线异常条件,包括:
提取所述第一数据中的当前总线标志数据;
若所述当前总线标志数据与所述本地总线数据不匹配,则确定满足所述数据总线标志异常条件。
可选地,若不满足所述总线异常条件,则将所述目标数据写入目标缓存位置;
在确定满足所述总线异常条件之后,若不存在状态为健康的所述目标候选总线,则清空所述目标缓存位置并上报异常。
本申请还提供了一种总线异常处置装置,包括:
获取模块,用于从若干个目标总线上分别获取对应的若干个目标数据;其中,所述目标总线包括一个主总线和若干个候选总线,所述主总线对应的所述目标数据为第一数据;
判断模块,用于判断所述第一数据是否满足总线异常条件;所述总线异常条件为数据总线标志异常条件或数据内容异常条件;
总线更新模块,用于若满足所述总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据。
本申请还提供了一种电子设备,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现上述的总线异常处置方法。
本申请还提供了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现上述的总线异常处置方法。
本申请提供的总线异常处置方法,从若干个目标总线上分别获取对应的若干个目标数据;其中,目标总线包括一个主总线和若干个候选总线,主总线对应的目标数据为第一数据;判断第一数据是否满足总线异常条件;总线异常条件为数据总线标志异常条件或数据内容异常条件;若满足总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据。
可见,本申请中,各个控制器之间具有一个主总线和若干个候选总线,利用这至少两条总线共同进行数据通信。该方法中,将主总线上获取到的目标数据称为第一数据,利用第一数据可以判断主总线是否出现异常,即判断第一数据是否满足总线异常条件,进而判断是否出现了控制期间通信不畅的情况。总线异常条件可以为数据总线标志异常条件,即检测第一数据中的总线标志是否异常;或者可以为数据内容异常条件,即检测第一数据的数据内容是否异常。若满足上述任一条件,及说明从主总线上获取到的第一数据并不是原控制器发送的数据,进而说明主总线出现了异常,主总线的异常会导致各个控制器之间的通信不畅。为了避免造成上层软件的“脑裂”,或者可能会造成数据不一致的问题,在检测到满足总线异常条件后,选择状态为健康的目标候选总线作为新的主总线,完成主总线的替换,并更新本地总线数据,以便表明旧的主总线发生异常。通过更换主总线的身份,选择健康的(即正常的)目标候选总线作为新的主总线,因此可以一直利用正常状态的总线进行通信,保证了各个控制器之间的通信畅通,避免造成上层软件的“脑裂”,保证数据的一致性。
此外,本申请还提供了一种总线异常处置装置、电子设备及计算机可读存储介质,同样具有上述有益效果。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种总线异常处置方法流程图;
图2为本申请实施例提供的一种控制器连接结构图;
图3为本申请实施例提供的一种主节点选举过程时序图;
图4为本申请实施例提供的一种节点通信步骤流程图;
图5为本申请实施例提供的一种具体的总线异常处置方法流程图;
图6为本申请实施例提供的一种总线异常处置装置的结构示意图;
图7为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
请参考图1,图1为本申请实施例提供的一种总线异常处置方法流程图。该方法包括:
S101:从若干个目标总线上分别获取对应的若干个目标数据。
本申请中的部分或全部步骤可以由一机框内的任意一个控制器执行。其中,目标总线包括一个主总线和若干个候选总线,主总线对应的目标数据为第一数据。目标数据的数据内容和数据类型可以有多种选择,例如可以为同步数据广播命令,其数据内容为需要被同步的数据;或者可以为请求同步命令,其数据内容为被指定的节点的唯一身份信息;或者可以为争抢主节点身份的抢主信息。
需要说明的是,目标数据由控制器生成后,发送至所有目标总线上。在目标总线均处于正常状态的情况下,其他各个控制器可以从各个目标总线上得到目标数据,并抛弃除第一数据以外的其他目标数据,根据第一数据执行对应的指令。其中,候选总线与主总线的类型可以相同或不同。
对于各个类型的目标数据的生成方式,本实施例对此不做限定。可以理解的是,控制器在运行过程中,必然存在争抢主控制器身份的过程和数据同步的过程。请参考图2,图2为本申请实施例提供的一种控制器连接结构图。4个控制器(控制器1、控制器2、控制器3和控制器4)上的CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件)通过背板互联到bus1(即总线1)和bus2(即总线2)上。背板上存在开关,该开关具体可以为一个开关芯片或者MOS管(MOSFET的缩写,MOSFET为Metal-Oxide-Semiconductor Field-EffectTransistor的缩写,金属-氧化物半导体场效应晶体管,简称金氧半场效晶体管),该开关也由CPLD控制。在控制器主板插接到位之后,CPLD再打开此开关芯片(或者MOS管),起到防止热插拔控制器的电流浪涌,对正在总线上通信的其他控制器造成干扰的问题。此外,在主板上具有上拉电阻和电源,控制器板卡采用开漏的输出模式,总线1和总线2可以以IIC(Inter-Integrated Circuit,集成电路总线)为原型,每个总线的两根数据一根是时钟线,一根是数据线(即SCL/SDA、SCL’/SDA’中的一个)。
以图2所示的结构为例,下面对选举主控制器这一过程进行举例说明。请参考图3,图3为本申请实施例提供的一种主节点选举过程时序图。CPLD检测总线的时钟线或者数据线有电平的变化即认为总线处于非空闲状态。如果非空闲状态持续超过200ms,则CPLD认为当前总线是没有“主”的,即各个控制器之间不存在主控制器。在这种情况下,各个CPLD根据自身的node编码(即节点编码)开启第一计时器(node编码*10ms)。第一计时器满后,就在各个总线上发送一个“抢主”命令。之后开启第二计时器(node编码*1ms),如果第二计时器时间内没有发现总线处于非空闲状态,则抢主成功,同时发送一个“抢主成功”命令。
需要说明的是,本实施例并不限定上述命令的具体内容,在一种实施方式中,各类命令的格式以及内容可以如下表所示:
Figure 58697DEST_PATH_IMAGE001
在抢主成功后,则可以进行数据同步,请参考图4,图4为本申请实施例提供的一种节点通信步骤流程图,包括如下步骤:
步骤0:主node(即控制器)发出“upload广播命令”。所有节点同时将“接受缓冲区”收集的4个node(包括自身)同步数据并更新至自身的“BMC读取缓冲区”中,保证所有节点数据一致性。同时将“接受缓冲区”清零。
步骤1:主node发出“同步数据广播命令”,广播自己的控制器主板的关键信息“abcdef”(简单举例)。同时将该数据存储到自己的“接受缓冲区”中。另外3个node监听到“同步数据广播命令”后,将主node发出的“abcdef”存储到自己的“接受缓冲区”中。
步骤2:主node发出针对node2“请求同步命令”,之后进入被动监听状态。
步骤3:node2收到“请求同步命令”后,发出“同步数据广播命令”,广播自己的控制器主板的关键信息“abcdef”(简单举例)。同时数据存储到自己的“接受缓冲区”中。另外3个node监听到“同步数据广播命令”后,将node2发出的“abcdef”存储到自己的“接受缓冲区”中。
步骤4、步骤5、步骤6、步骤7与步骤2、步骤3的动作类似,主node遍例node3和node4。根据上述过程可知,在一个读写周期中,取消了从节点(即非主控制器)对主节点(即主控制器)回复ACK(Acknowledge character,确认字符)的过程,取消了sda(串行数据线)驱动权的切换,提高了可靠性,降低了总线挂死的概率。
需要说明的是,上述过程中,任何控制器发送的任何信息,均需要在所有的目标总线上发送。
S102:判断第一数据是否满足总线异常条件。
由于第一数据从主总线上获取,因此,通过判断第一数据是否满足总线异常条件,可以确定本控制器当前认为的主总线是否发生了异常。在确定满足总线异常条件时,可以认为主总线已经无法正确传输数据,为了避免长时间无法与其他控制器正常通信造成上层软件出现“脑裂”以及数据不同步的问题,在这种情况下,可以执行S103步骤,否则可以执行S104步骤。
在本申请中,总线异常条件为数据总线标志异常条件或数据内容异常条件。数据总线标志异常条件,是指说明第一数据中总线标志异常的条件。数据内容异常条件,是指说明第一数据的数据内容异常的条件。通过上述两种具体的异常条件,可以从第一数据的总线标志以及第一数据的数据内容两个方面对主总线是否发生异常进行说明。
具体的,在一种可行的实施方式中,若总线异常条件为数据内容异常条件,判断第一数据是否满足总线异常条件的过程可以包括:
步骤11:判断第一数据与目标第二数据是否一致。
步骤12:若不一致,则判断总线变量是否处于异常状态。
步骤13:若处于异常状态,则确定满足数据内容异常条件。
本实施例中,候选总线对应的目标数据为第二数据,目标第二数据为第二数据中的至少一个。即在得到第一数据和第二数据后,从若干个第二数据中确定出若干个目标第二数据,并将各个目标第二数据与第一数据进行比对,判断第一数据与各个目标第二数据是否均一致。由于超过两个总线同时发生异常的概率几乎为零,可以认为不可能出现第一数据与目标第二数据均为异常数据的情况。因此,若第一数据与至少一个目标第二数据不一致时,可以认为第一数据可能出现异常。在这种情况下,为了准确确定主总线是否异常,可以判断总线变量是否处于异常状态,若处于异常状态,则可以额确定满足数据内容异常条件。
总线变量,是指描述主总线工作情况的变量,其具体类型和数量不做限定,例如可以为链路异常变量、校验异常变量、类型异常变量等。可以理解的是,不同类型的总线变量可以表征主总线发生了不同类型的异常,总线变量的数量越多,即可从越多的角度对主总线进行检测。本实施例并不限定判断总线便令是否处于异常状态的具体检测方式,在一种实施方式中,总线变量为链路异常变量,判断总线变量是否处于异常状态的过程包括:
步骤21:对主总线监听预设时长,得到监听结果。
步骤22:若监听结果为全零或全一,则将链路异常变量设置为异常状态,确定链路异常变量处于异常状态。
由于物理链路发生故障时,例如图2中的开关发生故障后,链路将与3V3电源彻底接通或断开,在这种情况下,可以通过对主总线进行监听的方式判断物理链路是否发生异常。具体的,需要对主总线监听预设时长得到监听结果,预设时长大于单个帧长,避免在监听期间总线上刚好存在全零或全一信号。若监听结果为全零或全一,则说明物理链路发生故障,在这种情况下,可以额将链路异常变量设置为异常状态,进而确定检测到链路异常变量处于异常状态。
进一步的,在另一种实施方式中,总线变量为校验异常变量,判断总线变量是否处于异常状态,包括:
步骤31:对第一数据进行目标比特位数量统计,得到统计结果。
步骤32:若统计结果与第一数据内的校验数据不匹配,则更新校验异常变量。
步骤33:若校验异常变量大于第一阈值,则确定校验异常变量处于异常状态。
目标比特位,是指预先设定的用于作为检测标准的比特位,例如为0比特位或1比特位。由于主总线收到信号干扰等因素的影响时,其上传输的数据可能发生变化,其中的比特位会发生改变,例如从0比特位改变为1比特位。因此,通过对第一数据中的比特位数量进行统计,并将统计得到的统计结果与第一数据内的校验数据进行匹配,可以确定第一数据中的比特位是否被改变。
在实际应用中,主总线可能受到偶发原因的影响而不稳定,进而导致其上传输的第一数据被改变。在这种情况下,还是可以认为其能够正常通信。因此,在确定统计结果与校验数据不匹配时,可以更新校验异常变量。校验异常变量若大于第一阈值,则说明第一数据被改变的情况较多,主总线可能出现异常而并不是收到偶发原因的影响,因此可以确定校验异常变量处于异常状态。
进一步的,在另一种实施方式中,总线变量为类型异常变量,判断总线变量是否处于异常状态的过程包括:
步骤41:提取第一数据中帧类型字段的类型数据。
步骤42:若类型数据不属于标准类型数据,则更新类型异常变量。
步骤43:若类型异常变量大于第二阈值,则确定类型异常变量处于异常状态。
帧类型字段,是指用于表示第一数据的类型的字段,该字段内的具体数据即为类型数据。标准类型数据,是指类型字段可选的合法数据。若类型数据属于标准类型数据,则说明第一数据的类型是合法且确定的,能够被准确识别。与上个实施方式所述的情况类似,由于主总线收到信号干扰等因素的影响时,其上传输的数据可能发生变化,其中的比特位会发生改变,因此可能出现偶数个比特位被同时改变的情况,其中可能涉及帧类型字段中的比特位。主总线也可能受到偶发原因的影响而不稳定,进而导致其上传输的第一数据被改变。在这种情况下,通过将类型数据与标准类型数据进行比对,并在类型数据不属于标准类型数据时更新类型异常变量。若类型异常变量大于第二阈值,则说明主总线可能出现异常而并不是收到偶发原因的影响,因此可以确定类型异常变量处于异常状态。
在另外的实施方式中,若总线异常条件为数据总线标志异常条件,判断第一数据是否满足总线异常条件的过程可以包括:
步骤51:提取第一数据中的当前总线标志数据。
步骤52:若当前总线标志数据与本地总线数据不匹配,则确定满足数据总线标志异常条件。
其中,本地总线数据,是指用于表示本控制器认为的各个目标总线的身份数据。第一数据中具有生成第一数据的控制器认为的主总线,由于本控制器上一轮可能在发送数据,因此其无法分辨主总线是否发生异常。若获取到的第一数据中当前总线标志数据已经发生改变,则说明其他控制器已经认定本控制器认为的主总线发生异常,因此可以借鉴其它控制器的检测结果,认定主总线出现异常。即在当前总线标志数据与本地总线数据不匹配的情况下,认定满足数据总线标志异常条件。
S103:选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据。
在确定主总线出现异常后,可以利用状态为健康的目标候选总线作为新的主总线,并更新本地总线数据。其中,目标候选总线首先为候选总线,其次,其状态必须为健康,在满足这两点要求后,任一候选总线均可以为目标候选总线。因此,可以理解的是,在选择新的主总线时,需要对各个候选总线的健康状态进行检测。本实施例并不限定健康状态监测的具体方式,例如,本地总线数据在表明主总线身份的同时,还可以表征各个目标中线的健康状态,通过读取本地总线数据,即可确定目标候选总线。
S104:预设操作。
需要说明的是,本实施例并不限定预设操作的具体内容,例如在一种实施方式中,若不满足总线异常条件,则将目标数据写入目标缓存位置,例如为上述的“接受缓冲区”。此外,在确定满足总线异常条件之后,若不存在状态为健康的目标候选总线,则可以清空目标缓存位置并上报异常。
请参考图5,图5为本申请实施例提供的一种具体的总线异常处置方法流程图。继续以图2所示的结构为例,若主总线为bus1,在bus1上运行时,获取第一数据(即获取到的“接受缓冲区”的数据,也即其他node的48个bit同步数据)后,检测其中的“当前使用总线号”数值(即当前总线标志数据)是否等于bus1。若是,则确认无异常;若否,则查询bus2的健康状态,若健康,则将bus2确定为新的主总线,即切换到bus2。若不健康,则清空“接受缓冲区”和“BMC读取缓冲区”,若自身为主控制器则放弃主控制器身份,同时向本地BMC(Baseboard Management Controller,基板管理控制器)上报“双总线错误”的错误,进入idle(空闲)状态。
此外,在获取到第一数据后,可以轮询检测第一数据与bus2上的第二数据是否一致,若不一致,则判断变量是否异常,该变量即为链路异常变量、校验异常变量或类型异常变量。其中,若检测到bad-cycle,即接收到没有终止位的数据帧,则对bus1进行监听,判断是否为全零或全一,若是,则确定满足条件。或者,判断CRC错误累计数(即校验异常变量)是否大于3次,若是,则确定满足条件。或者,判断接收到未定义命令码的帧累计数(即类型异常变量)是否大于3次,若是,则确定满足条件。若没有任何变量满足条件,则确定bus1没有异常,将其对应的本地的“bus1健康状态值”设置为1,即健康的状态。
应用本申请实施例提供的总线异常处置方法,各个控制器之间具有一个主总线和若干个候选总线,利用这至少两条总线共同进行数据通信。该方法中,将主总线上获取到的目标数据称为第一数据,利用第一数据可以判断主总线是否出现异常,即判断第一数据是否满足总线异常条件,进而判断是否出现了控制期间通信不畅的情况。总线异常条件可以为数据总线标志异常条件,即检测第一数据中的总线标志是否异常;或者可以为数据内容异常条件,即检测第一数据的数据内容是否异常。若满足上述任一条件,及说明从主总线上获取到的第一数据并不是原控制器发送的数据,进而说明主总线出现了异常,主总线的异常会导致各个控制器之间的通信不畅。为了避免造成上层软件的“脑裂”,或者可能会造成数据不一致的问题,在检测到满足总线异常条件后,选择状态为健康的目标候选总线作为新的主总线,完成主总线的替换,并更新本地总线数据,以便表明旧的主总线发生异常。通过更换主总线的身份,选择健康的(即正常的)目标候选总线作为新的主总线,因此可以一直利用正常状态的总线进行通信,保证了各个控制器之间的通信畅通,避免造成上层软件的“脑裂”,保证数据的一致性。
下面对本申请实施例提供的总线异常处置装置进行介绍,下文描述的总线异常处置装置与上文描述的总线异常处置方法可相互对应参照。
请参考图6,图6为本申请实施例提供的一种总线异常处置装置的结构示意图,包括:
获取模块110,用于从若干个目标总线上分别获取对应的若干个目标数据;其中,目标总线包括一个主总线和若干个候选总线,主总线对应的目标数据为第一数据;
判断模块120,用于判断第一数据是否满足总线异常条件;总线异常条件为数据总线标志异常条件或数据内容异常条件;
总线更新模块130,用于若满足总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据。
可选地,判断模块120,包括:
一致判断单元,用于判断第一数据与目标第二数据是否一致;候选总线对应的目标数据为第二数据,目标第二数据为第二数据中的至少一个;
变量判断单元,用于若不一致,则判断总线变量是否处于异常状态;
第一异常确定单元,用于若处于异常状态,则确定满足数据内容异常条件。
可选地,变量判断单元,包括:
监听子单元,用于对主总线监听预设时长,得到监听结果;其中,预设时长大于单个帧长;
第一确定子单元,用于若监听结果为全零或全一,则将链路异常变量设置为异常状态,确定链路异常变量处于异常状态。
可选地,变量判断单元,包括:
统计子单元,用于对第一数据进行目标比特位数量统计,得到统计结果;
第一更新子单元,用于若统计结果与第一数据内的校验数据不匹配,则更新校验异常变量;
第二确定子单元,用于若校验异常变量大于第一阈值,则确定校验异常变量处于异常状态。
可选地,变量判断单元,包括:
提取子单元,用于提取第一数据中帧类型字段的类型数据;
第二更新子单元,用于若类型数据不属于标准类型数据,则更新类型异常变量;
第三确定子单元,用于若类型异常变量大于第二阈值,则确定类型异常变量处于异常状态。
可选地,判断模块120,包括:
标志获取单元,用于提取第一数据中的当前总线标志数据;
第二异常确定单元,用于若当前总线标志数据与本地总线数据不匹配,则确定满足数据总线标志异常条件。
可选地,还包括:
写入模块,用于若不满足总线异常条件,则将目标数据写入目标缓存位置;
上报模块,用于在确定满足总线异常条件之后,若不存在状态为健康的目标候选总线,则清空目标缓存位置并上报异常。
下面对本申请实施例提供的电子设备进行介绍,下文描述的电子设备与上文描述的总线异常处置方法可相互对应参照。
请参考图7,图7为本申请实施例提供的一种电子设备的结构示意图。其中电子设备100可以包括处理器101和存储器102,还可以进一步包括多媒体组件103、信息输入/信息输出(I/O)接口104以及通信组件105中的一种或多种。
其中,处理器101用于控制电子设备100的整体操作,以完成上述的总线异常处置方法中的全部或部分步骤;存储器102用于存储各种类型的数据以支持在电子设备100的操作,这些数据例如可以包括用于在该电子设备100上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器102可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,SRAM)、电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)、可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,EPROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、只读存储器(Read-OnlyMemory,ROM)、磁存储器、快闪存储器、磁盘或光盘中的一种或多种。
多媒体组件103可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器102或通过通信组件105发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口104为处理器101和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件105用于电子设备100与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件105可以包括:Wi-Fi部件,蓝牙部件,NFC部件。
电子设备100可以被一个或多个应用专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述实施例给出的总线异常处置方法。
下面对本申请实施例提供的计算机可读存储介质进行介绍,下文描述的计算机可读存储介质与上文描述的总线异常处置方法可相互对应参照。
本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现上述的总线异常处置方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本领域技术人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件的方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应该认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系属于仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语包括、包含或者其他任何变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (9)

1.一种总线异常处置方法,其特征在于,包括:
从若干个目标总线上分别获取对应的若干个目标数据;其中,所述目标总线包括一个主总线和若干个候选总线,所述主总线对应的所述目标数据为第一数据;
判断所述第一数据是否满足总线异常条件;所述总线异常条件为数据总线标志异常条件或数据内容异常条件;
若满足所述总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据;
若所述总线异常条件为数据总线标志异常条件,所述判断所述第一数据是否满足总线异常条件,包括:
提取所述第一数据中的当前总线标志数据;
若所述当前总线标志数据与所述本地总线数据不匹配,则确定满足所述数据总线标志异常条件。
2.根据权利要求1所述的总线异常处置方法,其特征在于,若所述总线异常条件为数据内容异常条件,所述判断所述第一数据是否满足总线异常条件,包括:
判断所述第一数据与目标第二数据是否一致;所述候选总线对应的所述目标数据为第二数据,目标第二数据为所述第二数据中的至少一个;
若不一致,则判断总线变量是否处于异常状态;
若处于所述异常状态,则确定满足所述数据内容异常条件。
3.根据权利要求2所述的总线异常处置方法,其特征在于,所述总线变量为链路异常变量,所述判断总线变量是否处于异常状态,包括:
对所述主总线监听预设时长,得到监听结果;其中,所述预设时长大于单个帧长;
若所述监听结果为全零或全一,则确定所述链路异常变量处于所述异常状态。
4.根据权利要求2所述的总线异常处置方法,其特征在于,所述总线变量为校验异常变量,所述判断总线变量是否处于异常状态,包括:
对所述第一数据进行目标比特位数量统计,得到统计结果;
若所述统计结果与所述第一数据内的校验数据不匹配,则更新校验异常变量;
若所述校验异常变量大于第一阈值,则确定所述校验异常变量处于所述异常状态。
5.根据权利要求2所述的总线异常处置方法,其特征在于,所述总线变量为类型异常变量,所述判断总线变量是否处于异常状态,包括:
提取所述第一数据中帧类型字段的类型数据;
若所述类型数据不属于标准类型数据,则更新类型异常变量;
若所述类型异常变量大于第二阈值,则确定所述类型异常变量处于所述异常状态。
6.根据权利要求1所述的总线异常处置方法,其特征在于,还包括:
若不满足所述总线异常条件,则将所述目标数据写入目标缓存位置;
在确定满足所述总线异常条件之后,若不存在状态为健康的所述目标候选总线,则清空所述目标缓存位置并上报异常。
7.一种总线异常处置装置,其特征在于,包括:
获取模块,用于从若干个目标总线上分别获取对应的若干个目标数据;其中,所述目标总线包括一个主总线和若干个候选总线,所述主总线对应的所述目标数据为第一数据;
判断模块,用于判断所述第一数据是否满足总线异常条件;所述总线异常条件为数据总线标志异常条件或数据内容异常条件;
总线更新模块,用于若满足所述总线异常条件,则选择状态为健康的目标候选总线作为新的主总线,并更新本地总线数据;
其中,判断模块,包括:
标志获取单元,用于提取第一数据中的当前总线标志数据;
第二异常确定单元,用于若当前总线标志数据与本地总线数据不匹配,则确定满足数据总线标志异常条件。
8.一种电子设备,其特征在于,包括存储器和处理器,其中:
所述存储器,用于保存计算机程序;
所述处理器,用于执行所述计算机程序,以实现如权利要求1至6任一项所述的总线异常处置方法。
9.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的总线异常处置方法。
CN202110991790.4A 2021-08-27 2021-08-27 一种总线异常处置方法、装置、电子设备及可读存储介质 Active CN113434354B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202110991790.4A CN113434354B (zh) 2021-08-27 2021-08-27 一种总线异常处置方法、装置、电子设备及可读存储介质
PCT/CN2021/127330 WO2023024248A1 (zh) 2021-08-27 2021-10-29 一种总线异常处置方法、装置、电子设备及可读存储介质
US18/271,658 US11995014B2 (en) 2021-08-27 2021-10-29 Bus exception handling method and apparatus, electronic device and readable storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110991790.4A CN113434354B (zh) 2021-08-27 2021-08-27 一种总线异常处置方法、装置、电子设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN113434354A CN113434354A (zh) 2021-09-24
CN113434354B true CN113434354B (zh) 2021-12-03

Family

ID=77798155

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110991790.4A Active CN113434354B (zh) 2021-08-27 2021-08-27 一种总线异常处置方法、装置、电子设备及可读存储介质

Country Status (3)

Country Link
US (1) US11995014B2 (zh)
CN (1) CN113434354B (zh)
WO (1) WO2023024248A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113434354B (zh) 2021-08-27 2021-12-03 苏州浪潮智能科技有限公司 一种总线异常处置方法、装置、电子设备及可读存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5872936A (en) * 1995-05-08 1999-02-16 Apple Computer, Inc. Apparatus for and method of arbitrating bus conflicts
JP2001062125A (ja) * 1999-08-24 2001-03-13 Amenitekku:Kk パチンコホール監視システム
KR100644596B1 (ko) 2000-07-27 2006-11-10 삼성전자주식회사 버스 시스템 및 그 버스 중재방법
KR101022472B1 (ko) * 2004-01-17 2011-03-16 삼성전자주식회사 효율적으로 버스를 사용하는 방법
JP4631569B2 (ja) * 2005-07-12 2011-02-16 パナソニック株式会社 通信システム、並びにこれに用いられるマスター装置及びスレーブ装置、通信方法
JP2007122410A (ja) * 2005-10-28 2007-05-17 Nec Electronics Corp バス調停回路及びバス調停方法
JP2010140440A (ja) * 2008-12-15 2010-06-24 Toshiba Corp バス調停装置
CN102521061B (zh) * 2011-11-23 2015-09-09 深圳市宇泰科技有限公司 总线故障智能切断的方法、装置及系统
US8867286B2 (en) * 2011-12-20 2014-10-21 Industrial Technology Research Institute Repairable multi-layer memory chip stack and method thereof
CN202737901U (zh) 2012-06-15 2013-02-13 北京石竹科技股份有限公司 一种1553b总线自动切换的系统
WO2016019938A1 (de) * 2014-08-08 2016-02-11 Gentherm Gmbh Bussystem und verfahren zu dessen steuerung
CN106027351B (zh) * 2016-07-07 2019-03-01 北京华电天仁电力控制技术有限公司 一种嵌入式Web服务器现场总线故障诊断通信模块
CN113434354B (zh) 2021-08-27 2021-12-03 苏州浪潮智能科技有限公司 一种总线异常处置方法、装置、电子设备及可读存储介质

Also Published As

Publication number Publication date
WO2023024248A1 (zh) 2023-03-02
US20240037049A1 (en) 2024-02-01
US11995014B2 (en) 2024-05-28
CN113434354A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
US11360842B2 (en) Fault processing method, related apparatus, and computer
CN110908838B (zh) 一种数据处理方法、装置及电子设备和存储介质
CN107070731B (zh) 一种主从仲裁方法及系统
CN109582506B (zh) 触摸屏失灵的恢复方法及装置、主机设备及触控系统
CN113434354B (zh) 一种总线异常处置方法、装置、电子设备及可读存储介质
CN111596747A (zh) 一种部件复位方法、装置、设备及可读存储介质
CN112437119B (zh) 分布式系统升级方法、装置及节点
JP6880961B2 (ja) 情報処理装置、およびログ記録方法
CN112506693A (zh) 一种记录异常信息的方法、装置、存储介质和电子设备
CN107273291B (zh) 一种处理器调试方法及系统
CN108958989B (zh) 一种系统故障恢复方法及装置
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
CN115098291A (zh) 一种系统重启原因记录的方法、系统、存储介质及设备
CN117337413A (zh) 可编程逻辑控制器、终端装置、程序管理系统、程序管理方法及程序
CN115268785A (zh) 一种应用于分布式存储系统的管理方法、装置及存储介质
CN112328287B (zh) 嵌入式设备系统更新方法、装置、设备及存储介质
CN108829417B (zh) 一种cpld的升级装置、方法、设备及存储介质
CN111400113A (zh) 一种计算机系统的整机自检方法、装置及系统
CN113867812B (zh) 一种bmc获取链路信息的方法、系统、设备以及介质
CN112148514B (zh) 看门狗复位的方法、装置、存储介质和电子设备
CN114115753B (zh) 一种存储设备、基于存储设备的请求处理方法及装置
CN115664943A (zh) 主从关系的确定方法和装置、存储介质和电子设备
CN116881050A (zh) 交互式自动重启方法、装置及系统
CN115344437A (zh) 容灾切换方法、装置、电子设备及存储介质
CN116841374A (zh) 一种电源在位状态修正方法、装置、设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant