CN108958990A - 一种提高现场可更换单元信息可靠性的方法和装置 - Google Patents

一种提高现场可更换单元信息可靠性的方法和装置 Download PDF

Info

Publication number
CN108958990A
CN108958990A CN201810821643.0A CN201810821643A CN108958990A CN 108958990 A CN108958990 A CN 108958990A CN 201810821643 A CN201810821643 A CN 201810821643A CN 108958990 A CN108958990 A CN 108958990A
Authority
CN
China
Prior art keywords
fru
information
information storage
storage module
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810821643.0A
Other languages
English (en)
Other versions
CN108958990B (zh
Inventor
王志浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810821643.0A priority Critical patent/CN108958990B/zh
Publication of CN108958990A publication Critical patent/CN108958990A/zh
Application granted granted Critical
Publication of CN108958990B publication Critical patent/CN108958990B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2094Redundant storage or storage space
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/08Error detection or correction by redundancy in data representation, e.g. by using checking codes
    • G06F11/10Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's
    • G06F11/1004Adding special bits or symbols to the coded information, e.g. parity check, casting out 9's or 11's to protect a block of data words, e.g. CRC or checksum
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/14Handling requests for interconnection or transfer
    • G06F13/16Handling requests for interconnection or transfer for access to memory bus
    • G06F13/1668Details of memory controller
    • G06F13/1684Details of memory controller using multiple buses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Security & Cryptography (AREA)
  • Hardware Redundancy (AREA)

Abstract

本申请实施例公开了一种提高FRU信息可靠性的方法,FRU信息一致性模块在数据链路开关断开上层系统和FRU信息存储系统的连接后,读取FRU信息存储系统中各FRU信息存储模块存储的自身信息;对比各FRU信息存储模块中存储的自身信息是否一致;若一致,则控制数据链路开关断开FRU信息一致性模块与FRU信息存储系统之间的连接,开通FRU信息存储系统与上层系统之间的连接;若不一致,则根据各个FRU信息存储模块中存储的自身信息和校验信息,确定异常的FRU信息存储模块。保证了FRU信息存储系统中各个FRU信息存储模块的FRU信息一致性,提高了FRU信息存储系统中各个FRU信息存储模块的FRU信息的可靠性。

Description

一种提高现场可更换单元信息可靠性的方法和装置
技术领域
本申请涉及存储系统设计技术领域,特别是涉及一种提高现场可更换单元信息可靠性的方法和装置。
背景技术
现场可更换单元(Field Replace Unit,FRU)一般应用于服务器或计算机的一些可更换的部件。目前双控存储系统中为了保证FRU信息的可靠性,通常应用两个FRU信息存储模块进行信息读取,保证当一个FRU信息存储模块失效时,控制器还可以从另一个FRU上读取系统的FRU信息。
FRU信息一般通过两线式串行总线(Inter-Integrated Circuit,I2C)存储在FRU信息存储模块中,基于I2C协议,存储系统在同一时间内通常只能读取主控下的FRU信息,由于当前系统无法保证两个FRU信息存储模块信息读取的一致性,若主控下的FRU信息存储模块发生故障,存储系统可能无法从另一个FRU上获取正确的信息,进而影响系统的可靠性。
发明内容
为了解决上述技术问题,本申请提供了一种提高现场可更换单元信息可靠性的方法和装置,能够保证FRU信息存储系统中各个FRU信息存储模块信息读取的一致性,提高FRU模块存储的信息的可靠性。
本申请实施例公开了如下技术方案:
第一方面,本申请实施例提供了一种提高现场可更换单元FRU信息可靠性的方法,应用于FRU信息一致性模块,所述方法包括:
在数据链路开关断开上层系统和FRU信息存储系统后,读取所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;所述FRU信息存储系统中包括至少两个FRU信息存储模块;
对比所述各个FRU信息存储模块中存储的自身信息是否一致;
若一致,则控制所述数据链路开关断开所述FRU信息一致性模块与所述FRU信息存储系统之间的连接,控制所述数据链路开关开通所述FRU信息存储系统与所述上层系统之间的连接;
若不一致,根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块。
可选的,所述FRU信息存储系统中包括两个FRU信息存储模块,分别为第一FRU信息存储模块和第二FRU信息存储模块。
可选的,所述根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块,包括:
获取所述第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息,以及所述第二FRU信息存储模块中存储的第二FRU自身信息和第一FRU校验信息;
利用所述第一FRU校验信息校验所述第一FRU自身信息,得到第一校验结果;利用所述第二FRU校验信息校验所述第二FRU自身信息,得到第二校验结果;
若所述第一校验结果表征所述第一FRU自身信息异常,则确定所述第一FRU信息存储模块异常;若所述第二校验结果表征所述第二FRU自身信息异常,则确定所述第二FRU信息存储模块异常。
可选的,所述方法还包括:
若确定所述第一FRU信息存储模块异常,所述第二FRU信息存储模块正常;则根据所述第二FRU信息存储模块中存储的所述第二FRU自身信息,修正所述第一FRU信息存储模块中存储的所述第一FRU自身信息;
若确定所述第二FRU信息存储模块异常,所述第一FRU信息存储模块正常;则根据所述第一FRU信息存储模块中存储的第一FRU自身信息,修正所述第二FRU信息存储模块中存储的第二FRU自身信息。
可选的,所述方法还包括:
若确定所述第一FRU信息存储模块和所述第二FRU信息存储模块均异常;
则将所述第一FRU信息存储模块和所述第二FRU信息存储模块中的信息均重置为初始值;
通知所述上层系统。
可选的,在所述数据链路开关断开上层系统和FRU信息存储系统之前,在所述方法还包括:
通知所述上层系统进入FRU信息校验过程。
第二方面,本申请实施例提供了一种提高现场可更换单元FRU信息可靠性的装置,所述装置包括:
读取模块,用于在数据链路开关断开上层系统和FRU信息存储系统后,读取所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;所述FRU信息存储系统中包括至少两个FRU信息存储模块;
对比模块,用于对比所述各个FRU信息存储模块中存储的自身信息是否一致;
控制模块,用于若一致,则控制所述数据链路开关断开所述FRU信息一致性模块与所述FRU信息存储系统之间的连接,控制所述数据链路开关开通所述FRU信息存储系统与所述上层系统之间的连接;
确定模块,用于若不一致,根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块。
可选的,所述FRU信息存储系统中包括两个FRU信息存储模块,分别为第一FRU信息存储模块和第二FRU信息存储模块。
可选的,所述确定模块具体用于:
获取所述第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息,以及所述第二FRU存储模块中存储的第二FRU自身信息和第一FRU校验信息;
利用所述第一FRU校验信息校验所述第一FRU自身信息,得到第一校验结果;利用所述第二FRU校验信息校验所述第二FRU自身信息,得到第二校验结果;
若所述第一校验结果表征所述第一FRU自身信息异常,则确定所述第一FRU信息存储模块异常;若所述第二校验结果表征所述第二FRU自身信息异常,则确定所述第二FRU信息存储模块异常。
可选的,所述装置还包括修正模块;
所述修正模块,用于若确定所述第一FRU信息存储模块异常,所述第二FRU信息存储模块正常;则根据所述第二FRU信息存储模块中存储的所述第二FRU自身信息,修正所述第一FRU信息存储模块中存储的所述第一FRU自身信息;
若确定所述第二FRU信息存储模块异常,所述第一FRU信息存储模块正常;则根据所述第一FRU信息存储模块中存储的第一FRU自身信息,修正所述第二FRU信息存储模块中存储的第二FRU自身信息。
可选的,所述修正模块还用于:
若确定所述第一FRU信息存储模块和所述第二FRU信息存储模块均异常;
则将所述第一FRU信息存储模块和所述第二FRU信息存储模块中的信息均重置为初始值;
通知所述上层系统。
可选的,所述装置还包括:
通知模块,用于通知所述上层系统进入FRU信息校验过程。
由上述技术方案可以看出,本申请实施例提供的提高现场可更换单元信息可靠性的方法应用于FRU信息一致性模块,该FRU信息一致性模块在数据链路开关断开上层系统和FRU信息存储系统后,读取FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;然后对比各个FRU信息存储模块中存储的自身信息是否一致;若一致,则FRU信息一致性模块控制数据链路开关断开FRU信息一致性模块与FRU信息存储系统之间的连接,并且控制数据链路开关开通FRU信息存储系统与上层系统之间的连接;若不一致,则根据各个FRU信息存储模块中存储的自身信息和校验信息,确定异常的FRU信息存储模块。上述提高FRU信息可靠性的方法,通过对比FRU信息存储系统中各个FRU信息存储模块中存储的自身信息是否一致,并在不一致的情况下确定出异常的FRU信息存储模块,对异常的FRU信息存储模块中存储的自身信息进行修正,由此保证FRU信息存储系统中各个FRU信息存储模块的FRU信息一致性,提高了FRU信息存储系统中各个FRU信息存储模块的FRU信息的可靠性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的提高FRU信息可靠性的应用系统的结构示意图;
图2为本申请实施例提供的提高FRU信息可靠性的方法的流程示意图;
图3为本申请实施例提供的提高FRU信息可靠性的装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
由于现有技术中并不存在监测FRU信息存储模块信息一致性的方法,因此,FRU信息存储模块中存储的信息可靠性较低,在主控下的FRU信息存储模块发生故障的情况下,存储系统极有可能无法从FRU信息存储系统中的其他FRU信息存储模块中读取到正确的信息。
为了解决现有技术中存在的技术问题,本申请实施例提供了一种提高FRU信息可靠性的方法,能够保证FRU信息存储系统中各个FRU信息存储模块信息的一致性,提高FRU模块存储的信息的可靠性。
下面对本申请实施例提供的提高FRU信息可靠性的方法的核心思路进行介绍:
本申请实施例提供的提高FRU信息可靠性的方法应用于FRU信息一致性模块,该FRU信息一致性模块在数据链路开关断开上层系统和FRU信息存储系统后,读取FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;然后对比各个FRU信息存储模块中存储的自身信息是否一致;若一致,则FRU信息一致性模块控制数据链路开关断开FRU信息一致性模块与FRU信息存储系统之间的连接,并且控制数据链路开关开通FRU信息存储系统与上层系统之间的连接;若不一致,则根据各个FRU信息存储模块中存储的自身信息和校验信息,确定异常的FRU信息存储模块。
上述提高FRU信息可靠性的方法,通过对比FRU信息存储系统中各个FRU信息存储模块中存储的自身信息是否一致,并在不一致的情况下确定出异常的FRU信息存储模块,对异常的FRU信息存储模块中存储的自身信息进行修正,由此保证FRU信息存储系统中各个FRU信息存储模块的FRU信息一致性,提高了FRU信息存储系统中各个FRU信息存储模块的FRU信息的可靠性。
为了便于进一步理解本申请实施例提供的提高FRU信息可靠性的方法,下面先对本申请实施例提供的提高FRU信息可靠性的应用系统进行介绍:
参见图1,图1为本申请实施例提供的提高FRU信息可靠性的应用系统的结构示意图。如图1所示,该应用系统中包括上层系统101、数据链路开关102、至少两个FRU信息存储模块103、FRU信息一致性模块104。
正常情况下,上层系统101通过数据链路开关102连接FRU信息存储模块103,以读取FRU信息存储模块103中存储的FRU信息。当FRU信息一致性模块104需要校验各个FRU信息存储模块103中存储的信息的一致性时,FRU信息一致性模块104控制数据链路开关102断开上层系统101与各个FRU信息存储模块103之间的连接,并且控制数据链路开关102开通自身与各个FRU信息存储模块103之间的连接,FRU信息一致性模块104执行本申请实施例提供的提高FRU信息可靠性的方法,对各个FRU信息存储模块103中存储的信息的一致性进行校验,并确定出存在异常的FRU信息存储模块103的情况下,对异常的FRU信息存储模块中存储的FRU信息进行修正。
下面以实施例的方式对本申请提供的提高FRU信息可靠性的方法进行介绍:
参见图2,图2为本申请实施例提供的提高FRU信息可靠性的方法的流程示意图。该提高FRU信息可靠性的方法应用于FRU信息一致性模块,如图2所示,该提高FRU信息可靠性的方法包括以下步骤:
步骤201:在数据链路开关断开上层系统和FRU信息存储系统后,读取所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;所述FRU信息存储系统中包括至少两个FRU信息存储模块。
当FRU信息一致性模块需要校验FRU信息存储系统中各个FRU信息存储模块中存储的自身信息是否一致时,FRU信息一致性模块控制数据链路开关断开上层系统和FRU信息存储系统之间的连接,开通自身和FRU信息存储系统之间的连接。进而,读取FRU信息存储系统中各个FRU信息存储模块中存储的自身信息。
需要说明的是,FRU信息存储系统中通常包括至少两个FRU信息存储模块。在本实施例的下述步骤中,以FRU信息存储系统中包括两个FRU信息存储模块:第一FRU信息存储模块和第二FRU信息存储模块为例,对本实施例的后续步骤进行介绍。应理解,当FRU信息存储系统中包括更多个FRU信息存储模块时,本实施例后续步骤的具体实现方式与包括两个FRU信息存储模块时的具体实现方式相类似。
需要说明的是,在FRU信息一致性模块控制数据链路开关断开上层系统和FRU信息存储系统之间的连接之前,FRU信息一致性模块可以预先通知上层系统进入FRU信息校验过程,以使上层系统在FRU信息校验过程中停止读取FRU信息存储模块中存储的信息。
步骤202:对比所述各个FRU信息存储模块中存储的自身信息是否一致。
FRU信息一致性模块读取到FRU信息存储模块中存储的自身信息后,对比各个FRU信息存储模块中存储的自身信息是否一致。
当FRU信息存储系统中包括第一FRU信息存储模块和第二FRU信息存储模块时,FRU信息一致性模块读取到第一FRU信息存储模块中存储的自身信息与第二FRU信息存储模块中存储的自身信息后,对比第一FRU信息存储模块中存储的自身信息与第二FRU信息存储模块中存储的自身信息是否一致。
步骤203:若一致,则控制所述数据链路开关断开所述FRU信息一致性模块与所述FRU信息存储系统之间的连接,控制所述数据链路开关开通所述FRU信息存储系统与所述上层系统之间的连接。
FRU信息一致性模块在对比FRU信息存储系统中各个FRU信息存储模块存储的自身信息一致的情况下,控制数据链路开关断开自身与FRU信息存储系统之间的连接,控制数据链路开关开通FRU信息存储系统与上层系统之间的连接。
步骤204:若不一致,根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块。
FRU信息一致性模块在对比FRU信息存储系统中各个FRU信息存储模块存储的自身信息不一致的情况下,根据FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定出异常的FRU信息存储模块,进而对异常的FRU信息存储模块中存储的自身信息做修正。
应理解,FRU信息存储模块中存储的自身信息即为自身存储的信息,FRU信息存储模块中存储的校验信息为用于校验FRU信息存储系统中其他FRU信息存储模块存储的自身信息是否正确的信息。
以FRU信息存储系统中包括第一FRU信息存储模块和第二FRU信息存储模块为例,具体确定异常FRU信息存储模块时,FRU信息一致性模块可以获取第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息,该第一FRU自身信息为第一FRU信息存储模块中自身存储的信息,第二FRU校验信息为第一FRU信息存储模块中存储的用于校验第二FRU信息存储模块存储的自身信息是否正确的信息;FRU信息一致性模块获取第二FRU信息存储模块中存储的第二FRU自身信息和第一FRU校验信息,该第二FRU自身信息为第二FRU信息存储模块中自身存储的信息,第一FRU校验信息为第二FRU信息存储模块中存储的用于校验第一FRU信息存储模块存储的自身信息是否正确的信息。
FRU信息一致性模块获取到第一FRU信息存储模块以及第二FRU信息存储模块中存储的自身信息和校验信息后,利用第二FRU信息存储模块中的第一FRU校验信息对第一FRU信息存储模块中存储的第一FRU自身信息进行校验,得到第一校验结果;利用第一FRU信息存储模块中的第二FRU校验信息对第二FRU信息存储模块中存储的第二FRU自身信息进行校验,得到第二校验结果。
具体实现时,FRU信息一致性模块可以对第一FRU自身信息进行相应地计算处理得到与该第一FRU自身信息对应的第一FRU校验信息,对比该第一FRU校验信息与第二FRU信息存储模块中存储的第一FRU校验信息是否一致,由此确定对应于第一FRU自身信息的第一校验结果,若上述二者一致,则第一校验结果表征第一FRU自身信息正常,第一FRU信息存储模块正常,反之,若上述二者不一致,则第一校验结果表征第一FRU自身信息异常,则确定第一FRU信息存储模块异常。
同理,FRU信息一致性模块可以对第二FRU自身信息进行相应地计算处理得到与该第二FRU自身信息对应的第二FRU校验信息,对比该第二FRU校验信息与第一FRU信息存储模块中存储的第二FRU校验信息是否一致,由此确定对应于第二FRU自身信息的第二校验结果,若上述二者不一致,则第二校验结果表征第二FRU自身信息正常,相应地,第二FRU信息存储模块正常,反之,若上述二者不一致,则第二校验结果表征第二FRU自身信息异常,则确定第二FRU信息存储模块异常。
应理解,FRU信息一致性模块可以先对第一FRU自身信息进行校验,后对第二FRU自身信息进行校验;也可以先对第二FRU自身信息进行校验,后对第二FRU自身信息进行校验;还可以同时对第一FRU自身信息和第二FRU自身信息进行校验,在此不对FRU信息一致性模块的校验顺序做任何限定。
在一种可能的实现方式中,若FRU信息一致性模块确定第一FRU信息存储模块异常,第二FRU信息存储模块正常,则FRU信息一致性模块可以根据第二FRU信息存储模块中存储的第二FRU自身信息,修正第一FRU信息存储模块中存储的第一FRU自身信息。
具体的,FRU信息一致性模块可以按照第二FRU信息存储模块中存储的第二FRU自身信息,对第一FRU信息存储模块中存储的第一FRU自身信息进行修正,以使第一FRU自身信息与第二FRU自身信息完全一致。
在另一种可能的实现方式中,若FRU信息一致性模块确定第二FRU信息存储模块异常,第一FRU信息存储模块正常,则FRU信息一致性模块可以根据第一FRU信息存储模块中存储的第一FRU自身信息,修正第二FRU信息存储模块中存储的第二FRU自身信息。
具体的,FRU信息一致性模块可以按照第一FRU信息存储模块中存储的第一FRU自身信息,对第二FRU信息存储模块中存储的第二FRU自身信息进行修正,以使第二FRU自身信息与第一FRU自身信息完全一致。
在又一种可能的实现方式中,若FRU信息一致性模块确定第一FRU信息存储模块与第二FRU信息存储模块均异常,则FRU信息一致性模块将第一FRU信息存储模块中存储的信息和第二FRU信息存储模块中存储的信息均重置为初始值,并通知上层系统。
具体的,FRU信息一致性模块将第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息均重置为初始值,将第二FRU信息存储模块中存储的第二FRU自身信息和第一FRU校验信息均重置为初始值,并告知上层系统第一FRU信息存储模块以及第二FRU信息存储模块均已被重置。
上述本申请实施例提供的提高FRU信息可靠性的方法,通过对比FRU信息存储系统中各个FRU信息存储模块中存储的自身信息是否一致,并在不一致的情况下确定出异常的FRU信息存储模块,对异常的FRU信息存储模块中存储的自身信息进行修正,由此保证FRU信息存储系统中各个FRU信息存储模块的FRU信息一致性,提高了FRU信息存储系统中各个FRU信息存储模块的FRU信息的可靠性。
此外,本申请还提供了一种提高FRU信息可靠性的装置,参见图3,图3为提高FRU信息可靠性的装置300的结构示意图,该装置300包括:
读取模块301,用于在数据链路开关断开上层系统和FRU信息存储系统后,读取所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;所述FRU信息存储系统中包括至少两个FRU信息存储模块;
对比模块302,用于对比所述各个FRU信息存储模块中存储的自身信息是否一致;
控制模块303,用于若一致,则控制所述数据链路开关断开所述FRU信息一致性模块与所述FRU信息存储系统之间的连接,控制所述数据链路开关开通所述FRU信息存储系统与所述上层系统之间的连接;
确定模块304,用于若不一致,根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块。
可选的,所述FRU信息存储系统中包括两个FRU信息存储模块,分别为第一FRU信息存储模块和第二FRU信息存储模块。
可选的,所述确定模块具体用于:
获取所述第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息,以及所述第二FRU存储模块中存储的第二FRU自身信息和第一FRU校验信息;
利用所述第一FRU校验信息校验所述第一FRU自身信息,得到第一校验结果;利用所述第二FRU校验信息校验所述第二FRU自身信息,得到第二校验结果;
若所述第一校验结果表征所述第一FRU自身信息异常,则确定所述第一FRU信息存储模块异常;若所述第二校验结果表征所述第二FRU自身信息异常,则确定所述第二FRU信息存储模块异常。
可选的,所述装置还包括修正模块;
所述修正模块,用于若确定所述第一FRU信息存储模块异常,所述第二FRU信息存储模块正常;则根据所述第二FRU信息存储模块中存储的所述第二FRU自身信息,修正所述第一FRU信息存储模块中存储的所述第一FRU自身信息;
若确定所述第二FRU信息存储模块异常,所述第一FRU信息存储模块正常;则根据所述第一FRU信息存储模块中存储的第一FRU自身信息,修正所述第二FRU信息存储模块中存储的第二FRU自身信息。
可选的,所述修正模块还用于:
若确定所述第一FRU信息存储模块和所述第二FRU信息存储模块均异常;
则将所述第一FRU信息存储模块和所述第二FRU信息存储模块中的信息均重置为初始值;
通知所述上层系统。
可选的,所述装置还包括:
通知模块,用于通知所述上层系统进入FRU信息校验过程。
上述本申请实施例提供的提高FRU信息可靠性的装置,通过对比FRU信息存储系统中各个FRU信息存储模块中存储的自身信息是否一致,并在不一致的情况下确定出异常的FRU信息存储模块,对异常的FRU信息存储模块中存储的自身信息进行修正,由此保证FRU信息存储系统中各个FRU信息存储模块的FRU信息一致性,提高了FRU信息存储系统中各个FRU信息存储模块的FRU信息的可靠性。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备及系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的设备及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
以上所述,仅为本申请的一种具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应该以权利要求的保护范围为准。

Claims (10)

1.一种提高现场可更换单元FRU信息可靠性的方法,其特征在于,应用于FRU信息一致性模块,所述方法包括:
在数据链路开关断开上层系统和FRU信息存储系统后,读取所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;所述FRU信息存储系统中包括至少两个FRU信息存储模块;
对比所述各个FRU信息存储模块中存储的自身信息是否一致;
若一致,则控制所述数据链路开关断开所述FRU信息一致性模块与所述FRU信息存储系统之间的连接,控制所述数据链路开关开通所述FRU信息存储系统与所述上层系统之间的连接;
若不一致,根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块。
2.根据权利要求1所述的方法,其特征在于,所述FRU信息存储系统中包括两个FRU信息存储模块,分别为第一FRU信息存储模块和第二FRU信息存储模块。
3.根据权利要求2所述的方法,其特征在于,所述根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块,包括:
获取所述第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息,以及所述第二FRU信息存储模块中存储的第二FRU自身信息和第一FRU校验信息;
利用所述第一FRU校验信息校验所述第一FRU自身信息,得到第一校验结果;利用所述第二FRU校验信息校验所述第二FRU自身信息,得到第二校验结果;
若所述第一校验结果表征所述第一FRU自身信息异常,则确定所述第一FRU信息存储模块异常;若所述第二校验结果表征所述第二FRU自身信息异常,则确定所述第二FRU信息存储模块异常。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若确定所述第一FRU信息存储模块异常,所述第二FRU信息存储模块正常;则根据所述第二FRU信息存储模块中存储的所述第二FRU自身信息,修正所述第一FRU信息存储模块中存储的所述第一FRU自身信息;
若确定所述第二FRU信息存储模块异常,所述第一FRU信息存储模块正常;则根据所述第一FRU信息存储模块中存储的第一FRU自身信息,修正所述第二FRU信息存储模块中存储的第二FRU自身信息。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
若确定所述第一FRU信息存储模块和所述第二FRU信息存储模块均异常;
则将所述第一FRU信息存储模块和所述第二FRU信息存储模块中的信息均重置为初始值;
通知所述上层系统。
6.根据权利要求1所述的方法,其特征在于,在所述数据链路开关断开上层系统和FRU信息存储系统之前,在所述方法还包括:
通知所述上层系统进入FRU信息校验过程。
7.一种提高现场可更换单元FRU信息可靠性的装置,其特征在于,所述装置包括:
读取模块,用于在数据链路开关断开上层系统和FRU信息存储系统后,读取所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息;所述FRU信息存储系统中包括至少两个FRU信息存储模块;
对比模块,用于对比所述各个FRU信息存储模块中存储的自身信息是否一致;
控制模块,用于若一致,则控制所述数据链路开关断开所述FRU信息一致性模块与所述FRU信息存储系统之间的连接,控制所述数据链路开关开通所述FRU信息存储系统与所述上层系统之间的连接;
确定模块,用于若不一致,根据所述FRU信息存储系统中各个FRU信息存储模块中存储的自身信息和校验信息,确定异常FRU信息存储模块。
8.根据权利要求7所述的装置,其特征在于,所述FRU信息存储系统中包括两个FRU信息存储模块,分别为第一FRU信息存储模块和第二FRU信息存储模块。
9.根据权利要求8所述的装置,其特征在于,所述确定模块具体用于:
获取所述第一FRU信息存储模块中存储的第一FRU自身信息和第二FRU校验信息,以及所述第二FRU存储模块中存储的第二FRU自身信息和第一FRU校验信息;
利用所述第一FRU校验信息校验所述第一FRU自身信息,得到第一校验结果;利用所述第二FRU校验信息校验所述第二FRU自身信息,得到第二校验结果;
若所述第一校验结果表征所述第一FRU自身信息异常,则确定所述第一FRU信息存储模块异常;若所述第二校验结果表征所述第二FRU自身信息异常,则确定所述第二FRU信息存储模块异常。
10.根据权利要求9所述的装置,其特征在于,所述装置还包括修正模块;
所述修正模块,用于若确定所述第一FRU信息存储模块异常,所述第二FRU信息存储模块正常;则根据所述第二FRU信息存储模块中存储的所述第二FRU自身信息,修正所述第一FRU信息存储模块中存储的所述第一FRU自身信息;
若确定所述第二FRU信息存储模块异常,所述第一FRU信息存储模块正常;则根据所述第一FRU信息存储模块中存储的第一FRU自身信息,修正所述第二FRU信息存储模块中存储的第二FRU自身信息。
CN201810821643.0A 2018-07-24 2018-07-24 一种提高现场可更换单元信息可靠性的方法和装置 Active CN108958990B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810821643.0A CN108958990B (zh) 2018-07-24 2018-07-24 一种提高现场可更换单元信息可靠性的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810821643.0A CN108958990B (zh) 2018-07-24 2018-07-24 一种提高现场可更换单元信息可靠性的方法和装置

Publications (2)

Publication Number Publication Date
CN108958990A true CN108958990A (zh) 2018-12-07
CN108958990B CN108958990B (zh) 2021-10-15

Family

ID=64464600

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810821643.0A Active CN108958990B (zh) 2018-07-24 2018-07-24 一种提高现场可更换单元信息可靠性的方法和装置

Country Status (1)

Country Link
CN (1) CN108958990B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1553328A (zh) * 2003-06-08 2004-12-08 华为技术有限公司 基于故障树分析的系统故障定位方法及装置
CN101594383A (zh) * 2009-07-09 2009-12-02 浪潮电子信息产业股份有限公司 一种双控制器存储系统的服务和控制器状态监控方法
CN103688248A (zh) * 2013-06-29 2014-03-26 华为技术有限公司 一种存储阵列的管理方法、装置和控制器
US8838919B2 (en) * 2010-08-30 2014-09-16 Oracle International Corporation Controlling data lag in a replicated computer system
CN105022586A (zh) * 2014-04-17 2015-11-04 中国移动通信集团公司 一种数据处理方法、装置和系统
CN107015881A (zh) * 2015-09-23 2017-08-04 Hgst荷兰公司 数据存储驱动器中的增强的低开销数据保护
CN107643882A (zh) * 2017-09-29 2018-01-30 昂纳信息技术(深圳)有限公司 一种数据可靠性的存储及恢复方法、系统及存储装置
US9984768B2 (en) * 2014-10-20 2018-05-29 Sandisk Technologies Llc Distributing storage of ECC code words

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1553328A (zh) * 2003-06-08 2004-12-08 华为技术有限公司 基于故障树分析的系统故障定位方法及装置
CN101594383A (zh) * 2009-07-09 2009-12-02 浪潮电子信息产业股份有限公司 一种双控制器存储系统的服务和控制器状态监控方法
US8838919B2 (en) * 2010-08-30 2014-09-16 Oracle International Corporation Controlling data lag in a replicated computer system
CN103688248A (zh) * 2013-06-29 2014-03-26 华为技术有限公司 一种存储阵列的管理方法、装置和控制器
CN105022586A (zh) * 2014-04-17 2015-11-04 中国移动通信集团公司 一种数据处理方法、装置和系统
US9984768B2 (en) * 2014-10-20 2018-05-29 Sandisk Technologies Llc Distributing storage of ECC code words
CN107015881A (zh) * 2015-09-23 2017-08-04 Hgst荷兰公司 数据存储驱动器中的增强的低开销数据保护
CN107643882A (zh) * 2017-09-29 2018-01-30 昂纳信息技术(深圳)有限公司 一种数据可靠性的存储及恢复方法、系统及存储装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李瑞东: "双控存储系统的设计与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Also Published As

Publication number Publication date
CN108958990B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
US7500120B2 (en) Apparatus has service processor determining interconnection between uninterruptible power supplies and system resources using configuration file that is stored in memory
CN108038019A (zh) 一种基板管理控制器的故障自动恢复方法及系统
US10725881B2 (en) Method for locating and isolating failed node of electromechnical management bus in communication device
CN106463179A (zh) 利用存储器控制器处理数据错误事件的方法、装置和系统
CN102882704B (zh) 一种issu的软重启升级过程中的链路保护方法和设备
US10611244B2 (en) Method for processing throttle control signal, electronic speed regulator, controller, and mobile platform
CN115269248B (zh) 双节点集群下防止脑裂方法和装置、电子设备和存储介质
CN112527582A (zh) 服务器线缆的检测方法、检测装置、检测设备及存储介质
CN107153591B (zh) 一种存储器供电架构的检测方法及装置
CN115950608B (zh) 漏液检测电路、系统、方法、电子设备及存储介质
JP2012504808A (ja) 1つまたは複数の交換ユニットのテストを管理するために1つまたは複数の交換可能ユニットを含むコンピュータ化ストレージ・システムで使用するための方法、装置、およびプログラム(交換ユニットのテストを管理するために交換可能ユニットを含むコンピュータ化ストレージ・システム)
CN107237773A (zh) 风机故障的检测方法及装置、存储介质、处理器
CN108334060B (zh) 一种总线故障注入设备
CN108958990A (zh) 一种提高现场可更换单元信息可靠性的方法和装置
CN111314290B (zh) 一种web应用防火墙业务连续性保护的方法、装置及电子设备
CN112307647A (zh) 充电桩通信中断的测试方法、装置、存储介质及处理器
CN105843336B (zh) 具有多机柜管理模块的机柜及其韧体更新方法
CN107729173A (zh) 一种用于服务器的redriver参数配置监控方法
CN103516560A (zh) 测试mvb网卡ab路冗余切换的方法及场景设置方法
CN109597728B (zh) 测试设备的控制方法及装置、计算机可读存储介质
US9086963B2 (en) System and defect position specifying method
CN114244735B (zh) 主备运行切换方法、装置及存储介质
JP6163448B2 (ja) 電気機器及び診断方法
CN111464389B (zh) 一种高可用节点故障检测方法及装置
CN111625363A (zh) 用于资源推荐操作的执行方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant