CN115221015A - 硬盘故障预警方法、系统、终端及存储介质 - Google Patents
硬盘故障预警方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN115221015A CN115221015A CN202210831662.8A CN202210831662A CN115221015A CN 115221015 A CN115221015 A CN 115221015A CN 202210831662 A CN202210831662 A CN 202210831662A CN 115221015 A CN115221015 A CN 115221015A
- Authority
- CN
- China
- Prior art keywords
- hard disk
- information
- asset information
- fault
- bmc
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 230000015654 memory Effects 0.000 claims description 20
- 238000012795 verification Methods 0.000 claims description 4
- 230000002159 abnormal effect Effects 0.000 claims description 3
- 230000005856 abnormality Effects 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000012545 processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108010028984 3-isopropylmalate dehydratase Proteins 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 241000700605 Viruses Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/32—Monitoring with visual or acoustical indication of the functioning of the machine
- G06F11/324—Display of status information
- G06F11/325—Display of status information by lamps or LED's
- G06F11/326—Display of status information by lamps or LED's for error or online/offline status
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明涉及飞腾服务器技术领域,具体提供一种硬盘故障预警方法、系统、终端及存储介质,包括:BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;BMC通过带外从硬盘背板获取第二硬盘资产信息;BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。本发明通过服务器不同固件的协作,实现飞腾CPU平台的NVMe硬盘故障自动点灯,从而进行NVMe硬盘故障预警,避免了飞腾CPU本身没有相关自动报错寄存器和HotPlug I2C总线,进而无法实现硬盘故障报警的影响。
Description
技术领域
本发明属于飞腾服务器技术领域,具体涉及一种硬盘故障预警方法、系统、终端及存储介质。
背景技术
目前在飞腾CPU平台服务器上,因为平台限制,NVMe硬盘的故障灯不能自主点亮,无法实现NVMe硬盘故障预警。给用户及整机制造厂商带来诸多不便。
专利CN109240894A主要强调在Intel平台中,BMC接收网络接口或操作系统内部接口的指令并发送给CPLD来点硬盘灯;专利CN109117347A主要强调通过CPLD模拟PCA9555芯片的I2C接口能力来实现BMC控制硬盘指示灯;专利CN113986692A强调的主要是避免PCIe总线的port口没有按顺序分布时导致的出错情况的发生,使用的点灯信号是VPP信号,飞腾平台没有VPP信号,Intel平台才有此信号。上述发明均基于Intel平台,所提出的发明内容不适用于飞腾平台。
专利CN112328440A的连接链路是硬盘控制器和BMC之间通过I2C链路连接,并传递硬盘信息,在飞腾平台上,I2C链路一般用来传递CPU的温度信息,无法传递故障信息;专利CN113868037A主要应用是为了判断背板上硬盘线缆连接是否正确,并且不涉及到BMC中对于硬盘信息表的数据处理;专利CN109086192A是针对SATA硬盘,不是NVME硬盘涉及的PCIE链路,并且也是硬盘控制器和BMC之间直接通过I2C链路连接,不涉及CPU和BIOS。上述发明均未针对飞腾平台的NVME故障点灯提出有效的解决方案。
发明内容
针对现有技术的上述不足,本发明提供一种硬盘故障预警方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种硬盘故障预警方法,包括:
BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;
BMC通过带外从硬盘背板获取第二硬盘资产信息;
BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
进一步的,BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息,包括:
BMC从BIOS获取包含硬盘故障信息和第一硬盘资产信息的第一信息表,并将所述第一信息表保持至寄存器;所述BIOS基于从CPU获取的硬盘故障信息和第一硬盘资产信息生成第一信息表;所述CPU通过PCIe链路遍历所有硬盘以获取硬盘故障信息和第一硬盘资产信息。
进一步的,BMC通过带外从硬盘背板获取第二硬盘资产信息,包括:
BMC通过带外从硬盘背板的CPLD获取第二硬盘资产信息,并在将第二硬盘资产信息存储至第二信息表后,将第二信息表保存至寄存器。
进一步的,在BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性后,所述方法还包括:
若第一硬盘资产信息与第二硬盘资产信息不一致,则生成硬盘背板异常的告警信息。
第二方面,本发明提供一种硬盘故障预警系统,包括:
第一获取单元,用于BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;
第二获取单元,用于BMC通过带外从硬盘背板获取第二硬盘资产信息;
预警执行单元,用于BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
进一步的,所述第一获取单元包括:
第一获取模块,用于BMC从BIOS获取包含硬盘故障信息和第一硬盘资产信息的第一信息表,并将所述第一信息表保持至寄存器;所述BIOS基于从CPU获取的硬盘故障信息和第一硬盘资产信息生成第一信息表;所述CPU通过PCIe链路遍历所有硬盘以获取硬盘故障信息和第一硬盘资产信息。
进一步的,所述第二获取单元包括:
第二获取模块,用于BMC通过带外从硬盘背板的CPLD获取第二硬盘资产信息,并在将第二硬盘资产信息存储至第二信息表后,将第二信息表保存至寄存器。
进一步的,所述系统还包括:
背板告警单元,用于若第一硬盘资产信息与第二硬盘资产信息不一致,则生成硬盘背板异常的告警信息。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,本发明提供的硬盘故障预警方法、系统、终端及存储介质,通过服务器不同固件的协作,实现飞腾CPU平台的NVMe硬盘故障自动点灯,从而进行NVMe硬盘故障预警,避免了飞腾CPU本身没有相关自动报错寄存器和HotPlug I2C总线,进而无法实现硬盘故障报警的影响。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的硬件连接拓扑示意图。
图3是本发明一个实施例的系统的示意性框图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本发明中出现的关键术语进行解释。
BMC,执行伺服器远端管理控制器,英文全称为Baseboard ManagementController.为基板管理控制器。它可以在机器未开机的状态下,对机器进行固件升级、查看机器设备、等一些操作。在BMC中完全实现IPMI功能需要一个功能强大的16位元或32位元微控制器以及用于数据储存的RAM、用于非挥发性数据储存的快闪记忆体和韧体,在安全远程重启、安全重新上电、LAN警告和系统健康监视方面能提供基本的远程可管理性。除了基本的IPMI功能和系统工作监视功能外,通过利用2个快闪记忆体之一储存以前的BIOS,mBMC还能实现BIOS快速元件的选择和保护。例如,在远程BIOS升级後系统不能启动时,远程管理人员可以切换回以前工作的BIOS映像来启动系统。一旦BIOS升级後,BIOS映像还能被锁住,可有效防止病毒对它的侵害。
I2C总线是由Philips公司开发的一种简单、双向二线制同步串行总线。它只需要两根线即可在连接于总线上的器件之间传送信息。主器件用于启动总线传送数据,并产生时钟以开放传送的器件,此时任何被寻址的器件均被认为是从器件.在总线上主和从、发和收的关系不是恒定的,而取决于此时数据传送方向。如果主机要发送数据给从器件,则主机首先寻址从器件,然后主动发送数据至从器件,最后由主机终止数据传送;如果主机要接收从器件的数据,首先由主器件寻址从器件.然后主机接收从器件发送的数据,最后由主机终止接收过程。在这种情况下.主机负责产生定时时钟和终止数据传送。
BIOS是英文"Basic Input Output System"的缩略词,直译过来后中文名称就是"基本输入输出系统"。在IBMPC兼容系统上,是一种业界标准的固件接口。它是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序、开机后自检程序和系统自启动程序,它可从CMOS中读写系统设置的具体信息。其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。此外,BIOS还向作业系统提供一些系统参数。系统硬件的变化是由BIOS隐藏,程序使用BIOS功能而不是直接控制硬件。现代作业系统会忽略BIOS提供的抽象层并直接控制硬件组件。
CPU中央处理器(central processing unit,简称CPU)作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。
CPLD(Complex Programmable Logic Device)是ComplexPLD的简称,一种较PLD为复杂的逻辑元件。CPLD是一种用户根据各自需要而自行构造逻辑功能的数字集成电路。其基本设计方法是借助集成开发软件平台,用原理图、硬件描述语言等方法,生成相应的目标文件,通过下载电缆(“在系统”编程)将代码传送到目标芯片中,实现设计的数字系统。
PCI-Express(peripheral component interconnect express)是一种高速串行计算机扩展总线标准,它原来的名称为“3GIO”,是由英特尔在2001年提出的,旨在替代旧的PCI,PCI-X和AGP总线标准。CPU通过PCIe接口连接外部设备。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种硬盘故障预警系统。
如图1所示,该方法包括:
步骤110,BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;
步骤120,BMC通过带外从硬盘背板获取第二硬盘资产信息;
步骤130,BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
为了便于对本发明的理解,下面以本发明硬盘故障预警方法的原理,结合实施例中对硬盘进行故障预警的过程,对本发明提供的硬盘故障预警方法做进一步的描述。
具体的,方法的执行依赖以下硬件拓扑结构:CPU、硬盘背板、BIOS芯片和BMC,CPU通过PCIE链路连接Nvme硬盘;CPU与BIOS芯片通信连接,BIOS芯片可读取CPU的寄存器A的信息;BIOS与BMC通过带外链路通信连接,BIOS可将从寄存器A读取的信息写入BMC的寄存器B;BMC与硬盘背板的控制器CPLD通信连接,硬盘背板上的CPLD可通过硬盘插槽收集硬盘信息,也可对硬盘背板上的LED的工作状态进行控制。本发明提供的硬盘故障预警方法包括:
S1、BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息。
硬盘背板上设有CPLD、多个硬盘插槽,每个硬盘插槽均对应一个LED,一个硬盘插槽可插入一个Nvme硬盘。CPLD通过硬盘插槽收集硬盘资产信息以及对LED和硬盘插槽进行管控。
CPU通过PCIE链路连接硬盘,通过PCIe链路遍历所有硬盘,以读取第一硬盘资产信息及硬盘故障信息,将读取的信息存储CPU寄存器。
BIOS从CPU读取第一硬盘资产信息及硬盘故障信息,并将读取的信息整合为第一信息表,然后将信息表发送至BMC寄存器。
S2、BMC通过带外从硬盘背板获取第二硬盘资产信息。
BMC通过带外从硬盘背板的CPLD读取第二硬盘资产信息,并在将第二硬盘资产信息存储至第二信息表后,将第二信息表保存至寄存器。
S3、BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
首先,比对第一硬盘资产信息与第二硬盘资产信息的一致性,若两者一致则进一步利用第一硬盘资产信息或第二硬盘资产信息和硬盘故障信息定位故障硬盘插槽号。硬盘资产信息记录硬盘插槽号对应的硬盘名称、硬盘大小、硬盘缓存、硬盘序列号等,若硬盘故障信息记录了硬盘序列号为XX的硬盘故障,则基于硬盘资产信息就可以定位到对应的硬盘插槽号。BMC将对应的硬盘插槽号作为目标硬盘插槽号发送至硬盘背板的CPLD,CPLD基于硬盘插槽号与LED的对应关系,点亮目标硬盘插槽号对应的LED。
若第一硬盘资产信息与第二硬盘资产信息不一致,则BMC生成硬盘背板异常的告警信息。
该方法通过服务器不同固件的协作,实现飞腾CPU平台的NVMe硬盘故障自动点灯,从而进行NVMe硬盘故障预警,避免了飞腾CPU本身没有相关自动报错寄存器和HotPlug I2C总线,进而无法实现硬盘故障报警的影响,同时可以避免操作系统宕机时NVME硬盘故障信息无法传递、无法进行故障预警的情况。
下面结合图2所示的硬件拓扑结构对本发明提供的硬盘故障预警方法进行说明:
(1)CPU通过链路①从slot0通过带内读取NVMe硬盘的故障信息,同时读取NVME硬盘的资产信息,生成资产信息表,并通过链路②将资产信息表存入CPU寄存器A。
(2)BIOS通过链路③读取寄存器A的信息,包含故障信息和硬盘的资产信息,生成信息表1,然后通过链路④,把信息表1传给BMC的寄存器B。
(3)CPLD通过链路⑦获取到硬盘的资产信息,BMC通过链路⑤带外从CPLD读取到NVME的硬盘的资产信息,然后生成信息表2,并将信息表2也存入BMC的寄存器B,然后通过比对信息表1和表2的内容,确定出现故障硬盘的位置为硬盘背板的SLOT0。
(4)BMC通过链路⑤带外把信息传递给CPLD,然后CPLD通过链路⑥去点亮SLOT0对应的LED0,LED点亮,定位到故障硬盘,整个流程结束。
如图3所示,该系统300包括:
第一获取单元310,用于BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;
第二获取单元320,用于BMC通过带外从硬盘背板获取第二硬盘资产信息;
预警执行单元330,用于BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
可选地,作为本发明一个实施例,所述第一获取单元包括:
第一获取模块,用于BMC从BIOS获取包含硬盘故障信息和第一硬盘资产信息的第一信息表,并将所述第一信息表保持至寄存器;所述BIOS基于从CPU获取的硬盘故障信息和第一硬盘资产信息生成第一信息表;所述CPU通过PCIe链路遍历所有硬盘以获取硬盘故障信息和第一硬盘资产信息。
可选地,作为本发明一个实施例,所述第二获取单元包括:
第二获取模块,用于BMC通过带外从硬盘背板的CPLD获取第二硬盘资产信息,并在将第二硬盘资产信息存储至第二信息表后,将第二信息表保存至寄存器。
可选地,作为本发明一个实施例,所述系统还包括:
背板告警单元,用于若第一硬盘资产信息与第二硬盘资产信息不一致,则生成硬盘背板异常的告警信息。
图4为本发明实施例提供的一种终端400的结构示意图,该终端400可以用于执行本发明实施例提供的硬盘故障预警方法。
其中,该终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC)组成,例如可以由单颗封装的IC所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明通过服务器不同固件的协作,实现飞腾CPU平台的NVMe硬盘故障自动点灯,从而进行NVMe硬盘故障预警,避免了飞腾CPU本身没有相关自动报错寄存器和HotPlugI2C总线,进而无法实现硬盘故障报警的影响,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种硬盘故障预警方法,其特征在于,包括:
BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;
BMC通过带外从硬盘背板获取第二硬盘资产信息;
BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
2.根据权利要求1所述的方法,其特征在于,BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息,包括:
BMC从BIOS获取包含硬盘故障信息和第一硬盘资产信息的第一信息表,并将所述第一信息表保持至寄存器;所述BIOS基于从CPU的获取硬盘故障信息和第一硬盘资产信息生成第一信息表;所述CPU通过PCIe链路遍历所有硬盘以获取硬盘故障信息和第一硬盘资产信息。
3.根据权利要求1所述的方法,其特征在于,BMC通过带外从硬盘背板获取第二硬盘资产信息,包括:
BMC通过带外从硬盘背板的CPLD获取第二硬盘资产信息,并在将第二硬盘资产信息存储至第二信息表后,将第二信息表保存至寄存器。
4.根据权利要求1所述的方法,其特征在于,在BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性后,所述方法还包括:
若第一硬盘资产信息与第二硬盘资产信息不一致,则生成硬盘背板异常的告警信息。
5.一种硬盘故障预警系统,其特征在于,包括:
第一获取单元,用于BMC从BIOS获取由CPU从硬盘读取的硬盘故障信息和第一硬盘资产信息;
第二获取单元,用于BMC通过带外从硬盘背板获取第二硬盘资产信息;
预警执行单元,用于BMC校验第一硬盘资产信息与第二硬盘资产信息的一致性,在通过校验后基于第一硬盘资产信息和硬盘故障信息定位故障硬盘插槽号,并点亮故障硬盘插槽号对应的故障灯。
6.根据权利要求5所述的系统,其特征在于,所述第一获取单元包括:
第一获取模块,用于BMC从BIOS获取包含硬盘故障信息和第一硬盘资产信息的第一信息表,并将所述第一信息表保持至寄存器;所述BIOS基于从CPU获取的硬盘故障信息和第一硬盘资产信息生成第一信息表;所述CPU通过PCIe链路遍历所有硬盘以获取硬盘故障信息和第一硬盘资产信息。
7.根据权利要求5所述的系统,其特征在于,所述第二获取单元包括:
第二获取模块,用于BMC通过带外从硬盘背板的CPLD获取第二硬盘资产信息,并在将第二硬盘资产信息存储至第二信息表后,将第二信息表保存至寄存器。
8.根据权利要求5所述的系统,其特征在于,所述系统还包括:
背板告警单元,用于若第一硬盘资产信息与第二硬盘资产信息不一致,则生成硬盘背板异常的告警信息。
9.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-4任一项所述的方法。
10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210831662.8A CN115221015A (zh) | 2022-07-15 | 2022-07-15 | 硬盘故障预警方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210831662.8A CN115221015A (zh) | 2022-07-15 | 2022-07-15 | 硬盘故障预警方法、系统、终端及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115221015A true CN115221015A (zh) | 2022-10-21 |
Family
ID=83611954
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210831662.8A Pending CN115221015A (zh) | 2022-07-15 | 2022-07-15 | 硬盘故障预警方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115221015A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118012507A (zh) * | 2024-04-09 | 2024-05-10 | 安擎计算机信息股份有限公司 | 一种pch直出的硬盘的管理方法和服务器 |
WO2024139423A1 (zh) * | 2022-12-29 | 2024-07-04 | 超聚变数字技术有限公司 | 故障检测方法及计算机设备 |
-
2022
- 2022-07-15 CN CN202210831662.8A patent/CN115221015A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024139423A1 (zh) * | 2022-12-29 | 2024-07-04 | 超聚变数字技术有限公司 | 故障检测方法及计算机设备 |
CN118012507A (zh) * | 2024-04-09 | 2024-05-10 | 安擎计算机信息股份有限公司 | 一种pch直出的硬盘的管理方法和服务器 |
CN118012507B (zh) * | 2024-04-09 | 2024-06-07 | 安擎计算机信息股份有限公司 | 一种pch直出的硬盘的管理方法和服务器 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8386764B2 (en) | BIOS architecture | |
CN115221015A (zh) | 硬盘故障预警方法、系统、终端及存储介质 | |
US20080046706A1 (en) | Remote Monitor Module for Computer Initialization | |
CN110162435B (zh) | 一种服务器pxe启动测试方法、系统、终端及存储介质 | |
CN109189627B (zh) | 一种硬盘故障监控检测方法、装置、终端及存储介质 | |
CN114003445A (zh) | Bmc的i2c监控功能测试方法、系统、终端及存储介质 | |
CN114116378A (zh) | 获取PCIe设备温度的方法、系统、终端及存储介质 | |
CN104679626A (zh) | Bios调试侦测系统及方法 | |
CN100590602C (zh) | 计算机初始化之远程监视模块 | |
CN114116337A (zh) | 基于pcie链路配置的硬盘测试方法、系统、终端及存储介质 | |
CN113760800A (zh) | 基于bmc的串口路径选择方法、系统、终端及存储介质 | |
CN112783721B (zh) | 一种i2c总线监控的方法、装置、系统及存储介质 | |
CN116112412B (zh) | 一种虚拟网卡绑定冗余功能测试方法、系统、装置及介质 | |
CN116627729A (zh) | 外接线缆、外接线缆在位检测装置、开机自检方法及系统 | |
CN115098342A (zh) | 系统日志收集方法、系统、终端及存储介质 | |
CN116226008A (zh) | 端口地址配置器、配置方法及终端 | |
CN113835762B (zh) | 硬盘背板默认配置更新方法及系统 | |
CN114253573A (zh) | PCIe设备固件批量升级方法、系统、终端及存储介质 | |
CN113900934A (zh) | 多镜像混合刷新测试方法、系统、终端及存储介质 | |
CN114996069A (zh) | 一种主板测试方法、装置以及介质 | |
CN114443446B (zh) | 硬盘指示灯控制方法、系统、终端及存储介质 | |
CN113608937B (zh) | 硬盘背板led无硬盘测试装置及方法 | |
CN114579381B (zh) | 磁盘阵列远程调试方法、系统、终端及存储介质 | |
CN113765827B (zh) | 一种交换机固件保护系统 | |
CN116719712B (zh) | 处理器串口日志输出方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |