CN111048138A - 一种硬盘的故障检测方法及相关装置 - Google Patents

一种硬盘的故障检测方法及相关装置 Download PDF

Info

Publication number
CN111048138A
CN111048138A CN201911332537.7A CN201911332537A CN111048138A CN 111048138 A CN111048138 A CN 111048138A CN 201911332537 A CN201911332537 A CN 201911332537A CN 111048138 A CN111048138 A CN 111048138A
Authority
CN
China
Prior art keywords
hard disk
fault detection
information
power
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911332537.7A
Other languages
English (en)
Inventor
高阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Inspur Data Technology Co Ltd
Original Assignee
Beijing Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Inspur Data Technology Co Ltd filed Critical Beijing Inspur Data Technology Co Ltd
Priority to CN201911332537.7A priority Critical patent/CN111048138A/zh
Publication of CN111048138A publication Critical patent/CN111048138A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11CSTATIC STORES
    • G11C29/00Checking stores for correct operation ; Subsequent repair; Testing stores during standby or offline operation
    • G11C29/04Detection or location of defective memory elements, e.g. cell constructio details, timing of test signals
    • G11C29/08Functional testing, e.g. testing during refresh, power-on self testing [POST] or distributed testing
    • G11C29/12Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details
    • G11C29/12005Built-in arrangements for testing, e.g. built-in self testing [BIST] or interconnection details comprising voltage or current generators

Abstract

本申请公开了一种硬盘的故障检测方法,包括:通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;根据硬盘在位信息和硬盘上电信息判断对应的硬盘是否插入并上电;当硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据执行方式执行故障检测操作,得到故障检测结果。通过获取到上下电控制模块的信号对硬盘的硬件状态进行判断,将硬盘的故障分为硬件故障和软件故障,并执行对应的故障检测操作,而不是只进行软件的故障检测,提高了故障检测的准确性和精度。本申请还公开了一种硬盘的故障检测装置、服务器以及计算机可读存储介质,具有以上有益效果。

Description

一种硬盘的故障检测方法及相关装置
技术领域
本申请涉及计算机技术领域,特别涉及一种硬盘的故障检测方法、故障检测装置、服务器以及计算机可读存储介质。
背景技术
通常在存储系统中应用了数量庞大的硬盘,该硬盘也是存储产品中的主要的存储数据单元。硬盘是主要的电脑存储媒介,硬盘相当于计算机的仓库,操作系统、安装的软件,还有文档、资料等等,都是以数据(0和1)的形式存储在“仓库”中的。软件的运行也是把数据先调入内存,CPU是和内存进行数据交互,最后的结果才放入外存即硬盘。因此,硬盘是存储系统中重要硬件之一,需要对硬盘硬件故障进行快速发现以及快速定位。
现有技术中,最直观和最快速定位硬盘状态就是通过硬盘的3种状态灯来判断,也就是通过硬盘中的error LED进行判断。目前,比较常见技术方案是在不同的错误情况下点亮硬盘Error灯。其中,错误情况如下:一种是硬盘连接超时,一种是硬盘降速到1.5G。大部分的错误情况都是软件层面判断出错误情况,不能覆盖所有硬盘损坏的情况。如果硬盘的硬件彻底损坏,插入后不会发生link动作时,软件是判断不到硬盘故障,也就不会进行报错。即在硬件层面损坏时,无法及时获取到硬件损坏情况,造成数据丢失等严重问题。
因此,如何在硬盘的硬件层面进行报错是本领域技术人员关注的重点问题。
发明内容
本申请的目的是提供一种硬盘的故障检测方法、故障检测装置、服务器以及计算机可读存储介质,通过获取到上下电控制模块的信号对硬盘的硬件状态进行判断,将硬盘的故障分为硬件故障和软件故障,并执行对应的故障检测操作,而不是只进行软件的故障检测,提高了故障检测的准确性和精度。
为解决上述技术问题,本申请提供一种硬盘的故障检测方法,包括:
通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;
根据所述硬盘在位信息和所述硬盘上电信息判断对应的硬盘是否插入并上电;
当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果。
可选的,还包括:
所述硬盘上下电控制模块按照预设周期获取硬盘的硬盘在位信息、硬盘上电信息以及电源状态使能状态信息;
并将所述硬盘在位信息、所述硬盘上电信息以及所述电源状态使能状态信息保存至寄存器中。
可选的,当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果,包括:
当所述硬盘处理插入并上电的状态时,判断所述硬盘连接状态是否为已连接;
若是,则对获取的硬盘运行信息进行软件故障分析,得到所述故障检测结果;
若否,则发送硬件故障信息,并作为所述故障检测结果。
可选的,发送硬件故障信息,并作为所述故障检测结果,包括:
点亮所述硬盘的错误指示灯。
可选的,还包括:
BMC从所述硬盘上下电控制模块的寄存器获取硬盘故障信息;
将所述硬盘故障信息记录为日志。
本申请还提供一种硬盘的故障检测装置,包括:
状态信息读取模块,用于通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;
硬件状态检测模块,用于根据所述硬盘在位信息和所述硬盘上电信息判断对应的硬盘是否插入并上电;
故障检测模块,用于当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果。
可选的,所述故障检测模块,包括:
连接状态判断单元,用于当所述硬盘处理插入并上电的状态时,判断所述硬盘连接状态是否为已连接;
软件故障检测单元,用于当所述硬盘连接状态为已连接状态时,对获取的硬盘运行信息进行软件故障分析,得到所述故障检测结果;
硬件故障检测单元,用于当所述硬盘连接状态为未连接状态时,发送硬件故障信息,并作为所述故障检测结果。
可选的,还包括:
故障信息获取模块,用于从所述硬盘上下电控制模块的寄存器获取硬盘故障信息;
故障日志记录模块,用于将所述硬盘故障信息记录为日志。
本申请还提供一种服务器,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上所述的故障检测方法的步骤。
本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的故障检测方法的步骤。
本申请所提供的一种硬盘的故障检测方法,包括:通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;根据所述硬盘在位信息和所述硬盘上电信息判断对应的硬盘是否插入并上电;当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果。
通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息,也就是在硬盘自身信息之外获取到硬盘的硬件状态,然后通过该硬件状态判断硬盘是否插入并上电,也就是确定该硬盘的硬件是否正确连接,排除连接问题,然后再通过硬盘连接状态确定故障检测操作的执行方式,也就是进行软件故障检测还是硬件故障检测,而不是现有技术中只在与硬盘进行连接后进行软件层面的故障检测,实现在硬件层面也可以进行故障检测,使故障检测更加全面可靠,提高了故障检测的准确性和精度。
本申请还提供一种硬盘的故障检测装置、服务器以及计算机可读存储介质,具有以上有益效果,在此不做赘述。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例所提供的一种硬盘的故障检测方法的流程图;
图2为本申请实施例所提供的一种硬盘的故障检测装置的结构示意图。
具体实施方式
本申请的核心是提供一种硬盘的故障检测方法、故障检测装置、服务器以及计算机可读存储介质,通过获取到上下电控制模块的信号对硬盘的硬件状态进行判断,将硬盘的故障分为硬件故障和软件故障,并执行对应的故障检测操作,而不是只进行软件的故障检测,提高了故障检测的准确性和精度。
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
现有技术中,最直观和最快速定位硬盘状态就是通过硬盘的3种状态灯来判断,也就是通过硬盘中的error LED进行判断。目前,比较常见技术方案是在不同的错误情况下点亮硬盘Error灯。其中,错误情况如下:一种是硬盘连接超时,一种是硬盘降速到1.5G。大部分的错误情况都是软件层面判断出错误情况,不能覆盖所有硬盘损坏的情况。如果硬盘的硬件彻底损坏,插入后不会发生link动作时,软件是判断不到硬盘故障,也就不会进行报错。即在硬件层面损坏时,无法及时获取到硬件损坏情况,造成数据丢失等严重问题。
因此,本申请提供了一种硬盘的故障检测方法,通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息,也就是在硬盘自身信息之外获取到硬盘的硬件状态,然后通过该硬件状态判断硬盘是否插入并上电,也就是确定该硬盘的硬件是否正确连接,排除连接问题,然后再通过硬盘连接状态确定故障检测操作的执行方式,也就是进行软件故障检测还是硬件故障检测,而不是现有技术中只在与硬盘进行连接后进行软件层面的故障检测,实现在硬件层面也可以进行故障检测,使故障检测更加全面可靠,提高了故障检测的准确性和精度。
以下通过一个实施例,对本申请提供的一种硬盘的故障检测方法进行说明。
请参考图1,图1为本申请实施例所提供的一种硬盘的故障检测方法的流程图。
本实施例中,该方法可以包括:
S101,通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;
本步骤旨在通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息,也就是获取硬盘在位信号和硬盘上电信号。
一般的,在存储系统中,是硬盘控制器与硬盘产生连接后,通过该连接获取到硬盘信息,再根据该硬盘信息判断硬盘是否出现故障,以及硬盘的故障是何种故障。但是,现有技术中故障操作都是基于已经与硬盘产生连接的基础上,属于在软件层面对硬盘故障进行检测。但是,当硬盘出现硬件问题,此时无法与硬盘产生连接操作,也就是基本无法获取到信息,进而无法进行故障判断。会导致不会出现报错情况,导致硬件错误无法被发现。
因此,本实施例中为了可以在硬件层面进行故障故障检测,首先通过本步骤获取到通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息。而更一般的,在现有技术中硬盘的控制模块或者控制器不会去获取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息,因此,现有技术默认硬盘的硬件是良好的状态。
可选的,本步骤还可以包括:
步骤1,硬盘上下电控制模块按照预设周期获取硬盘的硬盘在位信息、硬盘上电信息以及电源状态使能状态信息;
步骤2,并将硬盘在位信息、硬盘上电信息以及电源状态使能状态信息保存至寄存器中。
可见,本可选方案主要是说明寄存器中为何存在上述信息。
S102,根据硬盘在位信息和硬盘上电信息判断对应的硬盘是否插入并上电;
在S101的基础上,本步骤旨在判断该硬盘是否处于插入并上电的状态。也就是判断该硬盘的连接以及上电是否正常。如果该硬盘不处于插入并上电状态时,则根据硬盘在位信息和硬盘上电信息将此时的连接状态告知给技术人员,并进行处理。
具体而言,本步骤主要是在硬件层面判断硬件连接状态是否正常。如果,硬件连接状态正常的话,再进行进一步的判断操作。
S103,当硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据执行方式执行故障检测操作,得到故障检测结果。
在S103的基础上,本步骤旨在根据硬盘连接状态判断不同的执行方法,即判断是硬件故障检测还是软件故障检测。其中,不同的执行方式指的是故障检测操作的不同执行层面,是在硬件层面进行执行,还是在软件层面执行。
具体的,本步骤可以包括:
步骤1,当硬盘处理插入并上电的状态时,判断硬盘连接状态是否为已连接;
步骤2,若是,则对获取的硬盘运行信息进行软件故障分析,得到故障检测结果;
步骤3,若否,则发送硬件故障信息,并作为故障检测结果。
可见,本可选方案中,主要是如何执行故障检测操作进行说明。如果硬盘位已连接状态,那么进行软件故障检测,即进行软件故障分析,得到故障检测结果。如果硬盘处于未连接状态,则说明该硬盘在硬件上已经进行连接,但是,在软件层面处于未连接状态,则说明硬盘的硬件出现问题,可以直接发送硬件故障故障信息,并将该硬件故障信息作为故障检测结果。
其中,步骤3可以包括:
点亮硬盘的错误指示灯。
可见,本可选方案中发送硬件故障信息的方式可以是电量硬盘的错误指示灯。而该指示灯在一般的故障检测操作中,处于该种状态时无法进行软件层面的故障检测,进而无法点亮,也就无法告知出现错误。
可选的,该实施例还可以包括:
步骤1,BMC从硬盘上下电控制模块的寄存器获取硬盘故障信息;
步骤2,将硬盘故障信息记录为日志。
可见,本可选方案中主要是说明在服务器中使BMC直接获取硬盘上下电控制模块中的故障信息,将该信息进行保存,以便技术人员可以及时获取硬盘的故障情况。
综上,通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息,也就是在硬盘自身信息之外获取到硬盘的硬件状态,然后通过该硬件状态判断硬盘是否插入并上电,也就是确定该硬盘的硬件是否正确连接,排除连接问题,然后再通过硬盘连接状态确定故障检测操作的执行方式,也就是进行软件故障检测还是硬件故障检测,而不是现有技术中只在与硬盘进行连接后进行软件层面的故障检测,实现在硬件层面也可以进行故障检测,使故障检测更加全面可靠,提高了故障检测的准确性和精度。
以下通过另一具体的实施例,对本申请提供的一种硬盘的故障检测方法作进一步说明。
本实施例中的存储系统一般包括主板、SAS卡(磁盘阵列卡)、expender背板以及硬盘。其中,该主板通过对外接口连接到SAS卡,再通过SAS卡连接到expender背板,expender背板的作用主要是用来扩展硬盘(连接硬盘阵列)和管理硬盘。
其中,expender背板通常会由expender controller(扩展板控制器)和硬盘上下电控制模块组成,同时包括硬盘连接器,可以直接连接硬盘其中,expender controller通过SAS/SATA协议可以解析硬盘状态信息传送给SAS卡,同时SAS卡也会通过上层应用监控硬盘状态,并传送给主板,因此expender controller是最先可以检测硬盘状态。但是,expender controller是在与硬盘产生连接之后才在软件层面进行故障检测。
其中,硬盘上下电控制模块的作用主要包括:控制硬盘和expender背板上下电;当expender controller通过SGPIO协议向硬盘上下电控制模块发送硬盘状态信号时,硬盘上下电控制模块解析出硬盘状态信号后控制硬盘的LED灯,包括active,locate,error LED;获取硬盘在位信号状态、硬盘上电使能信号状态以及电源状态使能状态信息后存储到I2C寄存器中,可以让expender controller和BMC读取expender背板盒硬盘的状态。
很显然,在存储系统中最直观和最快速定位硬盘状态就是通过硬盘的3种状态灯来判断。其中error LED用于显示故障状态。目前,比较常见点亮error LED的情况如下:一种是硬盘连接超时,一种是硬盘降速到1.5G,都是上层应用做判断后下发下来的。大部分情况是软件层面判断出的错误。不能覆盖所有硬盘损坏的情况。例如硬盘硬件彻底坏了,插入后但是没有发生link动作时软件层是察觉不到硬盘故障,没有办法报错的。
因此,本实施例进行故障检测的方法可以包括:
步骤1,硬盘中的硬盘上下电控制模块获取硬盘在位信号状态,硬盘上电使能信号状态及电源状态使能状态信息后存储到I2C寄存器中;
步骤2,expender controller通过I2C读取硬盘上下电控制模块的寄存器中的硬盘在位信号状态和硬盘上电使能信号状态;
步骤3,判断硬盘是否插入且上电;若是,则执行步骤4;
步骤4,当硬盘插入并且上电时,判断是否出现连接动作;若否,则执行步骤5;
步骤5,发送硬盘硬件故障通知信息。
也就是,expender controller可以通过I2C路径读取硬盘上下电控制模块的寄存器,来获取硬盘在位信息和硬盘上电使能信息,由于硬盘在位信号是硬件制作的物理信号,只要有硬盘插入,无论硬盘的状态如何都不会受到影响,上电使能信号同样如此,只要识别到硬盘在位就会由硬件电路触发产生。因此expender controller获取了这2个信息后,就可以判断硬盘是否有插入系统,即当硬盘插入且硬盘上电使能发出时,但是没有任何link动作的时候,就可以判断此硬盘故障,点亮硬盘error灯,及时定位到问题硬盘。
此外,为了及时收到硬盘报错信息,将逻辑控制模块中记录的硬盘故障信息的寄存器开放给BMC,这样当有硬盘报错时,BMC可以第一时间获取到并且记录日志。
可见,本实施例通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息,也就是在硬盘自身信息之外获取到硬盘的硬件状态,然后通过该硬件状态判断硬盘是否插入并上电,也就是确定该硬盘的硬件是否正确连接,排除连接问题,然后再通过硬盘连接状态确定故障检测操作的执行方式,也就是进行软件故障检测还是硬件故障检测,而不是现有技术中只在与硬盘进行连接后进行软件层面的故障检测,实现在硬件层面也可以进行故障检测,使故障检测更加全面可靠,提高了故障检测的准确性和精度。
下面对本申请实施例提供的一种硬盘的故障检测装置进行介绍,下文描述的一种硬盘的故障检测装置与上文描述的一种硬盘的故障检测方法可相互对应参照。
请参考图2,图2为本申请实施例所提供的一种硬盘的故障检测装置的结构示意图。
本实施例中,该装置可以包括:
状态信息读取模块100,用于通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;
硬件状态检测模块200,用于根据硬盘在位信息和硬盘上电信息判断对应的硬盘是否插入并上电;
故障检测模块300,用于当硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据执行方式执行故障检测操作,得到故障检测结果。
可选的,该故障检测模块300,可以包括:
连接状态判断单元,用于当硬盘处理插入并上电的状态时,判断硬盘连接状态是否为已连接;
软件故障检测单元,用于当硬盘连接状态为已连接状态时,对获取的硬盘运行信息进行软件故障分析,得到故障检测结果;
硬件故障检测单元,用于当硬盘连接状态为未连接状态时,发送硬件故障信息,并作为故障检测结果。
可选的,该装置还可以包括:
故障信息获取模块,用于从硬盘上下电控制模块的寄存器获取硬盘故障信息;
故障日志记录模块,用于将硬盘故障信息记录为日志。
本申请实施例还提供一种服务器,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如以上实施例所述的故障检测方法的步骤。
本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如以上实施例所述的故障检测方法的步骤。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
以上对本申请所提供的一种硬盘的故障检测方法、故障检测装置、服务器以及计算机可读存储介质进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种硬盘的故障检测方法,其特征在于,包括:
通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;
根据所述硬盘在位信息和所述硬盘上电信息判断对应的硬盘是否插入并上电;
当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果。
2.根据权利要求1所述的故障检测方法,其特征在于,还包括:
所述硬盘上下电控制模块按照预设周期获取硬盘的硬盘在位信息、硬盘上电信息以及电源状态使能状态信息;
并将所述硬盘在位信息、所述硬盘上电信息以及所述电源状态使能状态信息保存至寄存器中。
3.根据权利要求1所述的故障检测方法,其特征在于,当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果,包括:
当所述硬盘处理插入并上电的状态时,判断所述硬盘连接状态是否为已连接;
若是,则对获取的硬盘运行信息进行软件故障分析,得到所述故障检测结果;
若否,则发送硬件故障信息,并作为所述故障检测结果。
4.根据权利要求3所述的故障检测方法,其特征在于,发送硬件故障信息,并作为所述故障检测结果,包括:
点亮所述硬盘的错误指示灯。
5.根据权利要求1所述的故障检测方法,其特征在于,还包括:
BMC从所述硬盘上下电控制模块的寄存器获取硬盘故障信息;
将所述硬盘故障信息记录为日志。
6.一种硬盘的故障检测装置,其特征在于,包括:
状态信息读取模块,用于通过I2C总线读取硬盘上下电控制模块中寄存器的硬盘在位信息和硬盘上电信息;
硬件状态检测模块,用于根据所述硬盘在位信息和所述硬盘上电信息判断对应的硬盘是否插入并上电;
故障检测模块,用于当所述硬盘处于插入并上电的状态时,根据硬盘连接状态确定故障检测操作的执行方式,根据所述执行方式执行故障检测操作,得到故障检测结果。
7.根据权利要求6所述的故障检测装置,其特征在于,所述故障检测模块,包括:
连接状态判断单元,用于当所述硬盘处理插入并上电的状态时,判断所述硬盘连接状态是否为已连接;
软件故障检测单元,用于当所述硬盘连接状态为已连接状态时,对获取的硬盘运行信息进行软件故障分析,得到所述故障检测结果;
硬件故障检测单元,用于当所述硬盘连接状态为未连接状态时,发送硬件故障信息,并作为所述故障检测结果。
8.根据权利要求6所述的故障检测装置,其特征在于,还包括:
故障信息获取模块,用于从所述硬盘上下电控制模块的寄存器获取硬盘故障信息;
故障日志记录模块,用于将所述硬盘故障信息记录为日志。
9.一种服务器,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的故障检测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的故障检测方法的步骤。
CN201911332537.7A 2019-12-22 2019-12-22 一种硬盘的故障检测方法及相关装置 Pending CN111048138A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911332537.7A CN111048138A (zh) 2019-12-22 2019-12-22 一种硬盘的故障检测方法及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911332537.7A CN111048138A (zh) 2019-12-22 2019-12-22 一种硬盘的故障检测方法及相关装置

Publications (1)

Publication Number Publication Date
CN111048138A true CN111048138A (zh) 2020-04-21

Family

ID=70237478

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911332537.7A Pending CN111048138A (zh) 2019-12-22 2019-12-22 一种硬盘的故障检测方法及相关装置

Country Status (1)

Country Link
CN (1) CN111048138A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306806A (zh) * 2020-10-30 2021-02-02 联想(北京)有限公司 电子设备控制方法、装置及电子设备
CN112954575A (zh) * 2021-01-28 2021-06-11 歌尔科技有限公司 一种无线耳机故障检测方法、故障检测设备及无线耳机
CN114020561A (zh) * 2021-10-22 2022-02-08 苏州浪潮智能科技有限公司 故障上报方法、系统、装置、计算机设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324859A (zh) * 2007-06-14 2008-12-17 上海市闵行中学 一种硬盘硬件故障的检测方法
CN101359309A (zh) * 2007-08-03 2009-02-04 中兴通讯股份有限公司 串行附接小型计算机系统接口硬盘状态指示装置及方法
US9244792B1 (en) * 2012-12-31 2016-01-26 Teradata Us, Inc. Disk-media-error detection and correction
CN109086081A (zh) * 2018-06-29 2018-12-25 深圳市同泰怡信息技术有限公司 一种即时提示SATA和NVMe设备在位变化的方法、系统及介质
CN110018939A (zh) * 2019-03-28 2019-07-16 山东超越数控电子股份有限公司 一种基于scsi协议的硬盘在线故障诊断方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101324859A (zh) * 2007-06-14 2008-12-17 上海市闵行中学 一种硬盘硬件故障的检测方法
CN101359309A (zh) * 2007-08-03 2009-02-04 中兴通讯股份有限公司 串行附接小型计算机系统接口硬盘状态指示装置及方法
US9244792B1 (en) * 2012-12-31 2016-01-26 Teradata Us, Inc. Disk-media-error detection and correction
CN109086081A (zh) * 2018-06-29 2018-12-25 深圳市同泰怡信息技术有限公司 一种即时提示SATA和NVMe设备在位变化的方法、系统及介质
CN110018939A (zh) * 2019-03-28 2019-07-16 山东超越数控电子股份有限公司 一种基于scsi协议的硬盘在线故障诊断方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112306806A (zh) * 2020-10-30 2021-02-02 联想(北京)有限公司 电子设备控制方法、装置及电子设备
CN112306806B (zh) * 2020-10-30 2023-04-28 联想(北京)有限公司 电子设备控制方法、装置及电子设备
CN112954575A (zh) * 2021-01-28 2021-06-11 歌尔科技有限公司 一种无线耳机故障检测方法、故障检测设备及无线耳机
CN114020561A (zh) * 2021-10-22 2022-02-08 苏州浪潮智能科技有限公司 故障上报方法、系统、装置、计算机设备及存储介质

Similar Documents

Publication Publication Date Title
CN111048138A (zh) 一种硬盘的故障检测方法及相关装置
CN100395717C (zh) 硬盘装置损坏监测方法及系统
CN103207820B (zh) 基于raid卡日志的硬盘的故障定位方法及装置
CN103514068A (zh) 内存故障自动定位方法
CN103364650A (zh) 测试系统和测试方法
CN105045689A (zh) 一种利用raid卡批量检测硬盘监控和报警的方法
CN112286709A (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN108959031B (zh) 一种nvme背板点灯控制方法、系统、介质及设备
CN112256499A (zh) 掉电监测方法、装置、电子设备及计算机可读存储介质
CN103049345A (zh) 基于异步通信机制的磁盘状态变迁检测方法及装置
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN112783721B (zh) 一种i2c总线监控的方法、装置、系统及存储介质
CN111858178B (zh) 一种电源启动类型的判断方法、装置、设备及可读介质
CN113742182A (zh) 硬盘点灯方法、装置、存储介质及计算机程序产品
CN111124785B (zh) 一种硬盘故障检查的方法、装置、设备及存储介质
CN107807862A (zh) 检测硬盘故障点的方法、装置及服务器
CN114218001A (zh) 故障修复方法、装置、电子设备及可读存储介质
CN115098342A (zh) 系统日志收集方法、系统、终端及存储介质
CN114996069A (zh) 一种主板测试方法、装置以及介质
CN113852502A (zh) 一种智能网卡的故障诊断方法、装置、设备及可读介质
CN117573455B (zh) 一种pcie设备检测系统、方法、装置及产品
US9990382B1 (en) Secure erasure and repair of non-mechanical storage media
CN112579366A (zh) 硬盘在位检测系统
CN111475107A (zh) 一种硬盘格式化的方法、装置及存储介质
CN116758973B (zh) 一种企业级固态硬盘意外掉电数据校验的测试方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20200421