CN114020561A - 故障上报方法、系统、装置、计算机设备及存储介质 - Google Patents

故障上报方法、系统、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114020561A
CN114020561A CN202111235717.0A CN202111235717A CN114020561A CN 114020561 A CN114020561 A CN 114020561A CN 202111235717 A CN202111235717 A CN 202111235717A CN 114020561 A CN114020561 A CN 114020561A
Authority
CN
China
Prior art keywords
hard disk
fault
information
controller
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111235717.0A
Other languages
English (en)
Other versions
CN114020561B (zh
Inventor
曲燕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202111235717.0A priority Critical patent/CN114020561B/zh
Publication of CN114020561A publication Critical patent/CN114020561A/zh
Application granted granted Critical
Publication of CN114020561B publication Critical patent/CN114020561B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3051Monitoring arrangements for monitoring the configuration of the computing system or of the computing system component, e.g. monitoring the presence of processing resources, peripherals, I/O links, software programs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种故障上报方法、系统、装置、计算机设备及存储介质,适用于存储设备技术领域。该方法包括:接收硬盘控制器发送的硬盘故障信息,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测对应的硬盘是否发生故障;基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。采用该方法不需要基板管理控制器轮询检测硬盘是否发生故障,从而可以减少CPU的占用率,且在硬盘发生故障的情况下,中断目标CPU的当前处理任务,从而可以使得目标CPU优先处理硬盘故障,且保证目标CPU在处理硬盘故障时CPU的占用率较少。

Description

故障上报方法、系统、装置、计算机设备及存储介质
技术领域
本发明涉及存储设备技术领域,具体涉及一种故障上报方法、系统、装置、计算机设备及存储介质。
背景技术
随着科技的发展,计算机设备的功能也越来越强大。其中,计算机设备的硬盘管理在计算机设备的正常工作中发挥着至关重要的作用。因此,需要周期性或者实时地对硬盘的工作状态进行监控。
在现有技术中,通常是基板管理控制器采用线程轮询等方式通过实时获取硬盘控制器发送的硬盘相关的传感器数据,根据相关的传感器数据判断计算机设备硬盘异常故障原因,从而实现对硬盘工作状态进行进行实时监控。在硬盘发生故障的情况下,计算机设备的CPU在处理其他任务的情况下,还需要处理硬盘故障,因此导致CPU的占用率过高。
上述方法中,由于计算机设备外设负载过多,即使多线程处理,轮询的方式依然存在CPU占用率过高的问题,因此,如何在对硬盘进行监控的同时降低CPU的占用率成为了至关重要的问题。
发明内容
有鉴于此,本发明实施例提供了一种故障上报方法、系统、装置、计算机设备及存储介质,以解决在对硬盘进行监控时,CPU占用率过高的问题。
根据第一方面,本发明实施例提供了一种故障上报方法,该方法包括:接收硬盘控制器发送的硬盘故障信息,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测对应的硬盘是否发生故障;基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。
在本申请实施例中,基板管理控制器接收硬盘控制器发送的硬盘故障信息,并基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。上述方法中,硬盘控制器可以实时检测硬盘是否发生故障,不需要基板管理控制器轮询检测硬盘是否发生故障,从而可以减少CPU的占用率。基板管理控制器在接收到硬盘故障信息之后,中断目标CPU的当前处理任务,从而可以使得目标CPU优先处理硬盘故障,且保证目标CPU在处理硬盘故障时CPU的占用率较少。进一步避免目标CPU在占用率较高的情况下处理硬盘故障,导致目标CPU不能正常工作,从而既影响了目标CPU的当前处理任务,又不能处理硬盘故障。
结合第一方面,在第一方面第一实施方式中,方法还包括:向硬盘控制器发送位置询问信息;接收硬盘控制器发送的硬盘内部的位置分布信息;根据位置分布信息,确定故障硬盘的位置。
在本申请实施例中,基板管理控制器向硬盘控制器发送位置询问信息,并接收硬盘控制器发送的硬盘内部的位置分布信息,然后根据位置分布信息,确定故障硬盘的位置。从而可以保证基板管理控制器确定的故障硬盘的位置的准确性。
结合第一方面,在第一方面第二实施方式中,硬盘故障信息包括故障硬盘的故障类型,方法还包括:基于故障类型,确定故障硬盘的故障等级;根据故障等级对故障硬盘进行标识;根据标识,发出硬盘故障的提示信息。
在本申请实施例中,基板管理控制器基于故障类型,确定故障硬盘的故障等级;根据故障等级对故障硬盘进行标识;根据标识,发出硬盘故障的提示信息。从而使得用户可以及时了解到硬盘发生故障,并及时对硬盘故障进行处理,防止发生硬盘故障导致数据丢失、数据泄漏等问题。
结合第一方面,在第一方面第三实施方式中,接收硬盘控制器发送的硬盘故障信息之后,方法还包括:基于硬盘故障信息,将硬盘的故障输出给用户。
在本申请实施例中,基板管理控制器基于硬盘故障信息,将硬盘的故障输出给用户。从而使得用户可以获取到硬盘的故障,并对硬盘的故障采取相应的处理措施。保证硬盘故障不会影响到整个计算机设备的运行。
结合第一方面第一实施例,在第一方面第四实施方式中,向硬盘控制器发送位置询问信息,包括:通过BIOS向硬盘控制器发送位置询问信息。
在本申请实施例中,基板管理控制器通过BIOS向硬盘控制器发送位置询问信息,从而可以保证发送的位置询问信息的准确性。
根据第二方面,本发明实施例提供了一种故障上报系统,,系统包括硬盘、硬盘控制器、基板管理控制器以及目标CPU,其中:
硬盘控制器,用于获取对应硬盘的故障信息并将硬盘故障信息发送至基板管理控制器;硬盘故障信息中包括故障硬盘的标识信息;
基板管理控制器,用于接收硬盘控制器发送的硬盘故障信息,并基于硬盘故障信息,中断目标CPU的当前处理任务;
目标CPU用于对硬盘故障信息进行处理。
在本申请实施例中,硬盘控制器可以实时检测硬盘是否发生故障,不需要基板管理控制器轮询检测硬盘是否发生故障,从而可以减少CPU的占用率。此外,在基板管理控制器接收到硬盘管理控制器发送的硬盘故障信息之后,基于硬盘故障信息,中断目标CPU的当前处理任务,进一步减少CPU的占用率,保证CPU正常运行。
结合第二方面,在第二方面第一实施方式中,硬盘控制器,还用于在检测到硬盘发生故障的情况下,检测硬盘发生故障的类型,并将故障类型信息发送至基板管理控制器。
在本申请实施例中,硬盘控制器在检测到硬盘发生故障的情况下,检测硬盘发生故障的类型,并将故障类型信息发送至基板管理控制器。从而使得基板管理控制器可以基于故障类型信息对故障硬盘进行标记,避免对故障硬盘标记错误。
根据第三方面,本发明实施例提供了一种故障上报装置,装置包括:
第一接收模块,用于接收硬盘控制器发送的硬盘故障信息,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测硬盘是否发生故障;
中断模块,用于基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。
结合第三方面,在第三方面第一实施方式中,上述故障上报装置,还包括:
发送模块,用于向硬盘控制器发送位置询问信息;
第二接收模块,用于接收硬盘控制器发送的硬盘内部的位置分布信息;
第一确定模块,用于根据位置分布信息,确定故障硬盘的位置。
结合第三方面,在第三方面第二实施方式中,硬盘故障信息包括故障硬盘的故障类型,上述故障上报装置,还包括:
第二确定模块,用于基于故障类型,确定故障硬盘的故障等级;
标识模块,用于根据故障等级对故障硬盘进行标识;
发出模块,用于根据标识,发出硬盘故障的提示信息。
结合第三方面,在第三方面第三实施方式中,上述故障上报装置,还包括:
输出模块,用于基于硬盘故障信息,将硬盘的故障输出给用户。
结合第三方面第一实施例,在第三方面第四实施方式中,上述发送模块,具体用于通过BIOS向硬盘控制器发送位置询问信息。
根据第四方面,本发明实施例提供了一种计算机设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行第一方面或者第一方面的任意一种实施方式中的故障上报方法。
根据第五方面,本发明实施例提供了一种计算机可读存储介质,计算机可读存储介质存储计算机指令,计算机指令用于使计算机执行第一方面或者第一方面的任意一种实施方式中的故障上报方法。
根据第六方面,本发明实施例提供了一种计算机程序产品,计算机程序产品包括存储在计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,使计算机执行第一方面或者第一方面的任意一种实施方式中的故障上报方法。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了一个实施例中故障上报方法的步骤流程图;
图2示出了另一个实施例中故障上报方法的步骤流程图;
图3示出了另一个实施例中故障上报方法的步骤流程图;
图4示出了另一个实施例中故障上报方法的步骤流程图;
图5示出了另一个实施例中故障上报装置的结构框图;
图6示出了一个实施例中故障上报装置的结构框图;
图7示出了一个实施例中故障上报装置的结构框图;
图8示出了一个实施例中故障上报装置的结构框图;
图9示出了一个实施例计算机设备为服务器时的内部结构图;
图10示出了一个实施例计算机设备为终端时的内部结构图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请实施例提供的故障上报的方法,其执行主体可以是故障上报的装置,该故障上报的装置可以通过软件、硬件或者软硬件结合的方式实现成为计算机设备的部分或者全部,其中,该计算机设备可以是服务器或者终端,其中,本申请实施例中的服务器可以为一台服务器,也可以为由多台服务器组成的服务器集群,本申请实施例中的终端可以是智能手机、个人电脑、平板电脑、可穿戴设备以及智能机器人等其他智能硬件设备。其中,计算机设备中可以包括硬盘、与硬盘对应的硬盘控制器、目标CPU以及基板管理控制器,下述方法实施例中,均以执行主体是计算机设备中的基板管理控制器为例来进行说明。
在本申请一个实施例中,提供了一种故障上报方法,如图1所示,以该方法应用于计算机设备中的基板管理控制器为例进行说明,包括以下步骤:
101,接收硬盘控制器发送的硬盘故障信息。
其中,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测对应的硬盘是否发生故障。
具体地,硬盘控制器可以实时通过传感器获取到硬盘数据,其中,获取到的硬盘数据可以包括温度数据、电流数据、电压数据等。硬盘控制器对获取到的硬盘数据进行分析,然后确定硬盘是否发生故障。
在硬盘发生故障的情况下,硬盘控制器通过与基板管理控制器之间的通信,将硬盘故障信息发送至基板管理控制器,基板管理控制器接收硬盘控制器发送的硬盘故障信息。
102,基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。
具体地,基板管理控制器在接收到硬盘控制器发送的硬盘故障信息之后,确定硬盘出现故障。为了使得目标CPU在处理硬盘故障时占用率较低,基板管理控制器可以中断CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理,从而降低CPU的占用率。
在本申请实施例中,基板管理控制器接收硬盘控制器发送的硬盘故障信息,并基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。上述方法中,硬盘控制器可以实时检测硬盘是否发生故障,不需要基板管理控制器轮询检测硬盘是否发生故障,从而可以减少CPU的占用率。基板管理控制器在接收到硬盘故障信息之后,中断目标CPU的当前处理任务,从而可以使得目标CPU优先处理硬盘故障,且保证目标CPU在处理硬盘故障时CPU的占用率较少。进一步避免目标CPU在占用率较高的情况下处理硬盘故障,导致目标CPU不能正常工作,从而既影响了目标CPU的当前处理任务,又不能处理硬盘故障。
在本申请一个实施例中,如图2所示,上述故障上报方法还可以包括以下步骤:
201,向硬盘控制器发送位置询问信息。
具体地,基板管理控制器为了获取到硬盘内部的位置分布信息,确定硬盘内各存储空间的位置,基板管理控制器可以基于与硬盘控制器之间的通信向硬盘控制器发送位置询问信息。
202,接收硬盘控制器发送的硬盘内部的位置分布信息。
具体地,硬盘控制器在接收到基板管理控制器发送的位置询问信息之后,对硬盘内各存储空间的位置以及标识信息进行汇总,向基板管理控制器发送硬盘内部的位置分布信息。然后,基板管理控制器接收硬盘控制器发送的硬盘内部的位置分布信息。
在本申请一种可选的实施方式中,基板管理控制器还可以向硬盘发送资产信息进行位置检索。示例性的,其资产信息可以如下所示:CPU1_RAID2_I2C2_DISK4即在cpu1下的raid2插槽通过i2c2读取的disk4盘位。
203,根据位置分布信息,确定故障硬盘的位置。
具体地,基板管理控制器接收到硬盘控制器发送的硬盘内部的位置分布信息之后,基板管理控制器可以基于硬盘内部的位置分布信息以及硬盘故障信息中包括的故障硬盘的标识信息,确定故障硬盘的位置。
在本申请实施例中,基板管理控制器向硬盘控制器发送位置询问信息,并接收硬盘控制器发送的硬盘内部的位置分布信息,然后根据位置分布信息,确定故障硬盘的位置。从而可以保证基板管理控制器确定的故障硬盘的位置的准确性。
在本申请一个实施例中,硬盘故障信息包括故障硬盘的故障类型,如图3所示,上述故障上报方法还可以包括以下步骤:
301,基于故障类型,确定故障硬盘的故障等级。
具体地,硬盘控制器可以实时通过传感器获取到硬盘数据,其中,硬盘数据可以包括温度数据、电流数据、电压数据等。硬盘控制器对获取到的硬盘数据进行分析,然后确定硬盘是否发生故障。硬盘控制器在确定硬盘故障的情况下,基于传感器获取到的故障硬盘数据,并对故障硬盘数据进行分析,确定故障硬盘的故障类型。然后,硬盘控制器将故障硬盘的故障类型以及故障硬盘的标识信息打包为硬盘故障信息发送给基板管理控制器。
基板管理控制器基于硬盘故障信息确定故障硬盘的故障类型,然后根据故障硬盘的故障类型与故障等级之间的对应关系,确定故障类型对应的故障硬盘的故障等级。
示例性,故障类型与故障等级之间的对应关系可以是温度大于温度阈值,故障等级为3级。
302,根据故障等级对故障硬盘进行标识。
具体地,基板管理控制器基于故障硬盘的故障等级,对故障硬盘进行标识,其中,标识可以是对故障硬盘进行点灯,还可以是对故障硬盘进行标记,本申请实施例对故障硬盘进行标识的方式不做具体限定。
示例性的,若故障硬盘的故障等级为3类故障,则基板管理控制器将故障硬盘标记为红灯;若故障硬盘的故障等级为2类故障,则基板管理控制器将故障硬盘标记为黄灯。
示例性的,若故障硬盘的故障等级为3类故障,则基板管理控制器对故障硬盘标记为3。若故障硬盘的故障等级为2类故障,则基板管理控制器将故障硬盘标记为2。
303,根据标识,发出硬盘故障的提示信息。
具体地,基板管理控制器可以基于故障硬盘的标识,发出硬盘故障的提示信息。其中,提示信息可以是发出提示声音,还可以是向用户发送提消息等。本申请实施例对发出硬盘故障的提示信息的方式不做具体限定。
在本申请实施例中,基板管理控制器基于故障类型,确定故障硬盘的故障等级;根据故障等级对故障硬盘进行标识;根据标识,发出硬盘故障的提示信息。从而使得用户可以及时了解到硬盘发生故障,并及时对硬盘故障进行处理,防止发生硬盘故障导致数据丢失、数据泄漏等问题。
在本申请一个实施例中,接收硬盘控制器发送的硬盘故障信息之后,方法还包括:
基于硬盘故障信息,将硬盘的故障输出给用户。
具体地,基板管理控制器在接收到硬盘控制器发送的硬盘故障信息之后,可以将硬盘故障信息传输给输出组件,然后经过输出组件,将硬盘的故障输出给用户。
在本申请实施例中,基板管理控制器基于硬盘故障信息,将硬盘的故障输出给用户。从而使得用户可以获取到硬盘的故障,并对硬盘的故障采取相应的处理措施。保证硬盘故障不会影响到整个计算机设备的运行。
在本申请一个实施例中,上述步骤201中的“向硬盘控制器发送位置询问信息”,可以包括以下步骤:
通过BIOS向硬盘控制器发送位置询问信息。
其中,BIOS(Basic Input Output System,基本输入输出系统发)它是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序、开机后自检程序和系统自启动程序,它可从CMOS中读写系统设置的具体信息。其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。
在本申请实施例中,基板管理控制器通过BIOS向硬盘控制器发送位置询问信息,从而可以保证发送的位置询问信息的准确性。
在本申请一个实施例中,提供了一种故障上报系统,系统包括硬盘、硬盘控制器、基板管理控制器以及目标CPU,其中:
硬盘控制器,用于获取对应硬盘的故障信息并将硬盘故障信息发送至基板管理控制器;硬盘故障信息中包括故障硬盘的标识信息。
基板管理控制器,用于接收硬盘控制器发送的硬盘故障信息,并基于硬盘故障信息,中断目标CPU的当前处理任务;目标CPU用于对硬盘故障信息进行处理。
在本申请实施例中,硬盘控制器可以实时检测硬盘是否发生故障,不需要基板管理控制器轮询检测硬盘是否发生故障,从而可以减少CPU的占用率。此外,在基板管理控制器接收到硬盘管理控制器发送的硬盘故障信息之后,基于硬盘故障信息,中断目标CPU的当前处理任务,进一步减少CPU的占用率,保证CPU正常运行。
在本申请一个实施例中,硬盘控制器,还用于在检测到硬盘发生故障的情况下,检测硬盘发生故障的类型,并将故障类型信息发送至基板管理控制器。
在本申请实施例中,硬盘控制器在检测到硬盘发生故障的情况下,检测硬盘发生故障的类型,并将故障类型信息发送至基板管理控制器。从而使得基板管理控制器可以基于故障类型信息对故障硬盘进行标记,避免对故障硬盘标记错误。
关于故障上报系统的具体限定可以参见上文中对于故障上报方法的限定,在此不再赘述。
为了更好的解释本申请实施例提供的故障上报方法,如图4所示,本申请实施例提供了一种故障上报方法的整体流程图,可以包括如下步骤:
401,通过BIOS向硬盘控制器发送位置询问信息。
402,接收硬盘控制器发送的硬盘内部的位置分布信息。
403,接收硬盘控制器发送的硬盘故障信息。
404,根据位置分布信息,确定故障硬盘的位置。
405,基于故障类型,确定故障硬盘的故障等级。
406,根据故障等级对故障硬盘进行标识。
407,根据标识,发出硬盘故障的提示信息。
408,基于硬盘故障信息,将硬盘的故障输出给用户。
应该理解的是,虽然图1-4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-4中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
相应地,请参考图5,本发明实施例提供一种故障上报装置500;上述故障上报装置500,包括:
第一接收模块510,用于接收硬盘控制器发送的硬盘故障信息,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测硬盘是否发生故障;
中断模块520,用于基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。
在本申请一个实施例中,如图6所示,上述故障上报装置500,还包括:
发送模块530,用于向硬盘控制器发送位置询问信息;
第二接收模块540,用于接收硬盘控制器发送的硬盘内部的位置分布信息;
第一确定模块550,用于根据位置分布信息,确定故障硬盘的位置。
在本申请一个实施例中,如图7所示,硬盘故障信息包括故障硬盘的故障类型,上述故障上报装置500,还包括:
第二确定模块560,用于基于故障类型,确定故障硬盘的故障等级;
标识模块570,用于根据故障等级对故障硬盘进行标识;
发出模块580,用于根据标识,发出硬盘故障的提示信息。
在本申请一个实施例中,如图8所示,上述故障上报装置500,还包括:
输出模块590,用于基于硬盘故障信息,将硬盘的故障输出给用户。
在本申请一个实施例中,上述发送模块530,具体用于通过BIOS向硬盘控制器发送位置询问信息。
关于故障上报装置的具体限定以及有益效果可以参见上文中对于故障上报方法的限定,在此不再赘述。上述故障上报装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、运营商网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种故障上报方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储故障上报数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种故障上报方法。
本领域技术人员可以理解,图9和10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:接收硬盘控制器发送的硬盘故障信息,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测对应的硬盘是否发生故障;基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:向硬盘控制器发送位置询问信息;接收硬盘控制器发送的硬盘内部的位置分布信息;根据位置分布信息,确定故障硬盘的位置。
在本申请一个实施例中,硬盘故障信息包括故障硬盘的故障类型,处理器执行计算机程序时还实现以下步骤:基于故障类型,确定故障硬盘的故障等级;根据故障等级对故障硬盘进行标识;根据标识,发出硬盘故障的提示信息。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:基于硬盘故障信息,将硬盘的故障输出给用户。
在本申请一个实施例中,处理器执行计算机程序时还实现以下步骤:通过BIOS向硬盘控制器发送位置询问信息。
在本申请一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:接收硬盘控制器发送的硬盘故障信息,硬盘故障信息中包括故障硬盘的标识信息;硬盘控制器用于检测对应的硬盘是否发生故障;基于硬盘故障信息,中断目标CPU的当前处理任务,以使得目标CPU基于标识信息对硬盘故障信息进行处理。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:向硬盘控制器发送位置询问信息;接收硬盘控制器发送的硬盘内部的位置分布信息;根据位置分布信息,确定故障硬盘的位置。
在本申请一个实施例中,硬盘故障信息包括故障硬盘的故障类型,计算机程序被处理器执行时还实现以下步骤:基于故障类型,确定故障硬盘的故障等级;根据故障等级对故障硬盘进行标识;根据标识,发出硬盘故障的提示信息。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:基于硬盘故障信息,将硬盘的故障输出给用户。
在本申请一个实施例中,计算机程序被处理器执行时还实现以下步骤:通过BIOS向硬盘控制器发送位置询问信息。
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(Random AccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
虽然结合附图描述了本发明的实施例,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下作出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims (10)

1.一种故障上报方法,其特征在于,所述方法包括:
接收硬盘控制器发送的硬盘故障信息,所述硬盘故障信息中包括故障硬盘的标识信息;所述硬盘控制器用于检测对应的硬盘是否发生故障;
基于所述硬盘故障信息,中断目标CPU的当前处理任务,以使得所述目标CPU基于所述标识信息对所述硬盘故障信息进行处理。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向所述硬盘控制器发送位置询问信息;
接收所述硬盘控制器发送的硬盘内部的位置分布信息;
根据所述位置分布信息,确定所述故障硬盘的位置。
3.根据权利要求1所述的方法,其特征在于,所述硬盘故障信息包括故障硬盘的故障类型,所述方法还包括:
基于所述故障类型,确定所述故障硬盘的故障等级;
根据所述故障等级对所述故障硬盘进行标识;
根据所述标识,发出硬盘故障的提示信息。
4.根据权利要求1所述的方法,其特征在于,所述接收所述硬盘控制器发送的硬盘故障信息之后,所述方法还包括:
基于所述硬盘故障信息,将硬盘的故障输出给用户。
5.根据权利要求2所述的方法,其特征在于,所述向所述硬盘控制器发送位置询问信息,包括:
通过BIOS向所述硬盘控制器发送位置询问信息。
6.一种故障上报系统,其特征在于,所述系统包括硬盘、硬盘控制器、基板管理控制器以及目标CPU,其中:
所述硬盘控制器,用于获取对应硬盘的故障信息并将硬盘故障信息发送至所述基板管理控制器;所述硬盘故障信息中包括故障硬盘的标识信息;
所述基板管理控制器,用于接收所述硬盘控制器发送的所述硬盘故障信息,并基于所述硬盘故障信息,中断所述目标CPU的当前处理任务;
所述目标CPU用于对所述硬盘故障信息进行处理。
7.根据权利要求6所述的系统,其特征在于,所述硬盘控制器,还用于在检测到所述硬盘发生故障的情况下,检测所述硬盘发生故障的类型,并将故障类型信息发送至所述基板管理控制器。
8.一种故障上报装置,其特征在于,所述装置包括:
第一接收模块,用于接收硬盘控制器发送的硬盘故障信息,所述硬盘故障信息中包括故障硬盘的标识信息;所述硬盘控制器用于检测硬盘是否发生故障;
中断模块,用于基于所述硬盘故障信息,中断目标CPU的当前处理任务,以使得所述目标CPU基于所述标识信息对所述硬盘故障信息进行处理。
9.一种计算机设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器之间互相通信连接,所述存储器中存储有计算机指令,所述处理器通过执行所述计算机指令,从而执行权利要求1-5中任一项所述的故障上报方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使所述计算机执行权利要求1-5中任一项所述的故障上报方法。
CN202111235717.0A 2021-10-22 2021-10-22 故障上报方法、系统、装置、计算机设备及存储介质 Active CN114020561B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111235717.0A CN114020561B (zh) 2021-10-22 2021-10-22 故障上报方法、系统、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111235717.0A CN114020561B (zh) 2021-10-22 2021-10-22 故障上报方法、系统、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN114020561A true CN114020561A (zh) 2022-02-08
CN114020561B CN114020561B (zh) 2024-05-24

Family

ID=80057325

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111235717.0A Active CN114020561B (zh) 2021-10-22 2021-10-22 故障上报方法、系统、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114020561B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169469A (ja) * 2008-01-10 2009-07-30 Hitachi Ltd 計算機システム
CN103455395A (zh) * 2013-08-08 2013-12-18 华为技术有限公司 一种硬盘故障的检测方法及装置
CN104021054A (zh) * 2014-06-11 2014-09-03 浪潮(北京)电子信息产业有限公司 服务器故障可视化侦测及处理方法、系统及可编程芯片
CN106951354A (zh) * 2017-03-20 2017-07-14 湖南磐石科技有限公司 固态硬盘及其故障检测装置和方法
CN111048138A (zh) * 2019-12-22 2020-04-21 北京浪潮数据技术有限公司 一种硬盘的故障检测方法及相关装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009169469A (ja) * 2008-01-10 2009-07-30 Hitachi Ltd 計算機システム
CN103455395A (zh) * 2013-08-08 2013-12-18 华为技术有限公司 一种硬盘故障的检测方法及装置
CN104021054A (zh) * 2014-06-11 2014-09-03 浪潮(北京)电子信息产业有限公司 服务器故障可视化侦测及处理方法、系统及可编程芯片
CN106951354A (zh) * 2017-03-20 2017-07-14 湖南磐石科技有限公司 固态硬盘及其故障检测装置和方法
CN111048138A (zh) * 2019-12-22 2020-04-21 北京浪潮数据技术有限公司 一种硬盘的故障检测方法及相关装置

Also Published As

Publication number Publication date
CN114020561B (zh) 2024-05-24

Similar Documents

Publication Publication Date Title
CN109558282B (zh) 一种pcie链路检测方法、系统及电子设备和存储介质
US7589624B2 (en) Component unit monitoring system and component unit monitoring method
US8549277B2 (en) Server system including diplexer
CN104704478A (zh) 输入/输出错误遏制事件后的恢复
CN109634813A (zh) 电子装置、云平台异常确认方法及存储介质
CN115314416B (zh) 网卡状态自动检测方法、装置、电子设备及存储介质
CN112328442A (zh) 一种散热器检测方法、装置及计算机可读存储介质
CN115543872A (zh) 一种设备管理方法、装置及计算机存储介质
CN114020561B (zh) 故障上报方法、系统、装置、计算机设备及存储介质
CN102549510B (zh) 用于检查操作系统的实时特性的方法
CN111880945B (zh) 共享设备信息处理方法、系统、装置、计算机和存储介质
US10291582B2 (en) System and method of supporting more than 256 sensors by intelligent platform management interface (IPMI) based server management controller
CN115865634B (zh) 功能模块的控制方法及装置、服务器
US11797368B2 (en) Attributing errors to input/output peripheral drivers
CN117251769B (zh) 基于监控组件的异常数据识别方法、装置、设备及介质
CN109992510B (zh) 一种远程调试装置及方法
CN118132310A (zh) 异常检测方法及电子设备
CN114171108A (zh) 一种检测系统、方法及电子设备
CN107451035B (zh) 用于计算机装置的错误状态数据提供方法
CN113848497A (zh) 电池性能测试方法、装置、计算机设备以及存储介质
KR20040026934A (ko) 교환기의 장애 처리 방법 및 장치
CN115865634A (zh) 功能模块的控制方法及装置、服务器
TWI602054B (zh) 用於電腦裝置的錯誤狀態資料提供方法
CN114356061A (zh) 电源故障检测方法、装置、系统以及检测设备
KR100497893B1 (ko) 교환기의 장애 처리 방법 및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant