WO2017125014A1 - 硬盘监控方法及装置 - Google Patents

硬盘监控方法及装置 Download PDF

Info

Publication number
WO2017125014A1
WO2017125014A1 PCT/CN2017/071523 CN2017071523W WO2017125014A1 WO 2017125014 A1 WO2017125014 A1 WO 2017125014A1 CN 2017071523 W CN2017071523 W CN 2017071523W WO 2017125014 A1 WO2017125014 A1 WO 2017125014A1
Authority
WO
WIPO (PCT)
Prior art keywords
parameter
hard disk
abnormal
disk
alarm information
Prior art date
Application number
PCT/CN2017/071523
Other languages
English (en)
French (fr)
Inventor
崔向武
陈海树
刘上国
Original Assignee
中兴通讯股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 中兴通讯股份有限公司 filed Critical 中兴通讯股份有限公司
Publication of WO2017125014A1 publication Critical patent/WO2017125014A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring

Definitions

  • the present disclosure relates to the field of information storage technologies, for example, to a hard disk monitoring method and apparatus.
  • a hard disk is an indispensable storage device of a server system. If the hard disk is damaged, data cannot be read and written normally, which affects server reliability.
  • Real-time monitoring of hard disk parameters and health status, timely detection of faulty disks and isolation is an effective way to prevent business damage.
  • the system running on the server can be a Linux system and a Windows system.
  • the storage module can be composed of a physical disk, a logical disk, and a controller. Different types of device parameters are different, and most of the monitoring tools are only for a single type of a single system, and the hard disk occurs. The faults only have alarms, and it is impossible to distinguish the types of faults, and it is not possible to take different countermeasures according to different types of faults.
  • the present disclosure provides a hard disk monitoring method and device, which can solve the problem that the monitoring of the hard disk is directed to a single type of the single system, and only the alarm prompts for the failure of the hard disk, the type of the fault cannot be distinguished, and different faults cannot be adopted according to different types of faults.
  • a method for monitoring a hard disk comprising: acquiring an operating state parameter in a hard disk; determining whether an abnormal parameter exists in the operating state parameter; and determining a category of the abnormal parameter when determining that the running state parameter has an abnormal parameter, And generating alarm information corresponding to the category.
  • obtaining an operating state parameter in the hard disk including: acquiring a configured scanning period;
  • the running status parameter in the hard disk includes at least one of the following parameters: physical disk parameters, logical disk parameters, and controller parameters in the hard disk.
  • Determining whether the abnormality parameter exists in the running state parameter comprises: respectively comparing the obtained running state parameter with a preset running state parameter to obtain a comparison result; and determining the running state parameter according to the comparison result Whether there are abnormal parameters in the middle.
  • determining the abnormal parameter when it is determined that an abnormal parameter exists in the running state parameter, determining the abnormal parameter And generating the alarm information corresponding to the category, including: generating physical disk abnormality alarm information when determining that the physical disk parameter is abnormal; and generating logical disk abnormality alarm information when determining that the logical disk parameter is abnormal;
  • the controller abnormality alarm information is generated; and the alarm information is presented through the display interface and the abnormal operating state parameter exists.
  • the method further includes: retrieving the set management interface, and adding the running state parameter to the management interface; and displaying the management interface.
  • a hard disk monitoring device includes: an obtaining module configured to acquire an operating state parameter in a hard disk;
  • a determining module configured to determine whether an abnormal parameter exists in the operating state parameter
  • a processing module configured to determine a category of the abnormal parameter when the abnormal parameter exists in the operating state parameter, and generate a corresponding category Alarm information.
  • the acquiring module is configured to retrieve a configured scan period, and periodically scan physical disk parameters and/or logical disk parameters and/or controller parameters in the hard disk according to the scan period.
  • the obtaining module is configured to obtain at least one of the following parameters: a physical disk parameter, a logical disk parameter, and a controller parameter in the hard disk.
  • the determining module is configured to compare the obtained running state parameter with the preset running state parameter to obtain a comparison result, and determine, according to the comparison result, whether the abnormal parameter exists in the operating state parameter.
  • the processing module is configured to: when it is determined that the physical disk parameter has an abnormality, generate physical disk abnormality alarm information; when it is determined that the logical disk parameter has an abnormality, generate logical disk abnormality alarm information; when determining that the controller parameter exists When the abnormality occurs, the controller abnormality alarm information is generated; the alarm information and the abnormal running state parameter are presented through the display interface.
  • a hard disk monitoring device including one or more processors, a memory, and One or more programs, the one or more programs being stored in a memory, when executed by one or more processors, performing any of the methods of hard disk monitoring described above.
  • a computer program product comprising a computer program stored on a non-transitory computer readable storage medium, the computer program comprising program instructions that, when executed by a computer, cause the computer to execute Any of the above methods for monitoring a hard disk.
  • the hard disk monitoring device in the embodiment can generate the alarm information corresponding to the category according to the category of the abnormal parameter, so that only the alarm prompt for the fault that occurs on the hard disk can be solved, and the fault type cannot be distinguished, and different types can be implemented.
  • the abnormal parameters are used to perform different alarms to improve the accuracy of hard disk fault detection.
  • FIG. 1 is a flowchart of a method for monitoring a hard disk in the embodiment
  • FIG. 2 is a schematic structural diagram of a hard disk monitoring device according to the embodiment.
  • FIG. 3 is a schematic structural diagram of hardware of a hard disk monitoring device according to an embodiment of the present invention.
  • the present embodiment provides a method and an apparatus for monitoring a hard disk.
  • the technical solutions of the present disclosure are described in detail below through the accompanying drawings and the optional embodiments. It should be understood that the technical features in the embodiments and the embodiments are only for the technical solutions. Explain, not limit. The technical features in this embodiment and the embodiments can be combined with each other without conflict.
  • FIG. 1 is a flowchart of a method for monitoring a hard disk in the embodiment, where the method includes S110-S130.
  • the hard disk may be composed of three parts: a physical disk, a logical disk, and a controller.
  • the physical disk parameters may include: physical disk temperature, size, capacity, model, physical location, hard disk coding, and health status; logical disk parameters may include: capacity, name, health status, raid reconstruction progress, and cache cache status;
  • the parameters may include: model number, firmware version number, Oprom version number, cache size, temperature, Battery Backup Unit (BBU) in-position information, BBU temperature, and BBU voltage.
  • BBU Battery Backup Unit
  • the hard disk monitoring device may set a scanning period, and when the hard disk monitoring device detects the operating state parameter of the hard disk, the hard disk monitoring device retrieves the configured scanning period, according to the scanning. Periodically, periodically scan physical disk parameters and/or logical disk parameters and/or controller parameters in the hard disk. This periodic scanning method can not only ensure the data collection efficiency, but also reduce the power consumption of the hard disk monitoring device to a certain extent.
  • the hard disk monitoring device acquires operating state parameters of the hard disk, and the operating state parameters may include one or more of the foregoing physical disk parameters and/or logical disk parameters and/or controller parameters.
  • the hard disk monitoring device compares the obtained one or more operating state parameters with the preset hard disk parameters, that is, compares each obtained physical disk parameter with a corresponding preset physical disk parameter; Each logical disk parameter is compared with a corresponding preset logical disk parameter; each obtained controller parameter is compared with a corresponding preset controller parameter.
  • the hard disk monitoring device may obtain one or more comparison results, and based on the one or more comparison results, determine whether an abnormal parameter exists in the physical disk parameter and/or the logical disk parameter and/or the controller parameter.
  • the processing mode of the logical disk and the controller is consistent with the processing mode of the physical disk to determine whether there are abnormal parameters in the logical disk parameters and whether there are abnormal parameters in the controller.
  • the category of the abnormal parameter may be determined.
  • the hard disk monitoring device may determine that the physical hard disk parameter is abnormal, and the hard disk monitoring device may generate the physical hard disk abnormal alarm information;
  • the hard disk monitoring device may determine that the logical disk parameter is abnormal. At this time, the hard disk monitoring device may generate logical disk abnormality alarm information.
  • the hard disk monitoring device may determine that the controller is abnormal, and the hard disk monitoring device may generate the controller abnormality alarm information.
  • the hard disk monitoring device can generate the alarm information corresponding to the category according to the category of the abnormal parameter, and can solve the problem that the hard disk monitoring device only targets a single type of the single system, and can also ensure the alarm corresponding to the abnormal parameter category.
  • the information accurately reflects the abnormal device, so that the user can know and handle the problem in time.
  • the user can view the running status parameter and the abnormal alarm information in time, and after the hard disk monitoring device monitors the running status parameter and the abnormal alarm information, the hard disk monitoring device can display the detected running status parameter and the abnormal alarm information. The device is displayed.
  • the hard disk monitoring device determines the faulty device that generates the abnormal parameter and generates a control signal to send the control signal to the executing device, wherein the control signal can be used to instruct the executing device to repair the faulty device.
  • the hard disk monitoring device detects that the temperature of the physical hard disk is abnormal. For example, when the temperature of the physical hard disk is higher than the normal temperature, the hard disk monitoring device may generate a control signal for controlling the fan to increase the rotational speed, and send the control signal to the fan. After receiving the control signal, the fan will increase the speed, so that the temperature of the physical hard disk can be lowered until the temperature of the physical hard disk returns to the normal temperature.
  • This method can not only detect the fault of the hard disk, but also automatically control the corresponding fault based on the fault. The device eliminates the fault and improves the stability of the hard disk operation.
  • the BMC can obtain the operating state parameters of the hard disk, and then add the operating state parameters to the management.
  • the management interface is presented to the user, and the user can learn and manage the running status of the hard disk through the management interface.
  • the present embodiment further provides a hard disk monitoring device.
  • a schematic structural diagram of a hard disk monitoring device in the embodiment may be included.
  • the device may include:
  • the obtaining module 210 is configured to acquire an operating state parameter in the hard disk.
  • the processing module 230 is configured to determine a category of the abnormal parameter when determining an abnormal parameter in the operating state parameter, and generate alarm information corresponding to the category.
  • the obtaining module 210 may be configured to retrieve a configured scan period, and periodically scan physical disk parameters and/or logical disk parameters and/or controller parameters in the hard disk according to the scan period.
  • the obtaining module 220 may be configured to obtain at least one of the following parameters: a physical disk parameter, a logical disk parameter, and a controller parameter in the hard disk.
  • the determining module 230 may be configured to compare the acquired running state parameter with the preset running state parameter to obtain a comparison result, and determine, according to the comparison result, whether the abnormal parameter exists in the operating state parameter.
  • the processing module 230 may be configured to: when it is determined that the physical disk parameter has an abnormality, generate physical disk abnormality alarm information; when it is determined that the logical disk parameter has an abnormality, generate logical disk abnormality alarm information; when determining the control When there is an abnormality in the parameter of the device, the controller abnormality alarm information is generated; the alarm information is presented through the display interface, and the abnormal operating state parameter is present.
  • the processing module 230 is further configured to determine a faulty device that generates an abnormal parameter, and generate a control signal, where the control signal is used to instruct the executing device to repair the faulty device; send the control signal To the execution device.
  • FIG. 3 is a schematic diagram showing the hardware structure of a hard disk monitoring device according to the embodiment.
  • the hard disk monitoring device includes: a processor 310 and a memory 320; and a communication interface 330. And bus 340.
  • the processor 310, the memory 320, and the communication interface 330 can complete communication with each other through the bus 340. Communication interface 330 can be used for information transmission.
  • the processor 310 can invoke logic instructions in the memory 320 to perform any of the methods of hard disk monitoring of the above embodiments.
  • the logic instructions in the memory 320 described above may be implemented in the form of a software functional unit and sold or used as a stand-alone product, and may be stored in a computer readable storage medium.
  • the technical solution of the present disclosure may be embodied in the form of a software product stored in a storage medium, including a plurality of instructions for causing a computer device (which may be a personal computer, a server, or a network) The device or the like) performs all or part of the steps of the method described in the embodiments of the present disclosure.
  • the program when executed, may include a flow of an embodiment of the method described above, wherein the computer readable storage medium may be a magnetic disk, an optical disk, a read only memory (ROM), or a random access memory. (RAM), etc.
  • the computer readable storage medium may be a magnetic disk, an optical disk, a read only memory (ROM), or a random access memory. (RAM), etc.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

一种硬盘监控方法及装置,该方法包括:获取硬盘中的运行状态参数,判定运行状态参数中是否存在异常参数,当判定该运行状态参数中存在异常参数时,确定该异常参数的类别,并生成与该类别对应的告警信息,硬盘监控装置可以确定异常参数的类别,生成与该类别对应的告警信息。

Description

硬盘监控方法及装置 技术领域
本公开涉及信息存储技术领域,例如涉及一种硬盘监控方法及装置。
背景技术
硬盘是服务器系统不可缺少的存储设备,硬盘损坏会导致数据无法正常读写,影响服务器可靠性。
对硬盘参数和健康状态进行实时监控,及时发现故障盘并隔离是一种防止业务受损的有效方法。当服务器所支持的硬盘数量越来越多时,在满足服务器日益增长的数据存储空间同时,使得监控硬盘在线状态的工作变得越来越繁琐。服务器上运行的系统可以为Linux系统和Windows系统,存储模块可以由物理盘、逻辑盘和控制器组成,不同类型设备参数有差异,而监控工具多数只针对单一系统的单一类型,且对硬盘发生的故障只有告警提示,无法区分故障类型,也无法根据不同类型的故障采取不同的应对措施。
发明内容
本公开提供一种硬盘监控方法及装置,可以解决对硬盘的监控知针对单一系统的单一类型,且对硬盘发生的故障只有告警提示,无法区别故障类型,也无法根据不同类型的故障采取不同的应对措施的问题。
一种硬盘监控的方法,包括:获取硬盘中的运行状态参数;判定所述运行状态参数中是否存在异常参数;以及当判定所述运行状态参数存在异常参数时,确定所述异常参数的类别,并生成与所述类别对应的告警信息。
可选的,获取硬盘中的运行状态参数,包括:调取配置的扫描周期;以及
根据所述扫描周期,周期性扫描所述硬盘中的运行状态参数。
可选的,硬盘中的运行状态参数,包括以下参数中的至少一种:硬盘中的物理盘参数、逻辑盘参数和控制器参数。
所述判定所述运行状态参数中是否存在异常参数,包括:分别将获取的运行状态参数与预设的运行状态参数进行比较,得到比较结果;以及根据所述比较结果,确定所述运行状态参数中是否存在异常参数。
可选的,当判定所述运行状态参数中存在异常参数时,确定所述异常参数 的类别,并生成与所述类别对应的告警信息,包括:当确定物理盘参数存在异常时,则生成物理盘异常告警信息;当确定逻辑盘参数存在异常时,则生成逻辑盘异常告警信息;当确定控制器参数存在异常时,则生成控制器异常告警信息;以及通过显示界面呈现告警信息以及存在异常的运行状态参数。
可选的,当判定所述运行状态参数中存在异常参数时,确定所述异常参数的类别,并生成所述类别对应的告警信息之后,所述方法还包括:确定产生异常参数的故障装置,并生成控制信号,其中,所述控制信号用于指示执行装置修复所述故障装置;以及将所述控制信号发送至所述执行装置。
可选的,获取硬盘中的运行状态参数之后,所述方法还包括:调取设定的管理界面,并将所述运行状态参数添加到所述管理界面中;以及显示所述管理界面。
一种硬盘监控装置,包括:获取模块,设置为获取硬盘中的运行状态参数;
判定模块,设置为判定所述运行状态参数中是否存在异常参数;以及处理模块,设置为当所述运行状态参数中存在异常参数时,确定所述异常参数的类别,并生成所述类别对应的告警信息。
可选的,所述获取模块设置为调取配置的扫描周期;根据所述扫描周期,周期性扫描所述硬盘中的物理盘参数和/或逻辑盘参数和/或控制器参数。
可选的,所述获取模块设置为获取以下参数中的至少一种:硬盘中的物理盘参数、逻辑盘参数和控制器参数。
所述判定模块设置为分别将获取的运行状态参数与预设的运行状态参数进行比较,得到比较结果;根据所述比较结果,确定所述运行状态参数中是否存在异常参数。
可选的,所述处理模块设置为当确定物理盘参数存在异常时,则生成物理盘异常告警信息;当确定逻辑盘参数存在异常时,则生成逻辑盘异常告警信息;当确定控制器参数存在异常时,则生成控制器异常告警信息;通过显示界面呈现所述告警信息以及存在异常的运行状态参数。
可选的,所述处理模块还设置为在确定所述异常参数的类别后,确定产生异常参数的故障装置,并生成控制信号,其中,所述控制信号用于指示执行装置修复所述故障装置;将所述控制信号发送至所述执行装置。
一种非暂态计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述任意一种硬盘监控的方法。
一种硬盘监控装置,该硬盘监控装置包括一个或多个处理器、存储器以及 一个或多个程序,所述一个或多个程序存储在存储器中,当被一个或多个处理器执行时,执行上述任意一种硬盘监控的方法。
一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行上述任意一种硬盘监控的方法。
本实施例中的硬盘监控装置可以根据异常参数的类别,生成与该类别对应的告警信息,从而可以解决对硬盘发生的故障只有告警提示,不能区别故障类型的问题,此外还可以实现对不同类别的异常参数进行不同的告警,提升硬盘故障检测的准确性。
附图说明
图1为本实施例中一种硬盘监控方法的流程图;
图2为本实施例中一种硬盘监控装置的结构示意图;以及
图3为本实施例中一种硬盘监控装置的硬件结构示意图。
具体实施方式
本实施例提供了一种硬盘监控的方法及装置,下面通过附图以及可选实施例对本公开技术方案做详细的说明,应当理解,本实施例以及实施例中的技术特征只是对技术方案的说明,而不是限定。在不冲突的情况下,本实施例以及实施例中的技术特征可以相互组合。
如图1所示为本实施例中一种硬盘监控方法的流程图,该方法包括S110-S130。
在S110中,获取硬盘中的运行状态参数。
可选地,硬盘可以由物理盘、逻辑盘、控制器三个部分组成。其中,物理盘的参数可以包括:物理盘温度、尺寸、容量、型号、物理位置、硬盘编码和健康状态;逻辑盘参数可以包括:容量、名称、健康状态、raid重建进度和缓存cache状态;控制器参数可以包括:型号、固件版本号、Oprom版本号、缓存大小、温度、电池备份单元(Battery Backup Unit,BBU)在位信息、BBU温度和BBU电压等。
在硬盘运行时,硬盘监控装置获取硬盘的运行状态参数可以是指获取上述一种或多种参数。例如,硬盘监控装置可以在物理盘、逻辑盘和控制器的至少一个中获取某一种或多种参数。示例性地,硬盘可以只从逻辑盘中获取一种或 多种参数;也可以从物理盘中获取一种或多种参数的同时,从逻辑盘中获取一种或多种参数;或者还可以获取物理盘、逻辑盘和控制器中的全部参数。
可选地,为了保证实时获取硬盘的运行状态参数,硬盘监控装置可以设置一个扫描周期,在硬盘监控装置检测硬盘的运行状态参数时,该硬盘监控装置调取出配置的扫描周期,根据该扫描周期,周期性的扫描硬盘中的物理盘参数和/或逻辑盘参数和/或控制器参数。这种周期性的扫描方式不仅可以保证数据的采集效率,并且还可以在一定程度上降低硬盘监控装置的功耗。
在S120中,判定运行状态参数中是否存在异常参数。
在S110中,硬盘监控装置获取到硬盘的运行状态参数,这些运行状态参数中可以包含上述物理盘参数和/或逻辑盘参数和/或控制器参数中的一种或多种参数。
硬盘监控装置将获取到的一种或多种运行状态参数分别与预设的硬盘参数进行比较,即:将获取的每一种物理盘参数与对应的预设物理盘参数进行比较;将获取的每一种逻辑盘参数与对应的预设逻辑盘参数进行比较;将获取的每一种控制器参数与对应的预设控制器参数进行比较。
在上述的比较之后,硬盘监控装置可以得到一个或多个比较结果,根据该一个或多个比较结果,确定物理盘参数和/或逻辑盘参数和/或控制器参数中是否存在异常参数。
示例性地,硬盘监控装置获取到物理盘中的运行状态参数,例如,获取一下各项参数:物理盘温度、尺寸、容量、型号、物理位置、硬盘编码和健康状态。硬盘监控装置将物理盘温度与预设温度进行比较,将容量与预设容量进行比较等,根据比较可以得到物理盘温度的比较结果和容量的比较结果等,从而确定物理盘参数中是否存在异常参数。例如,当获取的物理盘温度高于预设温度时,则比较结果表示物理盘温度出现异常。
同理,逻辑盘以及控制器的处理方式与物理盘的处理方式一致,以分别确定逻辑盘参数中是否存在异常参数,以及控制器中是否存在异常参数。
在S130中,当判定获取的运行状态参数中存在异常参数时,确定该异常参数的类别,并生成与该类别对应的告警信息。
可选地,在S120中确定获取的运行状态参数中存在异常参数时,可以确定该异常参数的类别。
当该异常参数为物理盘的温度异常时,则硬盘监控装置可以确定物理硬盘参数异常,此时该硬盘监控装置可以生成物理硬盘异常告警信息;
当该异常参数为逻辑盘降低异常时,则硬盘监控装置可以确定逻辑盘参数异常,此时该硬盘监控装置可以生成逻辑盘异常告警信息;
当该异常参数为控制器的BBU温度参数异常时,则硬盘监控装置可以确定控制器异常,此时该硬盘监控装置可以生成控制器异常告警信息。
在上述的实施例中,硬盘监控装置可以根据异常参数的类别,生成与该类别对应的告警信息,可以解决硬盘监控装置只针对单一系统单一类型的问题,还可以保证与异常参数类别对应的告警信息准确地反应出现异常的装置,从而方便用户及时的获知以及处理故障问题。
可选地,为了方便用户可以及时查看到硬盘运行状态参数以及异常告警信息,在硬盘监控装置监测到运行状态参数以及异常告警信息之后,硬盘监控装置可以将检测运行状态参数以及异常告警信息通过显示装置进行显示。
可选地,硬盘监控装置在确定产生异常参数的故障装置,并生成控制信号,将控制信号发送至执行装置,其中,控制信号可用于指示执行装置修复故障装置。
示例性地,硬盘监控装置检测到物理硬盘的温度异常,例如物理硬盘的温度高于正常温度时,硬盘监控装置可以生成用于控制风扇提高转速的控制信号,并且将该控制信号发送至风扇,风扇在接收到控制信号之后将提高转速,从而可以降低物理硬盘的温度,直至物理硬盘的温度恢复到正常温度,通过该方法不仅可以检测硬盘出现的故障,并且还可以基于故障来自动的控制对应的装置来的消除故障,提升了硬盘运行的稳定性。
另外,对于Linux系统和windows系统而言,通过安装不同的监控程序与基板管理控制器(Baseboard Management Controller,BMC)通讯,从而BMC就可以得到硬盘的运行状态参数,然后将运行状态参数添加到管理界面中,并将管理界面呈现给用户,用户可以通过该管理界面来获知以及管理硬盘的运行状态。
对应本实施例中一种硬盘监控的方法,本实施例还提供了一种硬盘监控装置,如图2所示为本实施例中一种硬盘监控装置的结构示意图,该装置可以包括:
获取模块210,设置为获取硬盘中的运行状态参数。
判定模块220,设置为判定所述运行状态参数中是否存在异常参数。
处理模块230,设置为当判定运行状态参数中存在异常参数时,确定该异常参数的类别,并生成与该类别对应的告警信息。
可选地,所述获取模块210,可以设置为调取配置的扫描周期;根据所述扫描周期,周期性扫描所述硬盘中的物理盘参数和/或逻辑盘参数和/或控制器参数。
可选地,所述获取模块220,可以设置为获取以下参数中的至少一种:硬盘中的物理盘参数、逻辑盘参数和控制器参数。
所述判定模块230,可以设置为分别将获取的运行状态参数与预设的运行状态参数进行比较,得到比较结果;根据该比较结果,确定所述运行状态参数中是否存在异常参数。
可选地,所述处理模块230,可以设置为当确定物理盘参数存在异常时,则生成物理盘异常告警信息;当确定逻辑盘参数存在异常时,则生成逻辑盘异常告警信息;当确定控制器参数存在异常时,则生成控制器异常告警信息;通过显示界面呈现告警信息以及存在异常的运行状态参数。
可选地,所述处理模块230,还可以设置为确定产生异常参数的故障装置,并生成控制信号,其中,所述控制信号用于指示执行装置修复所述故障装置;将所述控制信号发送至所述执行装置。
本实施例还提供一种非暂态计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行上述任意一种硬盘监控的方法。
如图3所示为本实施例提供的一种硬盘监控装置的硬件结构示意图,该硬盘监控装置包括:处理器(processor)310和存储器(memory)320;还可以包括通信接口(Communications Interface)330和总线340。
其中,处理器310、存储器320和通信接口330可以通过总线340完成相互间的通信。通信接口330可以用于信息传输。处理器310可以调用存储器320中的逻辑指令,以执行上述实施例的任意一种硬盘监控的方法。
此外,上述的存储器320中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开实施例所述方法的全部或部分步骤。而前述的存储介质可以是非暂态存储介质,包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质,也可以是暂态存储介质。
最后需要说明的是,本领域普通技术人员可理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来执行相关的硬件来完成的,该程序可存储于一个非暂态计算机可读存储介质中,该程序在执行时,可包括如上述方法的实施例的流程,其中,该计算机可读存储介质可以为磁碟、光盘、只读存储记忆体(ROM)或随机存储记忆体(RAM)等。
工业实用性
本公开提供了一种硬盘监控方法和装置,可以解决硬盘发生的故障只有告警提示,不能区别故障类型的问题,可以实现对不同类别的异常参数进行不同的告警,提升硬盘故障检测的准确性。

Claims (12)

  1. 一种硬盘监控方法,包括:
    获取硬盘中的运行状态参数;
    判定所述运行状态参数中是否存在异常参数;以及
    当判定所述运行状态参数中存在异常参数时,确定所述异常参数的类别,并生成与所述类别对应的告警信息。
  2. 如权利要求1所述的方法,其中,获取硬盘中的运行状态参数,包括:
    调取配置的扫描周期;以及
    根据所述扫描周期,周期性扫描所述硬盘中的运行状态参数。
  3. 如权利要求1所述的方法,其中,硬盘中的运行状态参数,包括以下参数中的至少一种:硬盘中的物理盘参数、逻辑盘参数和控制器参数;
    所述判定所述运行状态参数中是否存在异常参数,包括:
    分别将获取的运行状态参数与预设的运行状态参数进行比较,得到比较结果;
    根据所述比较结果,确定所述运行状态参数中是否存在异常参数。
  4. 如权利要求3所述的方法,其中,当判定所述运行状态参数中存在异常参数时,确定所述异常参数的类别,并生成与所述类别对应的告警信息,包括:
    当确定物理盘参数存在异常时,则生成物理盘异常告警信息;
    当确定逻辑盘参数存在异常时,则生成逻辑盘异常告警信息;
    当确定控制器参数存在异常时,则生成控制器异常告警信息;以及
    通过显示界面呈现所述告警信息以及存在异常的运行状态参数。
  5. 如权利要求1所述的方法,当判定所述运行状态参数中存在异常参数时,确定所述异常参数的类别,并生成与所述类别对应的告警信息之后,还包括:
    确定产生异常参数的故障装置,并生成控制信号,其中,所述控制信号用于指示执行装置修复所述故障装置;以及
    将所述控制信号发送至所述执行装置。
  6. 如权利要求1所述的方法,获取硬盘中的运行状态参数之后,还包括:
    调取设定的管理界面,并将所述运行状态参数添加到所述管理界面中;以及
    显示所述管理界面。
  7. 一种硬盘监控装置,包括:
    获取模块,设置为获取硬盘中的运行状态参数;
    判定模块,设置为判定所述运行状态参数中是否存在异常参数;以及
    处理模块,设置为当判定所述运行状态参数中存在异常参数时,确定所述异常参数的类别,并生成与所述类别对应的告警信息。
  8. 如权利要求7所述的装置,其中,所述获取模块设置为调取配置的扫描周期;根据所述扫描周期,周期性扫描所述硬盘中的物理盘参数和/或逻辑盘参数和/或控制器参数。
  9. 如权利要求7所述的装置,其中,所述获取模块设置为获取以下参数中的至少一种:硬盘中的物理盘参数、逻辑盘参数和控制器参数;
    所述判定模块,设置为分别将获取的运行状态参数与预设的运行状态参数进行比较,得到比较结果;根据所述比较结果,确定所述运行状态参数中是否存在异常参数。
  10. 如权利要求9所述的装置,其中,所述处理模块设置为当确定物理盘参数存在异常时,则生成物理盘异常告警信息;当确定逻辑盘参数存在异常时,则生成逻辑盘异常告警信息;当确定控制器参数存在异常时,则生成控制器异常告警信息;通过显示界面呈现所述告警信息以及存在异常的运行状态参数。
  11. 如权利要求7所述的装置,其中,所述处理模块还设置为在确定所述异常参数的类别后,确定产生异常参数的故障装置,并生成控制信号,其中,所述控制信号用于指示执行装置修复所述故障装置;以及将所述控制信号发送至所述执行装置。
  12. 一种非暂态计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1-6任一项所述的硬盘监控方法。
PCT/CN2017/071523 2016-01-18 2017-01-18 硬盘监控方法及装置 WO2017125014A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201610031497.2A CN106980562A (zh) 2016-01-18 2016-01-18 一种硬盘监控方法及装置
CN201610031497.2 2016-01-18

Publications (1)

Publication Number Publication Date
WO2017125014A1 true WO2017125014A1 (zh) 2017-07-27

Family

ID=59341165

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2017/071523 WO2017125014A1 (zh) 2016-01-18 2017-01-18 硬盘监控方法及装置

Country Status (2)

Country Link
CN (1) CN106980562A (zh)
WO (1) WO2017125014A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109918257A (zh) * 2017-12-12 2019-06-21 杭州海康威视数字技术股份有限公司 一种硬盘异常处理方法和装置
CN110908964A (zh) * 2019-10-18 2020-03-24 平安科技(深圳)有限公司 分布式文件系统的监控方法、装置、终端及存储介质
CN111274098A (zh) * 2018-12-05 2020-06-12 杭州海康威视数字技术股份有限公司 一种基于IoT的存储设备报警方法及装置
CN111880992A (zh) * 2020-07-24 2020-11-03 北京浪潮数据技术有限公司 一种存储设备中控制器状态的监测及维护方法
CN112131071A (zh) * 2017-09-18 2020-12-25 华为技术有限公司 一种内存评估的方法及装置
CN112346932A (zh) * 2020-11-05 2021-02-09 中国建设银行股份有限公司 隐性坏盘的定位方法、装置、电子设备及计算机存储介质
CN113590406A (zh) * 2021-08-16 2021-11-02 湖南博匠信息科技有限公司 一种基于电变量进行固态硬盘故障检测的方法及系统
CN113901530A (zh) * 2021-09-10 2022-01-07 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质
CN114251296A (zh) * 2021-12-08 2022-03-29 凌云光技术股份有限公司 一种对光源内部风扇进行故障监控的设备及方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110471832B (zh) * 2019-06-25 2024-05-07 平安科技(深圳)有限公司 程序运行的处理方法、装置及计算机可读存储介质
CN111274103A (zh) * 2020-02-26 2020-06-12 深圳忆联信息系统有限公司 自动判断硬盘健康状态的方法、装置、设备及介质
CN111966377A (zh) * 2020-08-17 2020-11-20 深圳忆联信息系统有限公司 基于图形界面设置硬盘固件参数的方法、装置、计算机设备及存储介质
CN114281611B (zh) * 2021-11-12 2023-11-03 苏州浪潮智能科技有限公司 一种全面检测系统盘的方法、系统、设备和存储介质
CN114970546A (zh) * 2022-05-30 2022-08-30 北京声智科技有限公司 信息输出方法、装置及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901181A (zh) * 2010-02-09 2010-12-01 浪潮(北京)电子信息产业有限公司 硬盘状态监测方法和系统
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法
CN102981939A (zh) * 2012-11-07 2013-03-20 曙光信息产业股份有限公司 磁盘监控方法
CN104866411A (zh) * 2015-06-08 2015-08-26 北京奇虎科技有限公司 固态硬盘的监测及分析方法及装置
CN105183600A (zh) * 2015-09-09 2015-12-23 浪潮电子信息产业股份有限公司 一种远程定位硬盘故障的装置和方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7206721B1 (en) * 2005-12-12 2007-04-17 Taiwan Semiconductor Manufacturing Co., Ltd. Methods and systems of offline measurement for process tool monitoring
CN101887387A (zh) * 2010-04-07 2010-11-17 山东高效能服务器和存储研究院 一种远程智能监控与分析raid故障的方法
CN102510344B (zh) * 2011-11-23 2014-11-05 华为技术有限公司 机柜服务器系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901181A (zh) * 2010-02-09 2010-12-01 浪潮(北京)电子信息产业有限公司 硬盘状态监测方法和系统
CN102279775A (zh) * 2011-08-19 2011-12-14 西安交通大学 一种Linux系统下的硬盘故障处理方法
CN102981939A (zh) * 2012-11-07 2013-03-20 曙光信息产业股份有限公司 磁盘监控方法
CN104866411A (zh) * 2015-06-08 2015-08-26 北京奇虎科技有限公司 固态硬盘的监测及分析方法及装置
CN105183600A (zh) * 2015-09-09 2015-12-23 浪潮电子信息产业股份有限公司 一种远程定位硬盘故障的装置和方法

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112131071B (zh) * 2017-09-18 2024-05-17 华为技术有限公司 一种内存评估的方法及装置
CN112131071A (zh) * 2017-09-18 2020-12-25 华为技术有限公司 一种内存评估的方法及装置
CN109918257A (zh) * 2017-12-12 2019-06-21 杭州海康威视数字技术股份有限公司 一种硬盘异常处理方法和装置
CN109918257B (zh) * 2017-12-12 2022-11-04 杭州海康威视数字技术股份有限公司 一种硬盘异常处理方法和装置
CN111274098A (zh) * 2018-12-05 2020-06-12 杭州海康威视数字技术股份有限公司 一种基于IoT的存储设备报警方法及装置
CN111274098B (zh) * 2018-12-05 2023-10-10 杭州海康威视数字技术股份有限公司 一种基于IoT的存储设备报警方法及装置
CN110908964A (zh) * 2019-10-18 2020-03-24 平安科技(深圳)有限公司 分布式文件系统的监控方法、装置、终端及存储介质
CN110908964B (zh) * 2019-10-18 2023-08-18 平安科技(深圳)有限公司 分布式文件系统的监控方法、装置、终端及存储介质
CN111880992B (zh) * 2020-07-24 2022-06-10 北京浪潮数据技术有限公司 一种存储设备中控制器状态的监测及维护方法
CN111880992A (zh) * 2020-07-24 2020-11-03 北京浪潮数据技术有限公司 一种存储设备中控制器状态的监测及维护方法
CN112346932A (zh) * 2020-11-05 2021-02-09 中国建设银行股份有限公司 隐性坏盘的定位方法、装置、电子设备及计算机存储介质
CN113590406A (zh) * 2021-08-16 2021-11-02 湖南博匠信息科技有限公司 一种基于电变量进行固态硬盘故障检测的方法及系统
CN113901530A (zh) * 2021-09-10 2022-01-07 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质
CN113901530B (zh) * 2021-09-10 2024-01-09 苏州浪潮智能科技有限公司 一种硬盘防御性预警保护的方法、装置、设备及可读介质
CN114251296A (zh) * 2021-12-08 2022-03-29 凌云光技术股份有限公司 一种对光源内部风扇进行故障监控的设备及方法

Also Published As

Publication number Publication date
CN106980562A (zh) 2017-07-25

Similar Documents

Publication Publication Date Title
WO2017125014A1 (zh) 硬盘监控方法及装置
US10147048B2 (en) Storage device lifetime monitoring system and storage device lifetime monitoring method thereof
US11055169B2 (en) Forecasting workload transaction response time
US8824261B1 (en) Peer to peer vibration mitigation
TWI450103B (zh) 伺服器之遠端管理系統及方法,及其電腦程式產品
US20170131991A1 (en) System and method for unified firmware managment
US9927853B2 (en) System and method for predicting and mitigating corrosion in an information handling system
US20130283099A1 (en) System and method for tesing stability of server
EP3627323A1 (en) Automatic diagnostic mode
CN112732477B (zh) 一种带外自检故障隔离的方法
US9703937B2 (en) Method to prevent operating system digital product key activation failures
CN112882796A (zh) 异常根因分析方法和装置,及存储介质
US10275330B2 (en) Computer readable non-transitory recording medium storing pseudo failure generation program, generation method, and generation apparatus
US20200033928A1 (en) Method of periodically recording for events
TW201828071A (zh) 開關裝置及偵測積體電路匯流排之方法
CN105404581A (zh) 一种数据库的评测方法和装置
US20120154158A1 (en) Computing device and alarm method of the computing device
JP5918661B2 (ja) 設備診断装置および設定変更督促方法
CN108899059B (zh) 一种固态硬盘的检测方法和设备
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
CN116225812A (zh) 基板管理控制器系统运行方法、装置、设备及存储介质
US20210334153A1 (en) Remote error detection method adapted for a remote computer device to detect errors that occur in a service computer device
CN115080132A (zh) 信息处理方法、装置、服务器及存储介质
TW201516423A (zh) 伺服器開機時間測試方法及系統
JP2013206046A (ja) 情報処理装置、起動時診断方法、及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 17741045

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 17741045

Country of ref document: EP

Kind code of ref document: A1