CN115098343A - 一种自动硬盘发现故障并自处理的机柜装置和方法 - Google Patents

一种自动硬盘发现故障并自处理的机柜装置和方法 Download PDF

Info

Publication number
CN115098343A
CN115098343A CN202210911364.XA CN202210911364A CN115098343A CN 115098343 A CN115098343 A CN 115098343A CN 202210911364 A CN202210911364 A CN 202210911364A CN 115098343 A CN115098343 A CN 115098343A
Authority
CN
China
Prior art keywords
hard disk
fault
cabinet
hard
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210911364.XA
Other languages
English (en)
Inventor
魏文华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202210911364.XA priority Critical patent/CN115098343A/zh
Publication of CN115098343A publication Critical patent/CN115098343A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3055Monitoring arrangements for monitoring the status of the computing system or of the computing system component, e.g. monitoring if the computing system is on, off, available, not available
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/325Display of status information by lamps or LED's
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明涉及机柜维护技术领域,具体涉及自动硬盘发现故障并自处理的机柜装置、方法、计算机设备及存储介质。该机柜装置机柜,内部安装有硬盘;监控系统,用于对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出;机械臂系统,获得硬盘状态信号,对故障硬盘进行定位,将硬盘拆下,并存放;并抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。本发明中BMC告警系统实时监控硬盘状态,当硬盘出现故障时,将硬盘状态信号发送给机柜的机械臂系统,机械臂系统获取到故障硬盘的位置,然后进行故障盘定位‑故障盘拔出‑故障盘存放‑抓取新盘‑新盘更换的操作。通过该技术可以实现自动更换故障硬盘,省时省力。

Description

一种自动硬盘发现故障并自处理的机柜装置和方法
技术领域
本发明涉及机柜维护技术领域,尤其涉及一种自动硬盘发现故障并自处理的机柜装置和方法,具体涉及一种自动硬盘发现故障并自处理的机柜装置、方法、计算机设备及存储介质。
背景技术
服务器是计算机的一种,它比普通计算机运行更快、负载更高、价格更贵。服务器在网络中为其它客户机(如PC机、智能手机、ATM等终端甚至是火车系统等大型设备)提供计算或者应用服务。服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。
服务器的应用领域越来越广泛,服务器的信息存储要求增大,硬盘数量越来越多,目前服务器已经支持热插拔,硬盘出现故障后需要人工将硬盘拔出更换新的硬盘。随着故障盘越来越多,时间和人工成功日益增多。
发明内容
为了解决上述现有技术中存在的技术问题,本发明提供了一种自动硬盘发现故障并自处理的机柜装置、方法、计算机设备及存储介质,当硬盘出现故障时,将硬盘状态信号发送给机柜的机械臂系统,机械臂系统获取到故障硬盘的位置,然后进行故障盘定位-故障盘拔出-故障盘存放-抓取新盘-新盘更换的操作。
为实现上述目的,本发明实施例提供了如下的技术方案:
第一方面,在本发明提供的一个实施例中,提供了自动硬盘发现故障并自处理的装置,该装置包括:机柜、监控系统和机械臂系统;
所述机柜,内部安装有硬盘;
所述监控系统,用于对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出;
所述机械臂系统,用于获得所述硬盘状态信号后,对故障硬盘进行定位,将硬盘拆下,并存放;并抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
作为本发明的进一步方案,所述机械臂系统通过x,y,z三维位置数据操作硬盘。
作为本发明的进一步方案,所述监控系统为BMC告警系统。
作为本发明的进一步方案,所述BMC告警系统,用于获取硬盘的位置和状态信息,所述BMC告警系统通过SNMP协议将硬盘状态信号发送给机械臂系统。
作为本发明的进一步方案,所述机柜上设置有用于分别放置备用硬盘和故障硬盘的两个存放装置中,两个所述存放装置设置在机柜的顶部。
作为本发明的进一步方案,所述存放装置,被配置为实时对备用硬盘数量和故障硬盘数量进行监控,并将硬盘数量和故障硬盘数量数据传递监控系统。
作为本发明的进一步方案,所述机械臂系统的机械爪位置设置有用于辅助监控的摄像头,通过设置摄像头对硬盘状态灯识别进行辅助定位。
第二方面,在本发明提供的又一个实施例中,提供了自动硬盘发现故障并自处理的方法,该方法包括以下步骤:
对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出;
获得所述硬盘状态信号,对故障硬盘进行定位,将故障硬盘拆下,并存放;
抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
第三方面,在本发明提供的又一个实施例中,提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器加载并执行所述计算机程序时实现自动硬盘发现故障并自处理的方法的步骤。
第四方面,在本发明提供的再一个实施例中,提供了一种存储介质,存储有计算机程序,所述计算机程序被处理器加载并执行时实现所述自动硬盘发现故障并自处理的方法的步骤。
本发明提供的技术方案,具有如下有益效果:
本发明提供的自动硬盘发现故障并自处理的机柜装置、方法、计算机设备及存储介质,本发明中BMC告警系统实时监控硬盘状态,当硬盘出现故障时,将硬盘状态信号发送给机柜的机械臂系统,机械臂系统获取到故障硬盘的位置,然后进行故障盘定位-故障盘拔出-故障盘存放-抓取新盘-新盘更换的操作。通过该技术可以实现自动更换故障硬盘,省时省力。大大提高了维护效率,减少了维护成本。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
图1为本发明一个实施例的自动硬盘发现故障并自处理的方法的流程图。
图2为本发明一个实施例的自动硬盘发现故障并自处理的机柜装置中结构框图。
图3为本发明一个实施例的自动硬盘发现故障并自处理的机柜装置的处理流程图。
图中:100-机柜、200-监控系统、300-机械臂系统。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
由于服务器的信息存储要求增大,硬盘数量越来越多,目前服务器已经支持热插拔,硬盘出现故障后需要人工将硬盘拔出更换新的硬盘。随着故障盘越来越多,时间和人工成功日益增多。
本发明当硬盘出现故障时,将硬盘状态信号发送给机柜的机械臂系统,机械臂系统获取到故障硬盘的位置,然后进行故障盘定位-故障盘拔出-故障盘存放-抓取新盘-新盘更换的操作。进而达到自动更换服务器故障盘的问题。
具体地,下面结合附图,对本发明实施例作进一步阐述。
请参阅图1,图1是本发明实施例提供的一种自动硬盘发现故障并自处理的方法的流程图,如图1所示,该自动硬盘发现故障并自处理的方法包括步骤S10至步骤S30。
S10、对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出。
在本发明的实施例中,所述硬盘状态信号包括硬盘的位置和状态信息。
在本发明的实施例中,所述硬盘状态信号可以通过SNMP协议进行信息传递。
在本发明的实施例中,所述对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出,包括以下步骤:
步骤一、对机柜中的每个硬盘槽进行坐标定位;
硬盘设置在硬盘槽中。
步骤二、基于坐标定位,获取发生故障的硬盘状态信号,所述硬盘状态信号中含有硬盘的坐标定位;
步骤三、将硬盘状态信号发出。
S20、获得所述硬盘状态信号,对故障硬盘进行定位,将故障硬盘拆下,并存放。
在本发明的实施例中,所述对故障硬盘进行定位,可以根据硬盘坐标定位对故障硬盘进行准确的定位。
在本发明的实施例中,所述获得所述硬盘状态信号,对故障硬盘进行定位,将硬盘拆下,并存放,还包括对故障硬盘进行验证定位。
具体的,拆故障硬盘时,通过识别硬盘状态灯显示状态,对硬盘定位进行辅助识别,进而辅助识别是否准确的找到需要更换的故障硬盘。
在本发明的实施例中,通过硬盘状态信号,对故障硬盘进行定位,定位完成后,通过对硬盘状态灯的显示状态进行识别,辅助验证硬盘是否为故障硬盘。
在本发明的实施例中,所述对硬盘状态灯的显示状态进行识别,可以通过摄像头对硬盘状态灯的显示状态进行识别。
在本发明的实施例中,在本发明的实施例中,通过摄像头对故障硬盘的硬盘灯进行识别判断。设置摄像头,进而能够对发出的故障信号进行比对判断,若发出的故障信号不准确,则需要及时进行维护,排除故障。
S30、抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
在本发明的实施例中,本发明还包括,对存放的故障硬盘数量和备用硬盘数量进行监控,及时的将故障硬盘数量和备用硬盘数量达到预警范围的信号发出。如此便于对故障硬盘进行清理和备用硬盘进行补充。如此进而能够及时的对硬盘进行补充。
具体的,通过提前将故障硬盘数量的存放量录入,然后对故障硬盘数量进行监控,当存放的故障硬盘数量达到预设值,即可发出报警信号。同理提前将备用硬盘数量的存放量录入,然后对备用硬盘数量进行监控,当存放的备用硬盘数量达到预设值,即可发出报警信号。如此进而能够准确的对存放的故障硬盘数量和备用硬盘数量进行监控,便于对存放的故障硬盘进行清理和及时对备用硬盘进行补充。
本发明通过实时的对硬盘状态进行监控,当硬盘出现故障时,准确的找到硬盘的位置,然后将硬盘拔出、故障盘存放、抓取新盘和新盘更换的操作,进而达到自动更换服务器故障盘的问题。
应该理解的是,上述虽然是按照某一顺序描述的,但是这些步骤并不是必然按照上述顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,本实施例的一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,参见图2所示,在本发明的实施例中还提供了自动硬盘发现故障并自处理的装置,该装置包括机柜100、监控系统200和机械臂系统300。
所述机柜100,为服务器机柜,内部安装有硬盘。
所述监控系统200,用于对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出。
在本发明的实施例中,所述监控系统可以为BMC告警系统,其可以实时的监控硬盘的状态。
在本发明的实施例中,所述BMC告警系统可以获取硬盘的位置和状态信息,如果硬盘出现故障可以通过SNMP协议将硬盘状态信号发送给机械臂系统300。
所述机械臂系统300,获得所述硬盘状态信号,对故障硬盘进行定位,将硬盘拆下,并存放;并抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
在本发明的实施例中,所述机械臂系统300可以通过x,y,z三维位置数据操作硬盘。
在本发明的实施例中,为了能够便于对机械臂系统300进行定位,因此机械臂系统300的座盘相对于机柜100固定,所述机械臂系统300可以固定安装在机柜100上。
在本发明的实施例中,所述机柜100上设置有用于分别放置备用硬盘和故障硬盘的两个存放装置中,两个存放装置可以设置在机柜100的顶部。
在本发明的实施例中,所述机械臂系统300在操作中过程中将故障硬盘取下后,放到对应的存放装置中,然后将从另一个存放装置中抓取正常的硬盘插入至被替换下来的硬盘槽中。
在本发明的实施例中,所述存放装置,被配置为实时对备用硬盘数量和故障硬盘数量进行监控,并将硬盘数量和故障硬盘数量数据传递监控系统200,方便备用硬盘耗尽时,人工替换。
具体的,所述插取式存放装置类似共享充电宝装置,其为现有技术。
在本发明的实施例中,为了能够便于机械臂系统300对硬盘进行定位,因此将机柜100的三维数据部署在机械臂系统300中,如此便于准确的对硬盘进行定位。
在本发明的实施例中,所述机械臂系统300的机械爪位置设置有摄像头,用于辅助监控,通过设置摄像头对硬盘状态灯识别进行辅助定位。
在本发明的实施例中,具体的,通过摄像头对故障硬盘的硬盘灯进行识别判断。通过设置摄像头,进而能够对监控系统200发出的故障信号进行比对判断,若监控系统200发出的故障信号不准确,则需要对监控系统200和机械臂系统300及时进行维护,排除系统故障。
在本发明的实施例中,所述机柜100安装在机械臂系统300上的辅助定位线条上,监控系统200安装设定的尺寸和卡槽进行排放。
具体的,所述机柜100的两边的安装位置设置有位置卡扣,机柜100放置在卡扣位置,固定机柜100的位置。
所述机柜100前置硬盘面板用于固定硬盘宽度,且硬盘热插拔框架上安装定位灯。如此设置进而便于机械臂系统300上的摄像头辅助定位硬盘位置。
示例性的,请参阅图3,图3提供一个实施例的自动硬盘发现故障并自处理的机柜装置的具体处理流程图,如图3所示,本发明中BMC告警系统实时监控硬盘状态,当硬盘出现故障时,将硬盘状态信号发送给机柜的机械臂系统,机械臂系统获取到故障硬盘的位置,然后进行故障盘定位-故障盘拔出-故障盘存放-抓取新盘-新盘更换的操作,进而达到自动更换服务器故障盘的问题。通过该技术可以实现自动更换故障硬盘,省时省力。大大提高了维护效率,减少了维护成本。
在一个实施例中,在本发明的实施例中还提供了一种计算机设备,包括至少一个处理器,以及与所述至少一个处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行所述的自动硬盘发现故障并自处理的方法,该处理器执行指令时实现上述方法实施例中的步骤:
S10、对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出。
在本发明的实施例中,所述硬盘状态信号包括硬盘的位置和状态信息。
在本发明的实施例中,所述硬盘状态信号可以通过SNMP协议进行信息传递。
在本发明的实施例中,所述对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出,包括以下步骤:
步骤一、对机柜中的每个硬盘槽进行坐标定位;
硬盘设置在硬盘槽中。
步骤二、基于坐标定位,获取发生故障的硬盘状态信号,所述硬盘状态信号中含有硬盘的坐标定位;
步骤三、将硬盘状态信号发出。
S20、获得所述硬盘状态信号,对故障硬盘进行定位,将故障硬盘拆下,并存放。
在本发明的实施例中,所述对故障硬盘进行定位,可以根据硬盘坐标定位对故障硬盘进行准确的定位。
在本发明的实施例中,所述获得所述硬盘状态信号,对故障硬盘进行定位,将硬盘拆下,并存放,还包括对故障硬盘进行验证定位。
具体的,拆故障硬盘时,通过识别硬盘状态灯显示状态,对硬盘定位进行辅助识别,进而辅助识别是否准确的找到需要更换的故障硬盘。
在本发明的实施例中,通过硬盘状态信号,对故障硬盘进行定位,定位完成后,通过对硬盘状态灯的显示状态进行识别,辅助验证硬盘是否为故障硬盘。
在本发明的实施例中,所述对硬盘状态灯的显示状态进行识别,可以通过摄像头对硬盘状态灯的显示状态进行识别。
在本发明的实施例中,在本发明的实施例中,通过摄像头对故障硬盘的硬盘灯进行识别判断。设置摄像头,进而能够对发出的故障信号进行比对判断,若发出的故障信号不准确,则需要及时进行维护,排除故障。
S30、抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
在本发明的实施例中,本发明还包括,对存放的故障硬盘数量和备用硬盘数量进行监控,及时的将故障硬盘数量和备用硬盘数量达到预警范围的信号发出。如此便于对故障硬盘进行清理和备用硬盘进行补充。如此进而能够及时的对硬盘进行补充。
具体的,通过提前将故障硬盘数量的存放量录入,然后对故障硬盘数量进行监控,当存放的故障硬盘数量达到预设值,即可发出报警信号。同理提前将备用硬盘数量的存放量录入,然后对备用硬盘数量进行监控,当存放的备用硬盘数量达到预设值,即可发出报警信号。如此进而能够准确的对存放的故障硬盘数量和备用硬盘数量进行监控,便于对存放的故障硬盘进行清理和及时对备用硬盘进行补充。
本发明通过实时的对硬盘状态进行监控,当硬盘出现故障时,准确的找到硬盘的位置,然后将硬盘拔出、故障盘存放、抓取新盘和新盘更换的操作,进而达到自动更换服务器故障盘的问题。通过该技术可以实现自动更换故障硬盘,省时省力。大大提高了维护效率,减少了维护成本。
所述计算机设备包括用户设备与网络设备。其中,所述用户设备包括但不限于电脑、智能手机、PDA等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
还应当进理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本发明的一个实施例中还提供了一种存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法实施例中的步骤:
S10、对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出。
在本发明的实施例中,所述硬盘状态信号包括硬盘的位置和状态信息。
在本发明的实施例中,所述硬盘状态信号可以通过SNMP协议进行信息传递。
在本发明的实施例中,所述对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出,包括以下步骤:
步骤一、对机柜中的每个硬盘槽进行坐标定位;
硬盘设置在硬盘槽中。
步骤二、基于坐标定位,获取发生故障的硬盘状态信号,所述硬盘状态信号中含有硬盘的坐标定位;
步骤三、将硬盘状态信号发出。
S20、获得所述硬盘状态信号,对故障硬盘进行定位,将故障硬盘拆下,并存放。
在本发明的实施例中,所述对故障硬盘进行定位,可以根据硬盘坐标定位对故障硬盘进行准确的定位。
在本发明的实施例中,所述获得所述硬盘状态信号,对故障硬盘进行定位,将硬盘拆下,并存放,还包括对故障硬盘进行验证定位。
具体的,拆故障硬盘时,通过识别硬盘状态灯显示状态,对硬盘定位进行辅助识别,进而辅助识别是否准确的找到需要更换的故障硬盘。
在本发明的实施例中,通过硬盘状态信号,对故障硬盘进行定位,定位完成后,通过对硬盘状态灯的显示状态进行识别,辅助验证硬盘是否为故障硬盘。
在本发明的实施例中,所述对硬盘状态灯的显示状态进行识别,可以通过摄像头对硬盘状态灯的显示状态进行识别。
在本发明的实施例中,在本发明的实施例中,通过摄像头对故障硬盘的硬盘灯进行识别判断。设置摄像头,进而能够对发出的故障信号进行比对判断,若发出的故障信号不准确,则需要及时进行维护,排除故障。
S30、抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
在本发明的实施例中,本发明还包括,对存放的故障硬盘数量和备用硬盘数量进行监控,及时的将故障硬盘数量和备用硬盘数量达到预警范围的信号发出。如此便于对故障硬盘进行清理和备用硬盘进行补充。如此进而能够及时的对硬盘进行补充。
具体的,通过提前将故障硬盘数量的存放量录入,然后对故障硬盘数量进行监控,当存放的故障硬盘数量达到预设值,即可发出报警信号。同理提前将备用硬盘数量的存放量录入,然后对备用硬盘数量进行监控,当存放的备用硬盘数量达到预设值,即可发出报警信号。如此进而能够准确的对存放的故障硬盘数量和备用硬盘数量进行监控,便于对存放的故障硬盘进行清理和及时对备用硬盘进行补充。
本发明通过实时的对硬盘状态进行监控,当硬盘出现故障时,准确的找到硬盘的位置,然后将硬盘拔出、故障盘存放、抓取新盘和新盘更换的操作,进而达到自动更换服务器故障盘的问题。通过该技术可以实现自动更换故障硬盘,省时省力。大大提高了维护效率,减少了维护成本。
在本发明的实施例中,本发明还包括,对存放的故障硬盘数量和备用硬盘数量进行监控,及时的将故障硬盘数量和备用硬盘数量达到预警范围的信号发出。如此便于对故障硬盘进行清理和备用硬盘进行补充。如此进而能够及时的对硬盘进行补充。
具体的,通过提前将故障硬盘数量的存放量录入,然后对故障硬盘数量进行监控,当存放的故障硬盘数量达到预设值,即可发出报警信号。同理提前将备用硬盘数量的存放量录入,然后对备用硬盘数量进行监控,当存放的备用硬盘数量达到预设值,即可发出报警信号。如此进而能够准确的对存放的故障硬盘数量和备用硬盘数量进行监控,便于对存放的故障硬盘进行清理和及时对备用硬盘进行补充。
本发明通过实时的对硬盘状态进行监控,当硬盘出现故障时,准确的找到硬盘的位置,然后将硬盘拔出、故障盘存放、抓取新盘和新盘更换的操作,进而达到自动更换服务器故障盘的问题。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述方法的实施例的流程。其中,本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
以上是本发明公开的示例性实施例,但是应当注意,在不背离权利要求限定的本发明实施例公开的范围的前提下,可以进行多种改变和修改。根据这里描述的公开实施例的方法权利要求的功能、步骤和/或动作不需以任何特定顺序执行。此外,尽管本发明实施例公开的元素可以以个体形式描述或要求,但除非明确限制为单数,也可以理解为多个。
应当理解的是,在本文中使用的,除非上下文清楚地支持例外情况,单数形式“一个”旨在也包括复数形式。还应当理解的是,在本文中使用的“和/或”是指包括一个或者一个以上相关联地列出的项目的任意和所有可能组合。上述本发明实施例公开实施例序号仅仅为了描述,不代表实施例的优劣。
所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本发明实施例公开的范围(包括权利要求)被限于这些例子;在本发明实施例的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,并存在如上的本发明实施例的不同方面的许多其它变化,为了简明它们没有在细节中提供。因此,凡在本发明实施例的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明实施例的保护范围之内。

Claims (10)

1.一种自动硬盘发现故障并自处理的机柜装置,其特征在于,该机柜装置包括:包括机柜、监控系统和机械臂系统;
所述机柜,内部安装有硬盘;
所述监控系统,用于对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出;
所述机械臂系统,用于获得所述硬盘状态信号后,对故障硬盘进行定位,将硬盘拆下并存放;
抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
2.如权利要求1所述的自动硬盘发现故障并自处理的机柜装置,其特征在于,所述机械臂系统通过x,y,z三维位置数据操作硬盘。
3.如权利要求1所述的自动硬盘发现故障并自处理的机柜装置,其特征在于,所述监控系统为BMC告警系统。
4.如权利要求3所述的自动硬盘发现故障并自处理的机柜装置,其特征在于,所述BMC告警系统,用于获取硬盘的位置和状态信息,所述BMC告警系统通过SNMP协议将硬盘状态信号发送给机械臂系统。
5.如权利要求1所述的自动硬盘发现故障并自处理的机柜装置,其特征在于,所述机柜上设置有用于分别放置备用硬盘和故障硬盘的两个存放装置中,两个所述存放装置设置在机柜的顶部。
6.如权利要求5所述的自动硬盘发现故障并自处理的机柜装置,其特征在于,所述存放装置,被配置为实时对备用硬盘数量和故障硬盘数量进行监控,并将硬盘数量和故障硬盘数量数据传递监控系统。
7.如权利要求1-6任一所述的自动硬盘发现故障并自处理的机柜装置,其特征在于,所述机械臂系统的机械爪位置设置有用于辅助监控的摄像头,所述摄像头对硬盘状态灯识别进行辅助定位。
8.一种自动硬盘发现故障并自处理的方法,其特征在于,该方法包括:
对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出;
获得所述硬盘状态信号,对故障硬盘进行定位,将故障硬盘拆下,并存放;
抓取备用硬盘,将备用硬盘插入至拔出的故障硬盘卡槽中。
9.如权利要求8所述的自动硬盘发现故障并自处理的方法,其特征在于,所述对机柜中的硬盘故障进行监控,并将发生故障的硬盘状态信号及时发出,包括以下步骤:
对机柜中的每个硬盘槽进行坐标定位;
基于坐标定位,获取发生故障的硬盘状态信号,所述硬盘状态信号中含有硬盘的坐标定位;
将硬盘状态信号发出。
10.如权利要求8所述的自动硬盘发现故障并自处理的方法,其特征在于,所述获得所述硬盘状态信号,对故障硬盘进行定位,将硬盘拆下,并存放;还包括对故障硬盘进行验证定位;
所述对故障硬盘进行验证定位,包括通过识别硬盘状态灯显示状态,对硬盘定位进行辅助识别。
CN202210911364.XA 2022-07-30 2022-07-30 一种自动硬盘发现故障并自处理的机柜装置和方法 Pending CN115098343A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210911364.XA CN115098343A (zh) 2022-07-30 2022-07-30 一种自动硬盘发现故障并自处理的机柜装置和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210911364.XA CN115098343A (zh) 2022-07-30 2022-07-30 一种自动硬盘发现故障并自处理的机柜装置和方法

Publications (1)

Publication Number Publication Date
CN115098343A true CN115098343A (zh) 2022-09-23

Family

ID=83300651

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210911364.XA Pending CN115098343A (zh) 2022-07-30 2022-07-30 一种自动硬盘发现故障并自处理的机柜装置和方法

Country Status (1)

Country Link
CN (1) CN115098343A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116968028A (zh) * 2023-08-10 2023-10-31 上海合芯数字科技有限公司 一种存储介质故障更换控制方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359016A (zh) * 2018-09-27 2019-02-19 郑州云海信息技术有限公司 一种硬盘告警方法与装置
CN212497739U (zh) * 2020-09-14 2021-02-09 中国工商银行股份有限公司 服务器硬盘自动更换机器人

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109359016A (zh) * 2018-09-27 2019-02-19 郑州云海信息技术有限公司 一种硬盘告警方法与装置
CN212497739U (zh) * 2020-09-14 2021-02-09 中国工商银行股份有限公司 服务器硬盘自动更换机器人

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116968028A (zh) * 2023-08-10 2023-10-31 上海合芯数字科技有限公司 一种存储介质故障更换控制方法及系统

Similar Documents

Publication Publication Date Title
CN106789306B (zh) 通信设备软件故障检测收集恢复方法和系统
CN102355368B (zh) 一种网络设备的故障处理方法及系统
CN106603265A (zh) 管理方法、服务控制器装置以及非暂态计算机可读介质
CN107547273B (zh) 一种电力系统虚拟实例高可用的保障方法及系统
CN112529223A (zh) 一种设备故障报修方法、装置、服务器及储存介质
CN104268061A (zh) 一种适用于虚拟机的存储状态监控机制
CN106502814B (zh) 一种记录pcie设备错误信息的方法及装置
CN115098343A (zh) 一种自动硬盘发现故障并自处理的机柜装置和方法
CN111817921A (zh) 移动测试设备、测试方法、装置、系统及组网方法
CN114281788A (zh) 一种bmc固件数据提取方法、装置、终端及存储介质
CN112671586B (zh) 一种业务配置自动迁移和保障方法及装置
CN105849699B (zh) 控制数据中心架构设备的方法
CN110008084A (zh) 一种独立日志信息记录方法、系统、装置及存储介质
WO2024008130A1 (zh) 故障硬件处理方法、装置和系统
CN115102838B (zh) 服务器宕机风险的应急处理方法和装置、电子设备
CN110138628A (zh) 一种摄像机网络故障实时诊断与恢复方法、装置及摄像机
CN107888438B (zh) 一种基于流表技术的自动感知并适应云环境变化的系统
CN115373916A (zh) 异常检测方法、装置、电子设备及计算机可读存储介质
CN114661507A (zh) 基于时间关联数据的数据处理方法、装置和电子设备
CN114064401A (zh) 定位硬盘故障的方法、装置、电子设备及存储介质
CN114448935A (zh) 一种ip地址可用性告警自动推送处理方法及装置
CN111831511A (zh) 一种云服务的业务主机的检测处理方法、装置及介质
CN107046479A (zh) 一种网络设备的验证状态的方法及装置
CN112000442A (zh) 一种基于kubernetes平台的集群状态自动获取方法及装置
JP2007052756A (ja) ワイヤレスデバイスの不具合診断に適用する学習型診断データベース

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination