CN111858239B - 一种服务器硬盘监测方法、装置、设备及介质 - Google Patents

一种服务器硬盘监测方法、装置、设备及介质 Download PDF

Info

Publication number
CN111858239B
CN111858239B CN202010614617.8A CN202010614617A CN111858239B CN 111858239 B CN111858239 B CN 111858239B CN 202010614617 A CN202010614617 A CN 202010614617A CN 111858239 B CN111858239 B CN 111858239B
Authority
CN
China
Prior art keywords
hard disk
information
cpld
reading
error
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010614617.8A
Other languages
English (en)
Other versions
CN111858239A (zh
Inventor
张国奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Inspur Electronic Information Industry Co Ltd
Original Assignee
Inspur Electronic Information Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Inspur Electronic Information Industry Co Ltd filed Critical Inspur Electronic Information Industry Co Ltd
Priority to CN202010614617.8A priority Critical patent/CN111858239B/zh
Publication of CN111858239A publication Critical patent/CN111858239A/zh
Application granted granted Critical
Publication of CN111858239B publication Critical patent/CN111858239B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3037Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a memory, e.g. virtual memory, cache
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Abstract

本申请公开了一种服务器硬盘监测方法、装置、设备及计算机可读存储介质,方法应用于BMC,包括:在DC上电且BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息;若信息中存在错误信息,判断DC相邻两次上电间隔或相邻两次下电间隔是否小于或等于阈值;若是,拒绝将错误信息记录在错误日志中,待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息;判断再次读取到的信息中是否存在与错误信息相同的信息,若是,将与错误信息相同的信息记录在错误日志中。本申请公开的上述技术方案,通过双校验避免因硬盘背板CPLD未完成初始化而对硬盘监测产生影响,从而提高硬件监测的准确性。

Description

一种服务器硬盘监测方法、装置、设备及介质
技术领域
本申请涉及服务器测试技术领域,更具体地说,涉及一种服务器硬盘监测方法、装置、设备及计算机可读存储介质。
背景技术
近年来,得益于互联网数据与云计算等互联网基础设施建设加速,中国服务器市场增速显著高于全球,一方面是由于国内服务器企业技术突破,进口代替加速,同时国产的服务器厂商在全球服务器市场上的占有率显著上升。
目前,服务器在插入前置hdd(Hard Disk Drive,硬盘驱动器)硬盘与后置硬盘,OS(Operating System,操作系统)下跑DC(Direct Current,直流电)开关机压力脚本,以进行DC极限开关机测试(即持续进行开关机测试)时,硬盘背板CPLD(Complex ProgrammableLogic Device,复杂可编程逻辑器件)会读取硬盘的信息,且BMC(Baseboard ManagementController,基板管理控制器)会从硬盘背板CPLD获取信息,根据信息对硬盘进行监测。但是,由于BMC的初始化要比硬盘背板CPLD的初始化快,因此,BMC在从硬盘背板CPLD获取信息时硬盘背板CPLD可能还未完成初始化操作,这就导致硬盘背板CPLD提供的信息不是有效数据,而BMC在接收到非有效的数据时会认为硬盘在监测时出现错误而将这些非有效的数据记录在错误日志中。
综上所述,如何提高硬盘在服务器进行DC极限开关机测试时的监测准确性,是目前本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本申请的目的是提供一种服务器硬盘监测方法、装置、设备及计算机可读存储介质,用于提高硬盘在服务器进行DC极限开关机测试时的监测准确性。
为了实现上述目的,本申请提供如下技术方案:
一种服务器硬盘监测方法,应用于BMC,包括:
在DC上电且所述BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息;
判断所述信息中是否存在错误信息,若存在,则判断所述DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;
若小于或等于所述阈值,则拒绝将所述错误信息记录在错误日志中,并待所述硬盘背板CPLD完成初始化后,再次从所述硬盘背板CPLD中读取所述硬盘的信息;
判断再次读取到的所述信息中是否存在与所述错误信息相同的信息,若存在,则将与所述错误信息相同的信息记录在错误日志中。
优选的,在从硬盘背板CPLD中读取硬盘的信息之前,还包括:
预先进行连续多次的DC上下电测试,获取所述硬盘背板CPLD在每次测试时的初始化时长,并获取所述BMC在每次测试的初始化时长;
根据所述硬盘背板CPLD在多次测试中的初始化时长最大值与所述BMC在多次测试中的初始化时长最小值之差设定读取时间间隔;其中,所述硬盘背板CPLD在多次测试中的初始化时长最大值与所述BMC在多次测试中的初始化时长最小值之差位于一个所述读取时间间隔和两个所述读取时间间隔范围内;
相应地,从硬盘背板CPLD中读取硬盘的信息,包括:
等待所述读取时间间隔后从所述硬盘背板CPLD中读取硬盘的信息;
待所述硬盘背板CPLD完成初始化后,再次从所述硬盘背板CPLD中读取所述硬盘的信息,包括:
待第一次从所述硬盘背板CPLD中读取硬盘的信息后,等待所述读取时间间隔后再次从所述硬盘背板CPLD中读取所述硬盘的信息。
优选的,若确定再次读取到的所述信息中不存在与所述错误信息相同的信息,则还包括:
返回执行所述等待所述读取时间间隔后再次从所述硬盘背板CPLD中读取所述硬盘的信息的步骤。
优选的,若确定所述DC相邻两次的上电间隔或相邻两次的下电间隔大于所述阈值,则还包括:
将所述错误信息记录在所述错误日志中。
优选的,还包括:
当所述DC下电时,删除所述错误日志中记录的信息。
优选的,在将与所述错误信息相同的信息记录在错误日志中之后,还包括:
对所述错误日志进行显示和/或根据所述错误日志发出告警。
优选的,根据所述错误日志发出告警,包括:
根据所述错误日志通过短信通知、邮件通知、语音通知、蜂鸣通知中的任意一种或任意多种的组合发出告警。
一种服务器硬盘监测装置,应用于BMC,包括:
第一读取模块,用于在DC上电且所述BMC完成初始化后,间隔预设时间长度从硬盘背板CPLD中读取硬盘的信息;
判断模块,用于判断所述信息中是否存在错误信息,若存在,则判断所述DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;
第二读取模块,用于若小于或等于所述阈值,则拒绝将所述错误信息记录在错误日志中,并待所述硬盘背板CPLD完成初始化后,再次从所述硬盘背板CPLD中读取所述硬盘的信息;
记录模块,用于判断再次读取到的所述信息中是否存在与所述错误信息相同的信息,若存在,则将与所述错误信息相同的信息记录在错误日志中。
一种服务器硬盘监测设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如上述任一项所述的服务器硬盘监测方法的步骤。
一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一项所述的服务器硬盘监测方法的步骤。
本申请提供了一种服务器硬盘监测方法、装置、设备及计算机可读存储介质,其中,该方法应用于BMC,包括:在DC上电且BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息;判断信息中是否存在错误信息,若存在,则判断DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;若小于或等于阈值,则拒绝将错误信息记录在错误日志中,并待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息;判断再次读取到的信息中是否存在与错误信息相同的信息,若存在,则将与错误信息相同的信息记录在错误日志中。
本申请公开的上述技术方案,在BMC完成初始化后,先从硬盘背板CPLD中读取硬盘的信息,若确定信息中存在错误信息且在通过DC相邻两次上电间隔或相邻两次下电间隔与阈值的关系而确定是在进行DC极限开关机测试时,为了防止BMC接收到非有效数据而记录在错误日志中,可以拒绝将错误信息记录在错误日志中,并可以待硬盘背板CPLD完成初始化后再次读取硬盘的信息,若确定再次读取到的信息中存在与错误信息相同的信息,则确定硬盘在DC极限开关机测试中的确出现错误,此时,可以将与错误信息相同的信息记录在错误日志中,以避免硬盘背板CPLD未完成初始化而对硬盘在DC极限开关机测试时的监测造成影响,从而便于提高硬盘在DC极限开关机测试时的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种应用于BMC的服务器硬盘监测方法的流程图;
图2为本申请实施例提供的一种应用于BMC的服务器硬盘监测装置的结构示意图;
图3为本申请实施例提供的一种服务器硬盘监测设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1,其示出了本申请实施例提供的一种应用于BMC的服务器硬盘监测方法的流程图,本申请实施例提供的一种服务器硬盘监测方法,应用于BMC,可以包括:
S11:在DC上电且BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息。
考虑到目前在进行DC极限开关机测试时,可能会因硬盘背板CPLD未完全初始化而提供非有效数据,从而出现硬盘误监测的问题,为此,本申请提供一种服务器硬盘监测方法,用于提高硬盘在服务器进行DC极限开关机测试时的监测准确性:
具体地,在DC上电且在BMC完成初始化之后,BMC可以先从硬盘背板CPLD中读取硬盘背板CPLD所获取的硬盘的信息。
S12:判断信息中是否存在错误信息,若存在,则判断DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;若是,则执行步骤S13;
在执行完步骤S11之后,BMC可以判断读取到的信息中是否存在错误信息,其中,这里提及的错误信息具体为HDD Hot Plug(硬盘热插拔)和HDD Error Event(硬盘错误事件),具体地,可以根据信息中有无异常信息而对信息进行分类(具体分为异常信息和正常信息),若有异常信息,则根据异常信息中有无错误信息而对异常信息进行分类,从而得到分类结果,然后,判断分类结果中是否存在错误信息,或者可以直接根据信息中有无错误信息而对而信息进行分类,以得到分类结果,然后,根据分类结果判断是否存在错误信息,若确定不存在错误信息,则可以执行从硬盘背板CPLD中读取硬盘的信息的步骤,以对硬盘进行持续的监测。
若确定存在错误信息,此时,则可以获取DC相邻两次上电的时间间隔(即为上电间隔),并可以获取DC相邻两次下电的时间间隔(即下电间隔),且可以判断DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值,若DC相邻两次的上电间隔小于或等于阈值,或者若DC相邻两次的下电间隔小于或等于阈值,则确定服务器是在进行DC极限开关机测试,此时,可以执行步骤S13。
其中,这里提及的服务器具体可以指国产服务器,也可以指非国产服务器。
S13:拒绝将错误信息记录在错误日志中,并待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息。
在确定服务器是在进行DC极限开关机测试时,为了避免BMC在初始化之后第一次获取到的错误信息是由硬盘背板CPLD未完成初始化而获取非有效信息而引起的,则可以拒绝将错误信息记录在错误日志中,从而便于提高硬盘在服务器进行DC极限开关机测试时的监测准确性。
在拒绝将错误信息记录在错误日志中的同时或之后,可以等待硬盘CPLD进行初始化,待硬盘背板CPLD完全完成初始化之后,可以再次从硬盘背板CPLD中读取硬盘的信息。
S14:判断再次读取到的信息中是否存在与错误信息相同的信息;若是,则执行步骤S15;
S15:将与错误信息相同的信息记录在错误日志中。
在执行完步骤S13之后,可以判断再次读取到的信息中是否存在与第一次确定出的错误信息相同的信息,若否,则返回执行再次从硬盘背板CPLD中读取所述硬盘的信息的步骤,若是,则确定硬盘的确出现错误,此时,则可以将第二次所确定出的且第一次判断得到的错误信息相同的信息记录在错误日志中,以便于通过错误日志确定硬盘在服务器进行DC极限开关机测试时出现问题。
在上述过程中,可以通过BMC初始化后第一次读取信息并进行分类,且在确定错误信息存在时触发判断DC相邻两次的上电间隔或下电间隔是否小于或等于阈值,以确定是否是在对服务器进行DC极限开关机测试的第一次校验以及在硬盘背板CPLD完成初始化后判断再次读取到硬盘的信息中是否存在与第一次得到的错误信息相同的信息的第二次检验(简称为双校验)来避免因硬盘背板CPLD未完成初始化而获取非有效数据,并因非有效数据而导致硬盘监测出现错误的问题,从而可以提高硬件监测的准确性。
本申请公开的上述技术方案,在BMC完成初始化后,先从硬盘背板CPLD中读取硬盘的信息,若确定信息中存在错误信息且在通过DC相邻两次上电间隔或相邻两次下电间隔与阈值的关系而确定是在进行DC极限开关机测试时,为了防止BMC接收到非有效数据而记录在错误日志中,可以拒绝将错误信息记录在错误日志中,并可以待硬盘背板CPLD完成初始化后再次读取硬盘的信息,若确定再次读取到的信息中存在与错误信息相同的信息,则确定硬盘在DC极限开关机测试中的确出现错误,此时,可以将与错误信息相同的信息记录在错误日志中,以避免硬盘背板CPLD未完成初始化而对硬盘在DC极限开关机测试时的监测造成影响,从而便于提高硬盘在DC极限开关机测试时的准确性。
本申请实施例提供的一种服务器硬盘监测方法,在从硬盘背板CPLD中读取硬盘的信息之前,还可以包括:
预先进行连续多次的DC上下电测试,获取硬盘背板CPLD在每次测试时的初始化时长,并获取BMC在每次测试的初始化时长;
根据硬盘背板CPLD在多次测试中的初始化时长最大值与BMC在多次测试中的初始化时长最小值之差设定读取时间间隔;其中,硬盘背板CPLD在多次测试中的初始化时长最大值与BMC在多次测试中的初始化时长最小值之差位于一个读取时间间隔和两个读取时间间隔范围内;
相应地,从硬盘背板CPLD中读取硬盘的信息,可以包括:
等待读取时间间隔后从硬盘背板CPLD中读取硬盘的信息;
待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息,可以包括:
待第一次从硬盘背板CPLD中读取硬盘的信息后,等待读取时间间隔后再次从硬盘背板CPLD中读取硬盘的信息。
在本申请中,在从硬盘背板CPLD中读取硬盘的信息之前,可以预先对服务器进行连续多次的开关机测试,即可以进行连续多次的DC上下电测试,并可以获取硬盘背板CPLD在每次测试时的初始化时长,且同时可以获取BMC在每次测试时的初始化时长,然后,可以从中挑选出硬盘背板CPLD在多次测试中的初始化时长最大值、BMC在多次测试中的初始化时长最小值,并可以根据硬盘背板CPLD在多次测试中的初始化时长最大值及BMC在多次测试中的初始化时长最小值来设定BMC从硬盘背板CPLD中读取硬盘的信息的读取时间间隔,其中,硬盘背板CPLD在多次测试中的初始化时长最大值与BMC在多次测试中的初始化时长最小值之差(简称为初始化时长之差)位于一个读取时间间隔和两个读取时间间隔范围内(包括端点值,即初始化时长之差可以等于一个读取时间间隔或两个读取时间间隔),即所设定的读取时间间隔可以位于初始化时长之差的0.5倍和初始化时长之差的1倍之间(包括端点值),以保证硬盘背板CPLD可以在BMC进行第二次读取时已经完成初始化工作。
相应地,在BMC完成初始化之后,可以先等待一个读取时间间隔,然后,从硬盘背板CPLD中读取硬盘的信息,此时,按照设定的读取时间间隔与初始化时长之差的关系,硬盘背板CPLD并未完成初始化,读取的信息并非为有效的信息。与此同时,步骤S13中的待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息的过程具体可以为:待BMC初始化完成且等待读取时间间隔而第一次从硬盘背板CPLD中读取硬盘的信息后,BMC可以再次等待一个读取时间间隔,即从BMC完成初始化之后,等待两个读取时间间隔才再次从硬盘背板CPLD中读取硬盘的信息,此时,按照上述设定的读取时间间隔与初始化时长之差的关系可知硬盘背板CPLD已经完成了初始化,也即BMC再次从硬盘背板中读取的硬盘的信息即为有效的信息,因此,此信息可以较为准确地反映硬盘的状况,从而便于提高硬盘监测的准确性。
另外,设定读取时间间隔并使BMC间隔读取时间间隔从硬盘背板CPLD读取硬盘的信息的方式可以使BMC无需关注硬盘背板CPLD何时完成初始化,只需关于读取时间间隔即可,而且读取时间间隔的设定给BMC进行信息处理(信息读取、信息分类等)留下了足够的时间,从而便于提高信息处理的性能。
本申请实施例提供的一种服务器硬盘监测方法,若确定分类结果中不存在与错误信息相同的信息,则还可以包括:
返回执行等待读取时间间隔后再次从硬盘背板CPLD中读取硬盘的信息的步骤。
在对第二次读取到的信息进行判断,且确定其中不存在与第一次所确定出的错误信息相同的信息之后,可以返回执行等待读取时间间隔后再次从硬盘背板CPLD中读取硬盘的信息的步骤,即BMC可以等待读取时间间隔,并第三次从硬盘背板CPLD中读取硬盘的信息,且对读取的信息进行判断,此时,若确定第三次读取到的信息中存在错误信息,则将错误信息记录在错误日志中,以便于实现对硬盘的监测。
本申请实施例提供的一种服务器硬盘监测方法,若确定DC相邻两次的上电间隔或相邻两次的下电间隔大于阈值,则还可以包括:
将错误信息记录在错误日志中。
在执行步骤S12时,若确定DC相邻两次的上电间隔或相邻两次的下电间隔大于阈值,则表明服务器此时不是在进行DC极限开关机测试,而是服务器在进行正常的开关机,即在进行正常的使用,此时,BMC在从硬盘背板CPLD读取硬盘的信息时,硬盘背板CPLD已经完成了初始化,因此,则可以直接将对第一次确定出的错误信息记录在错误日志中,以实现对服务器中硬盘的监测。
本申请实施例提供的一种服务器硬盘监测方法,还可以包括:
当DC下电时,删除错误日志中记录的信息。
在对服务器硬盘进行监测时,在每次DC进行下电时,BMC可以删除错误日志中记录的信息,以避免错误日志中记录的信息对后续的硬盘监测造成干扰,从而便于提高硬盘监测的准确性和可靠性。
本申请实施例提供的一种服务器硬盘监测方法,在将与错误信息相同的信息记录在错误日志中之后,还可以包括:
对错误日志进行显示和/或根据错误日志发出告警。
在执行完步骤S15之后,可以对错误日志进行显示,或者可以根据错误日志发出告警,又或者显示和告警可以同时进行,以便于对工作人员起到提示的作用。
本申请实施例提供的一种服务器硬盘监测方法,根据错误日志发出告警,可以包括:
根据错误日志通过短信通知、邮件通知、语音通知、蜂鸣通知中的任意一种或任意多种的组合发出告警。
当对错误日志发出告警时,具体可以根据错误日志而通过短信通知、邮件通知、语音通知、蜂鸣通知中的任意一种或任意多种的组合发出告警,以便于工作人员可以及时或者硬盘出现错误这一问题。
通过上述过程可以有效避免硬盘在热拔插和错误检测时,尤其是在极限操作环境下,服务器出现误报警的现象,从而可以提高工作人员的工作效率。
本申请实施例还提供了一种服务器硬盘监测装置,应用于BMC,参见图2,其示出了本申请实施例提供的一种应用于BMC的服务器硬盘监测装置的结构示意图,可以包括:
第一读取模块21,用于在DC上电且BMC完成初始化后,间隔预设时间长度从硬盘背板CPLD中读取硬盘的信息;
判断模块22,用于判断信息中是否存在错误信息,若存在,则判断DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;
第二读取模块23,用于若小于或等于阈值,则拒绝将错误信息记录在错误日志中,并待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息;
记录模块24,用于判断再次读取到的信息中是否存在与错误信息相同的信息,若存在,则将与错误信息相同的信息记录在错误日志中。
本申请实施例提供的一种服务器硬盘监测装置,还可以包括:
预先测试模块,用于预先进行连续多次的DC上下电测试,获取硬盘背板CPLD在每次测试时的初始化时长,并获取BMC在每次测试的初始化时长;
设定模块,用于根据硬盘背板CPLD在多次测试中的初始化时长最大值与BMC在多次测试中的初始化时长最小值之差设定读取时间间隔;其中,硬盘背板CPLD在多次测试中的初始化时长最大值与BMC在多次测试中的初始化时长最小值之差位于一个读取时间间隔和两个读取时间间隔范围内;
相应地,第一读取模块21可以包括:
第一读取单元,用于等待读取时间间隔后从硬盘背板CPLD中读取硬盘的信息;
第二读取模块23可以包括:
第二读取单元,用于待第一次从硬盘背板CPLD中读取硬盘的信息后,等待读取时间间隔后再次从硬盘背板CPLD中读取硬盘的信息。
本申请实施例提供的一种服务器硬盘监测装置,还可以包括:
返回执行模块,用于若确定再次读取到的信息中不存在与错误信息相同的信息,则返回执行等待读取时间间隔后再次从硬盘背板CPLD中读取硬盘的信息的步骤。
本申请实施例提供的一种服务器硬盘监测装置,还可以包括:
记录模块,用于若确定DC相邻两次的上电间隔或相邻两次的下电间隔大于阈值,则将错误信息记录在错误日志中。
本申请实施例提供的一种服务器硬盘监测装置,还可以包括:
删除模块,用于当DC下电时,删除错误日志中记录的信息。
本申请实施例提供的一种服务器硬盘监测装置,还可以包括:
通知模块,用于在将与错误信息相同的信息记录在错误日志中之后,对错误日志进行显示和/或根据错误日志发出告警。
本申请实施例提供的一种服务器硬盘监测装置,通知模块可以包括:
告警单元,用于根据错误日志通过短信通知、邮件通知、语音通知、蜂鸣通知中的任意一种或任意多种的组合发出告警。
本申请实施例还提供了一种服务器硬盘监测设备,参见图3,其示出了本申请实施例提供的一种服务器硬盘监测设备的结构示意图,可以包括:
存储器31,用于存储计算机程序;
处理器32,用于执行存储器31存储的计算机程序时可实现如下步骤:
在DC上电且BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息;判断信息中是否存在错误信息,若存在,则判断DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;若小于或等于阈值,则拒绝将错误信息记录在错误日志中,并待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息判断;再次读取到的信息中是否存在与错误信息相同的信息,若存在,则将与错误信息相同的信息记录在错误日志中。
本申请实施例还提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序,计算机程序被处理器执行时可实现如下步骤:
在DC上电且BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息;判断信息中是否存在错误信息,若存在,则判断DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;若小于或等于阈值,则拒绝将错误信息记录在错误日志中,并待硬盘背板CPLD完成初始化后,再次从硬盘背板CPLD中读取硬盘的信息;判断再次读取到的信息中是否存在与错误信息相同的信息,若存在,则将与错误信息相同的信息记录在错误日志中。
该计算机可读存储介质可以包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例提供的一种服务器硬盘监测装置、设备及计算机可读存储介质中相关部分的说明可以参见本申请实施例提供的一种服务器硬盘监测中对应部分的详细说明,在此不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种服务器硬盘监测方法,其特征在于,应用于BMC,包括:
在DC上电且所述BMC完成初始化后,从硬盘背板CPLD中读取硬盘的信息;
判断所述信息中是否存在错误信息,若存在,则判断所述DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;
若小于或等于所述阈值,则拒绝将所述错误信息记录在错误日志中,并待所述硬盘背板CPLD完成初始化后,再次从所述硬盘背板CPLD中读取所述硬盘的信息;
判断再次读取到的所述信息中是否存在与所述错误信息相同的信息,若存在,则将与所述错误信息相同的信息记录在错误日志中;
其中,在从硬盘背板CPLD中读取硬盘的信息之前,还包括:
预先进行连续多次的DC上下电测试,获取所述硬盘背板CPLD在每次测试时的初始化时长,并获取所述BMC在每次测试的初始化时长;
根据所述硬盘背板CPLD在多次测试中的初始化时长最大值与所述BMC在多次测试中的初始化时长最小值之差设定读取时间间隔;其中,所述硬盘背板CPLD在多次测试中的初始化时长最大值与所述BMC在多次测试中的初始化时长最小值之差位于一个所述读取时间间隔和两个所述读取时间间隔范围内;
相应地,从硬盘背板CPLD中读取硬盘的信息,包括:
等待所述读取时间间隔后从所述硬盘背板CPLD中读取硬盘的信息;
待所述硬盘背板CPLD完成初始化后,再次从所述硬盘背板CPLD中读取所述硬盘的信息,包括:
待第一次从所述硬盘背板CPLD中读取硬盘的信息后,等待所述读取时间间隔后再次从所述硬盘背板CPLD中读取所述硬盘的信息;
若不存在,返回执行所述等待所述读取时间间隔后再次从所述硬盘背板CPLD中读取所述硬盘的信息的步骤。
2.根据权利要求1所述的服务器硬盘监测方法,其特征在于,若确定所述DC相邻两次的上电间隔或相邻两次的下电间隔大于所述阈值,则还包括:
将所述错误信息记录在所述错误日志中。
3.根据权利要求1至2任一项所述的服务器硬盘监测方法,其特征在于,还包括:
当所述DC下电时,删除所述错误日志中记录的信息。
4.根据权利要求3所述的服务器硬盘监测方法,其特征在于,在将与所述错误信息相同的信息记录在错误日志中之后,还包括:
对所述错误日志进行显示和/或根据所述错误日志发出告警。
5.根据权利要求4所述的服务器硬盘监测方法,其特征在于,根据所述错误日志发出告警,包括:
根据所述错误日志通过短信通知、邮件通知、语音通知、蜂鸣通知中的任意一种或任意多种的组合发出告警。
6.一种服务器硬盘监测装置,其特征在于,应用于BMC,包括:
第一读取模块,用于在DC上电且所述BMC完成初始化后,间隔预设时间长度从硬盘背板CPLD中读取硬盘的信息;
判断模块,用于判断所述信息中是否存在错误信息,若存在,则判断所述DC相邻两次的上电间隔或相邻两次的下电间隔是否小于或等于阈值;
第二读取模块,用于若小于或等于所述阈值,则拒绝将所述错误信息记录在错误日志中,并待所述硬盘背板CPLD完成初始化后,再次从所述硬盘背板CPLD中读取所述硬盘的信息;
记录模块,用于判断再次读取到的所述信息中是否存在与所述错误信息相同的信息,若存在,则将与所述错误信息相同的信息记录在错误日志中;
预先测试模块,用于预先进行连续多次的DC上下电测试,获取所述硬盘背板CPLD在每次测试时的初始化时长,并获取所述BMC在每次测试的初始化时长;
设定模块,用于根据所述硬盘背板CPLD在多次测试中的初始化时长最大值与所述BMC在多次测试中的初始化时长最小值之差设定读取时间间隔;其中,所述硬盘背板CPLD在多次测试中的初始化时长最大值与所述BMC在多次测试中的初始化时长最小值之差位于一个所述读取时间间隔和两个所述读取时间间隔范围内;
所述第一读取模块包括:第一读取单元;
所述第一读取单元,用于等待所述读取时间间隔后从所述硬盘背板CPLD中读取硬盘的信息;
所述第二读取模块包括:第二读取单元;
所述第二读取单元,用于待第一次从所述硬盘背板CPLD中读取硬盘的信息后,等待所述读取时间间隔后再次从所述硬盘背板CPLD中读取所述硬盘的信息;
返回执行模块,用于若确定再次读取到的所述信息中不存在与所述错误信息相同的信息,则返回执行所述等待所述读取时间间隔后再次从所述硬盘背板CPLD中读取所述硬盘的信息的步骤。
7.一种服务器硬盘监测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述的服务器硬盘监测方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的服务器硬盘监测方法的步骤。
CN202010614617.8A 2020-06-30 2020-06-30 一种服务器硬盘监测方法、装置、设备及介质 Active CN111858239B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010614617.8A CN111858239B (zh) 2020-06-30 2020-06-30 一种服务器硬盘监测方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010614617.8A CN111858239B (zh) 2020-06-30 2020-06-30 一种服务器硬盘监测方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN111858239A CN111858239A (zh) 2020-10-30
CN111858239B true CN111858239B (zh) 2022-06-10

Family

ID=72989224

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010614617.8A Active CN111858239B (zh) 2020-06-30 2020-06-30 一种服务器硬盘监测方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN111858239B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419719A (zh) * 2010-09-27 2012-04-18 鸿富锦精密工业(深圳)有限公司 电脑系统及电脑系统的开机方法
CN103176581A (zh) * 2011-12-22 2013-06-26 英业达股份有限公司 电源管理装置及电源管理方法
CN104020963A (zh) * 2014-06-04 2014-09-03 浙江宇视科技有限公司 一种防止误判硬盘读写错误的方法和装置
CN108958965A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备
CN108959005A (zh) * 2018-06-29 2018-12-07 深圳市同泰怡信息技术有限公司 带Expander背板的硬盘管控方法及服务器
CN109101393A (zh) * 2018-07-09 2018-12-28 深圳市同泰怡信息技术有限公司 基于bmc监控服务器cpu资源利用率的方法及系统
CN109376052A (zh) * 2018-09-10 2019-02-22 联想(北京)有限公司 一种监测硬盘状态的方法、电子设备
CN110109802A (zh) * 2019-04-16 2019-08-09 深圳市国鑫恒宇科技有限公司 一种实时读取硬盘温度的方法与系统
CN110187996A (zh) * 2019-05-30 2019-08-30 苏州浪潮智能科技有限公司 Bmc主进程故障诊断方法、装置、设备及可读存储介质
CN110377142A (zh) * 2019-06-27 2019-10-25 苏州浪潮智能科技有限公司 一种支持服务器硬盘独立上下电的系统及方法
CN110471800A (zh) * 2018-05-11 2019-11-19 佛山市顺德区顺达电脑厂有限公司 服务器及自动检修基板管理控制器的方法
CN110618918A (zh) * 2019-09-06 2019-12-27 苏州浪潮智能科技有限公司 Pch下硬盘状态灯的控制方法、控制装置及控制设备
CN111061338A (zh) * 2019-11-30 2020-04-24 苏州浪潮智能科技有限公司 一种基板管理控制器时序的更新方法、系统及设备
CN111290918A (zh) * 2020-02-26 2020-06-16 苏州浪潮智能科技有限公司 服务器运行状态监控方法、装置及计算机可读存储介质
CN111309509A (zh) * 2020-02-23 2020-06-19 苏州浪潮智能科技有限公司 一种基于服务器bmc通道切换失败的解决方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10067548B2 (en) * 2016-05-19 2018-09-04 Dell Products L.P. Efficient power-on sequence for a modular information handling system
US10846160B2 (en) * 2018-01-12 2020-11-24 Quanta Computer Inc. System and method for remote system recovery

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102419719A (zh) * 2010-09-27 2012-04-18 鸿富锦精密工业(深圳)有限公司 电脑系统及电脑系统的开机方法
CN103176581A (zh) * 2011-12-22 2013-06-26 英业达股份有限公司 电源管理装置及电源管理方法
CN104020963A (zh) * 2014-06-04 2014-09-03 浙江宇视科技有限公司 一种防止误判硬盘读写错误的方法和装置
CN110471800A (zh) * 2018-05-11 2019-11-19 佛山市顺德区顺达电脑厂有限公司 服务器及自动检修基板管理控制器的方法
CN108958965A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备
CN108959005A (zh) * 2018-06-29 2018-12-07 深圳市同泰怡信息技术有限公司 带Expander背板的硬盘管控方法及服务器
CN109101393A (zh) * 2018-07-09 2018-12-28 深圳市同泰怡信息技术有限公司 基于bmc监控服务器cpu资源利用率的方法及系统
CN109376052A (zh) * 2018-09-10 2019-02-22 联想(北京)有限公司 一种监测硬盘状态的方法、电子设备
CN110109802A (zh) * 2019-04-16 2019-08-09 深圳市国鑫恒宇科技有限公司 一种实时读取硬盘温度的方法与系统
CN110187996A (zh) * 2019-05-30 2019-08-30 苏州浪潮智能科技有限公司 Bmc主进程故障诊断方法、装置、设备及可读存储介质
CN110377142A (zh) * 2019-06-27 2019-10-25 苏州浪潮智能科技有限公司 一种支持服务器硬盘独立上下电的系统及方法
CN110618918A (zh) * 2019-09-06 2019-12-27 苏州浪潮智能科技有限公司 Pch下硬盘状态灯的控制方法、控制装置及控制设备
CN111061338A (zh) * 2019-11-30 2020-04-24 苏州浪潮智能科技有限公司 一种基板管理控制器时序的更新方法、系统及设备
CN111309509A (zh) * 2020-02-23 2020-06-19 苏州浪潮智能科技有限公司 一种基于服务器bmc通道切换失败的解决方法及系统
CN111290918A (zh) * 2020-02-26 2020-06-16 苏州浪潮智能科技有限公司 服务器运行状态监控方法、装置及计算机可读存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"Subverting your server through its BMC: the HPE iLO4 case";Fabien Périgaud等;《https://www.sstic.org/media/SSTIC2018/SSTIC-actes》;20181231;第3-30页 *
"基于可信BMC的服务器安全启动机制";孙亮等;《山东大学学报(理学版)》;20180131;第89-94页 *
"基于服务器硬件系统管理架构(SMASH)的服务器管理设计与实现";田祥波;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170315;I137-426 *

Also Published As

Publication number Publication date
CN111858239A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
WO2018120721A1 (zh) 用户界面的测试方法、系统、电子装置及计算机可读存储介质
WO2017125014A1 (zh) 硬盘监控方法及装置
CN110992992A (zh) 一种硬盘测试方法、设备以及存储介质
CN112017723B (zh) 存储器的掉电测试方法、装置、可读存储介质及电子设备
CN114077525A (zh) 异常日志处理方法、装置、终端设备、云服务器及系统
CN110609778A (zh) 一种保存服务器宕机日志的方法及系统
CN107329914A (zh) 一种基于Linux系统检测硬盘乱序的方法及装置
KR100985959B1 (ko) 컴퓨팅 시스템의 자율적 능력의 양적 측정
CN103984618A (zh) 一种linux服务器硬盘活动状态的监控方法
CN113672451A (zh) 一种bmc服务检测方法、装置、设备及可读存储介质
CN112015609A (zh) 一种热插拔测试方法、装置及设备
JP2019075131A5 (zh)
CN111858239B (zh) 一种服务器硬盘监测方法、装置、设备及介质
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN111124774B (zh) 一种服务器开机过程稳定性的测试方法及相关装置
CN111324486A (zh) expander芯片挂死的修复方法、系统及相关装置
CN113708986B (zh) 服务器监控装置、方法及计算机可读存储介质
CN114237957A (zh) 异常磁盘分区的处理方法与装置
CN113127245B (zh) 一种系统管理中断的处理方法、系统及装置
WO2018227475A1 (zh) 指纹芯片检测方法、装置及系统
CN113626233B (zh) 一种自动检测bios看门狗功能的方法、装置及设备
CN113626278A (zh) 一种硬件拓扑生成方法及其相关设备
KR101310070B1 (ko) 프로그램간의 충돌을 예방하는 방법 및 그 방법이 기록된 기록매체
CN112905415A (zh) 一种串口日志文件获取方法、装置及相关组件
CN112084512A (zh) 一种访问控制方法、装置、设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant