CN108287775A - 一种服务器故障检测的方法、装置、设备及存储介质 - Google Patents

一种服务器故障检测的方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN108287775A
CN108287775A CN201810171637.5A CN201810171637A CN108287775A CN 108287775 A CN108287775 A CN 108287775A CN 201810171637 A CN201810171637 A CN 201810171637A CN 108287775 A CN108287775 A CN 108287775A
Authority
CN
China
Prior art keywords
warping apparatus
triggering
register data
information
server failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810171637.5A
Other languages
English (en)
Inventor
袁传博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhengzhou Yunhai Information Technology Co Ltd
Original Assignee
Zhengzhou Yunhai Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou Yunhai Information Technology Co Ltd filed Critical Zhengzhou Yunhai Information Technology Co Ltd
Priority to CN201810171637.5A priority Critical patent/CN108287775A/zh
Publication of CN108287775A publication Critical patent/CN108287775A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2273Test methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2284Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing by power-on test, e.g. power-on self test [POST]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种服务器故障检测的方法,包括接收由上电自检程序在检测到异常设备时发送的触发信息;然后根据触发信息获取异常设备对应的寄存器数据;并根据预设的分析规则对寄存器数据进行分析并得出分析结果。可见,本方法通过上电自检程序检测服务器的设备,并在检测到异常设备时发送触发信息;通过触发信息获取异常设备对应的寄存器数据,并对异常设备的寄存器数据进行分析得出分析结果,从而不仅快速准确地获取异常设备的异常情况,还能快速准确地获取发生异常的设备的位置信息,进而提高服务器故障检测的便捷性。本申请还公开了一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。

Description

一种服务器故障检测的方法、装置、设备及存储介质
技术领域
本发明涉及设备检测领域,特别涉及一种服务器故障检测的方法、装置、设备及计算机可读存储介质。
背景技术
随着信息技术的飞速发展以及云计算和物联网的落地,用户对服务器的可靠性和信息处理能力有了更高的要求。与传统服务器相比,基于Purley平台的新一代服务器在计算性能和可靠性上与传统服务器相比具有很大的优势,因此基于Purley平台的服务器应用越来越广泛。随着服务器中的设备越来越多,因此导致各设备发生故障的因素也越来越多,对服务器中设备的故障检测工作也日益重要。
现有技术中基于Purley平台的服务器的故障检测方式是机柜内采用集中管理和分级管理的策略,通过整机柜对服务器中的所有设备统一进行故障监控、故障管理和故障记录,在检测到设备异常的信息以后,发出提示信息以便提示操作人员对服务器中的设备进行排查,找出异常的设备。但是这种方式是在检测出有设备异常后通过人工排查的方式找出故障发生的位置,需要耗费大量的人力物力。
因此,如何提高服务器故障检测的便捷性是本领域技术人员目前需要解决的技术问题。
发明内容
有鉴于此,本发明的目的在于提供一种服务器故障检测的方法,能够提高服务器故障检测的便捷性;本发明的另一目的是提供一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种服务器故障检测的方法,包括:
接收由上电自检程序在检测到异常设备时发送的触发信息;
根据所述触发信息获取所述异常设备对应的寄存器数据;
根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。
优选地,进一步包括:
将所述分析结果记录在故障日志中。
优选地,在所述将所述分析结果记录在故障日志中之后进一步包括:
通过网页显示所述故障日志的内容。
优选地,在所述将所述分析结果记录在故障日志中之后进一步包括:
利用警示器报警。
优选地,所述警示器具体为蜂鸣器和/或指示灯。
优选地,所述警示器包括多种报警信号,且各所述报警信号分别对应不同的故障情况。
优选地,其特征在于,在所述接收由上电自检程序在检测到异常设备时发送的触发信息之后进一步包括:
判断所述触发信息的格式是否与预设的格式相同;
若是,则进入所述根据所述触发信息获取所述异常设备对应的寄存器数据步骤;
若否,则结束进程。
为解决上述技术问题,本发明还提供一种服务器故障检测的装置,包括:
接收模块,用于接收由上电自检程序在检测到异常设备时发送的触发信息;
获取模块,用于根据所述触发信息获取所述异常设备对应的寄存器数据;
分析模块,用于根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。
为解决上述技术问题,本发明还提供一种服务器故障检测的设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一种服务器故障检测的方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种服务器故障检测的方法的步骤。
本发明提供的服务器故障检测的方法,通过接收由上电自检程序在检测到异常设备时发送的触发信息;然后根据触发信息获取异常设备对应的寄存器数据;再根据预设的分析规则对寄存器数据进行分析并得出分析结果。
可见,本方法通过上电自检程序对服务器的设备进行检测,在检测到异常设备时发送触发信息;在接收到触发消息后,根据触发信息获取异常设备对应的寄存器数据,再根据预设的分析规则分析寄存器数据并得出分析结果。也就是说,通过触发信息获取异常设备对应的寄存器数据,通过对异常设备的寄存器数据进行分析得出分析结果,从而不仅快速准确地获取异常设备的异常情况,还能快速准确地获取发生异常的设备的位置信息,进而提高服务器故障检测的便捷性。
为解决上述技术问题,本发明还提供了一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种服务器故障检测的方法的流程图;
图2为本发明实施例提供的另一种服务器故障检测的方法的流程图;
图3为本发明实施例提供的一种服务器故障检测的装置的结构图;
图4为本发明实施例提供的一种服务器故障检测的设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的核心是提供一种服务器故障检测的方法,能够提高服务器故障检测的便捷性;本发明的另一核心是提供一种服务器故障检测的装置、设备及计算机可读存储介质,均具有上述有益效果。
为了使本领域技术人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种服务器故障检测的方法的流程图。请参考图1,服务器故障检测的方法包括:
S10:接收由上电自检程序在检测到异常设备时发送的触发信息。
需要说明的是,上电自检程序(POST,Power-On-Self-Test)是BIOS(Basic InputOutput System,基本输入输出系统)功能的一个主要部分,主要完成对CPU、主板、内存、软硬盘子系统、显示子系统(包括显示缓存)、串并行接口、键盘、CD-ROM光驱等硬件设备的检测。具体的,在服务器主板接通电源的时候,上电自检程序将会对服务器上的设备进行检查。通过对服务器上的设备进行故障检测,判断设备是否正常工作,从而保障服务器的正常工作。
在具体实施中,当上电自检程序检测到某个设备异常时,也就是检测到存在异常设备时,发送触发信息。可以理解的是,触发信息用于触发开始后续的进程以及携带异常设备的信息。本实施例对触发信息的具体类型不做限定,作为优选的实施方式,触发信息可以是SEL日志(System Event Log,访问系统事件日志)。
另外需要说明的是,本实施例以Intel平台的服务器架构为例进行说明,但本实施例不限于Intel平台的服务器,还可以应用于其它平台的服务器与计算机平台。
S20:根据触发信息获取异常设备对应的寄存器数据。
具体的,服务器接收到触发信息后,根据触发信息获取异常设备对应的寄存器数据。需要说明的是,在本实施例中,在检测到异常设备时,发送SEL日志到服务器BMC(Baseboard Management Controller,基板管理控制器),服务器BMC根据PECI协议读取对应的寄存器数据。也就是说,根据触发信息携带的异常设备的信息,并根据PECI协议获取异常设备对应的寄存器数据。可以理解的是,一些设备的寄存器数据分别存在于多个不同的寄存器中,因此需要根据触发信息获取异常设备对应的所有的寄存器数据。具体的,寄存器包括但不限于MCA寄存器、AER寄存器以及PCIE ROOT PORT寄存器等。
需要说明的是,还可以进一步将获取到的寄存器数据存储于黑盒日志(BlackBox),以便于后续的操作。可以理解的是,黑盒日志为存储二进制信息的日志文件,一般使用计算机程序进行读取操作。
S30:根据预设的分析规则对寄存器数据进行分析并得出分析结果。
具体的,根据预先设置的分析规则对寄存器数据进行分析,分析规则包括但不限于解码、解析等,以获得分析结果。这样一来,操作者就可以根据分析结果得出异常设备的具体情况。更具体的,若S20中将寄存器数据存储于黑盒日志中,则对应的S30具体包括根据预设的分析规则对存储于黑盒日志中的寄存器数据进行分析并得出分析结果。
本实施例提供的服务器故障检测的方法,通过接收由上电自检程序在检测到设备异常时发送的触发信息;然后根据触发信息获取异常设备对应的寄存器数据;再根据预设的分析规则对寄存器数据进行分析并得出分析结果。
可见,本方法通过上电自检程序对服务器的设备进行检测,在检测到设备异常时发送触发信息;在接收到触发消息后,根据触发信息获取异常设备对应的寄存器数据,再根据预设的分析规则分析寄存器数据并得出分析结果。也就是说,通过触发信息获取异常设备对应的寄存器数据,通过对异常设备的寄存器数据进行分析得出分析结果,从而不仅快速准确地获取异常设备的异常情况,还能快速准确地获取发生异常的设备的位置信息,进而提高服务器故障检测的便捷性。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,在接收由上电自检程序在检测到异常设备时发送的触发信息之后进一步包括:
判断触发信息的格式是否与预设的格式相同;
若是,则进入根据触发信息获取异常设备对应的寄存器数据并将寄存器数据存储于黑盒日志的步骤;
若否,则结束进程。
具体的,在接收触发信息之后,判断触发信息的格式是否与预设的格式相同,也就是说,将触发信息的格式与预设的格式进行比较,判断触发信息的格式是否与预设的格式相同,若是,则进入根据触发信息获取异常设备对应的寄存器数据并将寄存器数据存储于黑盒日志的步骤;即若触发信息的格式正确,则继续进行后续的步骤;若触发信息的格式与预设的格式不同,则结束进程;即表示触发信息的格式不正确,那么即使启动后续的步骤,也会由于触发信息的格式不正确而不能准确地获取异常设备的寄存器数据。因此,在接收触发信息之后,增加判断触发信息的格式是否正确的步骤,能够提高获取异常设备的寄存器数据的准确度,从而提高检测服务器中设备异常的效率。
图2为本发明实施例提供的另一种服务器故障检测的方法的流程图。如图2所示,在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,进一步包括:
S40:将分析结果记录在故障日志中。
需要说明的是,故障日志为用于存储设备故障信息的日志文件,通过将分析结果记录在故障日志中,可以通过查看故障日志以获得历史分析结果的信息,即历史故障信息;或者可以通过将故障日志下载到本地存储空间以便进行其他的操作。需要说明的是,本实施例对具体的记录形式不做限定。需要说明的是,分析结果的具体内容可以包括故障发生的时间、故障设备的类型、故障级别、故障码、故障描述以及处理建议等。
作为优选的实施方式,在将分析结果记录在故障日志中之后进一步包括:
S50:通过网页显示故障日志的内容。
可以理解的是,为了使操作者更便捷地获取服务器中异常设备的情况,可以通过网页显示故障日志的内容,即将分析结果以网页的形式显示。具体的,网页可以是服务器WEB网页,当然也可以是其他的网页,本实施例对网页的具体类型不做限定。
另外,通过网页显示故障日志的内容,可以是将故障日志的内容进行全部显示,也可以对故障日志中的内容进行筛选后再进行显示,本实施例对显示故障日志的内容不做限定。可见,通过网页显示故障日志的内容,增加了获取故障信息的方式,在实际应用中更加实用。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,在将分析结果记录在故障日志中之后进一步包括:
利用警示器报警。
警示器具体为蜂鸣器和/或指示灯。
警示器包括多种报警信号,且各报警信号分别对应不同的故障情况。
可以理解的是,在实际应用中,显示器也是属于服务器中的设备之一,当显示器出现异常时,操作者将不能通过显示器获取分析结果即异常设备的信息。因此,在将分析结果记录在故障日志中之后进一步包括利用警示器进行报警,警示器具体为蜂鸣器和/或指示灯。
具体的,在实际应用中,一般使用蜂鸣器或者指示灯对进行报警,通过蜂鸣器或指示灯直观地进行报警提示。
警示器包括多种报警信号,且各报警信号分别对应不同的异常设备的故障情况。更具体的,可以将故障信息通过不同的声音序列进行展示,也就是说,蜂鸣器的蜂鸣声可以是短的蜂鸣声和长的蜂鸣声的组合,将不同的组合方式对应不同的故障内容。例如,可以通过一声短促的蜂鸣声来表示蜂鸣器正常工作;可以通过短促的蜂鸣声表示电源电压不稳定;通过长时间持续的蜂鸣声表示内存故障;通过一长两短的蜂鸣声表示视频卡故障等等;类似的,可以将故障信息通过不同的灯光序列进行展示,也就是说,指示灯的灯光可以是闪烁的灯光和长亮的灯光的组合,同样通过不同的组合方式对应不同的故障内容,此处不再赘述。本实施例对报警信号与故障信息的对应关系不做限定。
可见,通过蜂鸣器和/或指示灯对故障信息进行显示,能够更加直接快速地获取故障信息,提高了故障检测方法的便捷性。
上文对于本发明提供的一种服务器故障检测的方法的实施例进行了详细的描述,本发明还提供了一种与该方法对应的服务器故障检测的装置、设备及计算机可读存储介质,由于装置、设备及计算机可读存储介质部分的实施例与方法部分的实施例相互照应,因此装置、设备及计算机可读存储介质部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图3为本发明实施例提供的一种服务器故障检测的装置的结构图。如图所示,服务器故障检测的装置包括:
接收模块31,用于接收由上电自检程序在检测到异常设备时发送的触发信息;
获取模块32,用于根据触发信息获取异常设备对应的寄存器数据;
分析模块33,用于根据预设的分析规则对寄存器数据进行分析并得出分析结果。
本实施例提供的服务器故障检测的装置,具有上述服务器故障检测的方法的有益效果。
图4为本发明实施例提供的一种服务器故障检测的设备的结构图,包括:
存储器41,用于存储计算机程序;
处理器42,用于执行计算机程序时实现如下步骤:
接收由上电自检程序在检测到异常设备时发送的触发信息;
根据触发信息获取异常设备对应的寄存器数据;
根据预设的分析规则对寄存器数据进行分析并得出分析结果。
本实施例提供的服务器故障检测的设备,具有上述服务器故障检测的方法的有益效果。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现下步骤:
接收由上电自检程序在检测到异常设备时发送的触发信息;
根据触发信息获取异常设备对应的寄存器数据并将寄存器数据存储于黑盒日志;
根据预设的分析规则对黑盒日志中的寄存器数据进行分析并得出分析结果。
本实施例提供的计算机可读存储介质,具有上述服务器故障检测的方法的有益效果。
以上对本发明所提供的服务器故障检测的方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

Claims (10)

1.一种服务器故障检测的方法,其特征在于,包括:
接收由上电自检程序在检测到异常设备时发送的触发信息;
根据所述触发信息获取所述异常设备对应的寄存器数据;
根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。
2.根据权利要求1所述的方法,其特征在于,进一步包括:
将所述分析结果记录在故障日志中。
3.根据权利要求2所述的方法,其特征在于,在所述将所述分析结果记录在故障日志中之后进一步包括:
通过网页显示所述故障日志的内容。
4.根据权利要求2所述的方法,其特征在于,在所述将所述分析结果记录在故障日志中之后进一步包括:
利用警示器报警。
5.根据权利要求4所述的方法,其特征在于,所述警示器具体为蜂鸣器和/或指示灯。
6.根据权利要求4所述的方法,其特征在于,所述警示器包括多种报警信号,且各所述报警信号分别对应不同的故障情况。
7.根据权利要求1至6任一项所述的方法,其特征在于,在所述接收由上电自检程序在检测到异常设备时发送的触发信息之后进一步包括:
判断所述触发信息的格式是否与预设的格式相同;
若是,则进入所述根据所述触发信息获取所述异常设备对应的寄存器数据步骤;
若否,则结束进程。
8.一种服务器故障检测的装置,其特征在于,包括:
接收模块,用于接收由上电自检程序在检测到异常设备时发送的触发信息;
获取模块,用于根据所述触发信息获取所述异常设备对应的寄存器数据;
分析模块,用于根据预设的分析规则对所述寄存器数据进行分析并得出分析结果。
9.一种服务器故障检测的设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至7任一项所述的服务器故障检测的方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的服务器故障检测的方法的步骤。
CN201810171637.5A 2018-03-01 2018-03-01 一种服务器故障检测的方法、装置、设备及存储介质 Pending CN108287775A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810171637.5A CN108287775A (zh) 2018-03-01 2018-03-01 一种服务器故障检测的方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810171637.5A CN108287775A (zh) 2018-03-01 2018-03-01 一种服务器故障检测的方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN108287775A true CN108287775A (zh) 2018-07-17

Family

ID=62833275

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810171637.5A Pending CN108287775A (zh) 2018-03-01 2018-03-01 一种服务器故障检测的方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN108287775A (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109240863A (zh) * 2018-08-30 2019-01-18 郑州云海信息技术有限公司 一种cpu故障定位方法、装置、设备及存储介质
CN109688018A (zh) * 2019-02-26 2019-04-26 广东信通通信有限公司 一种基于设备异常的告警消息推送方法及系统
CN109783262A (zh) * 2018-12-24 2019-05-21 新华三技术有限公司 故障数据处理方法、装置、服务器及计算机可读存储介质
CN109901057A (zh) * 2019-04-15 2019-06-18 苏州浪潮智能科技有限公司 一种故障定位方法、装置、设备及存储介质
CN109947596A (zh) * 2019-03-19 2019-06-28 浪潮商用机器有限公司 Pcie设备故障系统宕机处理方法、装置及相关组件
CN110058979A (zh) * 2019-04-18 2019-07-26 苏州浪潮智能科技有限公司 一种温度读取失败故障的监控方法、bmc及存储介质
CN110097683A (zh) * 2018-07-20 2019-08-06 深圳怡化电脑股份有限公司 一种设备自检方法、装置、atm及存储介质
CN110377467A (zh) * 2019-07-12 2019-10-25 苏州浪潮智能科技有限公司 服务器开机过程的故障定位方法、装置、设备及存储介质
CN110928718A (zh) * 2019-11-18 2020-03-27 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、系统、终端及介质
CN111124771A (zh) * 2019-11-13 2020-05-08 苏州浪潮智能科技有限公司 一种定位故障的方法、设备及介质
CN111625382A (zh) * 2020-05-21 2020-09-04 浪潮电子信息产业股份有限公司 一种服务器故障诊断方法、装置、设备及介质
CN111694719A (zh) * 2020-06-10 2020-09-22 腾讯科技(深圳)有限公司 服务器故障处理方法、装置、存储介质及电子设备
CN111737039A (zh) * 2020-06-19 2020-10-02 广东浪潮大数据研究有限公司 一种错误信息辅助提取方法、装置、设备及可读存储介质
CN112463501A (zh) * 2020-12-11 2021-03-09 苏州浪潮智能科技有限公司 一种异常掉电的故障快速定位方法、设备及存储介质
CN112765021A (zh) * 2021-01-15 2021-05-07 苏州浪潮智能科技有限公司 一种引导程序的调试检验方法、装置、设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500133A (zh) * 2013-09-17 2014-01-08 华为技术有限公司 故障定位方法及装置
CN106874135A (zh) * 2017-02-20 2017-06-20 北京百度网讯科技有限公司 用于检测机房故障的方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103500133A (zh) * 2013-09-17 2014-01-08 华为技术有限公司 故障定位方法及装置
CN106874135A (zh) * 2017-02-20 2017-06-20 北京百度网讯科技有限公司 用于检测机房故障的方法、装置及设备

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110097683A (zh) * 2018-07-20 2019-08-06 深圳怡化电脑股份有限公司 一种设备自检方法、装置、atm及存储介质
CN109240863A (zh) * 2018-08-30 2019-01-18 郑州云海信息技术有限公司 一种cpu故障定位方法、装置、设备及存储介质
CN109783262B (zh) * 2018-12-24 2022-10-11 新华三技术有限公司 故障数据处理方法、装置、服务器及计算机可读存储介质
CN109783262A (zh) * 2018-12-24 2019-05-21 新华三技术有限公司 故障数据处理方法、装置、服务器及计算机可读存储介质
CN109688018A (zh) * 2019-02-26 2019-04-26 广东信通通信有限公司 一种基于设备异常的告警消息推送方法及系统
CN109947596A (zh) * 2019-03-19 2019-06-28 浪潮商用机器有限公司 Pcie设备故障系统宕机处理方法、装置及相关组件
CN109901057A (zh) * 2019-04-15 2019-06-18 苏州浪潮智能科技有限公司 一种故障定位方法、装置、设备及存储介质
CN110058979A (zh) * 2019-04-18 2019-07-26 苏州浪潮智能科技有限公司 一种温度读取失败故障的监控方法、bmc及存储介质
CN110377467A (zh) * 2019-07-12 2019-10-25 苏州浪潮智能科技有限公司 服务器开机过程的故障定位方法、装置、设备及存储介质
CN111124771A (zh) * 2019-11-13 2020-05-08 苏州浪潮智能科技有限公司 一种定位故障的方法、设备及介质
CN111124771B (zh) * 2019-11-13 2023-01-06 苏州浪潮智能科技有限公司 一种定位故障的方法、设备及介质
CN110928718A (zh) * 2019-11-18 2020-03-27 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、系统、终端及介质
CN110928718B (zh) * 2019-11-18 2024-01-30 上海维谛信息科技有限公司 一种基于关联分析的异常处理方法、系统、终端及介质
CN111625382B (zh) * 2020-05-21 2022-06-10 浪潮电子信息产业股份有限公司 一种服务器故障诊断方法、装置、设备及介质
CN111625382A (zh) * 2020-05-21 2020-09-04 浪潮电子信息产业股份有限公司 一种服务器故障诊断方法、装置、设备及介质
CN111694719A (zh) * 2020-06-10 2020-09-22 腾讯科技(深圳)有限公司 服务器故障处理方法、装置、存储介质及电子设备
CN111737039A (zh) * 2020-06-19 2020-10-02 广东浪潮大数据研究有限公司 一种错误信息辅助提取方法、装置、设备及可读存储介质
CN112463501A (zh) * 2020-12-11 2021-03-09 苏州浪潮智能科技有限公司 一种异常掉电的故障快速定位方法、设备及存储介质
CN112765021A (zh) * 2021-01-15 2021-05-07 苏州浪潮智能科技有限公司 一种引导程序的调试检验方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN108287775A (zh) 一种服务器故障检测的方法、装置、设备及存储介质
CN108376107A (zh) 一种服务器故障检测的方法、装置、设备及存储介质
CN108388489B (zh) 一种服务器故障诊断方法、系统、设备及存储介质
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
US9710122B1 (en) Customer support interface
US7539904B2 (en) Quantitative measurement of the autonomic capabilities of computing systems
CN109358975A (zh) 一种软件运行异常的分析方法、装置、电子设备及存储介质
US7398511B2 (en) System and method for providing a health model for software
US20190079854A1 (en) Systems and methods for executing tests
CN113708986B (zh) 服务器监控装置、方法及计算机可读存储介质
CN107274933A (zh) 一种测试固态硬盘的方法及装置
US9842044B2 (en) Commit sensitive tests
CN107329914A (zh) 一种基于Linux系统检测硬盘乱序的方法及装置
US7171586B1 (en) Method and apparatus for identifying mechanisms responsible for “no-trouble-found” (NTF) events in computer systems
CN111884858B (zh) 设备资产信息的校验方法、装置、系统和介质
CN109271009A (zh) 一种控制服务器背板上电的方法、装置及cpld
CN111124774B (zh) 一种服务器开机过程稳定性的测试方法及相关装置
CN115480970A (zh) 一种性能测试方法、装置、设备及存储介质
Oppermann et al. Anomaly Detection Approaches for Secure Cloud Reference Architectures in Legal Metrology.
Huffman Windows Performance Analysis Field Guide
US11429748B2 (en) Device and method for analyzing performances of a web application
US7992047B2 (en) Context sensitive detection of failing I/O devices
CN114218001A (zh) 故障修复方法、装置、电子设备及可读存储介质
WO2019125491A1 (en) Application behavior identification
CN106998468B (zh) 一种视频服务器性能测试的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180717