CN112711494A - 一种宕机故障定位方法及装置 - Google Patents

一种宕机故障定位方法及装置 Download PDF

Info

Publication number
CN112711494A
CN112711494A CN202011598751.XA CN202011598751A CN112711494A CN 112711494 A CN112711494 A CN 112711494A CN 202011598751 A CN202011598751 A CN 202011598751A CN 112711494 A CN112711494 A CN 112711494A
Authority
CN
China
Prior art keywords
starting
downtime
fault
electronic equipment
interface
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011598751.XA
Other languages
English (en)
Inventor
杨少俊
王兵
姚藩益
钱慧娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Inspur Intelligent Technology Co Ltd
Original Assignee
Suzhou Inspur Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Inspur Intelligent Technology Co Ltd filed Critical Suzhou Inspur Intelligent Technology Co Ltd
Priority to CN202011598751.XA priority Critical patent/CN112711494A/zh
Publication of CN112711494A publication Critical patent/CN112711494A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Retry When Errors Occur (AREA)

Abstract

本发明公开了一种宕机故障定位方法及装置,包括:在电子设备的开机过程中,记录电子设备的开机过程数据;检测到电子设备的开机过程存在宕机故障,则触发对开机过程的中断并启用I/O接口;读取开机过程数据,并利用开机过程数据对宕机故障进行定位,得到宕机故障信息;通过I/O接口输出宕机故障信息;解决了对开机过程中的宕机故障定位效率低并且不够精准的技术问题。

Description

一种宕机故障定位方法及装置
技术领域
本发明涉及软件技术领域,尤其涉及一种宕机故障定位方法及装置。
背景技术
在计算机,尤其是服务器的研发阶段,在重启测试或其他测试过程中,会出现很多宕机问题,而服务器因为其本身的复杂性,开机速度比个人计算机要慢很多,为了测试效率或模拟真实的使用场景,一般不会打开调试模式,因此如果在开机过程中遇到宕机,就没有任何串口可用也没有任何诊断数据或者宕机日志,在缺少诊断数据条件下很难对开机过程中的宕机问题进行定位。
传统的定位方式是:根据开机过程中的开机自检码(Post Code),BMC(BaseboardManagement Controller,底板管理控制器)日志记录以及宕机故障诊断功能,宕机故障时收集计算机寄存器中的信息,分析宕机故障源头,但是Post Code只能粗略记录开机过程,只能粗略定位到某个启动阶段出了问题,无法定位到更详细的位置;而BMC日志是一些信息,事件、宕机故障记录,也无法直接定位到问题点;宕机故障诊断功能主要用来定位操作系统运行过程的宕机故障,可以定位到哪些部件引发了宕机故障,对于开机过程的宕机故障没有帮助。
因此,现有技术无法确定开机过程中发生宕机故障的具体位置以及具体原因,导致定位宕机故障的效率低并且不够精准。
发明内容
本发明实施例通过提供一种宕机故障定位方法及装置,解决了对开机过程中的宕机故障定位效率低并且不够精准的技术问题。
第一方面,本发明通过本发明的一实施例,提供了一种宕机故障定位方法,包括:在电子设备的开机过程中,记录所述电子设备的开机过程数据;检测到所述电子设备的开机过程存在宕机故障,则触发对所述开机过程的中断并启用I/O接口;读取所述开机过程数据,并利用所述开机过程数据对所述宕机故障进行定位,得到宕机故障信息;通过所述I/O接口输出所述宕机故障信息。
优选地,所述利用所述开机过程数据对所述宕机故障进行定位,包括:判断所述开机过程数据是否包括Exception函数;若所述开机过程数据中包括所述Exception函数,则基于所述Exception函数对所述宕机故障进行定位,得到宕机故障信息。
优选地,所述开机过程数据,包括:电子设备开机过程中所使用的开机引导模块、记录的相关事件、调用的函数入口和函数出口、记录的实际开机时间以及经过的开机过程节点;其中,所述开机引导模块用于引导电子设备的开机过程,所述开机过程节点用于划分相邻两个开机阶段。
优选地,所述检测到所述电子设备的开机过程存在宕机故障,包括:在所述电子设备的开机过程中,若检测到任一开机阶段的实际开机时间大于对应的预设时间,则判定所述电子设备的开机过程存在宕机故障。
优选地,所述方法还包括:在所述电子设备的开机过程中检测到中断开关发起的中断触发信号时,触发对所述开机过程的中断并启用I/O接口。
优选地,在所述利用所述开机过程数据对所述宕机故障进行定位,得到宕机故障信息之后,还包括:基于所述宕机故障信息生成日志文件,并对所述日志文件进行存储;和/或通过显示器显示所述宕机故障信息。
优选地,所述启用I/O接口,包括:通过在中断处理函数中打开调试信息库的控制开关,以启用所述I/O接口。
第二方面,本发明通过本发明的一实施例,提供了一种宕机故障定位装置,包括:存储单元,用于在电子设备的开机过程中,记录所述电子设备的开机过程数据;触发单元,用于检测到所述电子设备的开机过程存在宕机故障,则触发对所述开机过程的中断并启用I/O接口;定位单元,用于读取所述开机过程数据,并利用所述开机过程数据对所述宕机故障进行定位,得到宕机故障信息;输出单元,用于通过所述I/O接口输出所述宕机故障信息。
第三方面,本发明通过本发明的一实施例,提供了一种宕机故障定位设备,包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的代码,所述处理器在执行所述代码时实现第一方面中任一实施方式所述方法。
第四方面,本发明通过本发明的一实施例,提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一实施方式所述方法。
本发明实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
在本发明实施例在电子设备的开机过程中,首先记录电子设备的开机过程数据,当检测到电子设备的开机过程存在宕机故障时,便会触发对开机过程的中断并启用I/O接口,然后读取开机过程数据,并利用开机过程数据对宕机故障进行定位,得到宕机故障信息,最后通过I/O接口输出宕机故障信息;通过触发开机过程中断并启用I/O接口之后,能够方便后续使用I/O接口进行调试以及交换数据,利用开机过程数据能对宕机故障进行定位得到宕机故障信息,实现对宕机故障进行迅速、精确地定位,最后通过I/O接口输出宕机故障信息,解决了对开机过程中的宕机故障定位效率低并且不够精准的技术问题,从而当电子设备在开机过程中出现宕机故障时,提高对开机过程中宕机故障定位的效率以及精准性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中宕机故障定位方法的流程图;
图2为本发明实施例中宕机故障定位装置的功能模块图;
图3为本发明实施例中宕机故障定位设备的结构示意图;
图4为本发明实施例中计算机可读存储介质的结构图。
具体实施方式
本发明实施例通过提供了一种宕机故障定位方法及装置,用以解决现有技术中对开机过程中的宕机故障定位效率低并且不够精准的技术问题。
本发明实施例提供的技术方案为解决上述技术问题,总体思路如下:
在电子设备的开机过程中,首先记录电子设备的开机过程数据,当检测到电子设备的开机过程存在宕机故障时,便会触发对开机过程的中断并启用I/O接口,然后读取开机过程数据,并利用开机过程数据对宕机故障进行定位,得到宕机故障信息,最后通过I/O接口输出宕机故障信息。
通过上述技术方案,一旦检测到电子设备的开机过程存在宕机故障,就会触发对开机过程的中断并启用I/O接口,利用开机过程数据能对宕机故障进行定位得到宕机故障信息,实现对宕机故障进行迅速、精确地定位,最后通过I/O接口输出宕机故障信息,从而当电子设备在开机过程中出现宕机故障时,提高对宕机故障定位的速度以及准确性。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
首先说明,本文中出现的术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
本发明实施例提供了一种宕机故障定位方法,该方法可以应用在个人电脑、平板电脑、智能手机、服务器等电子设备的开机过程中,当这些电子设备在开机过程中出现宕机故障时,该方法能够提高对宕机故障定位的效率以及准确性。
第一方面,本发明实施例提供的一种宕机故障定位方法,通过预先创建一个BootTrace Lib作为启动追踪库,用于为各个程序模块提供服务,主要包含记录服务和读取服务,当调用记录服务时,Boot Trace Lib会将相关信息记录到HOB(Hand Off Block),它是PEI阶段到DXE阶段传递信息的结构体;其中,PEI的全称是Pre-EFI Initialization,它是UEFI(Unified Extensible Firmware Interface,统一可扩展固件接口)和PI(PlatformInitialization,平台初始化)定义的开机过程中的内存初始化阶段,PEI阶段主要用来初始化内存,DXE的全称是Driver Execution Environment,它是UEFI和PI定义的开机过程中的加载驱动阶段,DXE阶段主要用来加载驱动程序;当调用读取服务时,Boot Trace Lib会从HOB中读取之前记录的相关信息并将相关信息反馈。
如图1所示,本发明实施例提供的方法包括如下步骤:
步骤S101:在电子设备的开机过程中,记录电子设备的开机过程数据。
在具体实施过程中,在电子设备接通电源并且开机的时刻,电子设备开始调用Boot Trace Lib的记录服务,记录服务会将服务器在开机过程中所使用的开机过程数据记录到HOB中。
具体的,记录电子设备的开机过程数据包括:电子设备开机过程中所使用的开机引导模块、记录的相关事件、调用的函数入口和函数出口、记录的实际开机时间以及经过的开机过程节点;其中,开机引导模块用于引导电子设备的开机过程,开机过程节点用于划分开机过程中相邻两个开机阶段。比如,某一电子设备的开机过程包括相邻的内存初始化阶段与加载驱动阶段,则开机过程节点是用于划分内存初始化阶段和加载驱动阶段。
步骤S102:检测到电子设备的开机过程存在宕机故障,则触发对开机过程的中断并启用I/O接口。
具体的,在电子设备的开机过程中,监测电子设备的开机过程是否宕机故障,直至监测到电子设备的开机过程存在宕机故障,则触发对开机过程的中断并启用I/O接口。
步骤S102中,若检测到任一开机阶段的实际开机时间大于对应的预设时间,则判定电子设备的开机过程存在宕机故障。在电子设备的开机过程存在宕机故障的情况下,可以通过如下方式启用I/O接口:触发对开机过程的中断并通过在中断处理函数中打开调试信息库的控制开关,以启用I/O接口。
更具体来讲,预先创建一个Timer Event(定时器事件)函数用于触发开机过程的中断,并且,针对Timer Event函数的预设事件为:任一开机阶段的实际开机时间大于对应的预设时间;一旦通过Timer Event函数检测到存在预设事件,便会触发开机过程的中断,并通过在中断处理函数中打开调试信息库的控制开关,以启用I/O接口。
举例来讲,假如,内存初始化阶段的预设时间为3s,而调用Timer Event函数,来获取到内存初始化阶段的实际开机时间为5s,由于内存初始化阶段的实际开机时间大于内存初始化阶段对应的预设时间,则Timer Event函数会判定内存初始化阶段存在预设事件,同时触发开机过程的中断并启用I/O接口,方便后续使用I/O接口进行实时输入/输出,用于输出定位到的宕机故障信息,还可以用于在宕机故障信息之后的程序调试过程的输入/输出,以实现实时对电子设备的开机过程进行监测与控制。
步骤S103:读取开机过程数据,并利用开机过程数据对宕机故障进行定位,得到宕机故障信息。
具体的,可以通过调用Boot Trace Lib的读取服务,来从HOB中读取服务器之前所记录的开机过程数据。
具体的,利用开机过程数据对宕机故障进行定位,包括:判断开机过程数据是否包括Exception函数。如果开机过程数据中包括Exception函数,则基于Exception函数对宕机故障进行定位。
需要说明的是,Exception函数是Java(一种计算机编程语言)的异常处理机制,当然,也可以采用类似于Exception函数的其他计算机编程语言的异常处理机制,例如C语言的异常处理机制为setjmp()函数与longjmp()函数;若开机过程数据中包括Exception函数,则基于Exception函数对宕机故障进行定位,得到宕机故障信息。
具体的,根据Exception函数中的RIP函数,以反汇编的方式定位发生错误的语句,从而得到对应的宕机故障信息。其中,RIP函数是当前要执行指令的地址。
其中,宕机故障信息包括:宕机故障原因、宕机故障定位结果。宕机故障定位结果表征了发生宕机故障的相关错误语句。
步骤S104:通过I/O接口输出宕机故障信息。
在具体实施过程中,可以通过服务器上的网络接口、U.2接口、PCIe接口等接口输出宕机故障的原因、宕机故障定位结果。
作为一种可选的实施例,该方法还包括:在电子设备的开机过程中检测到中断开关发起的中断触发信号时,触发对开机过程的中断并启用I/O接口。
在具体实施过程中,利用GPIO(General-purpose input/output,通用型输入输出),例如芯片的引脚,做成一个按钮并配置为可触发中断;具体的,当服务器在开机过程中出现宕机故障,并且通过I/O接口、显示器以及BMC人为判断Timer Event函数并没有成功触发,通过手动点按按钮触发对开机过程的中断,同时也打开了在中断处理函数中调试信息库的控制开关,启用I/O接口,另外,当管理员人为判定需要对开机过程进行中断时,不管服务器当时处于什么开机阶段,只要手动点按按钮就能触发对开机过程的中断并启用I/O接口,使得当Timer Event函数失效时,还可以采取按下GPIO按钮实现开机过程的中断和启用I/O接口,并且由于GPIO按钮属于物理中断机制,提高了对开机过程中断的可靠性。
作为一种可选的实施例,在步骤S103之后还包括:基于宕机故障信息生成日志文件,并对日志文件进行存储;和/或通过显示器显示宕机故障信息。
以服务器进行举例来讲,基于得到的宕机故障信息生成日志文件,将日志文件通过服务器的IPMI接口和/或Redfish接口存储至BMC中,并且如果检测到显示器可用,则将宕机故障信息通过显示器进行显示,管理员可以通过读取BMC中的日志文件,如果有显示器,还可以通过显示器直观地监视开机过程中的宕机故障信息,管理员通过BMC来管理服务器,实现对对应服务器进行远程控制。
第二方面,基于同一发明构思,本发明实施例提供了一种宕机故障定位装置,参考图2所示的宕机故障定位装置,包括:
存储单元201,用于在电子设备的开机过程中,记录电子设备的开机过程数据;
触发单元202,用于检测到电子设备的开机过程存在宕机故障,则触发对开机过程的中断并启用I/O接口;
定位单元203,用于读取开机过程数据,并利用开机过程数据对宕机故障进行定位,得到宕机故障信息;
输出单元204,用于通过I/O接口输出宕机故障信息。
在一可选的实施方式下,宕机故障定位单元203,包括:
判断子单元,用于判断开机过程数据是否包括Exception函数;
处理子单元,用于若开机过程数据中包括Exception函数,则基于Exception函数对宕机故障进行定位,得到宕机故障信息。
在一可选的实施方式下,开机过程数据包括:电子设备开机过程中所使用的开机引导模块、记录的相关事件、调用的函数入口和函数出口、记录的实际开机时间以及经过的开机过程节点;其中,开机引导模块用于引导电子设备的开机过程,开机过程节点用于划分开机过程中相邻两个开机阶段。
在一可选的实施方式下,触发单元202,具体用于:
在电子设备的开机过程中,若检测到任一开机阶段的实际开机时间大于对应的预设时间,则判定电子设备的开机过程存在宕机故障。
在一可选的实施方式下,该装置还包括:
中断开关单元,用于在电子设备的开机过程中检测到中断开关发起的中断触发信号时,触发对开机过程的中断并启用I/O接口。
在一可选的实施方式下,在利用开机过程数据对宕机故障进行定位,得到宕机故障信息之后,该装置还包括:
日志生成单元,用于基于宕机故障信息生成日志文件,并对日志文件进行存储;和/或通过显示器显示宕机故障信息。
在一可选的实施方式下,触发单元202,用于:
通过在中断处理函数中打开调试信息库的控制开关,以启用I/O接口。
由于本实施例所介绍的宕机故障定位装置为实施本发明实施例中宕机故障定位方法所采用的电子设备,故而基于本发明实施例中所介绍的宕机故障定位方法,本领域所属技术人员能够了解本实施例的电子设备的具体实施方式以及其各种变化形式,所以在此对于该电子设备如何实现本发明实施例中的方法不再详细介绍。只要本领域所属技术人员实施本发明实施例中宕机故障定位方法所采用的电子设备,都属于本发明所欲保护的范围。
第三方面,基于同一发明构思,本发明实施例提供了一种宕机故障定位设备。
参考图3所示,本发明实施例提供的宕机故障定位设备,包括:存储器301、处理器302及存储在存储器上并可在处理器302上运行的代码,处理器302在执行代码时实现前文宕机故障定位方法实施例一中任一实施方式。
其中,在图3中,总线架构(用总线300来代表),总线300可以包括任意数量的互联的总线和桥,总线300将包括由处理器302代表的一个或多个处理器和存储器301代表的存储器的各种电路链接在一起。总线300还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。总线接口306在总线300和接收器303和发送器304之间提供接口。接收器303和发送器304可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器302负责管理总线300和通常的处理,而存储器301可以被用于存储处理器302在执行操作时所使用的数据。
第四方面,基于同一发明构思,如图4所示,本实施例提供了一种计算机可读存储介质400,其上存储有计算机程序401,该程序401被处理器执行时实现前文宕机故障定位方法实施例一中任一实施方式。
上述本发明实施例中的技术方案,至少具有如下的技术效果或优点:
1、一旦检测到电子设备的开机过程存在宕机故障,就会触发对开机过程的中断并启用I/O接口,利用开机过程数据能对宕机故障进行定位得到宕机故障信息,实现对宕机故障进行迅速、精确地定位,最后通过I/O接口输出宕机故障信息,从而当电子设备在开机过程中出现宕机故障时,提高了对宕机故障定位的速度以及准确性。
2、当判定电子设备的开机过程存在宕机故障时,会触发对开机过程的中断并通过在中断处理函数中打开调试信息库的控制开关,以启用I/O接口,方便后续使用I/O接口进行调试以及交换数据,利用开机过程数据能对宕机故障进行定位得到宕机故障信息,实现对宕机故障进行迅速、精确地定位。
3、当人为判定需要对开机过程进行中断时,不管服务器当时处于什么开机阶段,只要手动点按按钮就能触发对开机过程的中断并启用I/O接口,使得当Timer Event函数失效时,还可以采取按下GPIO按钮实现开机过程的中断和启用I/O接口,并且由于GPIO按钮属于物理中断机制,提高了对开机过程中断的可靠性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机产品的流程图和/或方框图来描述的。应理解可由计算机指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (10)

1.一种宕机故障定位方法,其特征在于,包括:
在电子设备的开机过程中,记录所述电子设备的开机过程数据;
检测到所述电子设备的开机过程存在宕机故障,则触发对所述开机过程的中断并启用I/O接口;
读取所述开机过程数据,并利用所述开机过程数据对所述宕机故障进行定位,得到宕机故障信息;
通过所述I/O接口输出所述宕机故障信息。
2.如权利要求1所述的方法,其特征在于,所述利用所述开机过程数据对所述宕机故障进行定位,包括:
判断所述开机过程数据是否包括Exception函数;
若所述开机过程数据中包括所述Exception函数,则基于所述Exception函数对所述宕机故障进行定位,得到宕机故障信息。
3.如权利要求1所述的方法,其特征在于,所述开机过程数据,包括:
电子设备在开机过程中所使用的开机引导模块、记录的相关事件、调用的函数入口和函数出口、记录的实际开机时间以及经过的开机过程节点;
其中,所述开机引导模块用于引导电子设备的开机过程,所述开机过程节点用于划分相邻两个开机阶段。
4.如权利要求3所述的方法,其特征在于,所述检测到所述电子设备的开机过程存在宕机故障,包括:
在所述电子设备的开机过程中,若检测到任一开机阶段的实际开机时间大于对应的预设时间,则判定所述电子设备的开机过程存在宕机故障。
5.如权利要求1所述的方法,其特征在于,所述方法还包括:
在所述电子设备的开机过程中检测到中断开关发起的中断触发信号时,触发对所述开机过程的中断并启用I/O接口。
6.如权利要求1-5所述的方法,其特征在于,在所述利用所述开机过程数据对所述宕机故障进行定位,得到宕机故障信息之后,还包括:
基于所述宕机故障信息生成日志文件,并对所述日志文件进行存储;和/或
通过显示器显示所述宕机故障信息。
7.如权利要求1所述的方法,其特征在于,所述启用I/O接口,包括:
通过在中断处理函数中打开调试信息库的控制开关,以启用所述I/O接口。
8.一种宕机故障定位装置,其特征在于,包括:
存储单元,用于在电子设备的开机过程中,记录所述电子设备的开机过程数据;
触发单元,用于检测到所述电子设备的开机过程存在宕机故障,则触发对所述开机过程的中断并启用I/O接口;
定位单元,用于读取所述开机过程数据,并利用所述开机过程数据对所述宕机故障进行定位,得到宕机故障信息;
输出单元,用于通过所述I/O接口输出所述宕机故障信息。
9.一种电子设备,包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的代码,其特征在于,所述处理器在执行所述代码时实现权利要求1-7中任一所述方法。
10.一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现权利要求1-7任一所述方法。
CN202011598751.XA 2020-12-30 2020-12-30 一种宕机故障定位方法及装置 Pending CN112711494A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011598751.XA CN112711494A (zh) 2020-12-30 2020-12-30 一种宕机故障定位方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011598751.XA CN112711494A (zh) 2020-12-30 2020-12-30 一种宕机故障定位方法及装置

Publications (1)

Publication Number Publication Date
CN112711494A true CN112711494A (zh) 2021-04-27

Family

ID=75546618

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011598751.XA Pending CN112711494A (zh) 2020-12-30 2020-12-30 一种宕机故障定位方法及装置

Country Status (1)

Country Link
CN (1) CN112711494A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
CN110933363A (zh) * 2019-10-25 2020-03-27 苏州浪潮智能科技有限公司 一种服务器故障的录像记录方法、系统及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104850485A (zh) * 2015-05-25 2015-08-19 深圳国鑫恒宇技术有限公司 一种基于bmc远程诊断服务器开机故障的方法及系统
CN110933363A (zh) * 2019-10-25 2020-03-27 苏州浪潮智能科技有限公司 一种服务器故障的录像记录方法、系统及设备

Similar Documents

Publication Publication Date Title
US7536605B2 (en) Injection of software faults into an operational system
US20090172664A1 (en) Adding a profiling agent to a virtual machine to permit performance and memory consumption analysis within unit tests
TWI544410B (zh) 利用執行單步驟以進行編碼診斷
CN109669876B (zh) 一种javascript代码的调试控制方法及系统
US20070079288A1 (en) System and method for capturing filtered execution history of executable program code
US8117430B2 (en) Boot test system and method thereof
CN114168222B (zh) 一种启动耗时的获取方法、装置、终端设备和存储介质
US20150006961A1 (en) Capturing trace information using annotated trace output
CN107111595B (zh) 用于检测早期引导错误的方法、设备及系统
US20050183069A1 (en) ROM-embedded debugging of computer
CN102708015A (zh) 基于cpu不可屏蔽中断系统问题诊断的调试方法
CN113315675B (zh) 一种白盒交换机U-Boot自动化测试方法、系统和存储介质
US7827540B2 (en) Method for program debugging
JP2008135008A (ja) プログラムモジュール検証方式
CN112711494A (zh) 一种宕机故障定位方法及装置
CN100403275C (zh) 应用于固件程序除错的微处理器与方法
JP2004302731A (ja) 情報処理装置および障害診断方法
CN115756935A (zh) 嵌入式软件系统的异常故障定位方法、装置及设备
CN115827298A (zh) 一种服务器开机故障定位方法、装置、终端及存储介质
CN109634796A (zh) 一种计算机的故障诊断方法、装置及系统
CN112765021A (zh) 一种引导程序的调试检验方法、装置、设备及存储介质
CN102023916A (zh) 电脑系统的检测方法
JP2015130023A (ja) 情報記録装置、情報処理装置、情報記録方法、及び情報記録プログラム
CN112346786B (zh) 应用于开机阶段及开机后运行阶段的除错信息纪录方法
CN117909160B (zh) 基于物联网的固件崩溃分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210427