CN117608910B - 处理器的机器检查异常错误类型的确定方法、装置、系统 - Google Patents

处理器的机器检查异常错误类型的确定方法、装置、系统 Download PDF

Info

Publication number
CN117608910B
CN117608910B CN202410098513.4A CN202410098513A CN117608910B CN 117608910 B CN117608910 B CN 117608910B CN 202410098513 A CN202410098513 A CN 202410098513A CN 117608910 B CN117608910 B CN 117608910B
Authority
CN
China
Prior art keywords
value
fault
target
byte
register
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410098513.4A
Other languages
English (en)
Other versions
CN117608910A (zh
Inventor
孙秀强
成珊
朱慧蓉
叶丰华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suzhou Metabrain Intelligent Technology Co Ltd
Original Assignee
Suzhou Metabrain Intelligent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Metabrain Intelligent Technology Co Ltd filed Critical Suzhou Metabrain Intelligent Technology Co Ltd
Priority to CN202410098513.4A priority Critical patent/CN117608910B/zh
Publication of CN117608910A publication Critical patent/CN117608910A/zh
Application granted granted Critical
Publication of CN117608910B publication Critical patent/CN117608910B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0721Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment within a central processing unit [CPU]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供了一种处理器的机器检查异常错误类型的确定方法、装置、系统、服务器、存储介质及电子设备,其中,该方法包括:获取目标处理器的目标寄存器中存储的寄存器数值,基于寄存器数值中包括的事件类型字节以及事件顺序字节确定目标处理器发生的目标故障的故障类型;在故障类型指示目标故障的类型为第一机器检查异常错误类型的情况下,基于寄存器数值中包括的错误数值字节确定目标故障是否为机器检查异常故障,其中,错误数值字节为用于指示错误数值的字节。通过本申请,解决相关技术中存在的确定处理器的机器检查异常错误类型不准确的问题,提高了确定处理器的机器检查异常错误类型判定的准确性。

Description

处理器的机器检查异常错误类型的确定方法、装置、系统
技术领域
本申请实施例涉及处理器领域,具体而言,涉及一种处理器的机器检查异常错误类型的确定方法、装置、系统、服务器、存储介质及电子设备。
背景技术
在相关技术中,在对处理器的错误进行分类解析时,有些非MCE(Machine CheckException,机器检查异常)错误的数据会被记录到MCE类错误中。
由此可知,相关技术中存在确定处理器的机器检查异常错误类型不准确的问题。
针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种处理器的机器检查异常错误类型的确定方法、装置、系统、服务器、存储介质及电子设备,以至少解决相关技术中存在的确定处理器的机器检查异常错误类型不准确的问题。
根据本申请的一个实施例,提供了一种处理器的机器检查异常错误类型的确定方法,包括:获取目标处理器的目标寄存器中存储的寄存器数值,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节;在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
在一个示例性实施例中,所述方法还包括:在所述故障类型指示所述目标故障的类型为第二机器检查异常错误类型的情况下,确定所述目标故障为机器检查异常故障。
在一个示例性实施例中,所述基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障包括:确定所述错误数值字节中包括的第一子字节的第一数值;基于所述第一数值确定所述目标故障是否为机器检查异常故障。
在一个示例性实施例中,所述基于所述第一数值确定所述目标故障是否为机器检查异常故障包括:确定第二数值,其中,所述第二数值为所述目标处理器所在的设备中包括的固件存在第一故障的情况下,所述目标寄存器中存储的第一故障值中包括的值,所述第一故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第一故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第二数值在所述第一故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第二数值中存在与所述第一数值相同的数值的情况下,确定所述目标故障为非所述机器检查异常故障;在所述第一数值与所述第二数值中包括的数值均不同的情况下,基于所述错误数值字节确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,所述基于所述错误数值字节确定所述目标故障是否为机器检查异常故障包括:确定所述错误数值字节中包括的第二子字节;基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障包括:确定第三数值,其中,所述第三数值为所述目标处理器所在的设备中包括的固件存在第二故障的情况下,所述目标寄存器中存储的第二故障值中包括的值,所述第二故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第二故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第三数值在所述第二故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第一数值与所述第三数值相同的情况下,确定所述第二子字节的第四数值;基于所述第四数值确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,所述基于所述第四数值确定所述目标故障是否为所述机器检查异常故障包括:在所述第四数值与目标数值不同的情况下,确定所述目标故障为所述机器检查异常故障;在所述第四数值与所述目标数值相同的情况下,确定所述目标故障为非所述机器检查异常故障。
在一个示例性实施例中,所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障包括:确定第五数值,其中,所述第五数值为所述目标处理器所在的设备中包括的固件存在第三故障的情况下,所述目标寄存器中存储的第三故障值中包括的值,所述第三故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第三故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第五数值在所述第三故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第一数值与所述第五数值相同的情况下,基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,所述基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障包括:确定所述第二子字节的第六数值,以及确定所述第三子字节的第七数值;确定第八数值以及第九数值,其中,所述第八数值为所述目标处理器所在的设备中包括的固件存在第四故障的情况下,所述目标寄存器中存储的第四故障值中包括的值,所述第四故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第四故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第四故障值中包括的用于指示错误数值的字节中包括的第一顺序子字节的数值与所述第一数值相同,所述第八数值为用于指示错误数值的字节中包括的位于第二顺序子字节中的值,所述第九数值为用于指示错误数值的字节中包括的位于第三顺序子字节中的值,所述第八数值在所述第四故障值中的顺序与所述第六数值在所述寄存器数值中的顺序相同,所述第九数值在所述第四故障值中的顺序与所述第七数值在所述寄存器数值中的顺序相同;在所述第六数值与所述第八数值相同、且所述第七数值与所述第九数值相同的情况下,确定所述目标故障为所述机器检查异常故障;在所述第六数值与所述第八数值不同,和/或,所述第七数值与所述第九数值不同的情况下,确定所述目标故障为非所述机器检查异常故障。
在一个示例性实施例中,在基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障之后,所述方法还包括:在确定所述目标故障为所述机器检查异常故障的情况下,确定所述机器检查异常故障的故障信息;将所述故障信息记录到目标日志中。
在一个示例性实施例中,获取目标处理器的目标寄存器中存储的寄存器数值包括:确定数值获取周期;按照所述数值获取周期轮询所述目标寄存器,以获取所述寄存器数值。
在一个示例性实施例中,在获取目标处理器的目标寄存器中存储的寄存器数值之前,所述方法还包括:确定目标频率;将与所述目标寄存器通信的总线时钟频率设置为所述目标频率。
根据本申请的另一个实施例,提供了一种处理器的机器检查异常错误类型的确定系统,用于指示上述任一项实施例中所述的方法,包括:目标处理器,所述目标处理器包括组件;目标寄存器,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;基板管理控制器,其中,所述基板管理控制器用于获取目标处理器的目标寄存器中存储的寄存器数值,基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节,在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
根据本申请的另一个实施例,提供了一种服务器,包括: 上述实施例中的处理器的机器检查异常错误类型的确定系统。
根据本申请的另一个实施例中,提供了一种处理器的机器检查异常错误类型的确定装置,包括:获取模块,用于获取目标处理器的目标寄存器中存储的寄存器数值,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;第一确定模块,用于基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节;第二确定模块,用于在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
根据本申请的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
根据本申请的又一个实施例,还提供了一种电子设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。
通过本申请,获取目标处理器的目标寄存器中存储的寄存器数值,其中,目标寄存器用于存储故障值,故障值包括目标处理器中包括的组件发生故障时,写入到目标寄存器中的数值;根据寄存器数值中包括的事件类型字节以及事件顺序字节确定目标处理器发生的目标故障的故障类型,其中,事件类型字节为用于指示事件类型的字节,事件顺序字节为用于指示事件发生顺序的字节;在故障类型指示目标故障的类型为第一机器检查异常错误类型的情况下,基于寄存器数值中包括的错误数值字节确定目标故障是否为机器检查异常故障,其中,错误数值字节为用于指示错误数值的字节。由于在确定目标故障是否为机器检查异常故障时,可以通过对目标寄存器中的寄存器数值进行分析,确定寄存器数值中的事件类型字节和事件顺序字节确定目标故障的故障类型是第一机器检查异常错误类型时,进一步根据寄存器数值中的错误数值字节进行判断,确定目标故障是否为机器检查异常故障。通过利用事件类型字节、事件顺序字节以及错误数值字节综合确定目标故障是否为机器检查异常故障,可有效防止将其他故障认定为机器检查异常故障。因此,可以解决相关技术中存在的确定处理器的机器检查异常错误类型不准确的问题,提高了确定处理器的机器检查异常错误类型判定的准确性。
附图说明
图1是本申请实施例的一种处理器的机器检查异常错误类型的确定方法的服务器设备的硬件结构框图;
图2是根据本申请实施例的处理器的机器检查异常错误类型的确定方法的流程图;
图3是根据本申请实施例的目标处理器结构示意图;
图4是根据本发明具体实施例的处理器的机器检查异常错误类型的确定方法流程图;
图5是根据本发明具体实施例的处理器的机器检查异常错误类型的确定方法泳道图;
图6是根据本申请实施例的处理器的机器检查异常错误类型的确定装置的结构框图。
具体实施方式
下文中将参考附图并结合实施例来详细说明本申请的实施例。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例中所提供的方法实施例可以在服务器设备或者类似的运算装置中执行。以运行在服务器设备上为例,图1是本申请实施例的一种处理器的机器检查异常错误类型的确定方法的服务器设备的硬件结构框图。如图1所示,服务器设备可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,其中,上述服务器设备还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述服务器设备的结构造成限定。例如,服务器设备还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的处理器的机器检查异常错误类型的确定方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至服务器设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器设备的通信供应方提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
在本实施例中提供了一种处理器的机器检查异常错误类型的确定方法,图2是根据本申请实施例的处理器的机器检查异常错误类型的确定方法的流程图,如图2所示,该流程包括如下步骤:
步骤S202,获取目标处理器的目标寄存器中存储的寄存器数值,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;
步骤S204,基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节;
步骤S206,在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
在上述实施例中,目标处理器可以是ARM(Advanced RISC Machine)架构处理器,目标处理器可以应用在电子产业的相关领域,如汽车、物联网等领域。还可以应用在手机端、电脑端、服务器端等领域。以ARM架构为主的CPU的 能耗较低,可以到达节能的目的。目标处理器结构示意图可参见附图3,如图3所示,目标处理器可以包括多个组件,多组组件还可以分为设备组件和总线组件,如内存总线设备、PCI链路设备、ARM核片、SMpro管理部件、PMpro管理部件、Mesh总线、OCM设备、CCIX总线、GIC等核心关键部件。其中,PCI(PeripheralComponent Interconnect,定义局部总线的标准),SMpro为系统管理控制器,PMpro为电源管理控制器,Mesh为一种CPU内部总线,OCM(On-Chip Memory,片上存储器),CCIX(CacheCoherent Interconnect for Accelerators)是一种高性能互联网协议。GIC(GenericInterrupt Controller,通用中断控制器)。
在上述实施例中,目标寄存器可以是SCP(System Control Processor)寄存器、还可以是字节值寄存器。目标寄存器中可以存储多种故障值。故障值在目标寄存器中可以以字节的形式存储。故障值可以对应6个字节、8个字节等。本发明对字节的数量不作限制。当故障值的字节数量为6个字节时,可以包括一个事件类型字节、一个事件顺序字节以及四个错误数值字节。其中,故障值中包括目标处理器中包括的组件发生故障时,写入到目标寄存器中的值。例如,在目标处理器中包括的组件发生故障时,写入到目标寄存器中的数值可以包括但不限于Mesh总线错误、SMpro错误信息、PMpro错误信息、GIC中断错误、SMMU错误信息、CPM错误信息、OCM错误信息等ARM架构内部总线及组件的错误信息。故障值还可以包括目标处理器所在的设备中的其他固件出现故障时,写入到目标寄存器中的值。目标处理器所在的设备可以包括汽车、计算机、手机、服务器等。
在上述实施例中,ARM架构处理器内部包含多个组件,如内存总线设备、PCI链路设备、ARM核片、SMpro管理部件、PMpro管理部件、Mesh总线、OCM设备、CCIX总线、GIC等核心关键部件,一旦这些部件产生错误时必定会对ARM服务器整机系统造成严重或致命的错误,故可以通过对ARM处理器的错误寄存器数值按照一定规则进行解析。例如,可以BMC(基板管理控制器)通过I2C总线对ARM处理器的SCP寄存器进行轮训读取寄存器数值,并按照一定规则进行解析,确定目标故障是否为机器检查异常故障。在是机器检查异常故障的情况下,可以将寄存器数值显示在BMC的sel日志中,便于快速解析定位以实现高效快速定位处理器故障位置信息。
在上述实施例中,第一机器检查异常错误类型可以是目标处理器中包括的设备组件存在故障类型。此时,事件类型字节的数值可以为0x12,事件顺序字节的数值可以为0x8E。即当寄存器数值中包括的前两个字节的数值为0x128E时,第一机器检查异常错误类型可以是目标处理器中包括的设备组件存在故障类型。而当设备组件存在故障时,产生的寄存器数值中的事件类型字节和事件顺序字节的数值可能与目标处理器所在的设备的其他固件出现故障时所产生的寄存器数值中的事件类型字节和事件顺序字节的数值相同,因此,可以进一步根据寄存器数值中的错误数值字节进行判断。进而,提高了确定机器检查异常故障的准确性。
通过本申请,获取目标处理器的目标寄存器中存储的寄存器数值,其中,目标寄存器用于存储故障值,故障值包括目标处理器中包括的组件发生故障时,写入到目标寄存器中的数值;根据寄存器数值中包括的事件类型字节以及事件顺序字节确定目标处理器发生的目标故障的故障类型,其中,事件类型字节为用于指示事件类型的字节,事件顺序字节为用于指示事件发生顺序的字节;在故障类型指示目标故障的类型为第一机器检查异常错误类型的情况下,基于寄存器数值中包括的错误数值字节确定目标故障是否为机器检查异常故障,其中,错误数值字节为用于指示错误数值的字节。由于在确定目标故障是否为机器检查异常故障时,可以通过对目标寄存器中的寄存器数值进行分析,确定寄存器数值中的事件类型字节和事件顺序字节确定目标故障的故障类型是第一机器检查异常错误类型时,进一步根据寄存器数值中的错误数值字节进行判断,确定目标故障是否为机器检查异常故障。通过利用事件类型字节、事件顺序字节以及错误数值字节综合确定目标故障是否为机器检查异常故障,可有效防止将其他故障认定为机器检查异常故障。因此,可以解决相关技术中存在的确定处理器的机器检查异常错误类型不准确的问题,提高了确定处理器的机器检查异常错误类型判定的准确性。
其中,上述步骤的执行主体可以为处理器,如处理器中的基板管理控制器BMC等,但不限于此。
在一个示例性实施例中,所述方法还包括:在所述故障类型指示所述目标故障的类型为第二机器检查异常错误类型的情况下,确定所述目标故障为机器检查异常故障。在本实施例中,第二机器检查异常错误类型可以是目标处理器中包括的总线组件出现故障类型。当故障类型指示目标处理器中包括的总线出现故障时,可以认为一定出现了MCE错误。因此,无需再进一步对寄存器数值中包括的错误数值字节进行解析。节省了确定MCE故障的时间。
在上述实施例中,当目标故障的类型为第二机器检查异常错误类型时,事件类型字节的数值可以为0x07,事件顺序字节的数值可以为0x8C。即当寄存器数值中的前两个字节为0x078C时,可以认为目标故障的类型为第二机器检查异常错误类型。
需要说明的是,上述数值仅是一种示例性说明,本发明对此不作限制。事件类型字节以及事件顺序字节的数值不同可以代表不同的类型。事件类型字节以及事件顺序字节的数值与故障类型的对应关系可以是预先设置等。当出现一种故障时,则将该故障的故障类型对应的事件类型字节以及事件顺序字节的数值写入的目标寄存器中。
在一个示例性实施例中,所述基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障包括:确定所述错误数值字节中包括的第一子字节的第一数值;基于所述第一数值确定所述目标故障是否为机器检查异常故障。在本实施例中,当故障类型指示目标故障为第一机器检查异常故障时,可以认为是目标处理器中包括的除总线之外的其他组件存在故障。而当目标处理器所在的其他设备存在故障时,在目标寄存器中写入的数值中的事件类型字节与事件顺序字节有可能与当处理器中的组件存在故障时写入的事件类型字节与事件顺序字节相同,因此,可以进一步对寄存器数值中包括的错误数值字节进行解析,以确定目标故障是否为机器检查异常故障。
在上述实施例中,错误数值字节中可以包括多个字节,例如,当寄存器数值中包括6个字节时,可以包括一个事件类型字节、一个事件顺序字节以及四个错误数值字节。即错误数值字节中包括4个子字节。当确定目标故障的故障类型为第一机器检查异常错误类型时,可以进一步解析错误数值字节中包括的第一子字节,根据第一子字节确定目标故障是否为机器检查异常故障。无需对每个错误数值字节中包括的子字节进行解析,因此,可以提高确定机器检查异常故障的速度。
在一个示例性实施例中,所述基于所述第一数值确定所述目标故障是否为机器检查异常故障包括:确定第二数值,其中,所述第二数值为所述目标处理器所在的设备中包括的固件存在第一故障的情况下,所述目标寄存器中存储的第一故障值中包括的值,所述第一故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第一故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第二数值在所述第一故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第二数值中存在与所述第一数值相同的数值的情况下,确定所述目标故障为非所述机器检查异常故障;在所述第一数值与所述第二数值中包括的数值均不同的情况下,基于所述错误数值字节确定所述目标故障是否为所述机器检查异常故障。在本实施例中,当目标处理器所在的设备的其他固件存在故障时,可以将第一故障值写入到目标寄存器中。第一故障值的结构与寄存器数值的结构相同,即第一故障值中包括用于指示故障类型的字节、用于指示事件顺序的字节。二者的数值与寄存器数值中包括的事件类型字节以及事件顺序字节的数值相同。第一故障值中还包括用于指示错误数值的字节,该字节包括的子字节的数量与寄存器数值中包括的错误数值字节中包括的子字节数量相同。第二数值即为第一故障值中包括的用于指示错误数值的字节中的数值。第二数值在第一故障值中的顺序与第一子字节在错误数值字节中的顺序相同。
需要说明的是,第二数值还可以是目标处理器中包括的组件出现除MCE类型错误之外的其他类型错误,即第一故障时产生的第一故障值中包括的数值。
在上述实施例中,第二数值可以包括0xC3, 0x04, 0x07, 0x08, 0x0A, 0x0B,0x0C, 0x0D, 0x0E, 0x3F。当第二数值中存在与第一数值相同的数值时,可以认为目标故障为非机器检查异常故障。
在上述实施例中,当第一数值和第二数值中包括的数值均不同时,可以进一步根据错误数值字节确定目标故障是否为机器检查异常故障。例如,可以根据错误数值字节中包括的第二子字节确定目标故障是否为机器检查异常故障。进一步解析错误数值字节,通过错误数值字节确定目标故障是否为机器检查异常故障可以提高确定机器检查异常故障的准确性。
在一个示例性实施例中,所述基于所述错误数值字节确定所述目标故障是否为机器检查异常故障包括:确定所述错误数值字节中包括的第二子字节;基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障。在本实施例中,当第一数值与第二数值中包括的数值均不同的情况下,可以通过错误数值字节中包括的第二子字节以及第一数值确定目标故障是否为机器检查异常故障,即通过错误数值字节的第一子字节以及第二子字节组合判断。在进行机器检查异常故障判断时,可以逐一解析错误数值字节。当第一子字节能够判断出目标故障是否为机器检查异常故障时,无需进一步判断。当第一子字节不能判断出目标故障是否为机器检查异常故障时,进一步解析下一字节,而不是对所有错误数值字节中的数值均进行解析,既能提高确定机器检查异常错误类型的准确率,又能达到节约算力的效果。
在一个示例性实施例中,所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障包括:确定第三数值,其中,所述第三 数值为所述目标处理器所在的设备中包括的固件存在第二故障的情况下,所述目标寄存器中存储的第二故障值中包括的值,所述第二故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第二故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第三数值在所述第二故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第一数值与所述第三数值相同的情况下,确定所述第二子字节的第四数值;基于所述第四数值确定所述目标故障是否为所述机器检查异常故障。在本实施例中,当目标处理器所在的设备中包括的固件存在第二故障的情况下,可以在目标寄存器中写入第二故障值;第二故障值的结构与寄存器数值的结构相同,且第二故障值中包括的用于指示故障类型的字节的数值与事件类型字节的数值相同,用于指示故障顺序的字节的数值与事件顺序字节的数值相同。第二故障值中的第三数值可以是第二故障值中的用于指示错误数值的字节中的第一子字节,即第三数值与第一数值在各自的错误数值字节中的顺序相同。在第三数值与第一数值相同时,可以根据第二子字节的第四数值确定目标故障是否为机器检查异常故障。
在上述实施例中,目标处理器所在的设备中包括的固件可以包括目标处理器所在的设备中包括除目标处理器包括的组件之外的固件,还可以包括目标处理器包括的组件。当目标处理器中包括的某个类型的组件发生除MCE类型错误的故障时,可以在目标寄存器中写入第二故障值。当目标处理器所在的设备中包括除目标处理器包括的组件之外的某个固件发生某个类型的错误时,也可以在目标寄存器中写入第二故障值。其中,第二故障值中的第三数值可以是0x05。
在上述实施例中,为了防止上述情况发生时,将故障错误地识别为机器检查异常故障,可以将第一子字节和第二子字节进行组合解析,提高了确定机器检查异常错误类型的准确率。
在一个示例性实施例中,所述基于所述第四数值确定所述目标故障是否为所述机器检查异常故障包括:在所述第四数值与目标数值不同的情况下,确定所述目标故障为所述机器检查异常故障;在所述第四数值与所述目标数值相同的情况下,确定所述目标故障为非所述机器检查异常故障。在本实施例中,目标数值可以是0,当第四数值为非0时,可以确定目标故障为机器检查异常故障。当第四数值为0时,则认为目标故障不是机器检查异常故障。
在一个示例性实施例中,所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障包括:确定第五数值,其中,所述第五数值为所述目标处理器所在的设备中包括的固件存在第三故障的情况下,所述目标寄存器中存储的第三故障值中包括的值,所述第三故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第三故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第五数值在所述第三故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第一数值与所述第五数值相同的情况下,基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障。在本实施例中,当目标处理器所在的设备中包括的固件存在第三故障的情况下,可以在目标寄存器中写入第三故障值;第三故障值的结构与寄存器数值的结构相同,且第三故障值中包括的用于指示故障类型的字节的数值与事件类型字节的数值相同,用于指示故障顺序的字节的数值与事件顺序字节的数值相同。第三故障值中的第五数值可以是第三故障值中的用于指示错误数值的字节中的第一子字节,即第五数值与第一数值在各自的错误数值字节中的顺序相同。在第五数值与第一数值相同时,可以根据第二子字节以及第三子字节确定目标故障是否为机器检查异常故障。
在上述实施例中,目标处理器所在的设备中包括的固件可以包括目标处理器所在的设备中包括除目标处理器包括的组件之外的固件,还可以包括目标处理器包括的组件。当目标处理器中包括的某个类型的组件发生除MCE类型错误之外的某个类型故障时,可以在目标寄存器中写入第三故障值。当目标处理器所在的设备中包括除目标处理器包括的组件之外的某个固件发生某个类型的错误时,也可以在目标寄存器中写入第三故障值。其中,第三故障值中的第五数值可以是0xFF。
在上述实施例中,为了防止上述情况发生时,将故障错误地识别为机器检查异常故障,可以将第一子字节、第二子字节、第三子字节进行组合解析,提高了确定机器检查异常错误类型的准确率。
在一个示例性实施例中,所述基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障包括:确定所述第二子字节的第六数值,以及确定所述第三子字节的第七数值;确定第八数值以及第九数值,其中,所述第八数值为所述目标处理器所在的设备中包括的固件存在第四故障的情况下,所述目标寄存器中存储的第四故障值中包括的值,所述第四故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第四故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第四故障值中包括的用于指示错误数值的字节中包括的第一顺序子字节的数值与所述第一数值相同,所述第八数值为用于指示错误数值的字节中包括的位于第二顺序子字节中的值,所述第九数值为用于指示错误数值的字节中包括的位于第三顺序子字节中的值,所述第八数值在所述第四故障值中的顺序与所述第六数值在所述寄存器数值中的顺序相同,所述第九数值在所述第四故障值中的顺序与所述第七数值在所述寄存器数值中的顺序相同;在所述第六数值与所述第八数值相同、且所述第七数值与所述第九数值相同的情况下,确定所述目标故障为所述机器检查异常故障;在所述第六数值与所述第八数值不同,和/或,所述第七数值与所述第九数值不同的情况下,确定所述目标故障为非所述机器检查异常故障。在本实施例中,当错误数值字节包括4个子字节时,4个子字节可以分别是Evtdata1、Evtdata2、Evtdata3、Evtdata4。其中,第一子字节可以为Evtdata1,第二子字节可以为Evtdata2,第三子字节可以为Evtdata4。不同的子字节的数值可以表示不同的错误标识,多个子字节的组合,即错误数值字节即表示具体的故障代码。在不同的固件发生故障时,可以根据故障的种类生成位于不同字节处不同的数值,构成错误数值字节。
在上述实施例中,当第一数值与第五数值相同时,可以进一步判断第二子字节的第六数值以及第三子字节的第七数值。当目标处理器所在的设备中包括的固件存在第四故障的情况下,可以在目标寄存器中写入第四故障值;第四故障值的结构与寄存器数值的结构相同,且第四故障值中包括的用于指示故障类型的字节的数值与事件类型字节的数值相同,用于指示故障顺序的字节的数值与事件顺序字节的数值相同。第四故障值中的第八数值可以是第四故障值中的用于指示错误数值的字节中的第二子字节,即第八数值与第六数值在各自的错误数值字节中的顺序相同。第四故障值中的第九数值可以是第四故障值中的用于指示错误数值的字节中的第三子字节,即第九数值与第七数值在各自的错误数值字节中的顺序相同。在第八数值与第六数值相同、第九数值与第七数值相同时,可以确定目标故障为机器检查异常故障,否则则不是机器检查异常故障。
在上述实施例中,目标处理器所在的设备中包括的固件可以包括目标处理器所在的设备中包括除目标处理器包括的组件之外的固件,还可以包括目标处理器包括的组件。当目标处理器中包括的某个类型的组件发生除MCE类型错误之外的某个类型故障时,可以在目标寄存器中写入第四故障值。当目标处理器所在的设备中包括除目标处理器包括的组件之外的某个固件发生某个类型的错误时,也可以在目标寄存器中写入第四故障值。其中,第四故障值中的第八数值以及第九数值均可以是0xFF。
在上述实施例中,通过对第一子字节、第二子字节以及第三子字节进行解析,确定目标故障是否为机器检查异常故障,提高了识别机器检查异常故障的准确率。
在一个示例性实施例中,在基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障之后,所述方法还包括:在确定所述目标故障为所述机器检查异常故障的情况下,确定所述机器检查异常故障的故障信息;将所述故障信息记录到目标日志中。在本实施例中,目标日志可以为SEL日志。通过对寄存器数值进行校验以判断是否出现MCE错误,并在出现MCE错误的情况下,将对应的MCE错误信息记录到BMC的SEL日志中并进行显示,方便用户对MCE错误进行处理。
在上述实施例中,当确定目标处理器出现MCE错误时,可以提醒用户更换新的处理器,以防止目标处理器无法正常工作而导致目标处理器所在的设备,如服务器等无法正常工作。
在一个示例性实施例中,获取目标处理器的目标寄存器中存储的寄存器数值包括:确定数值获取周期;按照所述数值获取周期轮询所述目标寄存器,以获取所述寄存器数值。在本实施例中, 可以设置定期轮询机制,由BMC按照数值获取周期轮询目标寄存器,以获取寄存器数值。其中,数值获取周期可以是2s,需要说明的是,该取值仅是一种示例性说明,本发明对此不作限制。轮询机制便于实时追踪定位判断服务器是否出现故障,便于快递定位产生问题的根因及采取相应的维护措施。
在一个示例性实施例中,在获取目标处理器的目标寄存器中存储的寄存器数值之前,所述方法还包括:确定目标频率;将与所述目标寄存器通信的总线时钟频率设置为所述目标频率。在本实施例中个,可以确定目标处理器所在的设备的基本输入输出系统所支持的时钟频率,根据基本输入输出系统所支持的时钟频率确定目标频率,并将BMC与目标寄存器通信的总线时钟频率设置为目标频率,以提高目标处理器所在的设备的性能。其中,目标频率可以是100kHz,需要说明的是,该取值仅是一种示例性说明,本发明对此不作限制。
在上述实施例中,将ARM架构处理器MCE错误信息的产生类型,通过BMC初始化与SCP通信的I2C总线频率100khz且定时轮询机制读取SCP的0xDA寄存器,将获取的SCP的0xDA寄存器返回的6字节数值进行一一校验,根据不同的校验结果确认是否是MCE错误产生并以BMC的sel日志形式进行显示与记录,对定位出的问题便于研发人员和维护人员快速提供问题的解决方案,如更换系统下有问题的CPU,提高了系统运行的稳定性和安全性,提高了运维效率并降低了运维人员的人力成本。
在一个示例性实施例中,可以在目标处理器中设置多个寄存器,不同的寄存器用于存储不同的内容,在多个寄存器中包括一个MCE故障寄存器。当目标处理器中包括的组件发生MCE类型错误的故障时,可以控制发生MCE类型错误的故障的组件将故障值存储在MCE故障寄存器中。BMC可以确定MCE故障寄存器是否为空,在为MCE故障寄存器为空的情况下,确定目标处理器未发生MCE类型故障,即机器检查异常故障。当MCE故障寄存器非空的情况下,确定目标处理器发生MCE类型错误,即发生机器检查异常故障。因此,可以实现在确定目标处理器是否发生机器检查异常故障时,只需判断MCE故障寄存器是否为空,无需根据MCE故障寄存器中的数值进行判断。提高了确定目标处理器是否发生机器检查异常故障的效率。
在上述实施例中,当确定MCE故障寄存器非空时,确定目标处理器发生MCE类型错误,因此,可以获取MCE故障寄存器中的数值,根据数值进行故障定位。
下面结合具体实施方式对处理器的机器检查异常错误类型的确定方法进行说明:
图4是根据本发明具体实施例的处理器的机器检查异常错误类型的确定方法流程图,图5是根据本发明具体实施例的处理器的机器检查异常错误类型的确定方法泳道图,如图4-5所示,通过定义6个字节 数值区分上述48个字节的MCE错误解析方案,6个字节设计1个字节的事件类型、1个字节的事件顺序号、4个字节的错误数值进行自定义解析,具体解析规则如下:6个字节的前2个字节的事件类型和时间顺序号数值是否为0x128E ,若不是则不是MCE错误类型,若是0x128E则需要对后续4个字节进行一一组合判断以确认是否为MCE错误,第3个字节数值若是0xC3, 0x04, 0x07, 0x08, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E,0x3F 则认为不是MCE错误类型,若不是上述类型数值则需要对第3个数值和第4个数值 进行组合判断,即第3个数值是0x05且第四个数值是非0值则认为是MCE错误类型;第三个数值是0xFF数值且第4字节和第6字节则是0xFF数值则认为是MCE错误,其他情况为非MCE错误;同样对第1字节和第2字节判断为0x078C的也是归为MCE类错误, 一旦BMC自定义解析为MCE错误则需要我们立刻对服务器进行CPU的更换动作,如此才能保证服务器安全可靠运行。BMC对上述MCE错误解析完毕后会在BMC的SEL日志中予以记录并保存提醒使用人员进行设备更新。
具体实现过程如下:
1)BMC将与SCP通信的I2C链路设置100k Hz,同时,采取定时轮训(2s读取一次Scp寄存器)机制轮询SCP寄存器0xDA的数值;
2)BMC对SCP读取的0xDA寄存器数值进行解析,读取0xDA的寄存器返回的是6个字节的数据;
3)首先对获取的6个字节判断是否是0x078C或0x128E ,若不是上述数值则为非MCE错误;若是0x078C则是MCE错误;若是0x128E数值则需要进一步对读取的第3字节到第6字节进行判断处理;
4)当第1个和第2个数值为0x128E时,需要对第3个字节进行判断处理,若不是0xC3, 0x04, 0x07, 0x08, 0x0A, 0x0B, 0x0C, 0x0D, 0x0E, 0x3F数值则为Mce错误;若是0x05或0xFF数值时则对第4字节和第6字节进行判断处理;
5)若第3字节是0x05是,第四字节非0x0数值时则认为是MCE错误类型;
6)若第3字节是0xFF时,第四字节是0xFF且第6字节为0xFF时,则认为是MCE错误类型;
7)若步骤3至步骤6均未出现,则此数值对应的不是MCE错误可忽略处理;若是,则BMC将对应的数值解析为MCE错误并记录的BMC的SEL日志中便于记录查看,以保证服务器的稳定可靠性。
MCE错误的对应数值关系可参见表1。
表1
/>
在前述实施例中,通过BMC初始化时设置与SCP通信的I2C总线时钟频率为100khz,在服务器启动后的运行阶段采取定时2s轮询机制读取SCP的0xDA寄存器的6个字节数值,对获取的6个字节的前2个字节进行校验核对,若不是0x078c或0x128E则认定为非MCE错误,若是0x078c则认定为MCE错误信息且bmc记录到SEL日志中;若是0x128E值后需要对第3、第4及第6字节进行校验,若第三字节未非0xC3, 0x04, 0x07, 0x08, 0x0A, 0x0B, 0x0C, 0x0D,0x0E, 0x3F数值则认定为MCE错误并记录到SEL日志中;若第3字节是0x05则对第4字节的数据校验是否是非O数值,若不是则是MCE错误,若其他则非MCE错误;若第3字节是0xFF则对第4字节和第5字节的数据校验是否是0xFF的数值,若是则是MCE错误,若不是则为非MCE错误不用与记录sel日志信息。故本篇专利的关键点是BMC通过初始化100khz频率的I2C总线定时2s轮询读取SCP的0xDA寄存器并获取返回的6个字节数据,通过对6个字节的不同数值状态进行校验以判断是否出现mce错误并将对应的mce错误信息记录到BMC的SEL日志中并进行显示,同时,轮询机制便于实时追踪定位判断服务器是否出现故障,便于快递定位产生问题的根因及采取相应的维护措施。
需要说明的是,上述各个字节或子字节的数值仅是一种示例性说明,不同的组件在发生不同类型的故障时,可以生成不同的数值,每个组件发生不同类型的故障时所生成的数值可以是预先配置的。
在本实施例中还提供了一种处理器的机器检查异常错误类型的确定系统,用于执行上述任意一项实施例中描述的方法,该系统包括:
目标处理器,所述目标处理器包括组件;
目标寄存器,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;
基板管理控制器,其中,所述基板管理控制器用于获取目标处理器的目标寄存器中存储的寄存器数值,基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节,在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
在上述实施例中,目标处理器可以是ARM(Advanced RISC Machine)架构处理器,目标处理器可以应用在电子产业的相关领域,如汽车、物联网等领域。还可以应用在手机端、电脑端、服务器端等领域。以ARM架构为主的CPU的 能耗较低,可以到达节能的目的。目标处理器结构示意图可参见附图3,如图3所示,目标处理器可以包括多个组件,多组组件还可以分为设备组件和总线组件,如内存总线设备、PCI链路设备、ARM核片、SMpro管理部件、PMpro管理部件、Mesh总线、OCM设备、CCIX总线、GIC等核心关键部件。其中,PCI(PeripheralComponent Interconnect,定义局部总线的标准),SMpro为系统管理控制器,PMpro为电源管理控制器,Mesh为一种CPU内部总线,OCM(On-Chip Memory,片上存储器),CCIX(CacheCoherent Interconnect for Accelerators)是一种高性能互联网协议。GIC(GenericInterrupt Controller,通用中断控制器)。
在上述实施例中,目标寄存器可以是SCP(System Control Processor)寄存器、还可以是字节值寄存器。目标寄存器中可以存储多种故障值。故障值在目标寄存器中可以以字节的形式存储。故障值可以对应6个字节、8个字节等。本发明对字节的数量不作限制。当故障值的字节数量为6个字节时,可以包括一个事件类型字节、一个事件顺序字节以及四个错误数值字节。其中,故障值中包括目标处理器中包括的组件发生故障时,写入到目标寄存器中的值。例如,在目标处理器中包括的组件发生故障时,写入到目标寄存器中的数值可以包括但不限于Mesh总线错误、SMpro错误信息、PMpro错误信息、GIC中断错误、SMMU错误信息、CPM错误信息、OCM错误信息等ARM架构内部总线及组件的错误信息。故障值还可以包括目标处理器所在的设备中的其他固件出现故障时,写入到目标寄存器中的值。目标处理器所在的设备可以包括汽车、计算机、手机、服务器等。
在上述实施例中,ARM架构处理器内部包含多个组件,如内存总线设备、PCI链路设备、ARM核片、SMpro管理部件、PMpro管理部件、Mesh总线、OCM设备、CCIX总线、GIC等核心关键部件,一旦这些部件产生错误时必定会对ARM服务器整机系统造成严重或致命的错误,故可以通过对ARM处理器的错误寄存器数值按照一定规则进行解析。例如,可以BMC(基板管理控制器)通过I2C总线对ARM处理器的SCP寄存器进行轮训读取寄存器数值,并按照一定规则进行解析,确定目标故障是否为机器检查异常故障。在是机器检查异常故障的情况下,可以将寄存器数值显示在BMC的sel日志中,便于快速解析定位以实现高效快速定位处理器故障位置信息。
在上述实施例中,第一机器检查异常错误类型可以是目标处理器中包括的设备组件存在故障类型。此时,事件类型字节的数值可以为0x12,事件顺序字节的数值可以为0x8E。即当寄存器数值中包括的前两个字节的数值为0x128E时,第一机器检查异常错误类型可以是目标处理器中包括的设备组件存在故障类型。而当设备组件存在故障时,产生的寄存器数值中的事件类型字节和事件顺序字节的数值可能与目标处理器所在的设备的其他固件出现故障时所产生的寄存器数值中的事件类型字节和事件顺序字节的数值相同,因此,可以进一步根据寄存器数值中的错误数值字节进行判断。进而,提高了确定机器检查异常故障的准确性。
通过本申请,获取目标处理器的目标寄存器中存储的寄存器数值,其中,目标寄存器用于存储故障值,故障值包括目标处理器中包括的组件发生故障时,写入到目标寄存器中的数值;根据寄存器数值中包括的事件类型字节以及事件顺序字节确定目标处理器发生的目标故障的故障类型,其中,事件类型字节为用于指示事件类型的字节,事件顺序字节为用于指示事件发生顺序的字节;在故障类型指示目标故障的类型为第一机器检查异常错误类型的情况下,基于寄存器数值中包括的错误数值字节确定目标故障是否为机器检查异常故障,其中,错误数值字节为用于指示错误数值的字节。由于在确定目标故障是否为机器检查异常故障时,可以通过对目标寄存器中的寄存器数值进行分析,确定寄存器数值中的事件类型字节和事件顺序字节确定目标故障的故障类型是第一机器检查异常错误类型时,进一步根据寄存器数值中的错误数值字节进行判断,确定目标故障是否为机器检查异常故障。通过利用事件类型字节、事件顺序字节以及错误数值字节综合确定目标故障是否为机器检查异常故障,可有效防止将其他故障认定为机器检查异常故障。因此,可以解决相关技术中存在的确定处理器的机器检查异常错误类型不准确的问题,提高了确定处理器的机器检查异常错误类型判定的准确性。
在本实施例中还提供了一种服务器,包括上述实施例中的处理器的机器检查异常错误类型的确定系统。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
在本实施例中还提供了一种处理器的机器检查异常错误类型的确定装置,该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图6是根据本申请实施例的处理器的机器检查异常错误类型的确定装置的结构框图,如图6所示,该装置包括:
获取模块62,用于获取目标处理器的目标寄存器中存储的寄存器数值,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;
第一确定模块64,用于基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节;
第二确定模块66,用于在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
在一个示例性实施例中,所述装置还用于:在所述故障类型指示所述目标故障的类型为第二机器检查异常错误类型的情况下,确定所述目标故障为机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障:确定所述错误数值字节中包括的第一子字节的第一数值;基于所述第一数值确定所述目标故障是否为机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述第一数值确定所述目标故障是否为机器检查异常故障:确定第二数值,其中,所述第二数值为所述目标处理器所在的设备中包括的固件存在第一故障的情况下,所述目标寄存器中存储的第一故障值中包括的值,所述第一故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第一故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第二数值在所述第一故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第二数值中存在与所述第一数值相同的数值的情况下,确定所述目标故障为非所述机器检查异常故障;在所述第一数值与所述第二数值中包括的数值均不同的情况下,基于所述错误数值字节确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述错误数值字节确定所述目标故障是否为机器检查异常故障:确定所述错误数值字节中包括的第二子字节;基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障:确定第三数值,其中,所述第三数值为所述目标处理器所在的设备中包括的固件存在第二故障的情况下,所述目标寄存器中存储的第二故障值中包括的值,所述第二故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第二故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第三数值在所述第二故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第一数值与所述第三数值相同的情况下,确定所述第二子字节的第四数值;基于所述第四数值确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述第四数值确定所述目标故障是否为所述机器检查异常故障:在所述第四数值与目标数值不同的情况下,确定所述目标故障为所述机器检查异常故障;在所述第四数值与所述目标数值相同的情况下,确定所述目标故障为非所述机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障:确定第五数值,其中,所述第五数值为所述目标处理器所在的设备中包括的固件存在第三故障的情况下,所述目标寄存器中存储的第三故障值中包括的值,所述第三故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第三故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第五数值在所述第三故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第一数值与所述第五数值相同的情况下,基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障。
在一个示例性实施例中,第二确定模块66可以通过如下方式实现所述基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障:确定所述第二子字节的第六数值,以及确定所述第三子字节的第七数值;确定第八数值以及第九数值,其中,所述第八数值为所述目标处理器所在的设备中包括的固件存在第四故障的情况下,所述目标寄存器中存储的第四故障值中包括的值,所述第四故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第四故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第四故障值中包括的用于指示错误数值的字节中包括的第一顺序子字节的数值与所述第一数值相同,所述第八数值为用于指示错误数值的字节中包括的位于第二顺序子字节中的值,所述第九数值为用于指示错误数值的字节中包括的位于第三顺序子字节中的值,所述第八数值在所述第四故障值中的顺序与所述第六数值在所述寄存器数值中的顺序相同,所述第九数值在所述第四故障值中的顺序与所述第七数值在所述寄存器数值中的顺序相同;在所述第六数值与所述第八数值相同、且所述第七数值与所述第九数值相同的情况下,确定所述目标故障为所述机器检查异常故障;在所述第六数值与所述第八数值不同,和/或,所述第七数值与所述第九数值不同的情况下,确定所述目标故障为非所述机器检查异常故障。
在一个示例性实施例中,所述装置还用于在基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障之后,在确定所述目标故障为所述机器检查异常故障的情况下,确定所述机器检查异常故障的故障信息;将所述故障信息记录到目标日志中。
在一个示例性实施例中,获取模块62可以通过如下方式实现获取目标处理器的目标寄存器中存储的寄存器数值:确定数值获取周期;按照所述数值获取周期轮询所述目标寄存器,以获取所述寄存器数值。
在一个示例性实施例中,所述装置还用于在获取目标处理器的目标寄存器中存储的寄存器数值之前,确定目标频率;将与所述目标寄存器通信的总线时钟频率设置为所述目标频率。
需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
本申请的实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述计算机可读存储介质可以包括但不限于:U盘、只读存储器(Read-Only Memory,简称为ROM)、随机存取存储器(Random Access Memory,简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
本申请的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
在一个示例性实施例中,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例,本实施例在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (15)

1.一种处理器的机器检查异常错误类型的确定方法,其特征在于,
包括:
获取目标处理器的目标寄存器中存储的寄存器数值,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;
基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节;
在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节,所述第一机器检查异常错误类型包括所述目标处理器中包括的设备组件存在故障类型;
所述基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障包括:确定所述错误数值字节中包括的第一子字节的第一数值;基于所述第一数值确定所述目标故障是否为机器检查异常故障;
所述基于所述第一数值确定所述目标故障是否为机器检查异常故障包括:确定第二数值,其中,所述第二数值为所述目标处理器所在的设备中包括的固件存在第一故障的情况下,所述目标寄存器中存储的第一故障值中包括的值,所述第一故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第一故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第二数值在所述第一故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第二数值中存在与所述第一数值相同的数值的情况下,确定所述目标故障为非所述机器检查异常故障;在所述第一数值与所述第二数值中包括的数值均不同的情况下,基于所述错误数值字节确定所述目标故障是否为所述机器检查异常故障。
2.根据权利要求1所述的方法,其特征在于,
所述方法还包括:
在所述故障类型指示所述目标故障的类型为第二机器检查异常错误类型的情况下,确定所述目标故障为机器检查异常故障,其中,所述第二机器检查异常错误类型包括所述目标处理器中包括的总线组件出现故障类型。
3.根据权利要求1所述的方法,其特征在于,
所述基于所述错误数值字节确定所述目标故障是否为机器检查异常故障包括:
确定所述错误数值字节中包括的第二子字节;
基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障。
4.根据权利要求3所述的方法,其特征在于,
所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障包括:
确定第三数值,其中,所述第三数值为所述目标处理器所在的设备中包括的固件存在第二故障的情况下,所述目标寄存器中存储的第二故障值中包括的值,所述第二故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第二故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第三数值在所述第二故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;
在所述第一数值与所述第三数值相同的情况下,确定所述第二子字节的第四数值;
基于所述第四数值确定所述目标故障是否为所述机器检查异常故障。
5.根据权利要求4所述的方法,其特征在于,
所述基于所述第四数值确定所述目标故障是否为所述机器检查异常故障包括:
在所述第四数值与目标数值不同的情况下,确定所述目标故障为所述机器检查异常故障;
在所述第四数值与所述目标数值相同的情况下,确定所述目标故障为非所述机器检查异常故障。
6.根据权利要求3所述的方法,其特征在于,
所述基于所述第二子字节以及所述第一数值确定所述目标故障是否为所述机器检查异常故障包括:
确定第五数值,其中,所述第五数值为所述目标处理器所在的设备中包括的固件存在第三故障的情况下,所述目标寄存器中存储的第三故障值中包括的值,所述第三故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第三故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第五数值在所述第三故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;
在所述第一数值与所述第五数值相同的情况下,基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障。
7.根据权利要求6所述的方法,其特征在于,
所述基于所述第二子字节以及所述错误数值字节中包括的第三子字节确定所述目标故障是否为所述机器检查异常故障包括:
确定所述第二子字节的第六数值,以及确定所述第三子字节的第七数值;
确定第八数值以及第九数值,其中,所述第八数值为所述目标处理器所在的设备中包括的固件存在第四故障的情况下,所述目标寄存器中存储的第四故障值中包括的值,所述第四故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第四故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第四故障值中包括的用于指示错误数值的字节中包括的第一顺序子字节的数值与所述第一数值相同,所述第八数值为用于指示错误数值的字节中包括的位于第二顺序子字节中的值,所述第九数值为用于指示错误数值的字节中包括的位于第三顺序子字节中的值,所述第八数值在所述第四故障值中的顺序与所述第六数值在所述寄存器数值中的顺序相同,所述第九数值在所述第四故障值中的顺序与所述第七数值在所述寄存器数值中的顺序相同;
在所述第六数值与所述第八数值相同、且所述第七数值与所述第九数值相同的情况下,确定所述目标故障为所述机器检查异常故障;
在所述第六数值与所述第八数值不同,和/或,所述第七数值与所述第九数值不同的情况下,确定所述目标故障为非所述机器检查异常故障。
8.根据权利要求1所述的方法,其特征在于,
在基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障之后,所述方法还包括:
在确定所述目标故障为所述机器检查异常故障的情况下,确定所述机器检查异常故障的故障信息;
将所述故障信息记录到目标日志中。
9.根据权利要求1所述的方法,其特征在于,
获取目标处理器的目标寄存器中存储的寄存器数值包括:
确定数值获取周期;
按照所述数值获取周期轮询所述目标寄存器,以获取所述寄存器数值。
10.根据权利要求1所述的方法,其特征在于,
在获取目标处理器的目标寄存器中存储的寄存器数值之前,所述方法还包括:
确定目标频率;
将与所述目标寄存器通信的总线时钟频率设置为所述目标频率。
11.一种处理器的机器检查异常错误类型的确定系统,其特征在于,用于执行权利要求1至10任一项所述的方法,包括:
目标处理器,所述目标处理器包括组件;
目标寄存器,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;
基板管理控制器,其中,所述基板管理控制器用于获取目标处理器的目标寄存器中存储的寄存器数值,基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节,在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节。
12.一种服务器,其特征在于,包括如权利要求11所述的处理器的机器检查异常错误类型的确定系统。
13.一种处理器的机器检查异常错误类型的确定装置,其特征在于,
包括:
获取模块,用于获取目标处理器的目标寄存器中存储的寄存器数值,其中,所述目标寄存器用于存储故障值,所述故障值包括所述目标处理器中包括的组件发生故障时,写入到所述目标寄存器中的数值;
第一确定模块,用于基于所述寄存器数值中包括的事件类型字节以及事件顺序字节确定所述目标处理器发生的目标故障的故障类型,其中,所述事件类型字节为用于指示事件类型的字节,所述事件顺序字节为用于指示事件发生顺序的字节;
第二确定模块,用于在所述故障类型指示所述目标故障的类型为第一机器检查异常错误类型的情况下,基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障,其中,所述错误数值字节为用于指示错误数值的字节,所述第一机器检查异常错误类型包括所述目标处理器中包括的设备组件存在故障类型;
所述第二确定模块通过如下方式实现所述基于所述寄存器数值中包括的错误数值字节确定所述目标故障是否为机器检查异常故障:确定所述错误数值字节中包括的第一子字节的第一数值;基于所述第一数值确定所述目标故障是否为机器检查异常故障;
所述第二确定模块通过如下方式实现所述基于所述第一数值确定所述目标故障是否为机器检查异常故障:确定第二数值,其中,所述第二数值为所述目标处理器所在的设备中包括的固件存在第一故障的情况下,所述目标寄存器中存储的第一故障值中包括的值,所述第一故障值中包括的用于指示故障类型的字节的数值与所述事件类型字节的数值相同,所述第一故障值中包括的用于指示故障顺序的字节的数值与所述事件顺序字节的数值相同,所述第二数值在所述第一故障值中的顺序与所述第一数值在所述寄存器数值中的顺序相同;在所述第二数值中存在与所述第一数值相同的数值的情况下,确定所述目标故障为非所述机器检查异常故障;在所述第一数值与所述第二数值中包括的数值均不同的情况下,基于所述错误数值字节确定所述目标故障是否为所述机器检查异常故障。
14.一种计算机可读存储介质,其特征在于,
所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被处理器执行时实现所述权利要求1至10任一项中所述的方法的步骤。
15.一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,
所述处理器执行所述计算机程序时实现所述权利要求1至10任一项中所述的方法的步骤。
CN202410098513.4A 2024-01-24 2024-01-24 处理器的机器检查异常错误类型的确定方法、装置、系统 Active CN117608910B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410098513.4A CN117608910B (zh) 2024-01-24 2024-01-24 处理器的机器检查异常错误类型的确定方法、装置、系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410098513.4A CN117608910B (zh) 2024-01-24 2024-01-24 处理器的机器检查异常错误类型的确定方法、装置、系统

Publications (2)

Publication Number Publication Date
CN117608910A CN117608910A (zh) 2024-02-27
CN117608910B true CN117608910B (zh) 2024-04-12

Family

ID=89948398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410098513.4A Active CN117608910B (zh) 2024-01-24 2024-01-24 处理器的机器检查异常错误类型的确定方法、装置、系统

Country Status (1)

Country Link
CN (1) CN117608910B (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115858211A (zh) * 2022-11-22 2023-03-28 阿里巴巴(中国)有限公司 机器检查错误的处理方法及装置
CN117074829A (zh) * 2023-08-21 2023-11-17 北京百度网讯科技有限公司 自动驾驶系统的故障检测方法、装置及介质
CN117271234A (zh) * 2023-08-11 2023-12-22 苏州浪潮智能科技有限公司 故障诊断方法、装置、存储介质及电子装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10671465B2 (en) * 2016-11-28 2020-06-02 Intel Corporation Serializing machine check exceptions for predictive failure analysis

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115858211A (zh) * 2022-11-22 2023-03-28 阿里巴巴(中国)有限公司 机器检查错误的处理方法及装置
CN117271234A (zh) * 2023-08-11 2023-12-22 苏州浪潮智能科技有限公司 故障诊断方法、装置、存储介质及电子装置
CN117074829A (zh) * 2023-08-21 2023-11-17 北京百度网讯科技有限公司 自动驾驶系统的故障检测方法、装置及介质

Also Published As

Publication number Publication date
CN117608910A (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
CN109783262B (zh) 故障数据处理方法、装置、服务器及计算机可读存储介质
CN111414268B (zh) 故障处理方法、装置及服务器
CN112308126A (zh) 故障识别模型训练方法、故障识别方法、装置及电子设备
CN107038108B (zh) 软件的测试方法和装置
CN110764980A (zh) 日志处理方法和装置
CN112527484A (zh) 工作流断点续跑方法、装置、计算机设备及可读存储介质
CN113672456A (zh) 应用平台的模块化自监听方法、系统、终端及存储介质
CN109918221B (zh) 一种硬盘报错解析方法、系统、终端及存储介质
CN117608910B (zh) 处理器的机器检查异常错误类型的确定方法、装置、系统
CN106776728A (zh) 基于日志文件分析的代码检查方法、系统及开发平台
CN102541705B (zh) 计算机的测试方法和工装板
CN112087320A (zh) 一种异常定位方法、装置、电子设备和可读存储介质
CN112463504B (zh) 一种双控存储产品测试方法、系统、终端及存储介质
CN107844392A (zh) 一种x86架构cpu寄存器在线故障检测方法及装置
CN117493065B (zh) 处理器信息的处理方法和装置,存储介质及电子设备
US20200174875A1 (en) Secure forking of error telemetry data to independent processing units
CN105718375A (zh) 嵌入式系统的可恢复性度量方法
CN111835566A (zh) 一种系统故障管理方法、装置及系统
CN113064771B (zh) 一种i2c链路检查方法、系统、终端及存储介质
CN112825057A (zh) 一种可快速定位错误代码、监控ajax请求服务异常的监控方法
CN113419916B (zh) 风控检查程序不间断运行方法、装置、设备及存储介质
CN114253846B (zh) 自动化测试异常定位方法、装置、设备及可读存储介质
CN111538770B (zh) 数据监控方法、装置、电子设备及可读存储介质
CN111026610B (zh) 服务器故障日志多级分析方法、系统、终端及存储介质
CN105718326A (zh) 嵌入式系统的可恢复性测试方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant