CN113127245A - 一种系统管理中断的处理方法、系统及装置 - Google Patents

一种系统管理中断的处理方法、系统及装置 Download PDF

Info

Publication number
CN113127245A
CN113127245A CN202110315497.6A CN202110315497A CN113127245A CN 113127245 A CN113127245 A CN 113127245A CN 202110315497 A CN202110315497 A CN 202110315497A CN 113127245 A CN113127245 A CN 113127245A
Authority
CN
China
Prior art keywords
error information
processed
information
reporting
hardware
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110315497.6A
Other languages
English (en)
Other versions
CN113127245B (zh
Inventor
唐建亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yingxin Computer Technology Co Ltd
Original Assignee
Shandong Yingxin Computer Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yingxin Computer Technology Co Ltd filed Critical Shandong Yingxin Computer Technology Co Ltd
Priority to CN202110315497.6A priority Critical patent/CN113127245B/zh
Publication of CN113127245A publication Critical patent/CN113127245A/zh
Application granted granted Critical
Publication of CN113127245B publication Critical patent/CN113127245B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0787Storage of error reports, e.g. persistent data storage, storage using memory protection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种系统管理中断的处理方法、系统及装置。考虑到CE错误为可纠正错误,CE错误不及时处理并不能够对OS运行系统业务造成停运风险,而非CE错误不及时处理可能使系统存在宕机等安全风险,从而对OS运行系统业务造成停运风险,所以本申请将系统硬件错误信息分为CE错误信息和非CE错误信息两种类型,只将非CE错误信息交由基板管理控制器处理,以减少进入SMI中断所花费的时间,从而提高了系统业务的运行效率。

Description

一种系统管理中断的处理方法、系统及装置
技术领域
本发明涉及服务器管理领域,特别是涉及一种系统管理中断的处理方法、系统及装置。
背景技术
目前,服务器系统基本上都是24小时不间断运行,出现一些硬件故障是比较正常的情况。对于硬件故障,现有的处理方式为:当OS(operation system,操作系统)运行系统业务过程中出现硬件故障时,触发SMI(System Management Interrupt,系统管理中断)中断;当进入SMI中断后,收集系统硬件错误信息,并将系统硬件错误信息一一交由BMC(Baseboard Management Controller,基板管理控制器)诊断处理。但是,SMI中断会中断系统业务的运行,待本次SMI中断对应的系统硬件错误信息都处理完成后退出SMI中断,才恢复系统业务的运行,这就导致当系统硬件错误信息过多时进入SMI中断所花费的时间过长,从而影响系统业务的运行效率。
因此,如何提供一种解决上述技术问题的方案是本领域的技术人员目前需要解决的问题。
发明内容
本发明的目的是提供一种系统管理中断的处理方法、系统及装置,将系统硬件错误信息分为CE错误信息和非CE错误信息两种类型,只将非CE错误信息交由基板管理控制器处理,以减少进入SMI中断所花费的时间,从而提高了系统业务的运行效率。
为解决上述技术问题,本发明提供了一种系统管理中断的处理方法,包括:
在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;
判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;
若否,则将当前待处理的系统硬件错误信息上报至系统的基板管理控制器诊断处理;
若是,则不将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理。
优选地,所述系统管理中断的处理方法还包括:
在系统出现硬件故障触发SMI中断时,记录此时的中断触发时间;
在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,在不将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理之前,判断当前时间与所述中断触发时间的时间间隔是否大于预设时间阈值;
若是,则执行不将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理的步骤;
若否,则将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理。
优选地,收集系统硬件错误信息的过程,包括:
遍历用于记录系统错误的寄存器,从中确定系统当前的故障硬件对应的目标寄存器;
读取所述目标寄存器中的存储信息,得到系统硬件错误信息。
优选地,判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型的过程,包括:
判断当前待处理的系统硬件错误信息中是否存在CE错误对应的相关信息;
若是,则确定当前待处理的系统硬件错误信息对应的错误类型为CE类型;
若否,则确定当前待处理的系统硬件错误信息对应的错误类型不为CE类型。
优选地,所述系统管理中断的处理方法还包括:
将未上报至所述基板管理控制器诊断处理的系统硬件错误信息进行存储;
判断系统当前的业务是否处理完成;
若是,则将存储的系统硬件错误信息上报至所述基板管理控制器诊断处理。
优选地,所述系统管理中断的处理方法还包括:
判断所述基板管理控制器是否诊断处理完成目标硬件错误信息;其中,所述目标硬件错误信息为任一存储的系统硬件错误信息;
若是,则将存储的目标硬件错误信息进行删除处理。
为解决上述技术问题,本发明还提供了一种系统管理中断的处理系统,包括:
信息收集模块,用于在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;
上报判断模块,用于判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;若否,则执行信息上报模块;若是,则不执行所述信息上报模块;
信息上报模块,用于将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。
优选地,所述系统管理中断的处理系统还包括:
时间记录模块,用于在系统出现硬件故障触发SMI中断时,记录此时的中断触发时间;
相应的,所述上报判断模块还用于在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,判断当前时间与所述中断触发时间的时间间隔是否大于预设时间阈值;若是,则不执行所述信息上报模块;若否,则执行所述信息上报模块。
优选地,所述系统管理中断的处理系统还包括:
信息存储模块,用于将未上报至所述基板管理控制器诊断处理的系统硬件错误信息进行存储;
处理判断模块,用于判断系统当前的业务是否处理完成;若是,则执行存储上报模块;
存储上报模块,用于将存储的系统硬件错误信息上报至所述基板管理控制器诊断处理。
为解决上述技术问题,本发明还提供了一种系统管理中断的处理装置,包括:
存储器,用于存储计算机程序;
处理器,用于在执行所述计算机程序时实现上述任一种系统管理中断的处理方法的步骤。
本发明提供了一种系统管理中断的处理方法,在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;若否,则将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理;若是,则不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。可见,考虑到CE错误为可纠正错误,CE错误不及时处理并不能够对OS运行系统业务造成停运风险,而非CE错误不及时处理可能使系统存在宕机等安全风险,从而对OS运行系统业务造成停运风险,所以本申请将系统硬件错误信息分为CE错误信息和非CE错误信息两种类型,只将非CE错误信息交由基板管理控制器处理,以减少进入SMI中断所花费的时间,从而提高了系统业务的运行效率。
本发明还提供了一种系统管理中断的处理系统及装置,与上述处理方法具有相同的有益效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对现有技术和实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种系统管理中断的处理方法的流程图;
图2为本发明实施例提供的一种系统管理中断的处理系统的结构示意图。
具体实施方式
本发明的核心是提供一种系统管理中断的处理方法、系统及装置,将系统硬件错误信息分为CE错误信息和非CE错误信息两种类型,只将非CE错误信息交由基板管理控制器处理,以减少进入SMI中断所花费的时间,从而提高了系统业务的运行效率。
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,图1为本发明实施例提供的一种系统管理中断的处理方法的流程图。
该系统管理中断的处理方法包括:
步骤S1:在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息。
具体地,服务器系统在上电开机进入OS后便可开始运行业务。本申请在系统运行过程中出现硬件故障时会触发SMI中断,并在进入SMI中断时,会收集系统硬件错误信息,以为后续处理系统故障的硬件提供依据。
步骤S2:判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;若否,则执行步骤S3;若是,则不执行步骤S3。步骤S3:将当前待处理的系统硬件错误信息上报至系统的基板管理控制器诊断处理。
具体地,系统硬件错误信息可分为CE(Correctable Error,可纠正错误)错误信息和非CE错误信息两种类型。考虑到CE错误不及时处理并不能够对OS运行系统业务造成停运风险,而非CE错误不及时处理可能使系统存在宕机等安全风险,从而对OS运行系统业务造成停运风险,所以本申请可只将非CE错误信息交由基板管理控制器(BMC)处理,而不将CE错误信息交由基板管理控制器处理,以减少进入SMI中断所花费的时间,提高系统业务的运行效率。
基于此,本申请在收集系统硬件错误信息后,从中选择一个系统硬件错误信息作为当前待处理的系统硬件错误信息,然后判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型,若不为CE类型,则将当前待处理的系统硬件错误信息上报至系统的基板管理控制器诊断处理,以避免OS运行系统业务存在停运风险;若为CE类型,则不将当前待处理的系统硬件错误信息上报至系统的基板管理控制器诊断处理,以减少进入SMI中断所花费的时间,提高系统业务的运行效率。当当前触发的SMI中断对应的系统硬件错误信息都按照上述操作处理完成后,退出SMI中断。
本发明提供了一种系统管理中断的处理方法,在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;若否,则将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理;若是,则不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。可见,考虑到CE错误为可纠正错误,CE错误不及时处理并不能够对OS运行系统业务造成停运风险,而非CE错误不及时处理可能使系统存在宕机等安全风险,从而对OS运行系统业务造成停运风险,所以本申请将系统硬件错误信息分为CE错误信息和非CE错误信息两种类型,只将非CE错误信息交由基板管理控制器处理,以减少进入SMI中断所花费的时间,从而提高了系统业务的运行效率。
在上述实施例的基础上:
作为一种可选的实施例,系统管理中断的处理方法还包括:
在系统出现硬件故障触发SMI中断时,记录此时的中断触发时间;
在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,在不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理之前,判断当前时间与中断触发时间的时间间隔是否大于预设时间阈值;
若是,则执行不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理的步骤;
若否,则将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。
具体地,本申请在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,不直接执行不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理的步骤,而是增设一个时间限制,即限制CE错误信息上报至基板管理控制器诊断处理的时间,实现一方面处理掉一部分CE错误信息,另一方面减少进入SMI中断所花费的时间,提高系统业务的运行效率。
基于此,本申请在系统出现硬件故障触发SMI中断时,记录触发SMI中断的起始时间,具体可通过查看系统的定时寄存器保存触发SMI中断的起始时间,即中断触发时间。而且,本申请在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,先不执行不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理的步骤,而是先判断当前时间与中断触发时间的时间间隔是否大于预设时间阈值(如300ms),若大于预设时间阈值,则执行不将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理的步骤;若不大于预设时间阈值,则将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。
作为一种可选的实施例,收集系统硬件错误信息的过程,包括:
遍历用于记录系统错误的寄存器,从中确定系统当前的故障硬件对应的目标寄存器;
读取目标寄存器中的存储信息,得到系统硬件错误信息。
具体地,本申请可从系统故障硬件对应的寄存器信息中收集系统硬件错误信息,具体是先遍历用于记录系统错误的寄存器,以从中确定系统当前的故障硬件对应的寄存器(称为目标寄存器),然后读取目标寄存器中的存储信息,得到系统硬件错误信息。
作为一种可选的实施例,判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型的过程,包括:
判断当前待处理的系统硬件错误信息中是否存在CE错误对应的相关信息;
若是,则确定当前待处理的系统硬件错误信息对应的错误类型为CE类型;
若否,则确定当前待处理的系统硬件错误信息对应的错误类型不为CE类型。
具体地,考虑到CE错误信息中存在CE错误所专属的标志性信息,所以本申请判断系统硬件错误信息对应的错误类型是否为CE类型的方法为:判断系统硬件错误信息中是否存在CE错误对应的相关标志性信息;若存在CE错误对应的相关标志性信息,则确定此系统硬件错误信息对应的错误类型为CE类型;若不存在CE错误对应的相关标志性信息,则确定此系统硬件错误信息对应的错误类型不为CE类型。
作为一种可选的实施例,系统管理中断的处理方法还包括:
将未上报至基板管理控制器诊断处理的系统硬件错误信息进行存储;
判断系统当前的业务是否处理完成;
若是,则将存储的系统硬件错误信息上报至基板管理控制器诊断处理。
进一步地,本申请还可将未上报至基板管理控制器诊断处理的系统硬件错误信息进行存储,以等待系统当前的业务处理完成后,再将存储的系统硬件错误信息上报至基板管理控制器诊断处理,具体是在OS处理业务的过程中,判断系统当前的业务是否处理完成,若系统当前的业务处理完成,则将存储的系统硬件错误信息上报至基板管理控制器诊断处理。
作为一种可选的实施例,系统管理中断的处理方法还包括:
判断基板管理控制器是否诊断处理完成目标硬件错误信息;其中,目标硬件错误信息为任一存储的系统硬件错误信息;
若是,则将存储的目标硬件错误信息进行删除处理。
进一步地,本申请还可判断基板管理控制器是否诊断处理完成任一存储的系统硬件错误信息(称为目标硬件错误信息),若基板管理控制器诊断处理完成目标硬件错误信息,则可将存储的目标硬件错误信息进行删除处理,以释放目标硬件错误信息所占用的存储空间,保证系统存储空间充足。
另外,本申请的系统管理中断的处理方法可应用于NF5280M5等服务器中,具体可对服务器的BIOS(Basic Input and Output System,基本输入输出系统)进行改进,以使BIOS具有上述系统管理中断的处理功能。
请参照图2,图2为本发明实施例提供的一种系统管理中断的处理系统的结构示意图。
该系统管理中断的处理系统包括:
信息收集模块1,用于在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;
上报判断模块2,用于判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;若否,则执行信息上报模块3;若是,则不执行信息上报模块3;
信息上报模块3,用于将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。
作为一种可选的实施例,系统管理中断的处理系统还包括:
时间记录模块,用于在系统出现硬件故障触发SMI中断时,记录此时的中断触发时间;
相应的,上报判断模块2还用于在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,判断当前时间与中断触发时间的时间间隔是否大于预设时间阈值;若是,则不执行信息上报模块3;若否,则执行信息上报模块3。
作为一种可选的实施例,系统管理中断的处理系统还包括:
信息存储模块,用于将未上报至基板管理控制器诊断处理的系统硬件错误信息进行存储;
处理判断模块,用于判断系统当前的业务是否处理完成;若是,则执行存储上报模块;
存储上报模块,用于将存储的系统硬件错误信息上报至基板管理控制器诊断处理。
本申请提供的处理系统的介绍请参考上述处理方法的实施例,本申请在此不再赘述。
本申请还提供了一种系统管理中断的处理装置,包括:
存储器,用于存储计算机程序;
处理器,用于在执行计算机程序时实现上述任一种系统管理中断的处理方法的步骤。
本申请提供的处理装置的介绍请参考上述处理方法的实施例,本申请在此不再赘述。
还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其他实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种系统管理中断的处理方法,其特征在于,包括:
在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;
判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;
若否,则将当前待处理的系统硬件错误信息上报至系统的基板管理控制器诊断处理;
若是,则不将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理。
2.如权利要求1所述的系统管理中断的处理方法,其特征在于,所述系统管理中断的处理方法还包括:
在系统出现硬件故障触发SMI中断时,记录此时的中断触发时间;
在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,在不将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理之前,判断当前时间与所述中断触发时间的时间间隔是否大于预设时间阈值;
若是,则执行不将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理的步骤;
若否,则将当前待处理的系统硬件错误信息上报至所述基板管理控制器诊断处理。
3.如权利要求1所述的系统管理中断的处理方法,其特征在于,收集系统硬件错误信息的过程,包括:
遍历用于记录系统错误的寄存器,从中确定系统当前的故障硬件对应的目标寄存器;
读取所述目标寄存器中的存储信息,得到系统硬件错误信息。
4.如权利要求1所述的系统管理中断的处理方法,其特征在于,判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型的过程,包括:
判断当前待处理的系统硬件错误信息中是否存在CE错误对应的相关信息;
若是,则确定当前待处理的系统硬件错误信息对应的错误类型为CE类型;
若否,则确定当前待处理的系统硬件错误信息对应的错误类型不为CE类型。
5.如权利要求1-4任一项所述的系统管理中断的处理方法,其特征在于,所述系统管理中断的处理方法还包括:
将未上报至所述基板管理控制器诊断处理的系统硬件错误信息进行存储;
判断系统当前的业务是否处理完成;
若是,则将存储的系统硬件错误信息上报至所述基板管理控制器诊断处理。
6.如权利要求5所述的系统管理中断的处理方法,其特征在于,所述系统管理中断的处理方法还包括:
判断所述基板管理控制器是否诊断处理完成目标硬件错误信息;其中,所述目标硬件错误信息为任一存储的系统硬件错误信息;
若是,则将存储的目标硬件错误信息进行删除处理。
7.一种系统管理中断的处理系统,其特征在于,包括:
信息收集模块,用于在系统出现硬件故障触发SMI中断时,收集系统硬件错误信息;
上报判断模块,用于判断当前待处理的系统硬件错误信息对应的错误类型是否为CE类型;若否,则执行信息上报模块;若是,则不执行所述信息上报模块;
信息上报模块,用于将当前待处理的系统硬件错误信息上报至基板管理控制器诊断处理。
8.如权利要求7所述的系统管理中断的处理系统,其特征在于,所述系统管理中断的处理系统还包括:
时间记录模块,用于在系统出现硬件故障触发SMI中断时,记录此时的中断触发时间;
相应的,所述上报判断模块还用于在判断出当前待处理的系统硬件错误信息对应的错误类型为CE类型之后,判断当前时间与所述中断触发时间的时间间隔是否大于预设时间阈值;若是,则不执行所述信息上报模块;若否,则执行所述信息上报模块。
9.如权利要求7-8任一项所述的系统管理中断的处理系统,其特征在于,所述系统管理中断的处理系统还包括:
信息存储模块,用于将未上报至所述基板管理控制器诊断处理的系统硬件错误信息进行存储;
处理判断模块,用于判断系统当前的业务是否处理完成;若是,则执行存储上报模块;
存储上报模块,用于将存储的系统硬件错误信息上报至所述基板管理控制器诊断处理。
10.一种系统管理中断的处理装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于在执行所述计算机程序时实现如权利要求1-6任一项所述的系统管理中断的处理方法的步骤。
CN202110315497.6A 2021-03-24 2021-03-24 一种系统管理中断的处理方法、系统及装置 Active CN113127245B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110315497.6A CN113127245B (zh) 2021-03-24 2021-03-24 一种系统管理中断的处理方法、系统及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110315497.6A CN113127245B (zh) 2021-03-24 2021-03-24 一种系统管理中断的处理方法、系统及装置

Publications (2)

Publication Number Publication Date
CN113127245A true CN113127245A (zh) 2021-07-16
CN113127245B CN113127245B (zh) 2023-02-28

Family

ID=76774183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110315497.6A Active CN113127245B (zh) 2021-03-24 2021-03-24 一种系统管理中断的处理方法、系统及装置

Country Status (1)

Country Link
CN (1) CN113127245B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076183A (zh) * 2023-09-28 2023-11-17 飞腾信息技术有限公司 一种错误上报方法、片上系统、计算机设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060150009A1 (en) * 2004-12-21 2006-07-06 Nec Corporation Computer system and method for dealing with errors
CN107077408A (zh) * 2016-12-05 2017-08-18 华为技术有限公司 故障处理的方法、计算机系统、基板管理控制器和系统
CN109328340A (zh) * 2017-09-30 2019-02-12 华为技术有限公司 内存故障的检测方法、装置和服务器
CN109885521A (zh) * 2019-02-28 2019-06-14 苏州浪潮智能科技有限公司 一种中断处理方法、系统及电子设备和存储介质
US20200117625A1 (en) * 2018-12-20 2020-04-16 Intel Corporation Management of fault notifications
CN111221677A (zh) * 2018-11-27 2020-06-02 环达电脑(上海)有限公司 侦错备份方法与服务器
CN112306732A (zh) * 2020-11-19 2021-02-02 山东云海国创云计算装备产业创新中心有限公司 一种服务器中的自动纠错控制方法、装置、设备及介质
CN112463492A (zh) * 2020-12-04 2021-03-09 苏州浪潮智能科技有限公司 一种内存可纠正错误处理方法、系统、设备以及介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060150009A1 (en) * 2004-12-21 2006-07-06 Nec Corporation Computer system and method for dealing with errors
CN107077408A (zh) * 2016-12-05 2017-08-18 华为技术有限公司 故障处理的方法、计算机系统、基板管理控制器和系统
CN109328340A (zh) * 2017-09-30 2019-02-12 华为技术有限公司 内存故障的检测方法、装置和服务器
CN111221677A (zh) * 2018-11-27 2020-06-02 环达电脑(上海)有限公司 侦错备份方法与服务器
US20200117625A1 (en) * 2018-12-20 2020-04-16 Intel Corporation Management of fault notifications
CN109885521A (zh) * 2019-02-28 2019-06-14 苏州浪潮智能科技有限公司 一种中断处理方法、系统及电子设备和存储介质
CN112306732A (zh) * 2020-11-19 2021-02-02 山东云海国创云计算装备产业创新中心有限公司 一种服务器中的自动纠错控制方法、装置、设备及介质
CN112463492A (zh) * 2020-12-04 2021-03-09 苏州浪潮智能科技有限公司 一种内存可纠正错误处理方法、系统、设备以及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117076183A (zh) * 2023-09-28 2023-11-17 飞腾信息技术有限公司 一种错误上报方法、片上系统、计算机设备及存储介质
CN117076183B (zh) * 2023-09-28 2024-02-02 飞腾信息技术有限公司 一种错误上报方法、片上系统、计算机设备及存储介质

Also Published As

Publication number Publication date
CN113127245B (zh) 2023-02-28

Similar Documents

Publication Publication Date Title
US6438709B2 (en) Method for recovering from computer system lockup condition
US6012154A (en) Method and apparatus for detecting and recovering from computer system malfunction
US6502208B1 (en) Method and system for check stop error handling
US7506209B2 (en) Computer shutoff condition monitoring method, information processing apparatus, program and computer readable information recording medium
US10430267B2 (en) Determine when an error log was created
CN111143104A (zh) 一种内存异常的处理方法、系统、电子设备及存储介质
CN114328102A (zh) 设备状态监控方法、装置、设备及计算机可读存储介质
CN112631820A (zh) 软件系统的故障恢复方法及装置
CN113127245B (zh) 一种系统管理中断的处理方法、系统及装置
US7953914B2 (en) Clearing interrupts raised while performing operating system critical tasks
CN115543740A (zh) 业务运行异常监控方法、系统、设备及存储介质
TWI518680B (zh) 維護電腦系統之檔案系統的方法
CN113536320A (zh) 一种错误信息处理方法、装置及存储介质
WO2023240944A1 (zh) 数据恢复方法、装置、电子设备及存储介质
CN111813748B (zh) 一种文件系统的挂载方法、装置、电子设备及存储介质
CN115421960A (zh) 一种ue内存故障恢复方法、装置、电子设备及介质
CN115292082A (zh) 一种处理BIOS启动过程中Assert宕机故障的方法及系统
CN110532160B (zh) 一种bmc记录服务器系统热重启事件的方法
JP2006227962A (ja) アプリケーションタスク監視システムおよび方法
CN112650610A (zh) 一种Linux系统崩溃控制方法、系统及介质
JP2012108848A (ja) 動作ログ収集システム及びプログラム
CN101996129B (zh) 侦测计算机系统当机的方法
CN110442470B (zh) 一种通信设备的系统稳定性监测及恢复方法
CN113626233B (zh) 一种自动检测bios看门狗功能的方法、装置及设备
CN116302643A (zh) 看门狗重启触发原因的定位方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant