CN109992477B - 用于电子设备的信息处理方法、系统以及电子设备 - Google Patents

用于电子设备的信息处理方法、系统以及电子设备 Download PDF

Info

Publication number
CN109992477B
CN109992477B CN201910240408.9A CN201910240408A CN109992477B CN 109992477 B CN109992477 B CN 109992477B CN 201910240408 A CN201910240408 A CN 201910240408A CN 109992477 B CN109992477 B CN 109992477B
Authority
CN
China
Prior art keywords
error information
storage unit
management controller
information
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910240408.9A
Other languages
English (en)
Other versions
CN109992477A (zh
Inventor
李�浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Beijing Ltd
Original Assignee
Lenovo Beijing Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Beijing Ltd filed Critical Lenovo Beijing Ltd
Priority to CN201910240408.9A priority Critical patent/CN109992477B/zh
Publication of CN109992477A publication Critical patent/CN109992477A/zh
Application granted granted Critical
Publication of CN109992477B publication Critical patent/CN109992477B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3034Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system component is a storage system, e.g. DASD based or network based
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/327Alarm or error message display

Abstract

本公开提供了一种用于电子设备的信息处理方法,包括:由基板管理控制器获取第一存储单元产生的第一错误信息;以及将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息。

Description

用于电子设备的信息处理方法、系统以及电子设备
技术领域
本公开涉及一种用于电子设备的信息处理方法、一种用于电子设备的信息处理系统以及一种电子设备。
背景技术
在服务器中,内存经常会出现可修复错误,可修复错误虽然不会直接导致服务器无法工作,但是可以作为内存稳定性的一个判断标准。因此,可以根据错误出现的频率和数量来判断内存的可靠性,并且可以根据错误出现的频率和数量来预测故障,提前处理故障以保证服务器的稳定性和可靠性。当出现可修复错误之后,硬件本身会修复错误,当前通用做法是通知OS或BIOS,由OS或BIOS收集错误信息,根据错误信息进行预测,当达到报错标准时,通知用户进行其他的修复操作,例如通知用户更换内存。但是,以上方法存在诸多问题:在不同服务器中,由于不同平台的报错标准会有差异,所以OS无法准确处理内存出现的错误;当前BIOS或OS执行的报错标准由人为主观设定,存在很大的不确定性;BIOS或OS收集的可修复错误信息,一般仅在服务器当次启动有效,如果服务器系统出现重启或关机,收集到的可修复错误信息将会丢失。
发明内容
本公开的一个方面提供了一种用于电子设备的信息处理方法,包括:由基板管理控制器获取第一存储单元产生的第一错误信息,将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息。
可选地,上述由所述基板管理控制器获取所述第一存储单元产生的第一错误信息,包括:由所述基板管理控制器获取来自基本输入输出系统收集的所述第一错误信息,和/或所述基板管理控制器响应于接收到的触发信号,并通过监测接口获取所述第一错误信息。
可选地,上述方法还包括:由所述基板管理控制器获取与多个设备的历史错误信息和历史故障信息相关的预测信息,基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,在预测结果表明所述第一存储单元存在故障隐患时,发出提示信息。
可选地,上述预测信息包括:基于所述历史错误信息和所述历史故障信息生成的预测模型,所述基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,包括:利用所述预测模型基于所述第一错误信息预测所述第一存储单元是否存在故障隐患。
本公开的另一个方面提供了一种用于电子设备的信息处理系统,包括:基板管理控制器以及第一存储单元。第一存储单元用于存储可执行指令,其中,当所述指令被所述基板管理控制器执行时,使得所述基板管理控制器执行:获取第一存储单元产生的第一错误信息,将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息。
可选地,上述获取所述第一存储单元产生的第一错误信息,包括:获取来自基本输入输出系统收集的所述第一错误信息,和/或响应于接收到的触发信号,并通过监测接口获取所述第一错误信息。
可选地,上述基板管理控制器还用于执行:获取与多个设备的历史错误信息和历史故障信息相关的预测信息,基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,在预测结果表明所述第一存储单元存在故障隐患时,发出提示信息。
可选地,上述预测信息包括:基于所述历史错误信息和所述历史故障信息生成的预测模型,所述基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,包括:利用所述预测模型基于所述第一错误信息预测所述第一存储单元是否存在故障隐患。
本公开的另一个方面提供了一种电子设备,所述电子设备包括基板管理控制器,所述基板管理控制器包括:第一获取模块以及存储模块。第一获取模块获取第一存储单元产生的第一错误信息,存储模块将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息。
可选地,上述获取所述第一存储单元产生的第一错误信息,包括:获取来自基本输入输出系统收集的所述第一错误信息,和/或响应于接收到的触发信号,并通过监测接口获取所述第一错误信息。
可选地,上述基板管理控制器还包括:第二获取模块、预测模块以及提示模块。其中,第二获取模块获取与多个设备的历史错误信息和历史故障信息相关的预测信息,预测模块基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,提示模块在预测结果表明所述第一存储单元存在故障隐患时,发出提示信息。
可选地,上述预测信息包括:基于所述历史错误信息和所述历史故障信息生成的预测模型,所述基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,包括:利用所述预测模型基于所述第一错误信息预测所述第一存储单元是否存在故障隐患。
本公开的另一方面提供了一种非易失性可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指令,所述指令在被执行时用于实现如上所述的方法。
附图说明
为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中:
图1示意性示出了根据本公开实施例的用于电子设备的信息处理方法的流程图;
图2示意性示出了根据本公开另一实施例的用于电子设备的信息处理的流程图;
图3示意性示出了根据本公开实施例的用于电子设备的信息处理系统的框图;
图4示意性示出了根据本公开实施例的基板管理控制器的框图;
图5示意性示出了根据本公开另一实施例的基板管理控制器的框图;以及
图6示意性示出了根据本公开实施例的用于实现信息处理的计算机系统的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。在使用类似于“A、B或C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B或C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
附图中示出了一些方框图和/或流程图。应理解,方框图和/或流程图中的一些方框或其组合可以由计算机程序指令来实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其他可编程控制装置的处理器,从而这些指令在由该处理器执行时可以创建用于实现这些方框图和/或流程图中所说明的功能/操作的装置。
因此,本公开的技术可以硬件和/或软件(包括固件、微代码等)的形式来实现。另外,本公开的技术可以采取存储有指令的计算机可读介质上的计算机程序产品的形式,该计算机程序产品可供指令执行系统使用或者结合指令执行系统使用。在本公开的上下文中,计算机可读介质可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,计算机可读介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。计算机可读介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
本公开的实施例提供了一种用于电子设备的信息处理方法,包括:由基板管理控制器获取第一存储单元产生的第一错误信息,将第一错误信息存储至基板管理控制器的第二存储单元中,其中,第一错误信息包括出现错误后被电子设备修复的错误信息。
可见,在本公开实施例的技术方案中,由于基板管理控制器的第二存储单元为非易失性存储单元,因此,由基板管理控制器获取第一错误信息,并将第一错误信息存储至第二存储单元中,可以保证在服务器重启或者关机情况下,所存储的第一错误信息不会丢失。
图1示意性示出了根据本公开实施例的用于电子设备的信息处理方法的流程图。
如图1所示,该方法包括操作S110~S120。
在操作S110,由基板管理控制器获取第一存储单元产生的第一错误信息。
根据本公开实施例,电子设备例如可以是服务器,服务器中通常包括基板管理控制器(Baseboard Management Controller,BMC),基板管理控制器是服务器中的一个独立处理器,基板管理控制器可以监控服务器内部的物理变量,例如监控温度、湿度、电源电压、风扇速度、通信参数和操作系统函数等等。基板管理控制器还能够对服务器进行固件升级、查看服务器等一些操作。
在本公开实施例中,第一存储单元例如可以是服务器中的内存,在服务器运行过程中,内存经常会出现第一错误信息。其中,第一错误信息包括出现错误后被电子设备(服务器)修复的错误信息。例如,内存经常产生可修复错误,该可修复错误虽然不会直接导致服务器无法工作,但是会影响内存的稳定性。当内存出现可修复错误时,服务器会自动修复该错误。
例如,在内存中的最小数据单位为比特(bit),可以通过数据位“1”和数据位“0”来表示数据的高低电平信号。当内存中出现错误时(例如本来应该是“1”的数据位变成“0”,或者本来应该是“0”的数据位变成“1”),内存会通过错误检查和纠正技术(Error CorrectingCode,ECC)自动修改这些错误。
在本公开实施例中,当内存出现第一错误信息时,基板管理控制器可以收集该第一错误信息。具体地,由基板管理控制器获取第一存储单元产生的第一错误信息,包括以下(1)和(2)中的至少一项:
(1)由基板管理控制器获取来自基本输入输出系统收集的第一错误信息。
根据本公开实施例,第一错误信息可以由基本输入输出系统(BIOS)收集。例如,当第一错误信息出现后,内存触发系统管理中断(System Management Interruption,SMI),并由BIOS响应该触发,进而由BIOS解析出内存出现的第一错误信息(例如包括出错的内存位置),然后由BIOS将第一错误信息发送至基板管理控制器中。
(2)基板管理控制器响应于接收到的触发信号,并通过监测接口获取第一错误信息。
根据本公开实施例,当第一错误信息出现后,触发在错误引脚处生成触发信号,该错误引脚例如与基板管理控制器连接,基板管理控制器接收到触发信号之后,通过监测接口获取第一错误信息。其中,监测接口例如可以是平台环境式控制接口(PlatformEnvironment Control Interface,PECI)。
在操作S120,将第一错误信息存储至基板管理控制器的第二存储单元中。
根据本公开实施例,在基板管理控制器获取到第一错误信息之后,可以将该第一错误信息存储至基板管理控制器的第二存储单元中。其中,第二存储单元例如可以是非易失性存储单元,例如为基板管理控制器中的存储器(Embedded Multi Media Card,EMMC)。
根据本公开实施例,由于第二存储单元为非易失性存储单元,因此由第二存储单元收集并存储第一错误信息,可以保证在服务器重启或者关机情况下,所存储的第一错误信息不会丢失。另外,将第一错误信息存储在第二存储单元中,避免服务器提供商在收集第一错误信息时侵犯用户隐私。即,由于服务器的其他存储空间通常用于存储服务器使用者的个人信息,因此,将第一错误信息存储至第二存储单元中,使得服务器提供商在收集第一错误信息时,不需要从服务器中的其他存储空间获取该第一错误信息,保证不侵犯服务器使用者的个人隐私。
图2示意性示出了根据本公开另一实施例的用于电子设备的信息处理的流程图。
如图2所示,该方法包括操作S110~S120以及S210~S230。其中,操作S110~S120如上参考图1描述的操作相同或类似,在此不再赘述。
在操作S210,由基板管理控制器获取与多个设备的历史错误信息和历史故障信息相关的预测信息。
根据本公开实施例,多个设备例如可以是多个服务器,基板管理控制器可以收集关于多个服务器的预测信息,该预测信息例如为与多个服务器的历史错误信息和历史故障信息相关的信息。其中,历史错误信息例如包括内存的可修复错误,历史故障信息例如包括服务器故障维修的信息。
在操作S220,基于第一错误信息和预测信息预测第一存储单元是否存在故障隐患。
根据本公开实施例,可以根据第一错误信息和预测信息预测内存是否存在故障隐患。例如,当收集到100台服务器的历史错误信息和历史故障信息时(该100台服务器均为出现故障的服务器),例如其中60台服务器的内存出现第一错误信息的次数超过A次,表明出现第一错误信息的次数超过A次后出现故障的概率较大(例如概率大致为60%),此时,可以确定提示标准为第一错误信息出现次数为A次。即,当服务器的内存出现第一错误信息的次数超过A次后,存在较大概率的故障隐患。可以理解,除了基于第一错误信息出现的次数来预测故障隐患之外,还可以基于第一错误信息出现的频率(例如在预设时间段内,内存出现第一错误信息的次数)来预测内存的故障隐患。
在操作S230,在预测结果表明第一存储单元存在故障隐患时,发出提示信息。
根据本公开实施例,在基于第一错误信息和预测信息预测内存中存在故障隐患时,基板管理控制器可以发出提示信息,提示用户及时维修,以防止出现故障造成损失。
根据本公开实施例,预测信息例如包括包括基于历史错误信息和历史故障信息生成的预测模型。
在本公开实施例中,通过获取多个服务器的历史错误信息和历史故障信息,并基于历史错误信息和历史故障信息训练生成预测模型,该预测模型可以用于基于第一错误信息预测第一存储单元是否存在故障隐患。例如,该预测模型的输入可以是内存中第一错误信息出现的次数或频率,预测模型可以根据第一错误信息出现的次数或频率得到该内存是否存在故障隐患(或者内存存在故障隐患的概率),在预测结果表明内存中存在故障隐患的情况下,输出提示信息。
根据本公开实施例,该预测模型例如包括支持向量机模型、极端梯度提升模型等。其中,支持向量机模型(Support Vector Machine,SVM)是一类按监督学习(supervisedlearning)的方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier)。极端梯度提升模型(Extreme Gradient Boosting,xgboost)也是机器学习中常用模型之一,其对输入要求不敏感,效果好,在工业界用的较多。
可以理解,本公开实施例中的基板管理控制器是一个独立的处理器,该基板管理控制器可以执行复杂的计算功能,例如基板管理控制器能够运行复杂的预测模型。因此,通过基板管理控制器基于预测信息预测内存的故障隐患,实现及时预防服务器可能出现的故障,以提示用户及时维修,以防止出现故障造成损失。另外,不同的服务器的基板管理控制器可以基于相同的预测信息进行故障预测,预测标准一致,使得预测结果可信度高。并且,预测信息还可以实时更新,以不断改善预测标准,实现较精准的故障预测功能。
图3示意性示出了根据本公开实施例的用于电子设备的信息处理系统的框图。
如图3所示,本公开实施例的控制系统300包括基板管理控制器310以及第一存储单元320,第一存储单元320用于存储可执行指令,其中,当指令被基板管理控制器310执行时,使得基板管理控制器310执行:获取第一存储单元320产生的第一错误信息,将第一错误信息存储至基板管理控制器310的第二存储单元中,其中,第一错误信息包括出现错误后被电子设备修复的错误信息。
可选地,获取第一存储单元320产生的第一错误信息,包括:获取来自基本输入输出系统收集的第一错误信息,和/或响应于接收到的触发信号,并通过监测接口获取第一错误信息。
可选地,基板管理控制器310还用于执行:获取与多个设备的历史错误信息和历史故障信息相关的预测信息,基于第一错误信息和预测信息预测第一存储单元320是否存在故障隐患,在预测结果表明第一存储单元320存在故障隐患时,发出提示信息。
可选地,预测信息包括:基于历史错误信息和历史故障信息生成的预测模型,基于第一错误信息和预测信息预测第一存储单元320是否存在故障隐患,包括:利用预测模型基于第一错误信息预测第一存储单元320是否存在故障隐患。
图4示意性示出了根据本公开实施例的基板管理控制器的框图。
如图4所示,基板管理控制器400包括第一获取模块410以及存储模块420。
第一获取模块410可以用于获取第一存储单元产生的第一错误信息。
根据本公开实施例,获取第一存储单元产生的第一错误信息,包括:获取来自基本输入输出系统收集的第一错误信息,和/或基板管理控制器响应于接收到的触发信号,并通过监测接口获取第一错误信息。
根据本公开实施例,第一获取模块410例如可以执行上文参考图1描述的操作S110,在此不再赘述。
存储模块420可以用于将第一错误信息存储至基板管理控制器的第二存储单元中,其中,第一错误信息包括出现错误后被电子设备修复的错误信息。根据本公开实施例,存储模块420例如可以执行上文参考图1描述的操作S120,在此不再赘述。
图5示意性示出了根据本公开另一实施例的基板管理控制器的框图。
如图5所示,基板管理控制器500包括第一获取模块410、存储模块420、第二获取模块510、预测模块520以及提示模块530。其中,第一获取模块410以及存储模块420如上参考图4描述的模块相同或类似,在此不再赘述。
第二获取模块510可以用于获取与多个设备的历史错误信息和历史故障信息相关的预测信息。
根据本公开实施例,预测信息包括:基于历史错误信息和历史故障信息生成的预测模型,基于第一错误信息和预测信息预测第一存储单元是否存在故障隐患,包括:利用预测模型基于第一错误信息预测第一存储单元是否存在故障隐患。
根据本公开实施例,第二获取模块510例如可以执行上文参考图2描述的操作S210,在此不再赘述。
预测模块520可以用于基于第一错误信息和预测信息预测第一存储单元是否存在故障隐患。根据本公开实施例,预测模块520例如可以执行上文参考图2描述的操作S220,在此不再赘述。
提示模块530可以用于在预测结果表明第一存储单元存在故障隐患时,发出提示信息。根据本公开实施例,提示模块530例如可以执行上文参考图2描述的操作S230,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
例如,第一获取模块410、存储模块420、第二获取模块510、预测模块520以及提示模块530中的任意多个可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,第一获取模块410、存储模块420、第二获取模块510、预测模块520以及提示模块530中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,第一获取模块410、存储模块420、第二获取模块510、预测模块520以及提示模块530中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图6示意性示出了根据本公开实施例的用于实现信息处理的计算机系统的方框图。图6示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,实现信息处理的计算机系统600包括处理器601、计算机可读存储介质602。该系统600可以执行根据本公开实施例的方法。
具体地,处理器601例如可以包括通用微处理器、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以是用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
计算机可读存储介质602,例如可以是能够包含、存储、传送、传播或传输指令的任意介质。例如,可读存储介质可以包括但不限于电、磁、光、电磁、红外或半导体系统、装置、器件或传播介质。可读存储介质的具体示例包括:磁存储装置,如磁带或硬盘(HDD);光存储装置,如光盘(CD-ROM);存储器,如随机存取存储器(RAM)或闪存;和/或有线/无线通信链路。
计算机可读存储介质602可以包括计算机程序603,该计算机程序603可以包括代码/计算机可执行指令,其在由处理器601执行时使得处理器601执行根据本公开实施例的方法或其任何变形。
计算机程序603可被配置为具有例如包括计算机程序模块的计算机程序代码。例如,在示例实施例中,计算机程序603中的代码可以包括一个或多个程序模块,例如包括603A、模块603B、……。应当注意,模块的划分方式和个数并不是固定的,本领域技术人员可以根据实际情况使用合适的程序模块或程序模块组合,当这些程序模块组合被处理器601执行时,使得处理器601可以执行根据本公开实施例的方法或其任何变形。
根据本发明的实施例,第一获取模块410、存储模块420、第二获取模块510、预测模块520以及提示模块530中的至少一个可以实现为参考图6描述的计算机程序模块,其在被处理器601执行时,可以实现上面描述的相应操作。
本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现:
一种用于电子设备的信息处理方法,包括:由基板管理控制器获取第一存储单元产生的第一错误信息,将第一错误信息存储至基板管理控制器的第二存储单元中,其中,第一错误信息包括出现错误后被电子设备修复的错误信息。
根据本公开实施例,由基板管理控制器获取第一存储单元产生的第一错误信息,包括:由基板管理控制器获取来自基本输入输出系统收集的第一错误信息,和/或基板管理控制器响应于接收到的触发信号,并通过监测接口获取第一错误信息。
根据本公开实施例,用于电子设备的信息处理方法还包括:由基板管理控制器获取与多个设备的历史错误信息和历史故障信息相关的预测信息,基于第一错误信息和预测信息预测第一存储单元是否存在故障隐患,在预测结果表明第一存储单元存在故障隐患时,发出提示信息。
根据本公开实施例,预测信息包括:基于历史错误信息和历史故障信息生成的预测模型,基于第一错误信息和预测信息预测第一存储单元是否存在故障隐患,包括:利用预测模型基于第一错误信息预测第一存储单元是否存在故障隐患。
根据本公开的实施例,计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、射频信号等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
尽管已经参照本公开的特定示例性实施例示出并描述了本公开,但是本领域技术人员应该理解,在不背离所附权利要求及其等同物限定的本公开的精神和范围的情况下,可以对本公开进行形式和细节上的多种改变。因此,本公开的范围不应该限于上述实施例,而是应该不仅由所附权利要求来进行确定,还由所附权利要求的等同物来进行限定。

Claims (5)

1.一种用于电子设备的信息处理方法,包括:
由基板管理控制器获取第一存储单元产生的第一错误信息;
将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息;
由所述基板管理控制器获取与多个设备的历史错误信息和历史故障信息相关的预测信息;所述预测信息包括预设次数或预测模型;
基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,包括:
基于所述第一存储单元产生的第一错误信息的次数和所述预设次数,预测所述第一存储单元是否存在故障隐患,以得到表征所述第一存储单元是否存在故障隐患的第一预测结果;所述预设次数与多个设备中部分设备出现第一错误信息的次数相关联,其中所述部分设备出现第一错误信息的次数大于所述预设次数;或
利用所述基板管理控制器将所述第一存储单元产生的第一错误信息的次数作为预测模型的输入来运行所述预测模型,以得到用于表征第一存储单元是否存在故障隐患的第二预测结果;
在所述第一预测结果或所述第二预测结果表明所述第一存储单元存在故障隐患时,发出提示信息。
2.根据权利要求1所述的方法,其中,所述由所述基板管理控制器获取所述第一存储单元产生的第一错误信息,包括:
由所述基板管理控制器获取来自基本输入输出系统收集的所述第一错误信息;和/或
所述基板管理控制器响应于接收到的触发信号,并通过监测接口获取所述第一错误信息。
3.一种用于电子设备的信息处理系统,包括:
基板管理控制器;以及
第一存储单元,用于存储可执行指令,其中,当所述指令被所述基板管理控制器执行时,使得所述基板管理控制器执行:
获取第一存储单元产生的第一错误信息;
将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息;
由所述基板管理控制器获取与多个设备的历史错误信息和历史故障信息相关的预测信息;所述预测信息包括预设次数或预测模型;
基于所述第一错误信息和所述预测信息预测所述第一存储单元是否存在故障隐患,包括:
基于所述第一存储单元产生的第一错误信息的次数和所述预设次数,预测所述第一存储单元是否存在故障隐患,以得到表征所述第一存储单元是否存在故障隐患的第一预测结果;所述预设次数与多个设备中部分设备出现第一错误信息的次数相关联,其中所述部分设备出现第一错误信息的次数大于所述预设次数;或
利用所述基板管理控制器将所述第一存储单元产生的第一错误信息的次数作为预测模型的输入来运行所述预测模型,以得到用于表征第一存储单元是否存在故障隐患的第二预测结果;
在所述第一预测结果或所述第二预测结果表明所述第一存储单元存在故障隐患时,发出提示信息。
4.根据权利要求3所述的系统,其中,所述获取所述第一存储单元产生的第一错误信息,包括:
获取来自基本输入输出系统收集的所述第一错误信息;和/或
响应于接收到的触发信号,并通过监测接口获取所述第一错误信息。
5.一种电子设备,所述电子设备包括基板管理控制器,所述基板管理控制器包括:
第一获取模块,获取第一存储单元产生的第一错误信息;
存储模块,将所述第一错误信息存储至所述基板管理控制器的第二存储单元中,其中,所述第一错误信息包括出现错误后被所述电子设备修复的错误信息;
第二获取模块,获取与多个设备的历史错误信息和历史故障信息相关的预测信息;所述预测信息包括预设次数或预测模型;
预测模块用于:
基于所述第一存储单元产生的第一错误信息的次数和所述预设次数,预测所述第一存储单元是否存在故障隐患,以得到表征所述第一存储单元是否存在故障隐患的第一预测结果;所述预设次数与多个设备中部分设备出现第一错误信息的次数相关联,其中所述部分设备出现第一错误信息的次数大于所述预设次数;或
利用所述基板管理控制器将所述第一存储单元产生的第一错误信息的次数作为预测模型的输入来运行所述预测模型,以得到用于表征第一存储单元是否存在故障隐患的第二预测结果;
提示模块,在所述第一预测结果或所述第二预测结果表明所述第一存储单元存在故障隐患时,发出提示信息。
CN201910240408.9A 2019-03-27 2019-03-27 用于电子设备的信息处理方法、系统以及电子设备 Active CN109992477B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910240408.9A CN109992477B (zh) 2019-03-27 2019-03-27 用于电子设备的信息处理方法、系统以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910240408.9A CN109992477B (zh) 2019-03-27 2019-03-27 用于电子设备的信息处理方法、系统以及电子设备

Publications (2)

Publication Number Publication Date
CN109992477A CN109992477A (zh) 2019-07-09
CN109992477B true CN109992477B (zh) 2021-07-16

Family

ID=67131862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910240408.9A Active CN109992477B (zh) 2019-03-27 2019-03-27 用于电子设备的信息处理方法、系统以及电子设备

Country Status (1)

Country Link
CN (1) CN109992477B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112988442B (zh) * 2021-03-05 2023-03-24 山东英信计算机技术有限公司 一种服务器运行阶段传送故障信息的方法和设备
CN115495301A (zh) * 2021-06-18 2022-12-20 华为技术有限公司 一种故障处理方法、装置、设备及系统
CN113687869B (zh) * 2021-10-27 2022-02-22 苏州浪潮智能科技有限公司 一种兼容txt功能和asd功能的方法和装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116531A (zh) * 2013-01-25 2013-05-22 浪潮(北京)电子信息产业有限公司 存储系统故障预测方法和装置
CN107342878A (zh) * 2016-04-29 2017-11-10 中兴通讯股份有限公司 一种故障处理方法及装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103092316B (zh) * 2013-01-22 2017-04-12 浪潮电子信息产业股份有限公司 一种基于数据挖掘的服务器功耗管理系统
CN105117301B (zh) * 2015-08-14 2018-08-14 杭州华为数字技术有限公司 一种内存预警的方法及装置
CN109086151A (zh) * 2017-06-13 2018-12-25 中兴通讯股份有限公司 一种服务器上隔离内存故障的方法及装置
CN107769960B (zh) * 2017-09-07 2020-11-27 苏州浪潮智能科技有限公司 一种基于can总线的bmc管理架构
CN108491305B (zh) * 2018-03-09 2021-05-25 网宿科技股份有限公司 一种服务器故障的检测方法及系统
CN108958965B (zh) * 2018-06-28 2021-03-02 苏州浪潮智能科技有限公司 一种bmc监控可恢复ecc错误的方法、装置及设备
CN109254895A (zh) * 2018-08-21 2019-01-22 山东超越数控电子股份有限公司 一种基于bmc的高性能服务器故障分析预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116531A (zh) * 2013-01-25 2013-05-22 浪潮(北京)电子信息产业有限公司 存储系统故障预测方法和装置
CN107342878A (zh) * 2016-04-29 2017-11-10 中兴通讯股份有限公司 一种故障处理方法及装置

Also Published As

Publication number Publication date
CN109992477A (zh) 2019-07-09

Similar Documents

Publication Publication Date Title
US20230162063A1 (en) Interpretability-based machine learning adjustment during production
US11829896B2 (en) Uncertainty-based data filtering in a vehicle
US11288102B2 (en) Modifying resources for composed systems based on resource models
CN109992477B (zh) 用于电子设备的信息处理方法、系统以及电子设备
US11537459B2 (en) Automatically predicting device failure using machine learning techniques
US20200279180A1 (en) Artificial intelligence customer support case management system
US20190278658A1 (en) Resolving and preventing computer system failures caused by changes to the installed software
US11157380B2 (en) Device temperature impact management using machine learning techniques
US20160378602A1 (en) Pre-boot self-healing and adaptive fault isolation
US20170039105A1 (en) Support action based self learning and analytics for datacenter device hardware/firmare fault management
US11195132B2 (en) System, method and computer program product for characterizing object status and determining a maintenance schedule
US10769866B2 (en) Generating estimates of failure risk for a vehicular component
US10996861B2 (en) Method, device and computer product for predicting disk failure
US11711275B2 (en) Impact predictions based on incident-related data
US20140012784A1 (en) Monitoring state of health information for components
US20160378604A1 (en) Agentless and/or pre-boot support, and field replaceable unit (fru) isolation
US10007583B2 (en) Generating a data structure to maintain error and connection information on components and use the data structure to determine an error correction operation
US11455223B2 (en) Using system errors and manufacturer defects in system components causing the system errors to determine a quality assessment value for the components
US9678824B2 (en) Durability and availability evaluation for distributed storage systems
US20160093118A1 (en) Generating Estimates of Failure Risk for a Vehicular Component in Situations of High-Dimensional and Low Sample Size Data
US20210182739A1 (en) Ensemble learning model to identify conditions of electronic devices
US20230236923A1 (en) Machine learning assisted remediation of networked computing failure patterns
US11188412B2 (en) System and method for improving server usage based on anomaly detection
US20140101260A1 (en) Processing a technical system
CN111210231A (zh) 信息处理方法和信息处理装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant