CN114691400A - 故障处理方法及故障处理装置 - Google Patents

故障处理方法及故障处理装置 Download PDF

Info

Publication number
CN114691400A
CN114691400A CN202011637532.8A CN202011637532A CN114691400A CN 114691400 A CN114691400 A CN 114691400A CN 202011637532 A CN202011637532 A CN 202011637532A CN 114691400 A CN114691400 A CN 114691400A
Authority
CN
China
Prior art keywords
fault
computing device
management controller
board management
bmc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011637532.8A
Other languages
English (en)
Inventor
丁龙兴
胡铭河
邓福铮
黄靖文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lenovo Enterprise Solutions Singapore Pte Ltd
Original Assignee
Lenovo Enterprise Solutions Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lenovo Enterprise Solutions Singapore Pte Ltd filed Critical Lenovo Enterprise Solutions Singapore Pte Ltd
Priority to CN202011637532.8A priority Critical patent/CN114691400A/zh
Priority to US17/565,159 priority patent/US20220206891A1/en
Publication of CN114691400A publication Critical patent/CN114691400A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0769Readable error formats, e.g. cross-platform generic formats, human understandable formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/22Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing
    • G06F11/2252Detection or location of defective computer hardware by testing during standby operation or during idle time, e.g. start-up testing using fault dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种由计算设备执行的故障处理方法及故障处理装置,所述计算设备包括至少一个计算设备部件及耦接于所述至少一个计算设备部件的板管理控制器(BMC)。所述方法包括以下步骤:所述板管理控制器侦测涉及所述至少一个计算设备部件的故障;所述板管理控制器从数据库确定修复所述故障的技术规范,以及所述板管理控制器生成访问所述技术规范的信息。一种故障处理装置包括板管理控制器及耦接于所述板管理控制器的至少一个计算设备部件。所述板管理控制器被设置为:侦测涉及所述至少一个计算设备部件的故障;从数据库确定修复所述故障的技术规范,以及生成访问所述技术规范的信息。

Description

故障处理方法及故障处理装置
技术领域
本公开涉及故障处理方法及故障处理装置,特别涉计算系统中的故障处理方法及故障处理装置。
背景技术
计算系统例如计算机服务器中的板管理控制器(Board Management Controller,BMC)被设置为处理涉及计算系统部件的故障,例如中央处理单元(CPU)、存储卡以及连接接口等部件的故障。传统的计算系统板管理控制器通过检查系统状态发光二极管及系统故障发光二极管,在系统发生故障时通知用户。用户则需要另外联络客服中心,以获得与系统故障相关的进一步信息,例如故障管理记录等,从而获得修复该故障的解决方案信息。此类处理程序耗时长、而且客服中心会另外收费。因此,需要提供一种方法及装置,使得不需要依赖客服中心即可有效处理计算系统故障。
发明内容
在一个方面,本公开提供一种由计算设备执行的故障处理方法,所述计算设备包括至少一个计算设备部件及耦接于所述至少一个计算设备部件的板管理控制器(BMC),所述方法包括以下步骤:所述板管理控制器侦测涉及所述至少一个计算设备部件的故障;所述板管理控制器从数据库确定修复所述故障的技术规范,以及所述板管理控制器生成访问所述技术规范的信息。
优选地,所述板管理控制器生成的信息包括提供访问所述技术规范的链接。
优选地,本方法还包括在耦接于所述计算设备的屏幕上显示图像的步骤,其中所述链接编码于所述图像。
可替代地,本方法还包括在连接于所述计算设备的网页的图形用户界面显示图像的步骤,其中所述链接编码于所述图像。
优选地,本方法还包括将所述图像传输至阅读器,以访问用于修复所述故障的所述技术规范的步骤。
优选地,本方法还包括在所述故障被修复后生成维护记录的步骤,所述维护记录包括所述故障的说明及修复所述故障的所述技术规范。
优选地,本方法还包括在所述故障被修复后生成维护记录的步骤,所述维护记录包括所述故障的说明及修复所述故障的所述技术规范。
优选地,本方法还包括将所述维护记录上载于所述数据库的步骤。
优选地,本方法还包括根据所述维护记录更新所述技术规范的步骤。
在另一方面,本公开提供用于计算设备的故障处理装置,所述装置包括:板管理控制器及耦接于所述板管理控制器的至少一个计算设备部件;其中所述板管理控制器被设置为:侦测涉及所述至少一个计算设备部件的故障;从数据库确定修复所述故障的技术规范,以及生成访问所述技术规范的信息。
优选地,所述板管理控制器被进一步设置为提供访问所述技术规范的链接。
优选地,本装置还包括耦接于所述板管理控制器的屏幕,以显示所述链接。
优选地,所述板管理控制器被设置为在所述故障被修复后生成维护记录,所述维护记录包括所述故障的说明及修复所述故障的所述技术规范。
优选地,所述板管理控制器被设置为将所述维护记录上载于所述数据库。
附图说明
结合附图将更全面地理解实施例的特征,其中:
图1是根据本公开一个实施例的故障处理装置的示意框图。
图2是根据本公开一个实施例的故障处理系统的示意框图。
图3是根据本公开另一实施例的故障处理装置的示意框图。
图4是根据本公开另一实施例的故障处理系统的示意框图。
图5是根据本公开一个实施例的故障处理方法的流程示意图。
具体实施方式
在一个方面,本公开提供一种故障处理装置及计算系统。根据一个实施例,如图1所示,故障处理装置100包括板管理控制器110以及耦接于板管理控制器110的一个或多个计算设备部件120。该一个或多个计算设备部件120可以是计算设备的零部件、功能模块或组件。例如,部件120可以包括中央处理单元(CPU)1202、双线内存模组(Dual In-lineMemory Module,DIMM)1204、高速外围组件互联(PCIe)接口1206以及任何其他类型的计算设备零部件、功能模块或组件1208。
每个零部件1202、1204、1206及1208被设置为可以在该零部件发生系统故障时生成各自的故障信号1222、1224、1226及1228,且板管理控制器110被设置为侦测与至少一个计算系统部件相关的故障,并从该零部件1202、1204、1206及1208接收故障信号1222、1224、1226及1228。
板管理控制器110与数据库150耦接。数据库150可以是与板管理控制器110连接的云端存储空间,或者是以其他方式,例如通过局域网等与板管理控制器110数据联通的设备或设施。数据库150中存储有技术规范/技术文件集,例如故障解决报告152、154等。每份技术文件包含用于管理计算设备运行过程中其零部件可能发生的、基于该计算设备的设置、故障报告及故障解决的历史记录的任何产品问题或系统故障的信息。例如,该技术文件可以包括与在计算设备中可能发生的系统故障对应的信息,例如由故障信号1222、1224、1226及1228所代表的故障信息。
在另一方面,如图2所示,根据本公开另一实施例的计算系统190包括板管理控制器110,耦接于板管理控制器110的一个或多个计算设备部件,例如中央处理单元1202、DIMM1204、PCIe接口1206及其他部件1208,以及耦接于板管理控制器110的数据库150。数据库150中存储有技术文件152、154。每份技术文件包含用于管理计算设备运行过程中其零部件可能发生的、基于该计算设备的设置以及故障报告及故障解决的历史记录的任何产品问题或系统故障的信息。
参照图1所示的装置100及图2所示的系统190,当任何一个或多个部件120出现系统故障时,例如当CPU1202发生系统故障时,由CPU1202生成的第一故障信号1222被BMC110侦测到。当接收到该第一故障信号1222时,BMC110判定数据库150中的技术文件152包含有与该第一故障信号1222对应的、在CPU1202中发生的故障的性质、历史记录及起因等的详细信息。该技术文件还可以包括涉及用于修复所述故障的解决方案,例如问题确定及服务指南(Problem Determination and Service Guide,PDSG)。当确定了技术文件152,BMC110即提供链接142,用于访问数据库150中的技术文件152。
例如,BMC110生成图像132,链接142编码于图像132中。装置100包括耦接于BMC110的屏幕130,以显示该图像132。图像132可以是QR码或类似码,其可以通过读码器或遥控设备80阅读或扫描。在被阅读或扫描后,图像132被传输至阅读器或遥控设备80,用户例如服务人员即可从阅读器或遥控设备80通过链接142从数据库150获得技术文件152,以及采取必要行动以判定CPU1202发生的故障的起因,并根据由所获得的技术文件152提供的指南及信息修复该系统故障。
系统故障修复之后,BMC110生成维护记录162,其包括CPU1202中发生的故障的说明,从CPU1202接收的、代表该故障的故障信号1222,技术文件152提供的技术解决方案以及依照技术文件152所采取的该系统故障的修复步骤。BMC152将维护记录162上载至数据库150,以更新技术文件152。
根据另一实施例,如图3所示,故障处理装置200包括板管理控制器210以及耦接于板管理控制器210的一个或多个计算设备部件220。该一个或多个计算设备部件220可以是计算设备的零部件、功能模块或组件。例如CPU 2202,DIMM 2204,PCIe接口2206,以及任何其他类型的计算设备零部件、功能模块或组件2208。
每个零部件2202、2204、2206及2208被设置为可以在该零部件发生系统故障时生成各自的故障信号2222、2224、2226及2228,且板管理控制器210被设置为侦测与至少一个计算系统部件相关的故障,并从该零部件2202、2204、2206及2208接收故障信号2222、2224、2226及2228。
板管理控制器210与网站250数据连接。网站250存储有技术规范/技术文件集,例如故障解决报告252、254等,以及用于显示网站250的图形用户界面(graphical userinterface,GUI)251。每份技术文件包含用于管理计算设备运行过程中其零部件可能发生的、基于该计算设备的设置、故障报告及故障解决的历史记录的任何产品问题或系统故障的信息。例如,该技术文件可以包括与在计算设备中可能发生的系统故障对应的信息,例如由故障信号2222、2224、2226及2228所代表的故障信息。
如图4所示,根据本公开另一实施例的计算系统290包括板管理控制器210,耦接于板管理控制器210的一个或多个计算设备部件,例如CPU 2202,DIMM 2204,PCIe接口2206,其他类型的计算设备零部件、功能模块或组件2208,以及耦接于板管理控制器210的网站250。网站250存储有技术文件252、254,以及用于显示网站250的GUI 251。每份技术文件包含用于管理计算设备运行过程中其零部件可能发生的、基于该计算设备的设置以及故障报告及故障解决的历史记录的任何产品问题或系统故障的信息。
参照图3所示的装置200及图4所示的系统290,当任何一个或多个部件220出现系统故障时,例如当CPU 2202发生系统故障时,由CPU 2202生成的第一故障信号2222被BMC210侦测到。当接收到该第一故障信号2222时,BMC 210判定网站250中的技术文件252包含有与该第一故障信号2222对应的、在CPU 2202中发生的故障的性质、历史记录及起因等的详细信息。该技术文件还可以包括涉及用于修复该故障的解决方案,例如问题确定及服务指南(PDSG)。BMC 210随即提供链接242,用于访问网站250中的技术文件252。
例如,BMC 210生成图像,例如QR码232,链接242编码于该QR码232中。BMC 210将QR码232上载至网站250,在包括所判定的、对应于第一故障信号2222的技术文件252的清单中显示QR码232,并且在该技术文件252的同一行显示该QR码232。
网站250可以被例如服务人员的用户访问。QR码232可以被用户操作的读码器或遥控设备80读取或扫描,QR码232随之被传送至读码器或遥控设备80,用户即可以通过其中的链接242从网站250获得技术文件252,采取必要行动以判定CPU 2202发生的故障的起因,并根据由所获得的技术文件252提供的指南及信息修复该系统故障。
系统故障修复之后,BMC210生成维护记录262,其包括CPU 2202中发生的故障的说明,从CPU 2202接收的、代表该故障的故障信号2222,技术文件252提供的技术解决方案以及依照技术文件252所采取的该系统故障的修复步骤。BMC 210将维护记录262上载至网站250,以更新技术文件252。
在又一方面,本公开提供一种故障处理方法。根据一个实施例,如图5所示,故障处理方法500包括,在步骤510,板管理控制器侦测涉及一个计算设备部件的故障。该故障可以与系统故障相关。计算设备部件可以是计算设备的零部件、功能模块或组件。例如,计算设备部件可以包括CPU,DIMM,PCIe接口卡,或计算设备的任何其他零部件、功能模块或组件。
在步骤520,板管理控制器从数据库确定修复该故障的技术规范。数据库可以是存储有技术规范/技术文件集,例如问题管理报告的云端存储空间,或与BMC连接的网站。每份技术文件包含用于管理计算设备运行过程中其零部件可能发生的、基于该计算设备的设置、故障报告及故障解决的历史记录的任何产品问题或系统故障的信息。
在步骤530,板管理控制器提供访问数据库或网站中的所述技术规范的信息。
本方法还可以包括,在步骤540,生成图像,例如QR码,所述技术规范的链接信息编码于该图像中,以及在步骤552,在屏幕上显示该图像。可替代地,在步骤554,本方法可以在网站的图形用户界面显示该图像。
在步骤560,本方法将所述图像传输至用户例如服务人员的阅读器。当故障基于技术文件被修复后,在步骤570,本方法生成维护记录,该维护记录包括故障说明以及修复故障所实施的技术方案。维护记录生成之后,在步骤580,本方法将维护记录上载至数据库,以及在步骤590,本方法更新数据库中的技术文件。
如本文中所使用的,除非另外明确指出,否则单数“一”和“一个”可以被解释为包括复数“一个或多个”。
以上出于说明及描述的目的呈现本公开,但是并不旨在穷举或限制。许多修改及变化对于本领域普通技术人员来说是显而易见的。选择及描述示例实施例是为了解释原理及实际应用,并且使本领域普通技术人员能够理解本公开的各种实施例,其具有适合于预期的特定用途的各种修改。
因此,尽管本文参考附图描述说明性示例实施例,但是应该理解,该描述不是限制性的,并且本领域技术人员可以在其中实现各种其他变化及修改而不脱离本公开的范围或创新构思。

Claims (13)

1.一种由计算设备执行的故障处理方法,所述计算设备包括至少一个计算设备部件及耦接于所述至少一个计算设备部件的板管理控制器(BMC),所述方法包括以下步骤:
所述板管理控制器(BMC)侦测涉及所述至少一个计算设备部件的故障;
所述板管理控制器(BMC)从数据库确定修复所述故障的技术规范,以及
所述板管理控制器(BMC)生成访问所述技术规范的信息。
2.如权利要求1所述的方法,其特征在于,所述板管理控制器(BMC)生成的信息包括提供访问所述技术规范的链接。
3.如权利要求2所述的方法,其特征在于,还包括在耦接于所述计算设备的屏幕上显示图像的步骤,其中所述链接编码于所述图像。
4.如权利要求2所述的方法,其特征在于,还包括在连接于所述计算设备的网页的图形用户界面显示图像的步骤,其中所述链接编码于所述图像。
5.如权利要求3或4所述的方法,其特征在于,还包括将所述图像传输至阅读器以访问用于修复所述故障的所述技术规范的步骤。
6.如权利要求5所述的方法,其特征在于,还包括在所述故障被修复后生成维护记录的步骤,所述维护记录包括所述故障的说明及修复所述故障的所述技术规范。
7.如权利要求6所述的方法,其特征在于,还包括将所述维护记录上载于所述数据库的步骤。
8.如权利要求7所述的方法,其特征在于,还包括根据所述维护记录更新所述技术规范的步骤。
9.一种用于计算设备的故障处理装置,其特征在于,所述装置包括:
板管理控制器(BMC);
耦接于所述板管理控制器(BMC)的至少一个计算设备部件;
其中所述板管理控制器(BMC)被设置为:
侦测涉及所述至少一个计算设备部件的故障;
从数据库确定修复所述故障的技术规范,以及
生成访问所述技术规范的信息。
10.如权利要求9所述的装置,其特征在于,所述板管理控制器(BMC)被进一步设置为提供访问所述技术规范的链接。
11.如权利要求10所述的装置,其特征在于,还包括耦接于所述板管理控制器(BMC)的屏幕,以显示所述链接。
12.如权利要求11所述的装置,其特征在于,所述板管理控制器(BMC)被设置为在所述故障被修复后生成维护记录,所述维护记录包括所述故障的说明及修复所述故障的所述技术规范。
13.如权利要求12所述的装置,其特征在于,所述板管理控制器(BMC)被设置为将所述维护记录上载于所述数据库。
CN202011637532.8A 2020-12-31 2020-12-31 故障处理方法及故障处理装置 Pending CN114691400A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202011637532.8A CN114691400A (zh) 2020-12-31 2020-12-31 故障处理方法及故障处理装置
US17/565,159 US20220206891A1 (en) 2020-12-31 2021-12-29 Error handling method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011637532.8A CN114691400A (zh) 2020-12-31 2020-12-31 故障处理方法及故障处理装置

Publications (1)

Publication Number Publication Date
CN114691400A true CN114691400A (zh) 2022-07-01

Family

ID=82119877

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011637532.8A Pending CN114691400A (zh) 2020-12-31 2020-12-31 故障处理方法及故障处理装置

Country Status (2)

Country Link
US (1) US20220206891A1 (zh)
CN (1) CN114691400A (zh)

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100325490A1 (en) * 2009-06-22 2010-12-23 Anvin H Peter System and method to view crash dump information using a 2-d barcode
US9449278B2 (en) * 2013-04-12 2016-09-20 Apple Inc. Cloud-based diagnostics and remediation
US10333771B2 (en) * 2015-10-14 2019-06-25 Quanta Computer Inc. Diagnostic monitoring techniques for server systems
US11023302B2 (en) * 2018-03-07 2021-06-01 Dell Products L.P. Methods and systems for detecting and capturing host system hang events
US10901829B2 (en) * 2018-05-10 2021-01-26 International Business Machines Corporation Troubleshooting using a visual communications protocol
US11231944B2 (en) * 2018-10-29 2022-01-25 Alexander Permenter Alerting, diagnosing, and transmitting computer issues to a technical resource in response to a dedicated physical button or trigger
US11416327B2 (en) * 2019-05-24 2022-08-16 Dell Products L.P. System and method for intelligent firmware updates, firmware restore, device enable or disable based on telemetry data analytics, and diagnostic failure threshold for each firmware
US11099928B1 (en) * 2020-02-26 2021-08-24 EMC IP Holding Company LLC Utilizing machine learning to predict success of troubleshooting actions for repairing assets
CN114174996A (zh) * 2020-03-19 2022-03-11 株式会社日立制作所 修理辅助系统以及修理辅助方法
US20210342209A1 (en) * 2020-04-30 2021-11-04 Dell Products L.P. Self-learning, context-sensitive troubleshooting
US11314582B2 (en) * 2020-06-24 2022-04-26 Dell Products L.P. Systems and methods for dynamically resolving hardware failures in an information handling system
US11645138B2 (en) * 2020-07-01 2023-05-09 International Business Machines Corporation Diagnosing and resolving technical issues
CN114077525A (zh) * 2020-08-17 2022-02-22 鸿富锦精密电子(天津)有限公司 异常日志处理方法、装置、终端设备、云服务器及系统
US11620182B2 (en) * 2020-08-31 2023-04-04 Bank Of America Corporation System for resolution of technical issues using computing system-specific contextual data
US20240045752A1 (en) * 2020-12-11 2024-02-08 Telefonaktiebolaget Lm Ericsson (Publ) Methods and apparatuses for troubleshooting a computer system
US11726860B2 (en) * 2020-12-23 2023-08-15 EMC IP Holding Company LLC Intelligent automatic support
US20220207388A1 (en) * 2020-12-28 2022-06-30 Dell Products L.P. Automatically generating conditional instructions for resolving predicted system issues using machine learning techniques

Also Published As

Publication number Publication date
US20220206891A1 (en) 2022-06-30

Similar Documents

Publication Publication Date Title
CN100412804C (zh) 主板故障诊断卡错误代码的识别方法及系统
US7843359B2 (en) Fault management system using satellite telemetering technology and method thereof
CN109491819A (zh) 一种诊断服务器故障的方法和系统
CN110275992A (zh) 应急处理方法、装置、服务器及计算机可读存储介质
JP2019049802A (ja) 障害解析支援装置、インシデント管理システム、障害解析支援方法及びプログラム
CN110291505A (zh) 减少应用的恢复时间
CN113961478A (zh) 一种内存故障记录方法以及装置
CN113868058A (zh) 一种外设组件高速互联设备故障检测方法、装置及服务器
CN117891671A (zh) 医疗服务终端的监管方法、系统、电子设备及存储介质
KR20220168849A (ko) 정보통신 설비 점검 시스템 및 방법
KR20200004514A (ko) Pci-e 인터페이스를 이용한 컴퓨터 장애진단 시스템
CN109032867A (zh) 一种故障诊断方法、装置及设备
CN114691400A (zh) 故障处理方法及故障处理装置
CN111835566A (zh) 一种系统故障管理方法、装置及系统
CN113407397B (zh) 一种设备机箱丝印的显示方法、装置、设备及介质
CN115273354A (zh) 银行自助设备管理方法及其系统、计算机设备
CN113568806A (zh) 一种sas卡链路状态监控方法、系统、装置及可读存储介质
CN115190044A (zh) 设备连接状态检查方法、装置、设备和存储介质
US7996497B2 (en) Method of handling duplicate or invalid node controller IDs in a distributed service processor environment
US9372746B2 (en) Methods for identifying silent failures in an application and devices thereof
KR100930126B1 (ko) 계측 제어 시스템 및 그 제어 방법
CN113850987B (zh) 用于检测产品质量的系统
CN116431410A (zh) 一种服务器中硬盘的检测方法、系统及相关装置
CN113392090B (zh) 基于数据库迁移的数据验证方法、装置、设备及介质
CN114449370B (zh) 交换机组装部件一体化管理方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination