CN117609024A - 自动定位异常部件的方法、装置、电子设备及存储介质 - Google Patents
自动定位异常部件的方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN117609024A CN117609024A CN202311541420.6A CN202311541420A CN117609024A CN 117609024 A CN117609024 A CN 117609024A CN 202311541420 A CN202311541420 A CN 202311541420A CN 117609024 A CN117609024 A CN 117609024A
- Authority
- CN
- China
- Prior art keywords
- fault
- processor
- byte
- component
- locating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002159 abnormal effect Effects 0.000 title claims abstract description 65
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000013507 mapping Methods 0.000 claims abstract description 121
- 238000001514 detection method Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 37
- 238000012545 processing Methods 0.000 claims description 11
- 238000011084 recovery Methods 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 101000957815 Culex pipiens Alpha-glucosidase Proteins 0.000 description 1
- 206010033799 Paralysis Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005111 flow chemistry technique Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/362—Software debugging
- G06F11/3636—Software debugging by tracing the execution of the program
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3476—Data logging
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明提供了一种自动定位异常部件的方法、装置、电子设备及存储介质,其特征在于,方法包括:根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;若是,则根据错误信息日志从寄存器中获取错误状态寄存器值并确定错误状态寄存器值中的前四个故障定位字节,其中错误状态寄存器值包含多个二进制的故障定位字节;根据前四个故障定位字节和字节故障关系映射表定位处理器对应的故障部件;根据错误信息日志生成故障部件的故障信息并清除错误信息日志;根据故障信息确定故障部件中是否存在异常部件。通过解析出的错误寄存器值的前四位字节和对应的字节故障关系映射表快速定位处理器相关的故障类型和故障部件的具体位置。
Description
技术领域
本发明涉及故障定位技术领域,特别是涉及一种自动定位异常部件的方法、装置、电子设备及存储介质。
背景技术
随着科学技术的发展、芯片工艺制程技术的创新,导致越来越多的架构芯片被应用到电子产业的相关领域,如汽车、物联网等领域使用的是以ARM架构为主的CPU,PC和数据中心的服务器大部分均以X86架构主导的Intel和AMD处理器为主。但是,随着芯片流片技术的突破目前可以采用5纳米甚至2纳米的制程工具对处理器芯片进行流片,通过采取流程制程的提升可以将处理器的性能进行大幅度的性能提升,同时,CPU的性能提升的同时也带来了对耗电量的递增。综上所述,ARM架构服务器就越来越受到各个互联网及数据中心的青睐,因ARM架构处理器的能耗比是目前最领先的处理器,现在已经被手机端、电脑端、服务器端所普遍使用。但X86架构的处理器因其起步早且应用成熟度高,其RAS功能也是最完善的,无论是系统下对错误的定位还是管理软件对处理器内部寄存器的数据抓取及解析都是业界领先的存在,但ARM架构服务器也需要支持对服务器运行时遇到的错误信息进行解析及定位,故我们通过常规的系统下的dmesg文件用于记录ARM处理器的错误信息。Arm架构处理器与x86架构处理器不同,x86处理器只能记录一小部分CPU错误信息而大部分处理器错误信息是通过管理软件抓取CPU的寄存器后在通过规范文档进行解析,这样效率极低。但ARM处理器可以在系统下的dmesg文件中记录所有的CPU错误类型但均以二进制数值进行记录,包括但不限于Mesh总线错误、SMpro错误信息、PMpro错误信息、GIC中断错误、SMMU错误信息、CPM错误信息、OCM错误信息等ARM架构内部总线及组件的错误信息,而dmesg记录的也是错误来源等级、错误类型等一些基本的信息和一些错误数据结构体,与x86架构处理器管理原件抓取的错误数据类型,仍需要按照规范文档进行解析,虽然ARM架构不需要外部管理软件进行处理器的错误寄存器数据抓取,但其对处理器的错误数据寄存器解析一样需要人为按照规范文档进行造成了人力及问题定位时间的浪费。
发明内容
基于此,有必要针对上述技术问题,提供一种能够定位处理器相关故障部件并确定故障部件中异常部件的自动定位处理器的异常部件方法、装置、电子设备及存储介质。
第一方面,提供一种自动定位异常部件的方法,其特征在于,所述方法包括:
根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述方法还包括:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
另一方面,还提供一种自动定位故障部件的装置,其特征在于,所述装置包括:
遍历模块,用于根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
获取模块,若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
定位模块,用于根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
生成模块,用于根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
确定模块,用于根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述定位模块根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述定位模块根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述确定模块根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述确定模块根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述遍历模块根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述确定模块还用于包括:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
再一方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
又一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
首先,根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;然后根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;最后根据所述错误信息日志确定所述故障部件中的异常部件。通过解析出的错误寄存器值的前四位字节和对应的字节故障关系映射表快速定位处理器相关的故障类型和故障部件的具体位置;根据统计的故障部件对应的故障信息计算出每个周期各个故障部件的损耗率并确定这些故障部件中是否存在异常部件,通过更换异常部件避免处理器功能经常宕机。
附图说明
图1为自动定位异常部件方法的流程示意图;
图2为自动定位异常部件方法的步骤示意图;
图3为自动定位异常部件系统的系统示例图;
图4为自动定位故障部件方法的时序示例图;
图5为ARM架构下处理器的结构示意图;
图6为字节故障关系映射表的映射表示例图;
图7为自动定位异常部件装置的结构示意图;
图8为本发明实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,首先,根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;然后根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;之后根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;接着确定所述损耗率是否大于所述检测周期对应的的损耗阈值;若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在一个实施例中,如图2所示,本发明提供一种自动定位故障部件的方法,其特征在于,所述方法包括:
S201、根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
S202、若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
S203、根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
S204、根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
S205、根据所述故障信息确定所述故障部件中是否存在异常部件。
具体的,如图3所示,可以定时遍历OS(Operating System,操作系统)的dmsg(一种程序,用于检测和控制内核环缓冲,程序用来帮助用户了解系统的启动信息等)并获取关于CPU(Central Processing Unit,中央处理器)的错误信息日志,之后对从类似于ARM架构处理器的错误数值寄存器值中获取到一组二进制的48字节,其中可以将前4个字节设置成用于确认错误来源的组件信息,剩余的44个字节则是对错误组件信息进一步定位使用。前4个字节可以包括1个字节的错误类型,1个字节的错误子类型,2个字节的错误具体位置信息类型,从而在系统下快速定位故障信息以实现高效快速定位处理器故障位置信息,另外还可以通过这些故障信息定位到故障部件中可能存在的异常部件。
在其中一个实施例中,所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
具体的,如图4所示,通过对dmesg文件中产生处理器错误信息的数值进行解析,首先通过字节故障关系映射表对前4个字节的第一个字节进行解析,按照如下对应表对错误来源的CPU部件进行解析,当对部件进行解析完毕后再对部件错误进行进一步解析即第2个字节进行解析,确定Subtype的类型以更加准确的定位部件内部错误信息;当解析完第2个字节后,解析后面2个字节以确认该错误来自于具体部件的具体位置信息,如图5所示,如ARM处理器核数较多且内存槽位具备唯一性,通过解析3-4字节即可进行精准定位信息故障内存具体位置信息;如内存不可修正错误来源与CPU0的1通道的槽位0或者CPM Snoop-Lgic错误来源于cpu的CPM1模块组。
在其中一个实施例中,所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
具体的,可以根据48个字节中的后44字节确定故障部件的故障是否可修复,如果可修复则翻译后44个字节中记载的方法并将该方法发送给系统,由用户来处理该故障;如果不可修复,则需要向用户告警,告警信息中包括上述确定的故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型等。
在其中一个实施例中,所述根据所述错误信息日志确定所述故障部件中的异常部件包括:
其中所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
具体的,比如用户设置的检测周期为一个月,则统计这一周内同一部件的故障次数比如3次并分别记录这3次对应的故障时间,根据同一部件的前后两次的故障时间计算出故障间隔时间,比如3次故障时间分别为10号、15号和30号,则故障时间分别为5天和15天,之后根据这3次记录和对应的时间间隔计算出该部件在这个月的损耗率并确定该损耗率是否大于这个月的损耗阈值,注意损耗阈值不是一成不变的,随着该部件寿命的增加,该部件的损耗阈值也是增加的,具体的增加幅度可以由用户设置,比如每过一个月损耗阈值可以增加百分之一,只要该部件的损耗率不超过规定的损耗阈值,则说明该部件正常。
在其中一个实施例中,所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
具体的,如上所述,可以根据类似的公式计算出损耗率,其中Y代表损耗率,k代表第一权重,b代表第二权重,M代表故障次数,N代表故障间隔时间,由用户设置第一权重和第二权重,比如k可以设置成0.1,b设置成1,计算出第一损耗阈值为0.3,第二损耗阈值为0.267,从而计算出Y=0.567,如果本月的损耗阈值为0.5,则可以确定该部件为异常部件并提醒用户更换该异常部件,响应于用户将异常部件更换成正常部件,清除原异常部件对应的故障记录并将该正常部件对应的每个周期的损耗阈值还原,重新比较每个周期的损耗率和损耗阈值。
在其中一个实施例中,所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
具体的,如图6所示,为字节故障关系映射表,因为每个处理器相关的部件可能有所差异,所以需要用户设置字节和处理器故障类型、处理器故障子类型和故障部件具体位置之间的映射关系。该映射表还可以为节点树结构,通过第一故障定位字节到第二故障定位字节再到第三和第四故障定位字节的顺序往下查询,直到确定故障部件的具体位置。
在其中一个实施例中,所述方法还包括:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
具体的,在用户设置的查询周期比如十分钟内,如果在十分钟内系统中存在多个错误信息日志,说明处理器已“瘫痪”,其相关功能收到较大影响,此时需要向用户进行告警,排查是什么特殊原因导致处理器相关的多个部件故障,排查结束后可以由用户确定是否记录此次的所有故障部件对应的故障信息,如果不是场外原因比如人为等情况导致多个部件同时故障,则记录所有故障部件对应的故障信息,并将此次的故障信息代入到这一次检测周期的损耗率的计算中。
本申请的方案有如下有益效果:
1)通过解析出的错误寄存器值的前四位字节和对应的字节故障关系映射表快速定位处理器相关的故障类型和故障部件的具体位置;
2)根据统计的故障部件对应的故障信息计算出每个周期各个故障部件的损耗率并确定这些故障部件中是否存在异常部件,通过更换异常部件避免处理器功能经常宕机。
应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次执行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,还提供一种自动定位故障部件的装置,其特征在于,所述装置包括:
遍历模块701,用于根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
获取模块702,若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
定位模块703,用于根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
生成模块704,用于根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
确定模块705,用于根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述定位模块根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述定位模块根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述确定模块根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述确定模块根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述遍历模块根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述确定模块还用于包括:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
关于自动定位异常部件装置的具体限定可以参见上文中对于自动定位异常部件方法的限定,在此不再赘述。上述自动定位异常部件装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现告警信息处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述处理器执行所述计算机程序时实现以下步骤:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
根据所述故障信息确定所述故障部件中是否存在异常部件。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
在其中一个实施例中,所述计算机程序被处理器执行时实现以下步骤:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种自动定位异常部件的方法,其特征在于,所述方法包括:
根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;根据所述故障信息确定所述故障部件中是否存在异常部件。
2.根据权利要求1所述的方法,其特征在于,所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件包括:
根据第一故障定位字节和所述字节故障关系映射表确定处理器故障类型;
根据所述处理器故障类型、第二故障定位字节和所述字节故障关系映射表确定处理器故障子类型;
根据所述处理故障子类型、第三故障定位字节、第四故障定位字节和所述字节故障关系映射表定位所述故障部件的位置信息。
3.根据权利要求1所述的方法,其特征在于,所述根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件之后包括:
根据所述错误状态寄存器值解析出其余故障字节并根据所述其余故障字节和所述字节故障关系映射表确定所述故障部件是否可恢复;
若是,则根据所述其余故障字节确定所述故障部件对应的恢复方法;
若否,则向用户发送告警信息,其中所述告警信息包括所述故障部件对应的故障部件号、所述处理器故障类型和所述处理器故障子类型。
4.根据权利要求1所述的方法,其特征在于,所述根据所述故障信息确定所述故障部件中是否存在异常部件包括:
所述故障信息包括所述故障部件的故障次数和故障间隔时间;
根据所述故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率;
确定所述损耗率是否大于所述检测周期对应的的损耗阈值;
若是,则确定所述故障部件为异常部件并提醒所述用户更换所述异常部件。
5.根据权利要求4所述的方法,其特征在于,所述根据所述故障部件的故障信息和所述用户设置的检测周期计算出所述故障部件的损耗率包括:
根据所述故障次数和所述用户设置的第一权重计算出第一损耗系数;
根据所述故障间隔时间和所述用户设置的第二权重计算出第二损耗系数;
根据所述第一损耗系数和第二损耗系数计算出每个检测周期的损耗率。
6.根据权利要求2所述的方法,其特征在于,所述根据用户设置的查询周期遍历操作系统中是否存在错误信息日志之前包括:
用户将所述字节故障关系映射表输入到所述操作系统中,其中所述字节故障关系映射表包括所述第一故障定位字节和所述处理器故障类型之间的映射关系,所述第二故障定位字节和所述处理器故障子类型之间的映射关系,所述第三故障定位字节、第四故障定位字节和所述故障部件之间的映射关系。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于遍历到所述操作系统中存在多个错误信息日志,确定所述错误信息日志对应的错误日志数是否大于所述用户设置的日志数阈值;
若是,则确定所述处理器工作异常并向所述用户告警;
若否,则根据错误信息日志中的错误状态寄存器值定位所述故障部件。
8.一种自动定位故障部件的装置,其特征在于,所述装置包括:
遍历模块,用于根据用户设置的查询周期遍历操作系统中是否存在ARM处理器相关的错误信息日志;
获取模块,若是,则根据所述错误信息日志从所述ARM处理器中的寄存器中获取错误状态寄存器值并确定所述错误状态寄存器值中的前四个故障定位字节,其中所述错误状态寄存器值包含多个二进制的故障定位字节;
定位模块,用于根据前四个故障定位字节和所述操作系统中的字节故障关系映射表定位处理器对应的故障部件;
生成模块,用于根据所述错误信息日志生成所述故障部件对应的故障信息并清除所述错误信息日志;
确定模块,用于根据所述故障信息确定所述故障部件中是否存在异常部件。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311541420.6A CN117609024A (zh) | 2023-11-17 | 2023-11-17 | 自动定位异常部件的方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311541420.6A CN117609024A (zh) | 2023-11-17 | 2023-11-17 | 自动定位异常部件的方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117609024A true CN117609024A (zh) | 2024-02-27 |
Family
ID=89957152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311541420.6A Pending CN117609024A (zh) | 2023-11-17 | 2023-11-17 | 自动定位异常部件的方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117609024A (zh) |
-
2023
- 2023-11-17 CN CN202311541420.6A patent/CN117609024A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2017215377A1 (zh) | 内存硬错误的处理方法及装置 | |
CN109460343A (zh) | 基于日志的系统异常监控方法、装置、设备及存储介质 | |
CN109491819A (zh) | 一种诊断服务器故障的方法和系统 | |
CN108038039B (zh) | 记录日志的方法及微服务系统 | |
CN112866319B (zh) | 日志数据处理方法、系统和存储介质 | |
CN112579327B (zh) | 一种故障检测方法、装置及设备 | |
US11429574B2 (en) | Computer system diagnostic log chain | |
JP5495310B2 (ja) | 情報処理装置、障害解析方法及び障害解析プログラム | |
CN115421984A (zh) | 一种内存故障处理的方法、装置、电子设备及介质 | |
CN110647463B (zh) | 一种恢复测试断点的方法、装置、电子设备 | |
CN114860487A (zh) | 一种内存故障识别方法及一种内存故障隔离方法 | |
CN114385418A (zh) | 通信设备的保护方法、装置、设备和存储介质 | |
CN104102563A (zh) | 一种发现服务器系统的mca错误的方法及装置 | |
CN112242938B (zh) | 探测方法、装置、电子设备及计算机可读存储介质 | |
CN113392000A (zh) | 测试用例执行结果分析方法、装置、设备及存储介质 | |
JP2018180982A (ja) | 情報処理装置、およびログ記録方法 | |
CN117609024A (zh) | 自动定位异常部件的方法、装置、电子设备及存储介质 | |
CN115114066A (zh) | 一种内存故障监测方法、系统、存储介质及设备 | |
CN115952227A (zh) | 数据采集系统及方法、电子设备和存储介质 | |
CN115705261A (zh) | 内存故障的修复方法、cpu、os、bios及服务器 | |
CN115098291A (zh) | 一种系统重启原因记录的方法、系统、存储介质及设备 | |
CN112650613A (zh) | 一种错误信息处理方法、装置、电子设备及存储介质 | |
CN114253846B (zh) | 自动化测试异常定位方法、装置、设备及可读存储介质 | |
CN112187527A (zh) | 微服务的异常定位方法、装置、电子设备及可读存储介质 | |
CN116028141B (zh) | 标签数据的处理方法、系统及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |