CN114218001A - 故障修复方法、装置、电子设备及可读存储介质 - Google Patents

故障修复方法、装置、电子设备及可读存储介质 Download PDF

Info

Publication number
CN114218001A
CN114218001A CN202111442699.3A CN202111442699A CN114218001A CN 114218001 A CN114218001 A CN 114218001A CN 202111442699 A CN202111442699 A CN 202111442699A CN 114218001 A CN114218001 A CN 114218001A
Authority
CN
China
Prior art keywords
disk
abnormal
abnormal disk
target server
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111442699.3A
Other languages
English (en)
Inventor
车利斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Original Assignee
Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd filed Critical Shandong Yunhai Guochuang Cloud Computing Equipment Industry Innovation Center Co Ltd
Priority to CN202111442699.3A priority Critical patent/CN114218001A/zh
Publication of CN114218001A publication Critical patent/CN114218001A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0727Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a storage system, e.g. in a DASD or network based storage system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/18File system types
    • G06F16/1805Append-only file systems, e.g. using logs or journals to store data
    • G06F16/1815Journaling file systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请公开了一种故障修复方法、装置、电子设备及可读存储介质。其中,方法包括当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息;根据异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系;基于各映射关系,批量获取各异常盘片的串口日志;根据各异常盘片的串口日志的解析结果,执行故障修复操作。本申请可高效、精准地获取串口日志,基于异常盘片的串口日志可有效提升故障修复效率。

Description

故障修复方法、装置、电子设备及可读存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种故障修复方法、装置、电子设备及可读存储介质。
背景技术
随着大数据、云技术的快速发展,日常工作生活均与互联网息息相关。为了满足用户需求,数据中心应用而生。数据中心包括多个机柜,每个机柜又包括多个服务器,而每个服务器包括10个、12个或者16个等不同数量槽位和盘片。数据中心在发生通讯故障之后,通常都是人工去现场排查,受制于大量服务器,依赖人工去排查故障,效率太低,数据中心的故障修复效率并无法满足用户需求。
鉴于此,如何提升故障修复效率,是所属领域技术人员需要解决的技术问题。
发明内容
本申请提供了一种故障修复方法、装置、电子设备及可读存储介质,有效提升故障修复效率。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例一方面提供了一种故障修复方法,包括:
当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息;
根据所述异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系;
基于各映射关系,批量获取各异常盘片的串口日志;
根据各异常盘片的串口日志的解析结果,执行故障修复操作。
可选的,所述根据所述异常盘片信息,建立各目标服务器与各异常盘片之间的映射关系,包括:
从所述异常盘片信息中获取各异常盘片对应的服务器标识信息和槽位总线号;
为每个异常盘片,根据当前异常盘片对应的目标服务器的标识信息和槽位总线号,为所述当前异常盘片建立相应的映射关系。
可选的,所述获取各目标服务器的异常盘片信息,包括:
通过远程技术,获取各目标服务器的异常盘片信息。
可选的,所述基于各映射关系,批量获取各异常盘片的串口日志,包括:
根据各目标服务器的每个异常盘片的槽位总线号,利用远程技术基于相应的映射关系批量获取各异常盘片的串口日志。
可选的,所述当检测到至少一台目标服务器存在异常盘片之后,还包括:
展示盘片校验页面;所述盘片校验页面包括盘片显示区域和异常盘片选择区域;
响应用户的盘片拖曳指令,将所述盘片显示区域中的目标盘片拖曳至所述异常盘片选择区域;
根据所述异常盘片选择区域所包含的异常盘片和对应的目标服务器,生成各目标服务器的异常盘片信息。
可选的,所述展示盘片校验页面之后,还包括:
响应用户的盘片删除指令,从所述异常盘片选择区域中删除目标盘片。
可选的,所述根据各异常盘片的串口日志的解析结果,执行故障修复操作,包括:
获取预先设置的故障修复条件;所述故障修复条件根据异常盘片与总盘片比例值、各异常盘片的损坏级别和串口通信情况确定;
若根据所述解析结果判定不符合所述故障修复条件,则生成早期故障警示信息;
若根据所述解析结果判定符合所述故障修复条件,则对损坏级别超过预设级别的目标异常盘片进行修复或替换。
本发明实施例另一方面提供了一种故障修复装置,包括:
异常检测模块,用于当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息;
映射关系建立模块,用于根据所述异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系;
日志获取模块,用于基于各映射关系,批量获取各异常盘片的串口日志;
故障修复模块,用于根据各异常盘片的串口日志的解析结果,执行故障修复操作。
本发明实施例还提供了一种电子设备,包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如前任一项所述故障修复方法的步骤。
本发明实施例最后还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前任一项所述故障修复方法的步骤。
本申请提供的技术方案的优点在于,通过自动识别服务器的异常盘片,可实现多个服务器上多个SSD盘的串口日志的自动化执行收集,高效、精准地获取了数据中心各服务器的异常磁盘的串口日志,不仅可提高服务器磁盘的可维护性,还可通过解析各异常盘片的串口日志快速定位故障,进而快速修复故障,有效提升了故障修复效率,保障数据中心的稳定、安全的运行。
此外,本发明实施例还针对故障修复方法提供了相应的实现装置、电子设备及可读存储介质,进一步使得所述方法更具有实用性,所述装置、电子设备及可读存储介质具有相应的优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本公开。
附图说明
为了更清楚的说明本发明实施例或相关技术的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种故障修复方法的流程示意图;
图2为本发明实施例提供的一个示意性例子中的异常盘片检测结果示意图;
图3为本发明实施例提供的故障修复装置的一种具体实施方式结构图;
图4为本发明实施例提供的电子设备的一种具体实施方式结构图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等是用于区别不同的对象,而不是用于描述特定的顺序。此外术语“包括”和“具有”以及他们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可包括没有列出的步骤或单元。
在介绍了本发明实施例的技术方案后,下面详细的说明本申请的各种非限制性实施方式。
首先参见图1,图1为本发明实施例提供的一种故障修复方法的流程示意图,本发明实施例可包括以下内容:
S101:当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息。
本实施例适用于具有多台服务器且每台服务器具有多个盘片的应用场景,如每台服务器包括多块盘片如12块盘或者16块盘,盘片(disk)是硬盘中承载数据存储的介质。目标服务器是指任何一台服务器,异常盘片是指目标服务器中有故障的或者是有坏道的或者是其他异常问题的盘片,异常盘片可以为一块也可为多块,可采用任何一种检测盘片异常的方法进行检测,本申请对此不作任何限定。异常盘片信息可包括但并不限制于该异常盘片所属服务器的信息,异常盘片的标识信息、异常盘片的数量等。
S102:根据异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系。
在本实施例中,每个异常盘片和对应服务器均需建立唯一的映射关系,映射关系用于标识每个异常盘片所隶属的服务器。
S103:基于各映射关系,批量获取各异常盘片的串口日志。
串口即串行接口,也称为串行通信接口或串行通讯接口,通常指COM(clustercommunication port)接口,是采用串行通信方式的扩展接口,其数据是一位一位地顺序传送。串行接口通信线路简单,只要一对传输线就可以实现双向通信,成本低,适用于远距离通信,但传送速度较慢。串口日志用于记录串口通信过程的数据信息,可反映各串口的通信情况。相关技术获取串口日志通常采用的方式为:人工连接物理串口线;通过minicom命令找到ttyUSB设备,然后向设备发送串口命令登录串口,最后获取串口日志。该方式生产环境中,并且在服务器上的盘片数量少的情况下可行性较高,但是,如果服务器数量较大如成千上百台服务器,且通过相关技术这种人工方式去获取盘片的串口日志,需要耗费大量的人工成本和时间成本,造成人力和时间成本的浪费;此外,盘片数量太多,技术人员不方便对盘片进行维护,无法精确找到需要维护的盘片,不可避免会由于人为因素造成获取到错误的串口日志,增加故障修复成本。鉴于此,本步骤可以高效、精准地获取串口日志,有助于提升故障修复效率。
S104:根据各异常盘片的串口日志的解析结果,执行故障修复操作。
在本步骤中,串口日志记录了盘片的读写情况,通过读写情况的分析可获取盘片的损坏程度,及时发现损坏程度严重的盘片,从而尽早实现对盘片的维护和更换,保障服务器的稳定运行。本步骤的故障修复操作包括对异常盘片进行维护、替换异常盘片和对基于串口日志所定位服务器故障的修复。当然,若基于解析结果判定各异常盘片不影响当前服务器的稳定运行,可不执行任何修复操作,只需加强监控。
在本发明实施例提供的技术方案中,通过自动识别服务器的异常盘片,可实现多个服务器上多个SSD盘的串口日志的自动化执行收集,高效、精准地获取了数据中心各服务器的异常磁盘的串口日志,不仅可提高服务器磁盘的可维护性,还可通过解析各异常盘片的串口日志快速定位故障,进而快速修复故障,有效提升了故障修复效率,保障数据中心的稳定、安全的运行。
需要说明的是,本申请中各步骤之间没有严格的先后执行顺序,只要符合逻辑上的顺序,则这些步骤可以同时执行,也可按照某种预设顺序执行,图1只是一种示意方式,并不代表只能是这样的执行顺序。
在上述实施例中,对于如何执行步骤S102并不做限定,本实施例中给出映射关系建立的一种可选的实施方式,可包括如下步骤:
从异常盘片信息中获取各异常盘片对应的服务器标识信息和槽位总线号;
为每个异常盘片,根据当前异常盘片对应的目标服务器的标识信息和槽位总线号,为当前异常盘片建立相应的映射关系。
在本实施例中,如图2所示,当识别到有问题需要维护的盘片,可精确定位到槽位总线号,利用远程技术获取各目标服务器如Server:1、Server:2、Server:3、Server:4所有需要维护的异常盘片的槽位总线号,根据服务器标识与槽位总线号建立映射关系可为:Server:1:0xb3、Server:2:0xb3、Server:2:0xb6、Server:3:0xb1、Server:3:0xb4、Server:4:0xb3、Server:4:0xb7、Server:4:0xb8。
为避免人工方式获取盘片串口日志过程中,造成的人力成本和时间成本浪费,提高盘片的可维护性,本实施例可采用ssh远程技术,利用安全的网络通道,实现自动识别并远程获取多个服务器上多个SSD盘片的串口日志方法。基于此,上述实施例的获取各目标服务器的异常盘片信息的步骤可为:通过远程技术,获取各目标服务器的异常盘片信息。相应的,上述实施例基于各映射关系,批量获取各异常盘片的串口日志的过程可包括:根据各目标服务器的每个异常盘片的槽位总线号,利用远程技术基于相应的映射关系批量获取各异常盘片的串口日志。
本实施例可利用远程技术批量向不同服务器上多个SSD盘上对应总线串口获取固件的串口日志的动作,保证串口日志的安全获取。
为了进一步提高用户使用体验,提升故障修复效率,基于上述实施例,本申请还可包括下述内容:
当检测到至少一台目标服务器存在异常盘片之后,展示盘片校验页面。响应用户的盘片拖曳指令,将盘片显示区域中的目标盘片拖曳至异常盘片选择区域;根据异常盘片选择区域所包含的异常盘片和对应的目标服务器,生成各目标服务器的异常盘片信息。
在本实施例中,盘片校验页面可包括盘片显示区域和异常盘片选择区域;盘片显示区域用于展示所有服务器的所有盘片,异常盘片选择区域用于展示异常盘片。用户可将盘片显示区域中的盘片拖曳至异常盘片选择区域,相应的,也可从异常盘片选择区域中删除所显示的异常盘片,也即响应用户的盘片删除指令,从异常盘片选择区域中删除目标盘片。
在上述实施例中,对于如何执行步骤S104并不做限定,本实施例中给出该步骤一种可选的实施方式,可包括如下步骤:
获取预先设置的故障修复条件。若根据解析结果判定不符合故障修复条件,则生成早期故障警示信息;若根据解析结果判定符合故障修复条件,则对损坏级别超过预设级别的目标异常盘片进行修复或替换。
在本实施例中,故障修复条件是根据异常盘片与总盘片比例值、各异常盘片的损坏级别和串口通信情况共同确定。损坏级别可包括多个级别如严重故障、一般故障和轻微故障,严重故障则表明该异常盘片不可用,需要进行更换,一般故障则表明可进行维护从而恢复盘片的可用性,轻微故障则表明盘片不影响使用。如果异常盘片中损坏级别为严重故障的占比超过一定阈值,则需要进行故障修复。如果异常盘片中损坏级别为轻微故障占比超过一定阈值,则不需要进行故障修复。串口通信情况是指服务器的各硬盘的数据读写时间、读响应时间等。
本发明实施例还针对故障修复方法提供了相应的装置,进一步使得方法更具有实用性。其中,装置可从功能模块的角度和硬件的角度分别说明。下面对本发明实施例提供的故障修复装置进行介绍,下文描述的故障修复装置与上文描述的故障修复方法可相互对应参照。
基于功能模块的角度,参见图3,图3为本发明实施例提供的故障修复装置在一种具体实施方式下的结构图,该装置可包括:
异常检测模块301,用于当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息;
映射关系建立模块302,用于根据异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系;
日志获取模块303,用于基于各映射关系,批量获取各异常盘片的串口日志;
故障修复模块304,用于根据各异常盘片的串口日志的解析结果,执行故障修复操作。
可选的,在本实施例的一些实施方式中,上述映射关系建立模块302可用于:从异常盘片信息中获取各异常盘片对应的服务器标识信息和槽位总线号;为每个异常盘片,根据当前异常盘片对应的目标服务器的标识信息和槽位总线号,为当前异常盘片建立相应的映射关系。
作为上述实施例的一种可选的实施方式,上述异常检测模块301可用于:通过远程技术,获取各目标服务器的异常盘片信息。
作为上述实施例的另一种可选的实施方式,上述日志获取模块303可进一步用于:根据各目标服务器的每个异常盘片的槽位总线号,利用远程技术基于相应的映射关系批量获取各异常盘片的串口日志。
可选的,在本实施例的另一些实施方式中,上述装置例如还可包括人机交互模块,用于在检测到至少一台目标服务器存在异常盘片之后,向用户展示盘片校验页面;盘片校验页面包括盘片显示区域和异常盘片选择区域;响应用户的盘片拖曳指令,将盘片显示区域中的目标盘片拖曳至异常盘片选择区域;根据异常盘片选择区域所包含的异常盘片和对应的目标服务器,生成各目标服务器的异常盘片信息。
作为上述实施例的一种可选的实施方式,上述人机交互模块还可进一步用于:响应用户的盘片删除指令,从异常盘片选择区域中删除目标盘片。
可选的,在本实施例的其他一些实施方式中,上述故障修复模块304可进一步用于:获取预先设置的故障修复条件;故障修复条件根据异常盘片与总盘片比例值、各异常盘片的损坏级别和串口通信情况确定;若根据解析结果判定不符合故障修复条件,则生成早期故障警示信息;若根据解析结果判定符合故障修复条件,则对损坏级别超过预设级别的目标异常盘片进行修复或替换。
本发明实施例所述故障修复装置的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例可高效、精准地获取串口日志,基于异常盘片的串口日志可有效提升故障修复效率。
上文中提到的故障修复装置是从功能模块的角度描述,进一步的,本申请还提供一种电子设备,是从硬件角度描述。图3为本申请实施例提供的电子设备在一种实施方式下的结构示意图。如图3所示,该电子设备包括存储器30,用于存储计算机程序;处理器31,用于执行计算机程序时实现如上述任一实施例提到的故障修复方法的步骤。
其中,处理器31可以包括一个或多个处理核心,比如4核心处理器、8核心处理器,处理器31还可为控制器、微控制器、微处理器或其他数据处理芯片等。处理器31可以采用DSP(Digital Signal Processing,数字信号处理)、FPGA(Field-Programmable GateArray,现场可编程门阵列)、PLA(Programmable Logic Array,可编程逻辑阵列)中的至少一种硬件形式来实现。处理器31也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(Central Processing Unit,中央处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器31可以集成有GPU(Graphics Processing Unit,图像处理器),GPU用于负责显示屏所需要显示的内容的渲染和绘制。一些实施例中,处理器31还可以包括AI(ArtificialIntelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器30可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器30还可包括高速随机存取存储器以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。存储器30在一些实施例中可以是电子设备的内部存储单元,例如服务器的硬盘。存储器30在另一些实施例中也可以是电子设备的外部存储设备,例如服务器上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器30还可以既包括电子设备的内部存储单元也包括外部存储设备。存储器30不仅可以用于存储安装于电子设备的应用软件及各类数据,例如:执行漏洞处理方法的程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。本实施例中,存储器30至少用于存储以下计算机程序301,其中,该计算机程序被处理器31加载并执行之后,能够实现前述任一实施例公开的故障修复方法的相关步骤。另外,存储器30所存储的资源还可以包括操作系统302和数据303等,存储方式可以是短暂存储或者永久存储。其中,操作系统302可以包括Windows、Unix、Linux等。数据303可以包括但不限于故障修复结果对应的数据等。
在一些实施例中,上述电子设备还可包括有显示屏32、输入输出接口33、通信接口34或者称为网络接口、电源35以及通信总线36。其中,显示屏32、输入输出接口33比如键盘(Keyboard)属于用户接口,可选的用户接口还可以包括标准的有线接口、无线接口等。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。通信接口34可选的可以包括有线接口和/或无线接口,如WI-FI接口、蓝牙接口等,通常用于在电子设备与其他电子设备之间建立通信连接。通信总线36可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extendedindustry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,图3中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本领域技术人员可以理解,图3中示出的结构并不构成对该电子设备的限定,可以包括比图示更多或更少的组件,例如还可包括实现各类功能的传感器37。
本发明实施例所述电子设备的各功能模块的功能可根据上述方法实施例中的方法具体实现,其具体实现过程可以参照上述方法实施例的相关描述,此处不再赘述。
由上可知,本发明实施例可高效、精准地获取串口日志,基于异常盘片的串口日志可有效提升故障修复效率。
可以理解的是,如果上述实施例中的故障修复方法以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电可擦除可编程ROM、寄存器、硬盘、多媒体卡、卡型存储器(例如SD或DX存储器等)、磁性存储器、可移动磁盘、CD-ROM、磁碟或者光盘等各种可以存储程序代码的介质。
基于此,本发明实施例还提供了一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时如上任意一实施例所述故障修复方法的步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的硬件包括装置及电子设备而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
以上对本申请所提供的一种故障修复方法、装置、电子设备及可读存储介质进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本申请进行若干改进和修饰,这些改进和修饰也落入本申请权利要求的保护范围内。

Claims (10)

1.一种故障修复方法,其特征在于,包括:
当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息;
根据所述异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系;
基于各映射关系,批量获取各异常盘片的串口日志;
根据各异常盘片的串口日志的解析结果,执行故障修复操作。
2.根据权利要求1所述的故障修复方法,其特征在于,所述根据所述异常盘片信息,建立各目标服务器与各异常盘片之间的映射关系,包括:
从所述异常盘片信息中获取各异常盘片对应的服务器标识信息和槽位总线号;
为每个异常盘片,根据当前异常盘片对应的目标服务器的标识信息和槽位总线号,为所述当前异常盘片建立相应的映射关系。
3.根据权利要求2所述的故障修复方法,其特征在于,所述获取各目标服务器的异常盘片信息,包括:
通过远程技术,获取各目标服务器的异常盘片信息。
4.根据权利要求2所述的故障修复方法,其特征在于,所述基于各映射关系,批量获取各异常盘片的串口日志,包括:
根据各目标服务器的每个异常盘片的槽位总线号,利用远程技术基于相应的映射关系批量获取各异常盘片的串口日志。
5.根据权利要求1至4任意一项所述的故障修复方法,其特征在于,所述当检测到至少一台目标服务器存在异常盘片之后,还包括:
展示盘片校验页面;所述盘片校验页面包括盘片显示区域和异常盘片选择区域;
响应用户的盘片拖曳指令,将所述盘片显示区域中的目标盘片拖曳至所述异常盘片选择区域;
根据所述异常盘片选择区域所包含的异常盘片和对应的目标服务器,生成各目标服务器的异常盘片信息。
6.根据权利要求5所述的故障修复方法,其特征在于,所述展示盘片校验页面之后,还包括:
响应用户的盘片删除指令,从所述异常盘片选择区域中删除目标盘片。
7.根据权利要求5所述的故障修复方法,其特征在于,所述根据各异常盘片的串口日志的解析结果,执行故障修复操作,包括:
获取预先设置的故障修复条件;所述故障修复条件根据异常盘片与总盘片比例值、各异常盘片的损坏级别和串口通信情况确定;
若根据所述解析结果判定不符合所述故障修复条件,则生成早期故障警示信息;
若根据所述解析结果判定符合所述故障修复条件,则对损坏级别超过预设级别的目标异常盘片进行修复或替换。
8.一种故障修复装置,其特征在于,包括:
异常检测模块,用于当检测到至少一台目标服务器存在异常盘片,获取各目标服务器的异常盘片信息;
映射关系建立模块,用于根据所述异常盘片信息,建立各目标服务器与相应异常盘片之间的映射关系;
日志获取模块,用于基于各映射关系,批量获取各异常盘片的串口日志;
故障修复模块,用于根据各异常盘片的串口日志的解析结果,执行故障修复操作。
9.一种电子设备,其特征在于,包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7任一项所述故障修复方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述故障修复方法的步骤。
CN202111442699.3A 2021-11-30 2021-11-30 故障修复方法、装置、电子设备及可读存储介质 Pending CN114218001A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111442699.3A CN114218001A (zh) 2021-11-30 2021-11-30 故障修复方法、装置、电子设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111442699.3A CN114218001A (zh) 2021-11-30 2021-11-30 故障修复方法、装置、电子设备及可读存储介质

Publications (1)

Publication Number Publication Date
CN114218001A true CN114218001A (zh) 2022-03-22

Family

ID=80699030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111442699.3A Pending CN114218001A (zh) 2021-11-30 2021-11-30 故障修复方法、装置、电子设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN114218001A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115952025A (zh) * 2023-01-09 2023-04-11 深圳市赛柏特通信技术有限公司 一种数据管控方法、系统、终端设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115952025A (zh) * 2023-01-09 2023-04-11 深圳市赛柏特通信技术有限公司 一种数据管控方法、系统、终端设备及存储介质
CN115952025B (zh) * 2023-01-09 2024-03-05 深圳市赛柏特通信技术有限公司 一种数据管控方法、系统、终端设备及存储介质

Similar Documents

Publication Publication Date Title
CN112286709B (zh) 一种服务器硬件故障的诊断方法、诊断装置及诊断设备
CN113835643B (zh) 数据存储方法、装置、电子设备及可读存储介质
CN112380089A (zh) 一种数据中心监控预警方法及系统
CN111048138A (zh) 一种硬盘的故障检测方法及相关装置
CN114024834A (zh) 故障定位方法、装置、电子设备及可读存储介质
CN113127299A (zh) 服务器运维方法、装置、系统及计算机可读存储介质
CN107992399A (zh) 一种内存条状态检测方法、装置及系统
CN111949488A (zh) 一种硬盘故障预测方法、系统及电子设备和存储介质
CN114442930A (zh) 组磁盘阵列的控制方法、装置、电子设备及可读存储介质
CN114218001A (zh) 故障修复方法、装置、电子设备及可读存储介质
CN113590405A (zh) 硬盘错误的检测方法、装置、存储介质和电子装置
CN109271009A (zh) 一种控制服务器背板上电的方法、装置及cpld
CN109889432A (zh) 信息处理方法、装置、计算机装置及计算机可读存储介质
CN111124818B (zh) 一种扩展器Expander的监控方法、装置及设备
CN117591351A (zh) 磁盘故障检测模型的训练方法以及磁盘故障检测方法
CN111124730B (zh) 一种服务器的错误定位方法、装置及计算机存储介质
CN116415851A (zh) 一种基于深度学习的设施运维性态指标智能识别评价方法
CN113868023B (zh) 存储系统的快照方法、装置、电子设备及可读存储介质
CN112131090B (zh) 业务系统性能监控方法及装置、设备及介质
CN114372003A (zh) 测试环境监控方法、装置与电子设备
CN111831511A (zh) 一种云服务的业务主机的检测处理方法、装置及介质
CN111444032A (zh) 一种计算机系统故障修复方法、系统及设备
CN104468149A (zh) 信息处理方法、智能终端及光缆网络系统
CN113625956B (zh) Raid卡的缓存设置方法、装置、电子设备及存储介质
CN117055718B (zh) 一种服务器功耗检测系统、方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination