CN115686921A - 一种多路径异常检测修复方法、装置、设备及介质 - Google Patents

一种多路径异常检测修复方法、装置、设备及介质 Download PDF

Info

Publication number
CN115686921A
CN115686921A CN202211447034.6A CN202211447034A CN115686921A CN 115686921 A CN115686921 A CN 115686921A CN 202211447034 A CN202211447034 A CN 202211447034A CN 115686921 A CN115686921 A CN 115686921A
Authority
CN
China
Prior art keywords
information
cloud host
abnormal
path
detected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211447034.6A
Other languages
English (en)
Inventor
江治林
李东世
焦浩霖
马豹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jinan Inspur Data Technology Co Ltd
Original Assignee
Jinan Inspur Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jinan Inspur Data Technology Co Ltd filed Critical Jinan Inspur Data Technology Co Ltd
Priority to CN202211447034.6A priority Critical patent/CN115686921A/zh
Publication of CN115686921A publication Critical patent/CN115686921A/zh
Pending legal-status Critical Current

Links

Images

Abstract

本申请公开了一种多路径异常检测修复方法、装置、设备及介质,涉及计算机技术领域,包括:检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。通过本申请的上述技术方案,能够实现多路径异常自动检测和修复,提高多路径异常检测和修复的效率,降低人工成本。

Description

一种多路径异常检测修复方法、装置、设备及介质
技术领域
本发明涉及计算机技术领域,特别涉及一种多路径异常检测修复方法、装置、设备及介质。
背景技术
云计算平台的云主机使用以scsi(Small Computer System Interface,小型计算机系统接口)链路为链接的SAN(Storage Area Network,存储区域网络)存储时,为了实现基于多条路径的灾备以及IO(Input/Output,输入/输出)流量的负载均衡,需要使用多路径技术。然而多路径技术带来优势的同时,又存在许多的多路径异常,例如多路径丢失、多路径failed、wwid(类似于网卡的MAC地址)不一致以及lun-id不一致等。在实际应用中,多路径异常发生的频率很高,且很可能造成对应的SAN存储无法使用,甚至导致云主机无法正常使用。目前针对多路径异常的处理方法主要包括,使用多路径异常检测工具或者通过监控系统检测到异常。再手动输入指令处理或者使用多路径异常修复脚本进行异常的修复。这种处理方法,需要额外耗费大量的时间和人力,且很大可能多路径异常以及对实际应用的正常运行造成严重的影响。
由上可见,如何实现多路径异常自动检测和修复,提高多路径异常检测和修复的效率,降低人工成本是本领域有待解决的问题。
发明内容
有鉴于此,本发明的目的在于提供一种多路径异常检测修复方法、装置、设备及介质,能够实现多路径异常自动检测和修复,提高多路径异常检测和修复的效率,降低人工成本。其具体方案如下:
第一方面,本申请公开了一种多路径异常检测修复方法,应用于云计算平台,包括:
检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;
确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;
若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。
可选的,所述获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息,包括:
从本地预设数据库的云主机列表中获取所有的云主机信息,并根据所述云主机信息确定出云主机状态;
对云主机状态为错误的所述云主机信息进行删除操作,以得到目标云主机信息。
可选的,所述确定出与所述目标云主机信息相对应的挂载卷信息,包括:
基于所述目标云主机信息确定出通用唯一标识码;
从所述预设数据库的块设备映射命令表中筛选出与所述通用唯一标识码相对应的挂载卷信息。
可选的,所述对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,包括:
判断预设存储局域网中的挂载卷信息与所述挂载卷信息是否相同;
若预设存储局域网中的挂载卷信息与所述挂载卷信息相同,则校验通过,然后基于所述挂载卷信息确定出待检测信息,若预设存储局域网中的挂载卷信息与所述挂载卷信息不相同,则校验不通过,则对所述挂载卷信息进行删除操作。
可选的,所述基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常,包括:
基于所述挂载卷信息中的wwid确定出待检测异常信息;其中,所述待检测异常信息包括设备名称个数和设备名称状态;
判断所述设备名称个数是否等于预设的正常个数,然后判断所述设备名称状态是否为正常;
若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态不为正常,或,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态为正常,或,若所述设备名称个数等于预设的正常个数,并且所述设备名称状态不为正常,则确定所述待检测信息异常。
可选的,所述根据所述异常信息进行多路径自动修复操作,包括:
若所述设备名称个数不等于预设的正常个数,则基于所述异常信息确定出路径的逻辑单元号、协议信息以及主机信息,根据所述路径的逻辑单元号、所述协议信息以及所述主机信息进行精准扫盘修复操作;
若所述设备名称状态不为正常,则将设备名称状态不为正常的磁盘设备进行删除,然后再进行精准扫盘修复操作。
可选的,所述根据所述异常信息进行多路径自动修复操作之后,还包括:
当多路径自动修复操作完成之后,跳转至所述判断所述待检测信息是否异常步骤,以得到修复结果;
利用本地的测试和操作用户程序语言服务将包含所述修复结果的上报信息发送至客户端。
第二方面,本申请公开了一种多路径异常检测修复装置,包括:
检测模块,用于检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;
校验模块,用于确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;
多路径自动修复模块,用于若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。
第三方面,本申请公开了一种电子设备,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现前述的多路径异常检测修复方法。
第四方面,本申请公开了一种计算机存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的多路径异常检测修复方法的步骤。
可见,本申请提供了一种多路径异常检测修复方法,包括检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。本申请在Nova服务内部自动进行多路径异常检测,通过读取数据库信息获取所有的云主机以及对应SAN存储卷的挂载信息,再调用内部接口进行多路径异常检测。当检测到异常时,可以将异常信息上报到监控平台,并对异常进行自动修复。修复完成后,再次上报修复结果。整个多路径异常的检测和修复过程,实现了全自动化,不需要再有人为参与,有效的节省了时间和人力,且对多路径异常的响应时间大大缩短。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种多路径异常检测修复方法流程图;
图2为本申请公开的一种多路径异常检测修复方法的具体流程图;
图3为本申请公开的一种多路径异常检测修复方法流程图;
图4为本申请公开的一种多路径异常检测的具体流程图;
图5为本申请公开的一种多路径异常修复的具体流程图;
图6为本申请公开的一种多路径异常检测修复装置结构示意图;
图7为本申请提供的一种电子设备结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
云计算平台的云主机使用以scsi(Small Computer System Interface,小型计算机系统接口)链路为链接的SAN(Storage Area Network,存储区域网络)存储时,为了实现基于多条路径的灾备以及IO(Input/Output,输入/输出)流量的负载均衡,需要使用多路径技术。然而多路径技术带来优势的同时,又存在许多的多路径异常,例如多路径丢失、多路径failed、wwid(类似于网卡的MAC地址)不一致以及lun-id不一致等。在实际应用中,多路径异常发生的频率很高,且很可能造成对应的SAN存储无法使用,甚至导致云主机无法正常使用。目前针对多路径异常的处理方法主要包括,使用多路径异常检测工具或者通过监控系统检测到异常。再手动输入指令处理或者使用多路径异常修复脚本进行异常的修复。这种处理方法,需要额外耗费大量的时间和人力,且很大可能多路径异常以及对实际应用的正常运行造成严重的影响。由上可见,如何实现多路径异常自动检测和修复,提高多路径异常检测和修复的效率,降低人工成本是本领域有待解决的问题。
云计算平台,也称为云平台,是指基于硬件资源和软件资源的服务,提供计算、网络和存储能力。OpenStack是一个开源的云计算管理平台项目,同时也是目前市场上应用最为广泛的云计算平台之一,具有很大的商业潜力,当前国内多家云平台服务商使用OpenStack架构开发云平台。Nova是云计算平台Opentack内部的组件之一,负责管理云主机的生命周期,是OpenStack中最核心的服务。
参见图1所示,本发明实施例公开了一种多路径异常检测修复方法,具体可以包括:
步骤S11:检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信。
本实施例中,若触发了用于表征多路径异常检测的配置项,则从本地预设数据库的云主机列表中获取所有的云主机信息,并根据所述云主机信息确定出云主机状态,然后对云主机状态为错误的所述云主机信息进行删除操作,以得到目标云主机信息。
步骤S12:确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常。
本实施例中,基于所述目标云主机信息确定出通用唯一标识码,从所述预设数据库的块设备映射命令表中筛选出与所述通用唯一标识码相对应的挂载卷信息,然后对所述挂载卷信息进行校验。
具体校验过程为:判断预设存储局域网中的挂载卷信息与所述挂载卷信息是否相同;若预设存储局域网中的挂载卷信息与所述挂载卷信息相同,则校验通过,然后基于所述挂载卷信息确定出待检测信息,若预设存储局域网中的挂载卷信息与所述挂载卷信息不相同,则校验不通过,则对所述挂载卷信息进行删除操作。
步骤S13:若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。
本实施例中,当多路径自动修复操作完成之后,跳转至所述判断所述待检测信息是否异常步骤,以得到修复结果;利用本地的测试和操作用户程序语言服务将包含所述修复结果的上报信息发送至客户端。
本申请将多路径异常检测和修复工具的大部分功能融合到Nova组件内部,融合的功能主要为多路径丢失、多路径失败异常检测以及修复。Nova服务在正常运行的同时,可以执行内部的周期性任务,进行多路径异常检测。当检测到异常后,首先进行异常上报,再根据异常信息自动进行多路径异常修复,修复完成后,再次上报异常修复结果。由于一个云平台集群往往有多个Nova-compute节点,每一个Nova-compute节点管理一定数量的云主机。因此该发明也是以Nova-compute服务为单位执行任务,每个Nova-compute服务独立对当前宿主机上云主机的挂载卷进行多路径异常检测、上报以及异常修复工作。
本申请具体的多路径异常检测修复过程如图2所示,Nova组件内部查询数据库,获取当前宿主机上所有云主机信息,并将状态为error的云主机从包含所有云主机信息的云主机列表中剔除,列表内为云主机的UUID(Universally Unique Identifier,通用唯一识别码)。然后遍历云主机列表,查询数据库block_device_map表(即块设备映射命令表)获取云主机对应挂载卷信息,并对挂载卷的信息进行校验,不属于SAN存储的挂载卷会被删除,属于SAN存储的挂载卷信息会被保留,若所述待检测信息异常,则确定出异常信息,然后进行将异常信息上报至客户端,然后根据所述异常信息进行多路径自动修复操作,最后将多路径的修复情况上报。需要说明的是,通过配置文件中的配置项进行设置,判断上述步骤是否执行,即是否进行多路径异常检测,并通过另一个配置项进行设置,判断上述步骤执行的间隔周期,默认间隔时间为60s。
本实施例中,检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。本申请在Nova服务内部自动进行多路径异常检测,通过读取数据库信息获取所有的云主机以及对应SAN存储卷的挂载信息,再调用内部接口进行多路径异常检测。当检测到异常时,可以将异常信息上报到监控平台,并对异常进行自动修复。修复完成后,再次上报修复结果。整个多路径异常的检测和修复过程,实现了全自动化,不需要再有人为参与,有效的节省了时间和人力,且对多路径异常的响应时间大大缩短。
参见图3所示,本发明实施例公开了一种多路径异常检测修复方法,具体可以包括:
步骤S21:检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息。
步骤S22:确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息中的wwid确定出待检测异常信息,其中,所述待检测异常信息包括设备名称个数和设备名称状态;判断所述设备名称个数是否等于预设的正常个数,然后判断所述设备名称状态是否为正常,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态不为正常,或,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态为正常,或,若所述设备名称个数等于预设的正常个数,并且所述设备名称状态不为正常,则确定所述待检测信息异常,然后判断所述待检测信息是否异常。
步骤S23:若所述待检测信息异常,则确定出异常信息,若所述设备名称个数不等于预设的正常个数,则基于所述异常信息确定出路径的逻辑单元号、协议信息以及主机信息,根据所述路径的逻辑单元号、所述协议信息以及所述主机信息进行精准扫盘修复操作,若所述设备名称状态不为正常,则将设备名称状态不为正常的磁盘设备进行删除,然后再进行精准扫盘修复操作。
本申请多路径异常检测的具体流程如图4所示,Nova根据云主机对应的挂载卷信息,校验挂载卷映射的多路径是否存在异常。根据挂载卷的wwid,查询多路径对应的磁盘设备(device_path)信息(即包括设备名称个数和设备名称状态的待检测异常信息),通常一个多路径会对应多个磁盘设备。然后依次校验每一个磁盘设备的状态为正常(active)还是失败(failed),然后判断所述设备名称个数是否等于预设的正常个数,然后判断所述设备名称状态是否为正常,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态不为正常,或,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态为正常,或,若所述设备名称个数等于预设的正常个数,并且所述设备名称状态不为正常,则确定所述待检测信息异常。这里需要说明的是,正常磁盘个数是通过配置项设置在Cinder组件的配置文件中,Nova组件在挂载卷的时候,会将正常磁盘设备个数读取并写入到数据库的block_device_map表中,在检测是否触发了用于表征多路径异常检测的配置项的时候,就会读取出来。
本申请多路径异常修复的具体流程如图5所示,Nova会根据异常信息依次对每一个多路径进行自动修复。当异常为多路径丢失时,会根据多路径的lun-id、使用到的协议和host信息进行精准扫盘。当异常为多路径失败时,首先需要将状态为失败的磁盘设备删除,然后再进行精准扫盘。需要说明的是,是否自动进行多路径异常修复也是通过配置文件进行设置,可以更加灵活满足用户需求。修复完成后,会再次进行异常检测,检查路径是否恢复。所有的异常多路径修复动作完成后,可能会修复成功,也可能由于物理链路问题等原因修复失败。Nova会将修复结果进行汇总,以得到异常信息,然后再次通过内部的pluto服务,进行修复结果上报。若检测到存在多路径异常,会将异常信息汇总,并通过Nova内的pluto服务进行异常上报。若检测到多路径均正常,也会上报多路径正常。上报的对象能够进行配置,上报的客户端可以是监控平台、短信、邮件等,运维人员可以在第一时间内获得多路径异常的详细信息。
本申请有效缩短了多路径丢失、失败异常从出现到检测到异常以及修复异常的时间差,能够更加及时的发现并处理异常,在实际应用的往往会存在大量的SAN存储挂载到相应的云主机,无论是目前的多路径异常检测工具还是多路径异常检测监控系统,都需要耗费大量的人力去维护和监测。本发明真正实现了自动化检测和修复多路径丢失和失败异常,节约了大量人力,不需要单独耗费人力去维护和监测多路径异常工具,由于本发明是将多路径丢失和失败异常检测和修复功能加入到Nova组件内部,实现了自动化检测,提高了异常检测的准确性和稳定性。避免了因检测人员操作失误等人为因素造成检测遗漏或者不准确。本申请的关键点:将多路径丢失、多路径失败异常以及修复功能融合到Nova组件内部;Nova组件内部执行周期性任务进行多路径检测和修复并通过pluto服务上报异常;云主机通过查询数据库获取当前宿主机的云主机以及挂载卷信息,并以此信息为入口进行多路径异常检测和修复。
本实施例中,检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。本申请在Nova服务内部自动进行多路径异常检测,通过读取数据库信息获取所有的云主机以及对应SAN存储卷的挂载信息,再调用内部接口进行多路径异常检测。当检测到异常时,可以将异常信息上报到监控平台,并对异常进行自动修复。修复完成后,再次上报修复结果。整个多路径异常的检测和修复过程,实现了全自动化,不需要再有人为参与,有效的节省了时间和人力,且对多路径异常的响应时间大大缩短。
参见图6所示,本发明实施例公开了一种多路径异常检测修复装置,具体可以包括:
检测模块11,用于检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;
校验模块12,用于确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;
多路径自动修复模块13,用于若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。
本实施例中,检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。本申请在Nova服务内部自动进行多路径异常检测,通过读取数据库信息获取所有的云主机以及对应SAN存储卷的挂载信息,再调用内部接口进行多路径异常检测。当检测到异常时,可以将异常信息上报到监控平台,并对异常进行自动修复。修复完成后,再次上报修复结果。整个多路径异常的检测和修复过程,实现了全自动化,不需要再有人为参与,有效的节省了时间和人力,且对多路径异常的响应时间大大缩短。
在一些具体实施例中,所述检测模块11,具体可以包括:
云主机状态确定模块,用于从本地预设数据库的云主机列表中获取所有的云主机信息,并根据所述云主机信息确定出云主机状态;
目标云主机信息确定模块,用于对云主机状态为错误的所述云主机信息进行删除操作,以得到目标云主机信息。
在一些具体实施例中,所述检测模块11,具体可以包括:
通用唯一标识码确定模块,用于基于所述目标云主机信息确定出通用唯一标识码;
挂载卷信息确定模块,用于从所述预设数据库的块设备映射命令表中筛选出与所述通用唯一标识码相对应的挂载卷信息。
在一些具体实施例中,所述校验模块12,具体可以包括:
判断模块,用于判断预设存储局域网中的挂载卷信息与所述挂载卷信息是否相同;
待检测信息确定模块,用于若预设存储局域网中的挂载卷信息与所述挂载卷信息相同,则校验通过,然后基于所述挂载卷信息确定出待检测信息,若预设存储局域网中的挂载卷信息与所述挂载卷信息不相同,则校验不通过,则对所述挂载卷信息进行删除操作。
在一些具体实施例中,所述校验模块12,具体可以包括:
待检测异常信息确定模块,用于基于所述挂载卷信息中的wwid确定出待检测异常信息;其中,所述待检测异常信息包括设备名称个数和设备名称状态;
判断模块,用于判断所述设备名称个数是否等于预设的正常个数,然后判断所述设备名称状态是否为正常;
待检测信息异常确定模块,用于若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态不为正常,或,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态为正常,或,若所述设备名称个数等于预设的正常个数,并且所述设备名称状态不为正常,则确定所述待检测信息异常。
在一些具体实施例中,所述多路径自动修复模块13,具体可以包括:
扫盘修复模块,用于若所述设备名称个数不等于预设的正常个数,则基于所述异常信息确定出路径的逻辑单元号、协议信息以及主机信息,根据所述路径的逻辑单元号、所述协议信息以及所述主机信息进行精准扫盘修复操作;
删除模块,用于若所述设备名称状态不为正常,则将设备名称状态不为正常的磁盘设备进行删除,然后再进行精准扫盘修复操作。
在一些具体实施例中,所述多路径自动修复模块13,具体可以包括:
修复结果确定模块,用于当多路径自动修复操作完成之后,跳转至所述判断所述待检测信息是否异常步骤,以得到修复结果;
修复结果上报模块,用于利用本地的测试和操作用户程序语言服务将包含所述修复结果的上报信息发送至客户端。
图7为本申请实施例提供的一种电子设备的结构示意图。该电子设备20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的由电子设备执行的多路径异常检测修复方法中的相关步骤。
本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵循的通信协议是能够适用于本申请技术方案的任意通信协议,在此不对其进行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、磁盘或者光盘等,其上所存储的资源包括操作系统221、计算机程序222及数据223等,存储方式可以是短暂存储或者永久存储。
其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算机程序222,以实现处理器21对存储器22中数据223的运算与处理,其可以是Windows、Unix、Linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的多路径异常检测修复方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。数据223除了可以包括多路径异常检测修复设备接收到的由外部设备传输进来的数据,也可以包括由自身输入输出接口25采集到的数据等。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
进一步的,本申请实施例还公开了一种计算机可读存储介质,所述存储介质中存储有计算机程序,所述计算机程序被处理器加载并执行时,实现前述任一实施例公开的多路径异常检测修复方法步骤。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本发明所提供的一种多路径异常检测修复方法、装置、设备及存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种多路径异常检测修复方法,其特征在于,应用于云计算平台,包括:
检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;
确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;
若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。
2.根据权利要求1所述的多路径异常检测修复方法,其特征在于,所述获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息,包括:
从本地预设数据库的云主机列表中获取所有的云主机信息,并根据所述云主机信息确定出云主机状态;
对云主机状态为错误的所述云主机信息进行删除操作,以得到目标云主机信息。
3.根据权利要求2所述的多路径异常检测修复方法,其特征在于,所述确定出与所述目标云主机信息相对应的挂载卷信息,包括:
基于所述目标云主机信息确定出通用唯一标识码;
从所述预设数据库的块设备映射命令表中筛选出与所述通用唯一标识码相对应的挂载卷信息。
4.根据权利要求1所述的多路径异常检测修复方法,其特征在于,所述对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,包括:
判断预设存储局域网中的挂载卷信息与所述挂载卷信息是否相同;
若预设存储局域网中的挂载卷信息与所述挂载卷信息相同,则校验通过,然后基于所述挂载卷信息确定出待检测信息,若预设存储局域网中的挂载卷信息与所述挂载卷信息不相同,则校验不通过,则对所述挂载卷信息进行删除操作。
5.根据权利要求1所述的多路径异常检测修复方法,其特征在于,所述基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常,包括:
基于所述挂载卷信息中的wwid确定出待检测异常信息;其中,所述待检测异常信息包括设备名称个数和设备名称状态;
判断所述设备名称个数是否等于预设的正常个数,然后判断所述设备名称状态是否为正常;
若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态不为正常,或,若所述设备名称个数不等于预设的正常个数,并且所述设备名称状态为正常,或,若所述设备名称个数等于预设的正常个数,并且所述设备名称状态不为正常,则确定所述待检测信息异常。
6.根据权利要求5所述的多路径异常检测修复方法,其特征在于,所述根据所述异常信息进行多路径自动修复操作,包括:
若所述设备名称个数不等于预设的正常个数,则基于所述异常信息确定出路径的逻辑单元号、协议信息以及主机信息,根据所述路径的逻辑单元号、所述协议信息以及所述主机信息进行精准扫盘修复操作;
若所述设备名称状态不为正常,则将设备名称状态不为正常的磁盘设备进行删除,然后再进行精准扫盘修复操作。
7.根据权利要求1至6任一项所述的多路径异常检测修复方法,其特征在于,所述根据所述异常信息进行多路径自动修复操作之后,还包括:
当多路径自动修复操作完成之后,跳转至所述判断所述待检测信息是否异常步骤,以得到修复结果;
利用本地的测试和操作用户程序语言服务将包含所述修复结果的上报信息发送至客户端。
8.一种多路径异常检测修复装置,其特征在于,包括:
检测模块,用于检测是否触发了用于表征多路径异常检测的配置项,若触发了用于表征多路径异常检测的配置项,则获取本地所有的云主机信息,并从所述所有的云主机信息中筛选出目标云主机信息;
校验模块,用于确定出与所述目标云主机信息相对应的挂载卷信息,并对所述挂载卷信息进行校验,若校验通过,则基于所述挂载卷信息确定出待检测信息,然后判断所述待检测信息是否异常;
多路径自动修复模块,用于若所述待检测信息异常,则确定出异常信息,并根据所述异常信息进行多路径自动修复操作。
9.一种电子设备,其特征在于,包括:
存储器,用于保存计算机程序;
处理器,用于执行所述计算机程序,以实现如权利要求1至7任一项所述的多路径异常检测修复方法。
10.一种计算机可读存储介质,其特征在于,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的多路径异常检测修复方法。
CN202211447034.6A 2022-11-18 2022-11-18 一种多路径异常检测修复方法、装置、设备及介质 Pending CN115686921A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211447034.6A CN115686921A (zh) 2022-11-18 2022-11-18 一种多路径异常检测修复方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211447034.6A CN115686921A (zh) 2022-11-18 2022-11-18 一种多路径异常检测修复方法、装置、设备及介质

Publications (1)

Publication Number Publication Date
CN115686921A true CN115686921A (zh) 2023-02-03

Family

ID=85053095

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211447034.6A Pending CN115686921A (zh) 2022-11-18 2022-11-18 一种多路径异常检测修复方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN115686921A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116915348A (zh) * 2023-09-08 2023-10-20 南京源兴智达信息科技有限公司 基于射频直采的多路信号快速检测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116915348A (zh) * 2023-09-08 2023-10-20 南京源兴智达信息科技有限公司 基于射频直采的多路信号快速检测方法
CN116915348B (zh) * 2023-09-08 2023-12-08 南京源兴智达信息科技有限公司 基于射频直采的多路信号快速检测方法

Similar Documents

Publication Publication Date Title
US6651183B1 (en) Technique for referencing failure information representative of multiple related failures in a distributed computing environment
US7664986B2 (en) System and method for determining fault isolation in an enterprise computing system
CN107807877B (zh) 一种代码性能测试的方法和装置
JP4598065B2 (ja) 監視シミュレーション装置,方法およびそのプログラム
CN103490941A (zh) 一种云计算环境中实时监控在线配置方法
CN111371623B (zh) 业务性能和安全的监测方法、装置、存储介质及电子设备
CN112231130B (zh) 一种根据日志定位故障的方法、系统、设备及介质
US8327189B1 (en) Diagnosing an incident on a computer system using a diagnostics analyzer database
CN115686921A (zh) 一种多路径异常检测修复方法、装置、设备及介质
CN116016123A (zh) 故障处理方法、装置、设备及介质
CN111355740A (zh) 一种快速便捷检测防火墙配置的方法
CN112311574A (zh) 网络拓扑连线的检查方法、装置及设备
US20100251029A1 (en) Implementing self-optimizing ipl diagnostic mode
CN111988169B (zh) 一种云平台异常磁盘清理修复的方法、系统、设备及介质
CN116506340A (zh) 流量链路的测试方法、装置、电子设备及存储介质
CN116230067A (zh) 一种固态硬盘自动化测试方法、系统、设备及介质
US20050149809A1 (en) Real time determination of application problems, using a lightweight diagnostic tracer
CN111324516A (zh) 自动记录异常事件的方法及装置、存储介质、电子设备
CN113886122A (zh) 一种系统运行异常处理方法、装置、设备及存储介质
CN107102938B (zh) 测试脚本的更新方法及装置
CN117439871B (zh) 抄表故障定位方法、装置、存储介质及电子设备
CN114513398B (zh) 网络设备告警处理方法、装置、设备及存储介质
CN110460478B (zh) 告警测试方法、告警测试系统及告警制造设备、网管系统
CN114327967A (zh) 设备修复方法及装置、存储介质、电子装置
CN117762740A (zh) 数据安全监控的方法、系统、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination