发明内容
本发明提供一种运维设备巡检结果的故障判断方法和装置,以解决在运维设备巡检结果的故障分析中,依据机器的方式筛选过一次后,再由人为重新检查,依靠人为的处理方式,能分析与排查的量较少,造成分析与排查的效率和准确率低的问题。
为了解决上述问题,本发明提供了一种运维设备巡检结果的故障判断方法和装置,包括:
获取运维设备巡检结果;
将所述运维设备巡检结果与运维智库的第一关键词抽取配对,通过预设算法在所述运维智库中定位到故障点,得到当前发生故障的第一巡检类型与第一设备信息,其中,所述运维智库是根据第一关键词构建而成,所述第一关键词是由对预设的运维工作经验进行词量格式化区分后而生成;
根据预设的若干配置数据模型把所述运维智库中的关键词关联出来,根据关联出来的关键词定位到每一个历史故障点,对所述当前发生故障的第一巡检类型与第一设备信息进行分析数据校验,输出当前发生故障的第二巡检类型与第二设备信息,其中,所述AI分析模型库记录了运维智库中发生历史故障的巡检类型与设备信息的关键词按组合排序组成不同的数据组合,所述预设的若干配置数据模型是由所述AI分析模型库在所述运维智库中定位而来。
实施以上技术手段,具有如下技术效果:
本发明根据历史运维设备巡检结果得到若干第一关键词,以此构建运维智库,将运维设备巡检结果与运维智库的关键词抽取配对,来初步筛选运维设备巡检结果中当前发生故障的巡检类型与设备信息;建立AI分析模型库,根据AI分析模型库中的AI分析模型定位出运维智库中的配置数据模型,根据配置数据模型关联出来的运维智库中相关的信息定位到每一个历史故障点,使用每一个历史故障点对初步筛选后当前发生故障的巡检类型与设备信息做进一步筛选。相比于现有技术提升了业务的效率和准确率,能够降低在运维设备巡检结果的故障分析中耗费的人工成本,扩展业务范围。
作为优选方案,所述运维智库是根据第一关键词构建而成,所述第一关键词是由对预设的运维工作经验进行词量格式化区分后而生成,具体为:
将历史运维设备巡检结果转化成字符串,通过预设的运维工作经验从中抽取第二关键词,并赋予所述第二关键词可识别的中文描述,得到若干所述运维智库的第一关键词;
根据若干所述第一关键词,构建运维智库。
作为优选方案,所述根据若干所述第一关键词,构建运维智库,具体为:
获取若干个历史巡检类型和设备信息;
依次为各所述第一关键词绑定一个或多个所述历史巡检类型和设备信息,以构建所述运维智库;
其中,所述巡检类型包括:服务器类型、操作系统类型、存储类型、中间件类型、数据库类型、网络类型、业务系统类型和虚拟资源类型;所述设备信息包括:品牌信息和型号信息。
该优选方案通过第一关键词及其绑定的一个或多个历史巡检类型和设备信息构建运维智库,采用此方式建立的运维智库,能够根据其中的第一关键词,快速获取对应的历史巡检类型和设备信息,减少计算量,缩短定位时间。
作为优选方案,将所述运维设备巡检结果与运维智库的第一关键词抽取配对,通过预设算法在所述运维智库中定位到故障点,得到当前发生故障的第一巡检类型与第一设备信息,具体为:
将所述运维设备巡检结果与所述运维智库的第一关键词抽取配对,得到所述运维智库中对应的若干个第三关键词,以及各所述第三关键词在所述运维智库中绑定的一个或多个第三巡检类型和第三设备信息;
通过所述若干个第三关键词组合定位,得到当前发生故障的故障点,根据各所述第三关键词在所述运维智库中绑定的一个或多个第三巡检类型和第三设备信息,得到所述当前发生故障的故障点对应的所述第一巡检类型与第一设备信息,其中,所述若干个第三关键词包含巡检设备信息类型、设备相关的品牌与型号,在进行组合定位时,针对同一层级选择一种巡检设备信息类型、设备的品牌与型号。
该优选方案能够对输入的运维设备巡检结果进行初步筛选,将运维设备巡检结果中所有发生故障的故障点都筛选出来。
作为优选方案,将所述运维设备巡检结果与运维智库的第一关键词抽取配对,具体为:
把所述运维智库的第一关键词进行正则表达式的组合,与所述运维设备巡检结果配对,把信息按行的方式进行抽取;
或者,使用根据大数据库的hadoop的算法识别方式,把所述运维设备巡检结果进行自主拆分,根据hadoop的规则进行运维智库查询并进行识别;
或者,使用lucene的方式,利用网络关键词查找引擎,把所述运维智库的第一关键词进行拆分,再进行所述运维设备巡检结果的抽取与所述运维智库的第一关键词匹配。
该优选方案可以根据不同的环境灵活地采用不同的抽取配对方法,提高抽取配对的效率。
作为优选方案,所述AI分析模型库记录了运维智库中发生历史故障的巡检类型与设备信息的关键词按组合排序组成不同的数据组合,具体为:
将所述运维智库中发生历史故障的巡检类型与设备信息的第一关键词,按组合排序组成不同的数据组合,建立若干AI分析模型,由若干AI分析模型组成AI分析模型库,其中,所述发生历史故障的巡检类型与设备信息包括发生历史故障的设备类型、品牌、型号、IT类型,每个AI分析模型对应一种或多种发生历史故障的巡检类型与设备信息组合。
该优选方案所构建的AI分析模型库,其中的每一个AI分析模型都对应了一种运维智库中发生历史故障的情况,AI分析模型库是对运维智库中发生历史故障的情况汇总,能够对当前发生故障的运维设备巡检结果起到良好的参照作用。
作为优选方案,根据预设的配置数据模型把所述运维智库中的关键词关联出来,根据关联出来的关键词定位到每一个历史故障点,对所述当前发生故障的第一巡检类型与第一设备信息进行分析数据校验,输出当前发生故障的第二巡检类型与第二设备信息,具体为:
把所述预设的若干配置数据模型关联出来的所述运维智库中相关的第一关键词定位到每一个历史故障点,获取所述每一个历史故障点对应的第三巡检类型与第三设备信息,使用所述第三巡检类型与第三设备信息与所述第一巡检类型与第一设备信息进行对比,把所述第一巡检类型与第一设备信息中实际不存在的当前发生故障的巡检类型与设备信息删除,得到当前发生故障的第二巡检类型与第二设备信息并输出。
该优选方案通过AI分析模型能够快捷地定位出运维智库中发生历史故障的数据匹配模型,减少筛查所需的工程量;再由数据匹配模型关联出来第一关键词定位到每一个历史故障点做进一步筛选,得到第二巡检类型与第二设备信息,提高了筛选结果的准确率。
作为优选方案,输出当前发生故障的第二巡检类型与第二设备信息,具体为:
通过IT智能运维管理系统内部的结果页面输出或者使用PDF方式下载,将当前发生故障的第二巡检类型与第二设备信息以图形化的方式进行展示;
或者,通过接口方式输出,将当前发生故障的第二巡检类型与第二设备信息以接口的方式返回给用户,以供用户根据当前发生故障的第二巡检类型与第二设备信息进行图形化渲染。
该优选方案可以采用多种方式灵活输出当前发生故障的第二巡检类型与第二设备信息,并且能够以不同的方式展现出来,满足不同的工作需求。
作为优选方案,根据以上所述的一种运维设备巡检结果的故障判断方法,具体为:
所述运维设备巡检结果为字符串的形式,其中,所述运维设备巡检结果包括以下的一种或多种组合:文本字符结果、字节流结果、图表结果和表格信息结果。
该优选方案支持多种运维设备巡检结果的文件类型输入,能够满足不同的使用需求。
本发明提供了一种运维设备巡检结果的故障判断装置,包括:
运维智库构建模块,用于通过对运维工作经验进行词量格式化区分,得到所述第一关键词,构建运维智库;
故障点初步筛选模块,用于将所述运维设备巡检结果与所述运维智库的关键词抽取配对,通过预设算法在所述运维智库中定位到故障点,得到当前发生故障的第一巡检类型与第一设备信息;
AI分析模型库构建模块,用于根据运维智库中发生故障的巡检类型与设备信息的第一关键词,按组合排序组成不同的数据组合,建立若干AI分析模型,由所述若干AI分析模型建立AI分析模型库;
故障点精确筛选模块,用于通过所述AI分析模型库对所述当前发生故障的第二巡检类型与第二设备信息进行分析数据校验,得到当前发生故障的第二巡检类型与第二设备信息。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,除非另有说明,“若干”的含义是两个或两个以上。
请参阅图1,本发明的实施例提供了一种运维设备巡检结果的故障判断方法,包括:
S1、获取运维设备巡检结果。
在本实施例中,将运维设备巡检结果输入IT智能运维管理系统,其中,运维设备巡检结果包括以下的一种或多种组合:文本字符结果、字节流结果、图表结果和表格信息结果。
将输入的运维设备巡检结果转化为字符串的形式。
本发明实施例支持多种运维设备巡检结果的文件类型输入,能够满足不同的使用需求。
S2、将运维设备巡检结果与运维智库的第一关键词抽取配对,通过预设算法在运维智库中定位到故障点,得到当前发生故障的第一巡检类型与第一设备信息,其中,运维智库是根据第一关键词构建而成,第一关键词是由对预设的运维工作经验进行词量格式化区分后而生成。
在本实施例中,首先,构建运维智库:
将历史运维设备巡检结果转化成字符串,通过运维工程师、外部的工程师、网络的经验论坛等渠道获取预设的运维工作经验,通过预设的运维工作经验从转化成字符串的历史运维设备巡检结果中抽取第二关键词,并赋予第二关键词可识别的中文描述,得到若干运维智库的第一关键词,上述实施例中预设的运维工作经验来源广泛,多种来源渠道可以丰富运维智库的关键词量,还能够定时进行更新,使运维智库满足运维设备巡检结果的信息更迭;
获取若干个历史巡检类型和设备信息,巡检类型包括:服务器类型、操作系统类型、存储类型、中间件类型、数据库类型、网络类型、业务系统类型和虚拟资源类型;设备信息包括:品牌信息和型号信息。
依次为各第一关键词绑定一个或多个历史巡检类型和设备信息,以此构建运维智库,运维智库中包含第一关键词以及各第一关键词绑定的一个或多个历史巡检类型和设备信息。
然后,将运维设备巡检结果与运维智库的第一关键词抽取配对,配对方式有三种:
第一种是把运维智库的第一关键词进行正则表达式的组合,然后与运维设备巡检结果配对,把信息按行的方式进行抽取,该方式适用于词量相对较小的情况,在对服务器的运行性能要求相关较小、存储量较小,以及对于监控的设备数量不多的情况使用;第二种是使用根据大数据库的hadoop的算法识别方式,把运维设备巡检结果进行自主拆分,根据hadoop的规则进行数据库查询进行识别,该方式是基于数据库存储功能,有利于高性能的数据分析,在所需的服务器数量较多的情况下使用;第三种是使用lucene的方式,该方式类似于网络关键词查找引擎,将运维智库的第一关键词进行拆分,再进行运维设备巡检结果的抽取与运维智库的第一关键词匹配,该方式是文本存储方式,在仅一台服务器性能较高,以及巡检设备的数量相对较大的情况下使用,上述实施例中可以根据不同的环境灵活地采用不同的抽取配对方法,提高抽取配对的效率。
通过以上配对方式,得到运维智库中对应的若干个第三关键词,以及各第三关键词在运维智库中绑定的一个或多个第三巡检类型和第三设备信息,其中,若干个第三关键词包含巡检设备信息类型、设备相关的品牌与型号。
最后,进行初步筛选:
通过若干个第三关键词组合定位,得到当前发生故障的故障点,在进行组合定位时,针对同一层级选择一种巡检设备信息类型、设备的品牌与型号;根据各第三关键词在运维智库中绑定的一个或多个第三巡检类型和第三设备信息,得到当前发生故障的故障点对应的第一巡检类型与第一设备信息,上述实施例中通过第一关键词及其绑定的一个或多个历史巡检类型和设备信息所构建的运维智库,能够根据其中的第一关键词,快速获取对应的历史巡检类型和设备信息,减少计算量,缩短定位时间。
S3、根据预设的若干配置数据模型把运维智库中的关键词关联出来,根据关联出来的关键词定位到每一个历史故障点,对当前发生故障的第一巡检类型与第一设备信息进行分析数据校验,输出当前发生故障的第二巡检类型与第二设备信息,其中,AI分析模型库记录了运维智库中发生历史故障的巡检类型与设备信息的关键词按组合排序组成不同的数据组合,预设的若干配置数据模型是由AI分析模型库在运维智库中定位而来。
在本实施例中,首先,构建AI分析模型库:
将运维智库中发生历史故障的巡检类型与设备信息的第一关键词,按组合排序组成不同的数据组合,建立若干AI分析模型,由若干AI分析模型组成AI分析模型库,其中,发生历史故障的巡检类型与设备信息包括发生历史故障的设备类型、品牌、型号、IT类型,每个AI分析模型对应一种或多种发生历史故障的巡检类型与设备信息组合,并且各AI分析模型之间不能全部指标相同,必须存在一个以上的不同指标,上述实施例中AI分析模型库的每一个AI分析模型都对应了一种运维智库中发生历史故障的情况,AI分析模型库是对运维智库中发生历史故障的情况汇总,能够对当前发生故障的运维设备巡检结果起到良好的参照作用。
然后,获取预设的若干配置数据模型:
把AI分析模型库中的若干AI分析模型与运维智库中的第一关键词进行一一匹配,得到匹配出来的第一关键词,由这些匹配出来的第一关键词组成预设的若干配置数据模型,上述实施例通过AI分析模型能够快捷地定位出运维智库中发生历史故障的数据匹配模型,减少筛查所需的工程量。
其次,进行精确筛选:
把预设的若干配置数据模型关联出来运维智库中若干组相关的第一关键词,由若干组相关的第一关键词定位到每一个历史故障点,获取每一个历史故障点对应的第三巡检类型与第三设备信息,使用第三巡检类型与第三设备信息与第一巡检类型与第一设备信息进行对比,把第一巡检类型与第一设备信息中实际不存在的当前发生故障的巡检类型与设备信息删除,得到当前发生故障的第二巡检类型与第二设备信息,上述实施例需要进行精确筛选,是因为在初步筛选出来的第一巡检类型与第一设备信息中,是将所有可能发生故障的情况都筛选出来,但是有些发生故障的巡检类型与设备信息可能是不存在的,通过精确筛选可以提高筛选结果的准确率。
最后,输出精确筛选的结果:
当前发生故障的第二巡检类型与第二设备信息的输出方式有两种,第一种是通过IT智能运维管理系统内部的结果页面输出或者使用PDF方式下载,将当前发生故障的第二巡检类型与第二设备信息以图形化的方式进行展示;
第二种是通过接口方式输出,将当前发生故障的第二巡检类型与第二设备信息以接口的方式返回给用户,以供用户根据当前发生故障的第二巡检类型与第二设备信息进行图形化渲染,上述实施例采用多种方式灵活输出当前发生故障的第二巡检类型与第二设备信息,满足了不同的工作需求。
实施本发明实施例,具有以下有益效果:
本发明实施例通过建立运维智库,运用其中包含的第一关键词以及各第一关键词绑定的一个或多个历史巡检类型和设备信息,能够与运维设备巡检结果抽取配对,快速定位得到当前发生故障的故障点对应的第一巡检类型与第一设备信息;再通过构建AI分析模型库,利用其中的AI分析模型快速定位出运维智库中的若干配置数据模型,进而关联定位到每一个历史故障点对应的第三巡检类型与第三设备信息,以此对第一巡检类型与第一设备信息进行筛选,得到第二巡检类型与第二设备信息。通过构建的运维智库和AI分析模型库能够对信息进行两次快速定位,提高信息定位的效率,并且通过对运维设备巡检结果进行两次筛选,可以提高故障筛选的准确率,此外,以上方式都是通过计算机执行,能够降低在运维设备巡检结果的故障分析中耗费的人工成本,扩展业务范围。
请参阅图2,本发明的一个实施例还提供了一种运维设备巡检结果的故障判断装置,包括:
运维智库构建模块10,用于通过对运维工作经验进行词量格式化区分,得到第一关键词,构建运维智库;
故障点初步筛选模块20,用于将运维设备巡检结果与运维智库的关键词抽取配对,通过预设算法在运维智库中定位到故障点,得到当前发生故障的第一巡检类型与第一设备信息;
AI分析模型库构建模块30,用于根据运维智库中发生故障的巡检类型与设备信息的第一关键词,按组合排序组成不同的数据组合,建立若干AI分析模型,由若干AI分析模型建立AI分析模型库;
故障点精确筛选模块40,用于通过AI分析模型库对当前发生故障的第二巡检类型与第二设备信息进行分析数据校验,得到当前发生故障的第二巡检类型与第二设备信息。
本装置还包括:输出模块50,用于输出当前发生故障的第二巡检类型与第二设备信息。
在一个实施例中,运维智库构建模块10还用于:
将历史运维设备巡检结果转化成字符串,通过预设的运维工作经验从中抽取第二关键词,并赋予第二关键词可识别的中文描述,得到若干运维智库的第一关键词;
获取若干个历史巡检类型和设备信息;
依次为各第一关键词绑定一个或多个历史巡检类型和设备信息,以构建运维智库;
其中,巡检类型包括:服务器类型、操作系统类型、存储类型、中间件类型、数据库类型、网络类型、业务系统类型和虚拟资源类型;设备信息包括:品牌信息和型号信息。
在一个实施例中,故障点初步筛选模块20还用于:
运维设备巡检结果为字符串的形式,其中,运维设备巡检结果包括以下的一种或多种组合:文本字符结果、字节流结果、图表结果和表格信息结果。
将运维设备巡检结果与运维智库的第一关键词抽取配对,得到运维智库中对应的若干个第三关键词,以及各第三关键词在运维智库中绑定的一个或多个第三巡检类型和第三设备信息;
通过若干个第三关键词组合定位,得到当前发生故障的故障点,根据各第三关键词在运维智库中绑定的一个或多个第三巡检类型和第三设备信息,得到当前发生故障的故障点对应的第一巡检类型与第一设备信息,其中,若干个第三关键词包含巡检设备信息类型、设备相关的品牌与型号,在进行组合定位时,针对同一层级选择一种巡检设备信息类型、设备的品牌与型号。
将运维设备巡检结果与运维智库的第一关键词抽取配对,具体为:
把运维智库的第一关键词进行正则表达式的组合,与运维设备巡检结果配对,把信息按行的方式进行抽取;
或者,使用根据大数据库的hadoop的算法识别方式,把运维设备巡检结果进行自主拆分,根据hadoop的规则进行运维智库查询并进行识别;
或者,使用lucene的方式,利用网络关键词查找引擎,把运维智库的第一关键词进行拆分,再进行运维设备巡检结果的抽取与运维智库的第一关键词匹配。
在一个实施例中,AI分析模型库构建模块30还用于:
将运维智库中发生历史故障的巡检类型与设备信息的第一关键词,按组合排序组成不同的数据组合,建立若干AI分析模型,由若干AI分析模型组成AI分析模型库,其中,发生历史故障的巡检类型与设备信息包括发生历史故障的设备类型、品牌、型号、IT类型,每个AI分析模型对应一种或多种发生历史故障的巡检类型与设备信息组合。
在一个实施例中,故障点精确筛选模块40还用于:
把预设的若干配置数据模型关联出来的运维智库中相关的第一关键词定位到每一个历史故障点,获取每一个历史故障点对应的第三巡检类型与第三设备信息,使用第三巡检类型与第三设备信息与第一巡检类型与第一设备信息进行对比,把第一巡检类型与第一设备信息中实际不存在的当前发生故障的巡检类型与设备信息删除,得到当前发生故障的第二巡检类型与第二设备信息并输出。
在一个实施例中,输出模块50还用于:
通过IT智能运维管理系统内部的结果页面输出或者使用PDF方式下载,将当前发生故障的第二巡检类型与第二设备信息以图形化的方式进行展示;
或者,通过接口方式输出,将当前发生故障的第二巡检类型与第二设备信息以接口的方式返回给用户,以供用户根据当前发生故障的第二巡检类型与第二设备信息进行图形化渲染。
实施本发明实施例,具有以下有益效果:
本发明实施例通过建立运维智库,运用其中包含的第一关键词以及各第一关键词绑定的一个或多个历史巡检类型和设备信息,能够与运维设备巡检结果抽取配对,快速定位得到当前发生故障的故障点对应的第一巡检类型与第一设备信息;再通过构建AI分析模型库,利用其中的AI分析模型快速定位出运维智库中的若干配置数据模型,进而关联定位到每一个历史故障点对应的第三巡检类型与第三设备信息,以此对第一巡检类型与第一设备信息进行筛选,得到第二巡检类型与第二设备信息。通过构建的运维智库和AI分析模型库能够对信息进行两次快速定位,提高信息定位的效率,并且通过对运维设备巡检结果进行两次筛选,可以提高故障筛选的准确率,此外,以上方式都是通过计算机执行,能够降低在运维设备巡检结果的故障分析中耗费的人工成本,扩展业务范围。
请参阅图3,本发明的实施例还提供了一种基于运维智库与AI分析巡检结果的故障判断逻辑方法,包括运维智库、AI分析、故障结果这三个部分,具体为:
第一部分、运维智库:
根据运维关键词库、IT运维类型库、IT资源库建立运维智库;其中,运维关键词库是由对预设的运维工作经验进行词量格式化区分后而生成;
其中,IT运维类型库是对运维关键词库的类型划分,包括8大类:包括服务器类型、操作系统类型、存储类型、中间件类型、数据库类型、网络类型、业务系统类型、虚拟资源类型;IT资源库包含了运维关键词库绑定的巡检类型与设备信息,巡检类型包括:服务器类型、操作系统类型、存储类型、中间件类型、数据库类型、网络类型、业务系统类型和虚拟资源类型;设备信息包括:品牌信息和型号信息。
获取运维设备巡检结果;将运维设备巡检结果与运维智库中运维关键词库的运维关键词抽取配对,通过预设算法在运维智库中定位到故障点,得到当前发生故障的第一关键词对应的第一巡检类型与第一设备信息。
第二部分、AI分析:
通过AI模型、AI分析引擎、AI大数据资源库对第一巡检类型与第一设备信息进行分析筛选,得到当前发生故障的第二巡检类型与第二设备信息;
其中,AI模型是根据运维智库的运维关键词库中,发生故障的类型、故障设备的运维关键词按组合排序组成;AI分析引擎是对第一巡检类型、第一设备信息与AI模型进行匹配分析,得到当前发生故障的第二关键词;AI大数据资源库是对当前发生故障的运维关键词进行信息关联,得到当前发生故障的第二关键词对应的第二巡检类型与第二设备信息。
第三部分、故障结果:
以故障报告的形式输出当前发生故障的第二巡检类型与第二设备信息。
实施本发明实施例,具有以下有益效果:
本发明实施例通过建立运维智库,运用其中包含的运维关键词以及各运维关键词绑定的历史巡检类型和设备信息,能够与运维设备巡检结果抽取配对,快速定位得到当前发生故障的故障点对应的第一巡检类型与第一设备信息;再通过AI分析引擎,对AI模型和第一巡检类型与第一设备信息进行匹配分析,得到当前发生故障的第二关键词,最后通过AI大数据资源库得到当前发生故障的第二关键词对应的第二巡检类型与第二设备信息。通过构建的运维智库和AI模型能够对信息进行两次快速定位,提高信息定位的效率,并且通过对运维设备巡检结果进行两次筛选,可以提高故障筛选的准确率,此外,以上方式都是通过计算机执行,能够降低在运维设备巡检结果的故障分析中耗费的人工成本,扩展业务范围。
以上是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。