CN116245513B

CN116245513B - 基于规则库的自动化运维系统及其方法

Info

Publication number: CN116245513B
Application number: CN202310525654.5A
Authority: CN
Inventors: 汤代佳; 王伟国; 戎佳京; 毛冠军
Original assignee: Shenzhen United Information Technology Co ltd
Current assignee: Shenzhen United Information Technology Co ltd
Priority date: 2023-05-11
Filing date: 2023-05-11
Publication date: 2023-07-07
Anticipated expiration: 2043-05-11
Also published as: CN116245513A

Abstract

一种基于规则库的自动化运维系统及其方法，其获取待诊断用户设备的设备日志数据；采用基于深度学习的人工智能技术，挖掘用户设备的设备日志数据的上下文语义理解特征以及各个类型数据是否符合预定条件设定间的关联特征信息，基于此来快速且准确地进行设备故障类型的诊断。这样，可以根据设备不同的故障类型来对不同设备进行不同程度的维护，进而提高运维质量和效率。

Description

基于规则库的自动化运维系统及其方法

技术领域

本申请涉及智能化运维技术领域，并且更具体地，涉及一种基于规则库的自动化运维系统及其方法。

背景技术

信创环境是指在信息技术应用创新的背景下，基于国产化的cpu、国产操作系统为基础进行自主研发的环境。由于信创产业还处于发展阶段，相关的标准还未统一，在软硬件适配过程中存在各种问题。

目前，信创环境的主机、操作系统、应用软件、网络服务设备主要部署在企业的日常办公场景中，其特点是用户在办公中遇到问题需要快速响应并解决。在设备的运维过程中，最为关键的是对用户设备进行故障诊断，快速而准确的故障诊断是提高运维质量和效率的重中之重。

现有多种用于设备运维的故障诊断方案，但这些故障诊断方案大多过度依赖于行业专家，有时候无法满足运维的实时性。

因此，期待一种自动化运维系统。

发明内容

为了解决上述技术问题，提出了本申请。本申请的实施例提供了一种基于规则库的自动化运维系统及其方法，其获取待诊断用户设备的设备日志数据；采用基于深度学习的人工智能技术，挖掘用户设备的设备日志数据的上下文语义理解特征以及各个类型数据是否符合预定条件设定间的关联特征信息，基于此来快速且准确地进行设备故障类型的诊断。这样，可以根据设备不同的故障类型来对不同设备进行不同程度的维护，进而提高运维质量和效率。

第一方面，提供了一种基于规则库的自动化运维方法，其包括：

获取待诊断用户设备的设备日志数据；

基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量；

将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量；

对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量；

融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量；以及

将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签。

在上述基于规则库的自动化运维方法中，基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量，包括：

响应于所述设备日志数据中的条件符合预设规则库中的条件设定，将对应条件部分设置为1；以及，所述设备日志数据中的条件不符合预设规则库中的条件设定，将对应条件部分设置为0。

在上述基于规则库的自动化运维方法中，所述多尺度邻域特征提取模块，包括：相互并行的第一卷积层和第二卷积层，以及，与所述第一卷积层和所述第二卷积层连接的多尺度融合层，其中，所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。

在上述基于规则库的自动化运维方法中，将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量，包括：使用所述多尺度邻域特征提取模块的第一卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第一尺度特征向量，其中，所述第一卷积层具有第一长度的第一一维卷积核；其中，所述公式为：

；

其中，a为第一卷积核在x方向上的宽度、

为第一卷积核参数向量、/>

为与卷积核函数运算的局部向量矩阵，w为第一卷积核的尺寸，X表示所述设备日志二值化输入向量；使用所述多尺度邻域特征提取模块的第二卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第二尺度特征向量，其中，所述第二卷积层具有第二长度的第二一维卷积核，所述第一长度不同于所述第二长度；其中，所述公式为：

；

其中，b为第二卷积核在x方向上的宽度、

为第二卷积核参数向量、/>

为与卷积核函数运算的局部向量矩阵，m为第二卷积核的尺寸，X表示所述设备日志二值化输入向量；以及，将所述第一尺度特征向量和所述第二尺度特征向量进行级联以得到所述设备日志二值化特征向量。

在上述基于规则库的自动化运维方法中，对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量，包括：对所述设备日志数据进行分词处理以将所述设备日志数据转化为由多个词组成的词序列；使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列；以及，使用所述包含嵌入层的上下文编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述设备日志语义理解特征向量。

在上述基于规则库的自动化运维方法中，使用所述包含嵌入层的上下文编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述设备日志语义理解特征向量，包括：将所述词向量的序列进行一维排列以得到全局词特征向量；计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵；分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；以及，分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述设备日志语义理解特征向量。

在上述基于规则库的自动化运维方法中，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量，包括：将所述设备日志语义理解特征向量作为源向量且将所述设备日志二值化特征向量作为响应向量，以如下公式计算所述设备日志二值化特征向量和所述设备日志语义理解特征向量之间的非相干稀疏响应融合以得到所述分类特征向量；其中，所述公式为：

；

其中，

、/>

和/>

分别表示所述设备日志语义理解特征向量、所述设备日志二值化特征向量和所述分类特征向量，/>

和/>

分别表示向量的一范数和二范数，/>

为向量的长度，/>

和/>

分别表示向量乘积和向量点乘，且所有向量均为行向量形式，/>

表示向量的转置向量。

在上述基于规则库的自动化运维方法中，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签，包括：使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

第二方面，提供了一种基于规则库的自动化运维系统，其包括：

数据获取模块，用于获取待诊断用户设备的设备日志数据；

二值化转化模块，用于基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量；

多尺度特征提取模块，用于将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量；

上下文编码器模块，用于对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量；

融合模块，用于融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量；以及

故障类型分类模块，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签。

在上述基于规则库的自动化运维系统中，所述二值化转化模块，用于：响应于所述设备日志数据中的条件符合预设规则库中的条件设定，将对应条件部分设置为1；以及，所述设备日志数据中的条件不符合预设规则库中的条件设定，将对应条件部分设置为0。

与现有技术相比，本申请提供的基于规则库的自动化运维系统及其方法，其获取待诊断用户设备的设备日志数据；采用基于深度学习的人工智能技术，挖掘用户设备的设备日志数据的上下文语义理解特征以及各个类型数据是否符合预定条件设定间的关联特征信息，基于此来快速且准确地进行设备故障类型的诊断。这样，可以根据设备不同的故障类型来对不同设备进行不同程度的维护，进而提高运维质量和效率。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本申请实施例的基于规则库的自动化运维方法的场景示意图。

图2为根据本申请实施例的基于规则库的自动化运维方法的流程图。

图3为根据本申请实施例的基于规则库的自动化运维方法的架构示意图。

图4为根据本申请实施例的基于规则库的自动化运维方法中步骤140的子步骤的流程图。

图5为根据本申请实施例的基于规则库的自动化运维方法中步骤143的子步骤的流程图。

图6为根据本申请实施例的基于规则库的自动化运维方法中步骤160的子步骤的流程图。

图7为根据本申请实施例的基于规则库的自动化运维系统的框图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

除非另有说明，本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的，不是旨在限制本申请的范围。

在本申请实施例记载中，需要说明的是，除非另有说明和限定，术语“连接”应做广义理解，例如，可以是电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

需要说明的是，本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换，以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。

如上所述，目前，信创环境的主机、操作系统、应用软件、网络服务设备主要部署在企业的日常办公场景中，其特点是用户在办公中遇到问题需要快速响应并解决。在设备的运维过程中，最为关键的是对用户设备进行故障诊断，快速而准确的故障诊断是提高运维质量和效率的重中之重。现有多种用于设备运维的故障诊断方案，但这些故障诊断方案大多过度依赖于行业专家，有时候无法满足运维的实时性。因此，期待一种自动化运维系统。

相应地，考虑到在实际进行自动化运维的过程中，对于用户设备的设备日志数据进行自主分析，以此来及时准确地确定用户设备的故障类型是关键。但是，由于用户设备的设备日志数据中存在有较多的数据信息，难以对于有用的数据信息进行捕捉提取。并且，还考虑到由于所述设备日志数据中存在有较多的数据类型，这些数据类型中有的日志数据符合条件设定，有的则不符合，虽然能够基于所述设备日志数据中各个类型的数据来分别判断其是否符合条件设定，以此来判断其是否发生此类故障，但是由于所述各个类型的数据间在不同的类型跨度下具有着不同的关联程度，导致上述故障检测的方法精度较低，进而降低了运维质量和效率。

基于此，在本申请的技术方案中，期望基于用户设备的设备日志数据的上下文语义理解特征和各个类型数据是否符合预定条件设定间的关联特征来综合对于设备的故障类型进行快速而准确地诊断，以此来提高运维质量和效率。在此过程中，难点在于如何充分且准确地挖掘出所述用户设备的设备日志数据的上下文语义理解特征以及所述各个类型数据是否符合预定条件设定间的关联特征信息，以此来快速且准确地进行设备故障类型的诊断，从而根据设备不同的故障类型来对不同设备进行不同程度的维护，以提高运维质量和效率。

近年来，深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外，深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域，也展现出了接近甚至超越人类的水平。

深度学习以及神经网络的发展为挖掘所述用户设备的设备日志数据的上下文语义理解特征以及所述各个类型数据是否符合预定条件设定间的关联特征信息提供了新的解决思路和方案。

具体地，在本申请的技术方案中，首先，获取待诊断用户设备的设备日志数据。接着，考虑到由于所述待诊断用户设备的设备日志数据是由多个词和数字数据组成的，且各个词以及数字数据之间具有着上下文的语义关联特征信息。因此，为了能够提取出所述待诊断用户设备的设备日志数据中的语义关联特征信息，以对于所述待诊断用户设备的设备日志数据进行准确地语义理解，在本申请的技术方案中，进一步对所述待诊断用户设备的设备日志数据进行分词处理以避免后续进行语义特征提取时词序混乱后，将分词处理后的日志数据通过包含嵌入层的上下文编码器中进行语义编码，以提取出所述待诊断用户设备的设备日志数据中基于全局的上下文语义关联特征信息，从而得到设备日志语义理解特征向量。

然后，考虑到由于所述设备日志数据中存在有较多的数据类型，这些数据类型中有的数据符合预设规则库的条件设定，有的则不符合，虽然能够基于所述设备日志数据中各个类型的数据信息与所述预设规则库进行比较来分别判断其是否符合预定标准，以此来判断其是否发生此类故障。但是由于所述设备日志数据中的各个类型的数据信息间具有着关联性，并且这种关联性在不同的数据类型跨度下具有着不同的关联程度，导致该故障检测的方法精度较低，进而降低了运维质量和效率。因此，在本申请的技术方案中，为了提高对于故障类型判断的精准度，需要对于所述设备日志数据中的各个类型数据是否符合预定标准间的关联特征进行深度挖掘。

具体地，基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量。特别地，在本申请的技术方案中，响应于所述设备日志数据中的条件符合预设规则库中的条件设定，将对应条件部分设置为1；以及，所述设备日志数据中的条件不符合预设规则库中的条件设定，将对应条件部分设置为0。

接着，考虑到由于所述设备日志数据中的各个类型的数据信息间在不同的数据类型跨度下具有着不同的程度的关联特性信息，因此，在本申请的技术方案中，进一步将所述设备日志二值化输入向量通过多尺度邻域特征提取模块中进行特征挖掘，以提取出所述设备日志数据中的各个类型数据信息在不同数据类型跨度下的多尺度邻域关联特征信息，从而得到设备日志二值化特征向量。这样，能够基于数据间的关联特征来对于所述设备日志数据中的各个类型数据是否符合预定条件设定进行准确地判断，从而对于是否属于该类故障类型进行准确地诊断。

进一步地，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量，以此来融合所述待诊断用户设备的设备日志数据的上下文语义理解特征和所述设备日志数据中的各个类型数据是否符合预定条件设定间的关联特征的关联性特征分布信息，并以此作为分类特征向量通过分类器中进行分类处理，从而得到用于表示待诊断设备的故障类型标签的分类结果。

也就是，在本申请的技术方案中，所述分类器的标签是所述待诊断设备的故障类型标签，其中，所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。应可以理解，在本申请的技术方案中，所述分类器的分类标签为所述待诊断设备的故障类型标签，因此，在得到所述分类结果后，可基于所述分类结果来快速且准确地进行设备故障类型的诊断，从而根据设备不同的故障类型来对不同设备进行不同程度的维护，以提高运维质量和效率。

特别地，在本申请的技术方案中，在融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量得到所述分类特征向量时，由于可以将所述设备日志二值化特征向量表达的设备日志数据条件的二值化时序多邻域关联表达看作为对所述设备日志语义理解特征向量表达的上下文语义的条件化响应，因此，为了更好地基于所述条件化响应融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量，将所述设备日志语义理解特征向量，例如记为

作为源向量，将所述设备日志二值化特征向量，例如记为/>

作为响应向量，计算其非相干稀疏响应式融合以优化所述分类特征向量，例如，优化后的所述分类特征向量记为/>

，表示为：

；

其中

和/>

表示向量的一范数和二范数，/>

为向量的长度，/>

和/>

分别表示向量乘积和向量点乘，且所有向量均为行向量形式。

这里，所述非相干稀疏响应融合在以初始响应向量作为特征域间响应性融合的真实性分布（ground-truth distribution）的情况下，通过一范数表示的向量差异的模糊性位分布响应性，以及基于差分向量的模约束的真实差分嵌入响应性，来获得向量之间的非相干稀疏性融合表示，以提取特征向量融合后的概率分布描述度的响应关系，从而提升作为非相干稀疏响应式融合优化的所述分类特征向量

对于具有响应关系的源向量和响应向量的融合表达效果。这样，通过更好地基于所述条件化响应融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量，就提升了所述分类特征向量/>

的分类结果的准确性。这样，能够快速且准确地进行设备故障类型的诊断，从而根据设备不同的故障类型来对不同设备进行不同程度的维护，以提高运维质量和效率。

图1为根据本申请实施例的基于规则库的自动化运维方法的场景示意图。如图1所示，在该应用场景中，首先，获取待诊断用户设备的设备日志数据（例如，如图1中所示意的C）；然后，将获取的设备日志数据输入至部署有基于规则库的自动化运维算法的服务器（例如，如图1中所示意的S）中，其中所述服务器能够基于规则库的自动化运维算法对所述设备日志数据进行处理，以生成用于表示待诊断设备的故障类型标签的分类结果。

在介绍了本申请的基本原理之后，下面将参考附图来具体介绍本申请的各种非限制性实施例。

在本申请的一个实施例中，图2为根据本申请实施例的基于规则库的自动化运维方法的流程图。如图2所示，根据本申请实施例的基于规则库的自动化运维方法100，包括：110，获取待诊断用户设备的设备日志数据；120，基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量；130，将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量；140，对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量；150，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量；以及，160，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签。

图3为根据本申请实施例的基于规则库的自动化运维方法的架构示意图。如图3所示，在该网络架构中，首先，获取待诊断用户设备的设备日志数据；然后，基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量；接着，将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量；然后，对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量；接着，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量；以及，最后，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签。

具体地，在步骤110中，获取待诊断用户设备的设备日志数据。相应地，考虑到在实际进行自动化运维的过程中，对于用户设备的设备日志数据进行自主分析，以此来及时准确地确定用户设备的故障类型是关键。但是，由于用户设备的设备日志数据中存在有较多的数据信息，难以对于有用的数据信息进行捕捉提取。并且，还考虑到由于所述设备日志数据中存在有较多的数据类型，这些数据类型中有的日志数据符合条件设定，有的则不符合，虽然能够基于所述设备日志数据中各个类型的数据来分别判断其是否符合条件设定，以此来判断其是否发生此类故障，但是由于所述各个类型的数据间在不同的类型跨度下具有着不同的关联程度，导致上述故障检测的方法精度较低，进而降低了运维质量和效率。

具体地，在本申请的技术方案中，首先，获取待诊断用户设备的设备日志数据。

具体地，在步骤120中，基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量。考虑到由于所述设备日志数据中存在有较多的数据类型，这些数据类型中有的数据符合预设规则库的条件设定，有的则不符合，虽然能够基于所述设备日志数据中各个类型的数据信息与所述预设规则库进行比较来分别判断其是否符合预定标准，以此来判断其是否发生此类故障。但是由于所述设备日志数据中的各个类型的数据信息间具有着关联性，并且这种关联性在不同的数据类型跨度下具有着不同的关联程度，导致该故障检测的方法精度较低，进而降低了运维质量和效率。因此，在本申请的技术方案中，为了提高对于故障类型判断的精准度，需要对于所述设备日志数据中的各个类型数据是否符合预定标准间的关联特征进行深度挖掘。

具体地，在步骤130中，将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量。接着，考虑到由于所述设备日志数据中的各个类型的数据信息间在不同的数据类型跨度下具有着不同的程度的关联特性信息，因此，在本申请的技术方案中，进一步将所述设备日志二值化输入向量通过多尺度邻域特征提取模块中进行特征挖掘，以提取出所述设备日志数据中的各个类型数据信息在不同数据类型跨度下的多尺度邻域关联特征信息，从而得到设备日志二值化特征向量。这样，能够基于数据间的关联特征来对于所述设备日志数据中的各个类型数据是否符合预定条件设定进行准确地判断，从而对于是否属于该类故障类型进行准确地诊断。

其中，所述多尺度邻域特征提取模块，包括：相互并行的第一卷积层和第二卷积层，以及，与所述第一卷积层和所述第二卷积层连接的多尺度融合层，其中，所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。

将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量，包括：使用所述多尺度邻域特征提取模块的第一卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第一尺度特征向量，其中，所述第一卷积层具有第一长度的第一一维卷积核；其中，所述公式为：

；

其中，a为第一卷积核在x方向上的宽度、

为第一卷积核参数向量、/>

为与卷积核函数运算的局部向量矩阵，w为第一卷积核的尺寸，X表示所述设备日志二值化输入向量；使用所述多尺度邻域特征提取模块的第二卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第二尺度特征向量，其中，所述第二卷积层具有第二长度的第二一维卷积核，所述第一长度不同于所述第二长度；

其中，所述公式为：

；

其中，b为第二卷积核在x方向上的宽度、

为第二卷积核参数向量、/>

值得一提的是，相较于传统的特征工程，所述多尺度邻域特征提取模块本质上是一个基于深度学习的深度神经网络模型，其能够通过预定训练策略来拟合任何函数功能，且具有更高的特征提取泛化能力。

所述多尺度邻域特征提取模块包含多个并行的一维卷积层，其中，在所述多尺度邻域特征提取模块进行特征提取的过程中，所述多个并行的一维卷积层分别以具有不同尺度的一维卷积核对输入数据进行一维卷积编码以捕捉序列局部隐含特征。

具体地，在步骤140中，对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量。接着，考虑到由于所述待诊断用户设备的设备日志数据是由多个词和数字数据组成的，且各个词以及数字数据之间具有着上下文的语义关联特征信息。

因此，为了能够提取出所述待诊断用户设备的设备日志数据中的语义关联特征信息，以对于所述待诊断用户设备的设备日志数据进行准确地语义理解，在本申请的技术方案中，进一步对所述待诊断用户设备的设备日志数据进行分词处理以避免后续进行语义特征提取时词序混乱后，将分词处理后的日志数据通过包含嵌入层的上下文编码器中进行语义编码，以提取出所述待诊断用户设备的设备日志数据中基于全局的上下文语义关联特征信息，从而得到设备日志语义理解特征向量。

图4为根据本申请实施例的基于规则库的自动化运维方法中步骤140的子步骤的流程图，如图4所示，对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量，包括：141，对所述设备日志数据进行分词处理以将所述设备日志数据转化为由多个词组成的词序列；142，使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列；以及，143，使用所述包含嵌入层的上下文编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述设备日志语义理解特征向量。

图5为根据本申请实施例的基于规则库的自动化运维方法中步骤143的子步骤的流程图，如图5所示，使用所述包含嵌入层的上下文编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述设备日志语义理解特征向量，包括：1431，将所述词向量的序列进行一维排列以得到全局词特征向量；1432，计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵；1433，分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；1434，将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；以及，1435，分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述设备日志语义理解特征向量。

应可以理解，上下文编码器旨在挖掘得到词序列中上下文之间的隐藏模式，可选地，编码器包括：CNN(Convolutional Neural Network，卷积神经网络)、Recursive NN(RecursiveNeural Network，递归神经网络)、语言模型(Language Model)等。基于CNN的方法对于局部特征有比较好的提取效果，但其对于句子中的长程依赖(Long-termDependency)问题效果欠佳，因此基于Bi-LSTM(Long Short- Term Memory，长短期记忆网络)的编码器被广泛使用。Recursive NN把句子当作树状结构而非序列进行处理，从理论上而言具有更强的表示能力，但其存在样本标注难度大、深层易梯度消失、难以并行计算等弱点，因此在实际应用中使用较少。Transformer是应用广泛的网络结构了，同时具有CNN和RNN的特性，对于全局特征有较好的提取效果，同时相较于RNN(RecurrentNeural Network，循环神经网络)在并行计算上具有一定优势。

具体地，在步骤150中，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量。进一步地，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量，以此来融合所述待诊断用户设备的设备日志数据的上下文语义理解特征和所述设备日志数据中的各个类型数据是否符合预定条件设定间的关联特征的关联性特征分布信息，并以此作为分类特征向量通过分类器中进行分类处理，从而得到用于表示待诊断设备的故障类型标签的分类结果。

作为源向量，将所述设备日志二值化特征向量，例如记为/>

。

也就是，融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量，包括：将所述设备日志语义理解特征向量作为源向量且将所述设备日志二值化特征向量作为响应向量，以如下公式计算所述设备日志二值化特征向量和所述设备日志语义理解特征向量之间的非相干稀疏响应融合以得到所述分类特征向量；其中，所述公式为：

；

其中，

、/>

和/>

和/>

分别表示向量的一范数和二范数，/>

为向量的长度，/>

和/>

表示向量的转置向量。

具体地，在步骤160中，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签。也就是，在本申请的技术方案中，所述分类器的标签是所述待诊断设备的故障类型标签，其中，所述分类器通过软最大值函数来确定所述分类特征向量属于哪个分类标签。应可以理解，在本申请的技术方案中，所述分类器的分类标签为所述待诊断设备的故障类型标签，因此，在得到所述分类结果后，可基于所述分类结果来快速且准确地进行设备故障类型的诊断，从而根据设备不同的故障类型来对不同设备进行不同程度的维护，以提高运维质量和效率。

图6为根据本申请实施例的基于规则库的自动化运维方法中步骤160的子步骤的流程图，如图6所示，将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签，包括：161，使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，162，将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

在本申请一具体示例中，使用所述分类器以如下公式对所述分类特征向量进行处理以获得分类结果；其中，所述公式为：

，其中，/>

到/>

为权重矩阵，/>

到/>

为偏置向量，/>

为所述分类特征向量。

综上，基于本申请实施例的基于规则库的自动化运维方法100被阐明，其获取待诊断用户设备的设备日志数据；采用基于深度学习的人工智能技术，挖掘用户设备的设备日志数据的上下文语义理解特征以及各个类型数据是否符合预定条件设定间的关联特征信息，基于此来快速且准确地进行设备故障类型的诊断。这样，可以根据设备不同的故障类型来对不同设备进行不同程度的维护，进而提高运维质量和效率。

在本申请的一个实施例中，图7为根据本申请实施例的基于规则库的自动化运维系统的框图。如图7所示，根据本申请实施例的基于规则库的自动化运维系统200，包括：数据获取模块210，用于获取待诊断用户设备的设备日志数据；二值化转化模块220，用于基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量；多尺度特征提取模块230，用于将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量；上下文编码器模块240，用于对所述设备日志数据进行分词处理后通过包含嵌入层的上下文编码器以得到设备日志语义理解特征向量；融合模块250，用于融合所述设备日志二值化特征向量和所述设备日志语义理解特征向量以得到分类特征向量；以及，故障类型分类模块260，用于将所述分类特征向量通过分类器以得到分类结果，所述分类结果用于表示待诊断设备的故障类型标签。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述二值化转化模块，用于：响应于所述设备日志数据中的条件符合预设规则库中的条件设定，将对应条件部分设置为1；以及，所述设备日志数据中的条件不符合预设规则库中的条件设定，将对应条件部分设置为0。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述多尺度邻域特征提取模块，包括：相互并行的第一卷积层和第二卷积层，以及，与所述第一卷积层和所述第二卷积层连接的多尺度融合层，其中，所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述多尺度特征提取模块，包括：第一尺度单元，用于使用所述多尺度邻域特征提取模块的第一卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第一尺度特征向量，其中，所述第一卷积层具有第一长度的第一一维卷积核；其中，所述公式为：

；

其中，a为第一卷积核在x方向上的宽度、

为第一卷积核参数向量、/>

为与卷积核函数运算的局部向量矩阵，w为第一卷积核的尺寸，X表示所述设备日志二值化输入向量；第二尺度单元，用于使用所述多尺度邻域特征提取模块的第二卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第二尺度特征向量，其中，所述第二卷积层具有第二长度的第二一维卷积核，所述第一长度不同于所述第二长度；其中，所述公式为：

；

其中，b为第二卷积核在x方向上的宽度、

为第二卷积核参数向量、/>

为与卷积核函数运算的局部向量矩阵，m为第二卷积核的尺寸，X表示所述设备日志二值化输入向量；以及，级联单元，用于将所述第一尺度特征向量和所述第二尺度特征向量进行级联以得到所述设备日志二值化特征向量。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述上下文编码器模块，包括：分词单元，用于对所述设备日志数据进行分词处理以将所述设备日志数据转化为由多个词组成的词序列；词映射单元，用于使用所述包含嵌入层的上下文编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列；以及，上下文编码单元，用于使用所述包含嵌入层的上下文编码器对所述词向量的序列进行基于全局的上下文语义编码以获得所述设备日志语义理解特征向量。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述上下文编码单元，包括：一维排列子单元，用于将所述词向量的序列进行一维排列以得到全局词特征向量；计算子单元，用于计算所述全局词特征向量与所述词向量的序列中各个词向量的转置向量之间的乘积以得到多个自注意力关联矩阵；标准化处理子单元，用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵；激活子单元，用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值；以及，加权子单元，用于分别以所述多个概率值中各个概率值作为权重对所述词向量的序列中各个词向量进行加权以得到所述设备日志语义理解特征向量。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述融合模块，用于：将所述设备日志语义理解特征向量作为源向量且将所述设备日志二值化特征向量作为响应向量，以如下公式计算所述设备日志二值化特征向量和所述设备日志语义理解特征向量之间的非相干稀疏响应融合以得到所述分类特征向量；其中，所述公式为：

；

其中，

、/>

和/>

和/>

分别表示向量的一范数和二范数，/>

为向量的长度，/>

和/>

表示向量的转置向量。

在一个具体示例中，在上述基于规则库的自动化运维系统中，所述故障类型分类模块，包括：全连接编码单元，用于使用所述分类器的多个全连接层对所述分类特征向量进行全连接编码以得到编码分类特征向量；以及，分类结果单元，用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。

这里，本领域技术人员可以理解，上述基于规则库的自动化运维系统中的各个单元和模块的具体功能和操作已经在上面参考图1到图6的基于规则库的自动化运维方法的描述中得到了详细介绍，并因此，将省略其重复描述。

如上所述，根据本申请实施例的基于规则库的自动化运维系统100可以实现在各种终端设备中，例如用于基于规则库的自动化运维的服务器等。在一个示例中，根据本申请实施例的基于规则库的自动化运维系统100可以作为一个软件模块和/或硬件模块而集成到终端设备中。例如，该基于规则库的自动化运维系统100可以是该终端设备的操作系统中的一个软件模块，或者可以是针对于该终端设备所开发的一个应用程序；当然，该基于规则库的自动化运维系统100同样可以是该终端设备的众多硬件模块之一。

替换地，在另一示例中，该基于规则库的自动化运维系统100与该终端设备也可以是分立的设备，并且基于规则库的自动化运维系统100可以通过有线和/或无线网络连接到该终端设备，并且按照约定的数据格式来传输交互信息。

本申请还提供了一种计算机程序产品，所述计算机程序产品包括指令，当所述指令被执行时，以使得装置执行对应于上述方法中的操作。

在本申请的一个实施例中，还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有执行上述所述方法的计算机程序。

应可以理解，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等) 上实施的计算机程序产品的形式。

本申请实施例的方法、系统、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。

以上结合具体实施例描述了本申请的基本原理，但是，需要指出的是，在本申请中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

还需要指出的是，在本申请的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的，并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此，本申请不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种基于规则库的自动化运维方法，其特征在于，包括：

获取待诊断用户设备的设备日志数据；

2.根据权利要求1所述的基于规则库的自动化运维方法，其特征在于，基于预设规则库，对所述设备日志数据进行二值化转化以得到设备日志二值化输入向量，包括：响应于所述设备日志数据中的条件符合预设规则库中的条件设定，将对应条件部分设置为1；以及，所述设备日志数据中的条件不符合预设规则库中的条件设定，将对应条件部分设置为0。

3.根据权利要求2所述的基于规则库的自动化运维方法，其特征在于，所述多尺度邻域特征提取模块，包括：相互并行的第一卷积层和第二卷积层，以及，与所述第一卷积层和所述第二卷积层连接的多尺度融合层，其中，所述第一卷积层和所述第二卷积层使用具有不同尺度的一维卷积核。

4.根据权利要求3所述的基于规则库的自动化运维方法，其特征在于，将所述设备日志二值化输入向量通过多尺度邻域特征提取模块以得到设备日志二值化特征向量，包括：

使用所述多尺度邻域特征提取模块的第一卷积层以如下公式对所述设备日志二值化输入向量进行一维卷积编码以得到第一尺度特征向量，其中，所述第一卷积层具有第一长度的第一一维卷积核；

其中，所述公式为：