CN113065356B

CN113065356B - 一种基于语义分析算法的it设备运维故障建议处理方法

Info

Publication number: CN113065356B
Application number: CN202110296648.8A
Authority: CN
Inventors: 钟保强; 钟建栩; 佘俊; 谭毅恺; 董天波; 王伟; 朱磊; 鞠耀东
Original assignee: Information Communication Branch of Peak Regulation and Frequency Modulation Power Generation of China Southern Power Grid Co Ltd
Current assignee: Information Communication Branch of Peak Regulation and Frequency Modulation Power Generation of China Southern Power Grid Co Ltd
Priority date: 2021-03-19
Filing date: 2021-03-19
Publication date: 2023-10-31
Anticipated expiration: 2041-03-19
Also published as: CN113065356A

Abstract

本发明公开了一种基于语义分析算法的IT设备运维故障建议处理方法，获取IT设备运维的故障缺陷数据，对故障缺陷数据进行分类并根据分类信息生成故障知识图谱，根据故障知识图谱提取缺陷数据的缺陷描述过程，将缺陷描述过程生成缺陷处理问题，根据缺陷处理问题对应排布成一个故障缺陷描述‑缺陷处理问题模型，利用语义分析对故障缺陷描述‑缺陷处理问题模型中的每个IT设备故障缺陷数据样本进行训练，获取IT设备故障缺陷的处理建议，然后搜索与缺陷处理问题对应的缺陷处理建议，将搜索的缺陷处理建议进行排序和筛选，并对排序和筛选的处理建议进行推送。本发明的处理方法提高了IT设备缺陷处理建议的完整性和准确性。

Description

一种基于语义分析算法的IT设备运维故障建议处理方法

技术领域

本申请属于设备故障处理技术领域，尤其涉及一种基于语义分析算法的IT设备运维故障建议处理方法。

背景技术

随着集成信息处理技术的发展，IT设备的集成化水平越来越高，相关的IT设备故障检测、缺陷分析处理和特征分析究受到人们的极大关注；IT设备作为信息化产业的智能设备，其组成结构复杂，易出现多发性故障和缺陷，需要构建优化的IT设备缺陷处理模型，由于IT设备缺陷现象的背后往往存在多种可能的原因，直接利用“IT设备缺陷-缺陷处理建议”的端到端模型学习IT设备缺陷与缺陷处理建议的对应关系，缺乏对IT设备缺陷信息的联想，只能给出某一种可能的IT设备缺陷处理建议，无法完整全面地给出IT设备缺陷处理建议。为此，为实现对IT设备的缺陷类别辨识、特征分析和缺陷处理建议，对IT设备缺陷信息进行适当的联想和延伸以及研究并提出IT设备缺陷分析和提出相关缺陷处理建议，以提高IT设备缺陷处理建议推送的完整性和准确性、提高IT设备的输出工况稳定性，从而确保IT设备的正常稳定运行具有很高的现实意义。

发明内容

本发明的目的在于提供一种基于语义分析算法的IT设备运维故障建议处理方法，根据本发明的处理方法提高了IT设备缺陷处理建议的完整性和准确性。为了实现上述目的，本发明采用以下技术效果：

根据本发明的一个方面，提供一种基于语义分析算法的IT设备运维故障建议处理方法，获取IT设备运维的故障缺陷数据，对故障缺陷数据进行分类并根据分类信息生成故障知识图谱，根据故障知识图谱提取缺陷数据的缺陷描述过程，将缺陷描述过程生成缺陷处理问题，根据缺陷处理问题对应排布成一个故障缺陷描述-缺陷处理问题模型，利用语义分析对故障缺陷描述-缺陷处理问题模型中的每个IT设备故障缺陷数据样本进行训练，获取IT设备故障缺陷的处理建议，然后搜索与缺陷处理问题对应的缺陷处理建议，将搜索的缺陷处理建议进行排序和筛选，并对排序和筛选的处理建议进行推送。

上述方案进一步优选的，对搜索的缺陷处理建议进行排序和筛选获取超出一定阀值或排序靠近的缺陷处理建议，以获取完整的IT设备故障的缺陷处理建议，并完整推送IT设备故障的缺陷处理建议。

上述方案进一步优选的，利用语义分析方法对故障缺陷描述-缺陷处理问题模型的每个IT设备故障缺陷样本进行训练的过程包括：对IT设备故障缺陷描述与缺陷处理问题进行提问，并在每一次提问的前端插入一个开始标识符，在每一次提问的末端插入一个结束标识符，将始标识符和结束标识符作为一个词，基于各个词生成一个多维向量，收集多维向量作为学习问答网络的训练样本进行反复输入训练，生成多个不同的提问语句，根据提问语句对缺陷处理建议进行排序和筛选。

上述方案进一步优选的，基于各个词生成一个多维向量包括如下步骤：

步骤41：基于某一个IT设备故障缺陷描述包含N个词，每个词的词向量依次输入基于循环神经网络的编码层，编码层的每个单元采用门控循环单元GRU输出一个隐含层向量，则第N个词对应第n个门控循环单元GRU所输出的隐含层向量h_n满足；

h_n＝GRU(h_n-1,v_n)， (1)；

式中，GRU()为门控循环单元的运算函数，v_n为N个词对应的n维向量；

步骤42：提取第n个门控循环单元GRU的隐含层向量h_n作为解码层的输入，该解码层采用基于门控循环单元的循环神经网络结构，将隐含层向量h_n输入解码层的第1个循环神经网络结构GRU的同时，插入一个开始标识符对应的解码词向量w₀，并将第1个解码词向量w₀也输入解码层的第1个循环神经网络结构GRU，得到解码层第1个循环神经网络结构GRU的隐含层向量g₁，依次类推直至插入第m个开始标识符对应的解码词向量w_m，并将第m个解码词向量w_m也输入解码层的第m个循环神经网络结构GRU，得到第m个循环神经网络结构GRU输出的隐含层向量g_m，则解码层第m+1个循环神经网络结构GRU输出的隐含层向量g_m+1满足：

g_m+1＝GRU(g_m,w_m)， (2)；

其中，GRU()为门控循环单元的运算函数，w_m为解码层输出的第m个解码词的词向量；

步骤43：对第m个解码词对应的解码词向量w_m进行解码，并依次排列各个解码层输出的解码词，并将最后一个解码词删除，即为解码层输出的提问语句。

上述方案进一步优选的，对第m个解码词对应的解码词向量w_m进行解码的步骤为：

步骤51：计算第m个解码词对应解码词向量w_m属于每一种词类型的概率p_m,1、p _m,2和p _m,3，以及同时计算每种词类型对应的类型向量t_m,1、t _m,2、t _m,3；

步骤52：对将每种词类型对应的类型向量与对应的词类型概率相乘，再进行求和，得到最终的概率向量t_m；

步骤52：寻找出最终的概率向量t_m中数值大于0.3的维度，并在其中随机取一个维度，假设为第i维，则第m个循环神经网络结构GRU输出的词为词汇表中的第i个词，其词向量即为w_m，若输出的解码词为最后一个解码词，则停止求解；

上述方案进一步优选的，对每个IT设备故障缺陷样本进行训练包括如下步骤：

步骤61，构建文本段落排序网络，以根据提问语句进行缺陷处理建议的排序和筛选；对IT设备故障缺陷文本数据中每段文本的每个词依次输入到一个文本表示模块，所述文本表示模块提取每个词的3个特征，并将每个词转化为综合向量，然后对综合向量进行计算，输出对应的Z个词的预测向量；

步骤62，第一阶段预训练，对文本段落排序网络进行预训练；

步骤63，第二阶段预训练，对多个句子进行预测训练：

步骤630，对每段文本中所有连续的两个句子组成多个句子对，同时，将不连续的句子也两两随机组合，生成多个句子对：

步骤631，将分词后的句子对输入文本段落排序网络，句子对的第一个句子前加入一个分类标识符，句子对的两个句子之间再加入一个分隔标识符，分类标识符和分隔标识符都分别视为一个词，一并输入文本段落排序网络进行计算；

步骤632，经过文本段落排序网络计算，得到一组预测输出向量，其中第1个预测输出向量与分类标识符对应，在第1个预测输出向量之后接入一个softmax分类器，用于预测句子对中的两个句子为连续句子的第一预测概率；

步骤633，如果句子对的两个句子是连续句子，则训练输出第一标签概率值为1；反之，如果句子对的两个句子不是连续句子，则训练输出第一标签概率值为0，通过比较第一预测概率和第一标签概率的差异，对文本段落排序网络的参数进行调整，从而完成第二阶段预训练；

步骤64，经过第一阶段预训练和第二阶段预训练后，再针对具体的IT设备故障缺陷的处理建议推送任务对文本段落排序网络进行正式训练。

上述方案进一步优选的，在第一阶段预训练中，对文本段落排序网络进行预训练的过程如下：

步骤620，将IT设备故障缺陷文本数据按句进行切分，再对每个句子进行分词，将分词后的句子输入文本段落排序网络，在输入的句子中随机将其中的一个词替换为空标识符；

步骤621，假设将包含Z个词的句子的第z个词替换为空标识符，则将分词后的句子输入文本段落排序网络后，将得到一组向量输出，并在该组第z个向量之后接入一个softmax分类器，用于预测该组向量属于词汇表中各个词的概率，从而得到一个概率向量；

步骤622，对应于词汇表中第z个词的维度概率值为1，其他的维度概率值均为0，通过比较概率向量和标签向量的差异，对文本段落排序网络的参数进行调整，完成第一阶段预训练。

上述方案进一步优选的，在步骤64中，对文本段落排序网络进行正式训练的过程如下：

步骤640，构建对应于IT设备故障缺陷提问语句的缺陷处理建议，以便形成多个“提问语句-缺陷处理建议”句子对；同时，将不对应的IT设备故障缺陷提问语句和IT设备故障的缺陷处理建议进行两两随机组合，生成多个不对应句子对；

步骤641，对于每个句子对，在提问语句的第一个词之前加入一个分类标识符，在句子对的两个句子之间再加入一个分隔标识符，分类标识符和分隔标识符都分别视为一个词，一并输入文本段落排序网络；

步骤642，经过文本段落排序网络的计算，获得到一组预测输出向量，其中第1个预测输出向量与分类标识符对应；在第1个预测输出向量之后接入一个softmax分类器，用于预测句子对中IT设备故障缺陷的处理建议与IT设备缺陷提问语句对应的第二预测概率；

步骤643，如果句子对中IT设备缺陷处理建议与IT设备缺陷提问语句对应，则训练输出第二标签概率值为1；反之，如果句子对中IT设备缺陷处理建议与IT设备缺陷提问语句不对应，则训练输出的第二标签概率值为0，通过比较第二预测概率和第二标签概率的差异，对文本段落排序网络的参数进行调整，完成文本段落排序网络的正式训练；

步骤644，完成文本段落排序网络的训练后，再利用文本段落排序网络搜索生成的多个不同提问语句对应的IT设备缺陷处理建议，对于搜索的每个提问语句与预设的缺陷处理建议中所有缺陷处理建议语句进行配对，并组成句子对；

步骤645，在句子对提问语句的第一个词之前加入一个分类标识符，句子对的两个句子之间再加入一个分隔标识符，分类标识符和分隔标识符都分别视为一个词，一并输入训练好的文本段落排序网络进行计算，得到一组预测输出向量，其中，第一组预测输出向量与分类标识符对应，在第一组预测输出向量之后接入一个softmax分类器，用于预测句子对中IT设备缺陷处理建议与IT设备缺陷提问语句对应的概率值；并将概率值从大到小进行降序排列，并筛选出概率值大于0.8的缺陷处理建议；

步骤646，每一条IT设备缺陷描述的所有IT设备缺陷提问语句经过文本段落排序网络计算后，如果筛选之后输出的概率值大于0.8，则IT设备缺陷处理建议大于等于1条，且输出所有筛选后的IT设备缺陷处理建议；如果经过筛选之后输出的概率值小于等于0.8，则IT设备缺陷处理建议为0条，提取出概率值最大的5条缺陷处理建议进行输出，从而完成对一条IT设备缺陷描述的缺陷处理建议推送。

综上所述，由于本发明采用了上述技术方案，本发明具有以下技术效果：

本发明的处理方法针对IT设备缺陷描述生成多个问题通过学习问答网络进行训练，然后对每个问题，利用Passage Ranking网络构建包含提问机制的故障缺陷描述-缺陷解处理问题模型，利用提问机制先对IT设备缺陷信息进行适当的联想和延伸，搜索与问题对应的缺陷处理建议并进行排序，再根据提问查找对应的IT设备缺陷处理建议，筛选出超过一定阈值或排序靠前的缺陷处理建议，从而提高了IT设备缺陷处理建议的完整性和准确性。

附图说明

图1是本发明的一种基于语义分析算法的IT设备运维故障建议处理方法的流程图；

图2是本发明的学习问答网络的模型图；

图3是本发明的解码词向量的解码流程图；

图4是本发明的文本段落排序网络的模型结构图；

具体实施方式

为使本发明的目的、技术方案及优点更加清楚明白，以下参照附图并举出优选实施例，对本发明进一步详细说明。然而，需要说明的是，说明书中列出的许多细节仅仅是为了使读者对本发明的一个或多个方面有一个透彻的理解，即便没有这些特定的细节也可以实现本发明的这些方面。

结合图1，本发明提供了一种基于语义分析算法的IT设备运维故障建议处理方法，获取IT设备运维的故障缺陷数据，对故障缺陷数据进行分类并根据分类信息生成故障知识图谱，根据故障知识图谱提取缺陷数据的缺陷描述过程，根据缺陷描述过程生成缺陷处理问题，根据缺陷处理问题对应排布成一个故障缺陷描述-缺陷处理问题模型，利用语义分析对故障缺陷描述-缺陷处理问题模型中的每个IT设备故障缺陷数据样本进行训练，获取IT设备故障缺陷的处理建议，然后搜索与缺陷处理问题对应的缺陷处理建议，将搜索的缺陷处理建议进行排序和筛选，并对排序和筛选的处理建议进行推送，从而可以获取完整的IT设备故障的缺陷处理建议并对处理建议进行推送。在本发明中，对搜索的缺陷处理建议进行排序和筛选获取超出一定阀值或排序靠近的缺陷处理建议，以获取完整的IT设备故障的缺陷处理建议，并完整推送IT设备故障的缺陷处理建议。

在本发明中，利用语义分析方法对故障缺陷描述-缺陷处理问题模型的每个IT设备故障缺陷样本进行训练的过程包括：对IT设备故障缺陷描述与缺陷处理问题进行提问，并在每一次提问的前端插入一个开始标识符<start>，在每一次提问的末端插入一个结束标识符<end>，将始标识符<start>和结束标识符<end>作为一个词，基于各个词生成一个多维向量，例如，将各个词表示为100维的词向量，收集多维向量作为学习问答网络训练的样本进行反复输入训练，在故障知识图谱的缺陷数据的缺陷描述过程中，缺陷描述和相关提问的信息服务场景中，高质量缺陷描述-缺陷处理问题对是极为重要的数据。它一方面可以通过与用户提问语句的分析与匹配，直接展示满足用户的需求，另外也可以作为排序与筛选的训练数据。学习问答网络以根据自由文本就可以生成高质量的问答对；如图2所示，生成多个不同的提问语句，针对收集到用户IT设备故障缺陷描述与缺陷处理解决过程中对用户进行的相关提问，如缺陷描述为“电脑无法连接网络”或相关提问“是否可以连接内网”等，进行对应排布形成“故障缺陷描述-缺陷处理问题模型”作为样本，相关描述和提问如表1所示：

表1

表1中给出获取IT设备故障处理报告，例如处理设备型号，处理事件原因，处理事件描述，处理事件方法，处理事件结果等相关信息，按照具体信息进行故障数据信息分类和知识图谱可视化，根据故障知识图谱提取缺陷数据和获取故障处理问题，将缺陷描述过程生成缺陷处理问题，对搜索的缺陷处理建议进行排序和筛选获取超出一定阀值或排序靠近的缺陷处理建议，实际值超出阈值范围，或者波动幅度超出阈值，则进行推送处理建议给运维人员，并将相关处理建议录入缺陷处理建议库的日志中。根据日志分析每一台设备的故障频率，根据故障频率从而评价IT设备的健康度。

在本发明中，如图2所示，根据提问语句对缺陷处理建议进行排序和筛选，基于各个词生成一个多维向量包括如下步骤：

步骤41：基于某一个IT设备故障缺陷描述包含N个词，N为大于的整数，每个词的词向量依次为v₁、v₂、……、v_N，将每个词的词向量依次输入基于循环神经网络的编码层，编码层的每个单元采用门控循环单元(Gated Recurrent Unit，GRU)，编码层的每个单元采用门控循环单元GRU输出一个隐含层向量，则第N个词对应第n个门控循环单元GRU所输出的隐含层向量h_n满足；

h_n＝GRU(h_n-1,v_n)，(1)；

式中，GRU(·)为门控循环单元的运算函数，其中，n＝1，2，……，N；h_n-1为第n-1个门控循环单元GRU所输出的隐含层向量，v_n为N个词对应的n维向量，h₀为100维向量，采用随机初始化方法得到；

步骤42：提取第n个门控循环单元GRU的隐含层向量h_n作为解码层的输入，该解码层采用基于门控循环单元的循环神经网络结构，将隐含层向量h_n输入解码层的第1个循环神经网络结构GRU的同时，插入一个开始标识符<start>对应的解码词向量w₀，并将第1个解码词向量w₀也输入解码层的第1个循环神经网络结构GRU，得到解码层第1个循环神经网络结构GRU的隐含层向量g₁，其中隐含层向量g₁满足；

g₁＝GRU(h_n,w₀)，(2)；

依次类推直至插入第m(m＝1，2，……)个开始标识符对应的解码词向量w_m，并将第m个解码词向量w_m也输入解码层的第m个循环神经网络结构GRU，得到第m个循环神经网络结构GRU输出的隐含层向量g_m，则解码层第m+1个循环神经网络结构GRU输出的隐含层向量g_m+1满足：

g_m+1＝GRU(g_m,w_m)，(3)；

其中，GRU(·)为门控循环单元的运算函数，w_m为解码层输出的第m个解码词的词向量；

步骤43：对第m个解码词对应的解码词向量w_m进行解码，并依次排列各个解码层输出的解码词，并将最后一个解码词删除，即为解码层输出的提问语句；

其中，在本发明中，如图3所示，对第m个解码词对应的解码词向量w_m进行解码的步骤为：

步骤51：计算第m个解码词对应解码词向量w_m属于每一种词类型的概率p_m,1、p_m,2和p_m,3，即将解码词分为三类(主体词、疑问词和普通词)，以及同时计算每种词类型对应的类型向量t_m,1、t_m,2、t_m,3；

[p_m,1,p_m,2,p_m,3]^T＝softmax(Wg_m+b)， (4)；

式中，W为3×100的权重矩阵，b为3×1的偏置向量，W和b中各个元素的值都可在训练中自动学习得到；p_m,1表示第m个解码词属于主体词(表示缺陷设备主体的词，如“电脑”、“主机”等)的概率，p_m,2表示第m个解码词属于疑问词(表示疑问意义的词，如“什么”、“多少”等)的概率，p_m,3表示第m个解码词属于普通词(除主体词、疑问词以外的词)的概率，softmax(·)为归一化指数函数，T为向量的转置符号，通过如下公式计算每种词类型对应的类型向量t_m，1、t_m，2、t_m，3：

t_m,1＝softmax(W₁g_m+b₁)， (5)；

t_m,2＝softmax(W₂g_m+b₂)， (6)；

t_m,3＝softmax(W₃g_m+b₃)， (7)；

式中，W₁、W₂、W₃均为|V|×100的权重矩阵，b₁、b₂、b₃均为|V|×1的偏置向量，|V|为IT设备业务数据词汇表的词数，W₁、W₂、W₃和b₁、b₂、b₃中各个元素的值都可在训练中自动学习得到；t_1,1、t_1,2、t_1,3均为|V|×1的向量。

步骤52：对将每种词类型对应的类型向量与对应的词类型概率相乘，再进行求和，得到最终的概率向量t_m，其中概率向量t_m满足：

t_m＝p_m,1·t_m,1+p_m,2·t_m,2+p_m,3·t_m,3，(8)；

步骤52：寻找出最终的概率向量t_m中数值大于0.3的维度，并在其中随机取一个维度，假设为第i维，则第m个循环神经网络结构GRU输出的词为词汇表中的第i个词，其词向量即为w_m，若输出的解码词为<end>，则输出的解码词为最后一个解码词，则停止求解；假设已求得第m(m＝1，2，……)个循环神经网络结构GRU输出的隐含层向量g_m，则解码层第m+1个GRU的隐含层向量输出g_m+1满足：

g_m+1＝GRU(g_m,w_m)；

式中，w_m即为解码层输出的第m个解码词的词向量。

在本发明中，如图3和图4所示，对每个IT设备故障缺陷样本进行训练包括如下步骤：

步骤61，构建文本段落排序网络，段落排序(Passage Ranking)网络又称PassageSelection、Passage Retrieval网络，目的是在给定问题的情况下，从相关的文本中排除不包含答案的段落、选取出包含答案的段落，段落排序(Passage Ranking)网络采用基于转换器的双向编码表示(Bidirectional Encoder Representations from Transformers，BERT，或Transformers编码器)模型进行搭建；对IT设备故障缺陷文本数据中每段文本的每个词依次输入到一个文本表示模块，文本表示模块提取每个词的3个特征，并将每个词转化为综合向量，每个词3个特征包括词义特征、句子特征和位置特征，其分别表示每个词本身的词义信息、每个词所属的句子信息以及每个词在句子中的位置，假设输入共包含Z个词，各个词所生成的综合向量依次为x₁、x₂、……、x_Z，然后对综合向量基于转换器的双向编码表示模型进行计算，也就是将综合向量x₁、x₂、……、x_Z依次输入BERT模型，利用BERT模型结构中双层的转换器(Transformer)，对综合特征向量x₁、x₂、……、x_Z进行计算，模型将输出对应的Z个预测向量，分别记为y₁、y₂、……、y_Z，输出对应的Z个词的预测向量；

步骤62，第一阶段预训练，对文本段落排序网络(Passage Ranking网络)进行预训练：

步骤620，将IT设备故障缺陷文本数据按句进行切分，再对每个句子进行分词，将分词后的句子输入文本段落排序网络，在输入的句子中随机将其中的一个词替换为空标识符<empty>；

步骤621，假设将包含Z个词的句子的第z个词替换为空标识符<empty>，则将分词后的句子输入文本段落排序网络后，将得到一组向量输出为y₁、y₂、……、y_Z，其中第z个向量y_z为第z个词对应的输出向量，并在该组第z个向量之后接入一个softmax分类器，用于预测该组向量y_z属于词汇表中各个词的概率，从而得到一个概率向量，如图3所示；

步骤622，由于向量y_z是对应于被替换的第z个词，所以其训练输出标签向量中，对应于词汇表中第z个词的维度概率值为1，其他的维度概率值均为0，通过比较概率向量和标签向量的差异，对文本段落排序网络的参数进行调整，可以采用反向传播(BackPropagation，BP)算法对文本段落排序网络(Passage Ranking网络)的参数进行调整，比如，调整综合向量x输入BERT后会乘以某个参数的值，再加上某个参数的值等等，从而完成第一阶段预训练；

步骤63，第二阶段预训练：

步骤631，将分词后的句子对输入文本段落排序网络(Passage Ranking网络)，句子对的第一个句子前加入一个分类标识符<cls>，句子对的两个句子之间再加入一个分隔标识符<sep>，分类标识符<cls>和分隔标识符<sep>都分别视为一个词，一并输入文本段落排序网络(Passage Ranking网络)进行计算；

步骤632，经过文本段落排序网络(Passage Ranking网络)计算，得到一组预测输出向量，其中第1个预测输出向量y₁与分类标识符<cls>对应，在第1个预测输出向量y₁之后接入一个softmax分类器，用于预测句子对中的两个句子为连续句子的第一预测概率；

步骤633，如果句子对的两个句子是连续句子，则训练输出的标签概率值为1；反之，如果句子对的两个句子不是连续句子，则训练输出的标签概率值为0，通过比较第一预测概率和标签概率的差异，对文本段落排序网络的参数进行调整，可以采用反向传播(BackPropagation，BP)算法对文本段落排序网络(Passage Ranking网络)的参数进行调整，从而完成第二阶段预训练；

步骤64，经过第一阶段预训练和第二阶段预训练后，再针对具体的IT设备故障缺陷的处理建议推送任务对文本段落排序网(Passage Ranking网络)进行正式训练，其训练过程如下：

步骤640，构建对应于IT设备故障缺陷提问语句的缺陷处理建议，从而形成多个“提问语句-缺陷处理建议”句子对，以便根据提语句进行缺陷处理建议的排序和筛选；同时，将不对应的IT设备故障缺陷提问语句和IT设备故障的缺陷处理建议进行两两随机组合，生成多个不对应句子对；

步骤641，对于每个句子对，在提问语句的第一个词之前加入一个分类标识符<cls>，在句子对的两个句子之间再加入一个分隔标识符<sep>，分类标识符<cls>和分隔标识符<sep>都分别视为一个词，一并输入文本段落排序网络(Passage Ranking网络)；

步骤642，经过文本段落排序网络(Passage Ranking网络)的计算，获得到一组预测输出向量，其中第1个预测输出向量y₁与分类标识符<cls>对应；在第1个预测输出向量y₁之后接入一个softmax分类器，用于预测句子对中IT设备故障缺陷的处理建议与IT设备缺陷提问语句对应的第二预测概率；

步骤643，对于训练输出的标签概率值，如果句子对中IT设备缺陷处理建议与IT设备缺陷提问语句对应，则训练输出第二标签概率值为1；反之，如果句子对中IT设备缺陷处理建议与IT设备缺陷提问语句不对应，则训练输出第二标签概率值为0，通过比较第二预测概率和第二标签概率的差异，对文本段落排序网络的参数进行调整，完成文本段落排序网的正式训练；

步骤645，在句子对提问语句的第一个词之前加入一个分类标识符<cls>，句子对的两个句子之间再加入一个分隔标识符<sep>，分类标识符<cls>和分隔标识符<sep>都分别视为一个词，一并输入训练好的文本段落排序网进行计算，得到一组预测输出向量，其中，第一组预测输出向量与分类标识符<cls>对应，在第一组(或第一个)预测输出向量之后接入一个softmax分类器，用于预测句子对中IT设备缺陷处理建议与IT设备缺陷提问语句对应的概率值；对于每个IT设备缺陷提问语句，记录各条缺陷处理建议与之对应的概率值，并将概率值从大到小进行降序排列，并筛选出概率值大于0.8的缺陷处理建议；

步骤646，每一条IT设备缺陷描述的所有IT设备缺陷提问语句经过文本段落排序网计算后，，如果筛选之后输出的概率值大于0.8，则IT设备缺陷处理建议大于等于1条，且输出所有筛选后的IT设备缺陷处理建议；如果经过筛选之后输出的概率值小于等于0.8，则筛选后的IT设备缺陷处理建议为0条，那么，提取出概率值最大的5条缺陷处理建议进行输出，否则筛选后就还有缺陷处理建议被保留下来，即大于等于1条，从而完成对一条IT设备缺陷描述的缺陷处理建议推送。

本发明的训练中，将句子对(问题和包含答案的长文本作)为输入，在利用语义分析方法进行深度匹配，输出与问题描述和处理问题的相关的建议，基于各个词生成一个多维向量，解决文本、段落或提问语句的结构限制，便于搜索语义相关性，最终输出包含答案语句(即为缺陷处理建议)，从而可对缺陷处理建议进行排序和筛选训练，从而获取最平稳或稳定的概率值，从而得到缺陷处理建议并同时进行缺陷任务推送，提高了IT设备缺陷处理建议的完整性和准确性。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种基于语义分析算法的IT设备运维故障建议处理方法，其特征在于：获取IT设备运维的故障缺陷数据，对故障缺陷数据进行分类并根据分类信息生成故障知识图谱，根据故障知识图谱提取缺陷数据的缺陷描述过程，将缺陷描述过程生成缺陷处理问题，根据缺陷处理问题对应排布成一个故障缺陷描述-缺陷处理问题模型，利用语义分析对故障缺陷描述-缺陷处理问题模型中的每个IT设备故障缺陷数据样本进行训练，获取IT设备故障缺陷的处理建议，然后搜索与缺陷处理问题对应的缺陷处理建议，将搜索的缺陷处理建议进行排序和筛选，并对排序和筛选的处理建议进行推送；

利用语义分析方法对故障缺陷描述-缺陷处理问题模型的每个IT设备故障缺陷样本进行训练的过程包括：对IT设备故障缺陷描述与缺陷处理问题进行提问，并在每一次提问的前端插入一个开始标识符，在每一次提问的末端插入一个结束标识符，将始标识符和结束标识符作为一个词，基于各个词生成一个多维向量，收集多维向量作为学习问答网络的训练样本进行反复输入训练，生成多个不同的提问语句，根据提问语句对缺陷处理建议进行排序和筛选；

基于各个词生成一个多维向量包括如下步骤：

h_n＝GRU(h_n-1,v_n)， (1)；

g_m+1＝GRU(g_m,w_m)， (2)；

对每个IT设备故障缺陷样本进行训练包括如下步骤：

步骤63，第二阶段预训练，对多个句子进行预测训练：

步骤64，经过第一阶段预训练和第二阶段预训练后，再针对具体的IT设备故障缺陷的处理建议推送任务对文本段落排序网络进行正式训练；其中，对文本段落排序网络进行正式训练的过程如下：

2.根据权利要求1所述的一种基于语义分析算法的IT设备运维故障建议处理方法，其特征在于：对搜索的缺陷处理建议进行排序和筛选，获取超出阀值或排序靠近的缺陷处理建议，以获取完整的IT设备故障的缺陷处理建议，并完整推送IT设备故障的缺陷处理建议。

3.根据权利要求1所述的一种基于语义分析算法的IT设备运维故障建议处理方法，其特征在于：对第m个解码词对应的解码词向量w_m进行解码的步骤为：

步骤51：计算第m个解码词对应解码词向量w_m属于每一种词类型的概率p_m,1、p _m,2和p_m,3，以及同时计算每种词类型对应的类型向量t_m,1、t _m,2、t _m,3；

步骤52：寻找出最终的概率向量t_m中数值大于0.3的维度，并在其中随机取一个维度，假设为第i维，则第m个循环神经网络结构GRU输出的词为词汇表中的第i个词，其词向量即为w_m，若输出的解码词为最后一个解码词，则停止求解。

4.根据权利要求1所述的一种基于语义分析算法的IT设备运维故障建议处理方法，其特征在于：在第一阶段预训练中，对文本段落排序网络进行预训练的过程如下：