WO2019210820A1

WO2019210820A1 - 一种信息输出方法及装置

Info

Publication number: WO2019210820A1
Application number: PCT/CN2019/084814
Authority: WO
Inventors: 饶思维; 刘裕良; 田光见
Original assignee: 华为技术有限公司
Priority date: 2018-05-03
Filing date: 2019-04-28
Publication date: 2019-11-07
Also published as: CN109902283B; CN109902283A

Abstract

本申请公开了一种信息输出方法及装置，其中，该方法包括：获取故障描述文本，故障描述文本用于描述网络中发生的故障；通过语义生成模型生成故障描述文本的语义向量；获取多种类型的目标数据的相关文本分别对应的语义向量，该目标数据用于协助分析故障产生的原因；计算故障描述文本的语义向量与每种目标数据的相关文本的语义向量的相关性；确定并输出第一数据，该第一数据为多种目标数据中语义向量与故障描述文本的语义向量的相关性最大的目标数据，或该第一数据为多种目标数据中语义向量与故障描述文本的语义向量的相关性大于预设阈值的目标数据。通过实施本申请的方法，能够准确地查找出与故障描述文本的相关的用于协助分析故障原因的数据。

Description

一种信息输出方法及装置

技术领域

本申请涉及通信技术领域，尤其涉及一种信息输出方法及装置。

背景技术

当网络设备出现故障时，会影响正常的通信，给人们的工作和生活带来严重损失，所以网络设备故障的及时修复非常重要。目前，当网络设备出现故障时，一线工程师会从故障发生现场收集用于协助分析故障原因的数据，例如，收集网络设备故障发生前后一段时间内的关键性能指标(KPI)、设备告警、设备日志等参数数据。并且一线工程师会对故障现象进行描述，得到故障描述文本。一线工程师将收集的KPI等数据和故障描述文本以故障工单的形式反馈给运维部门。运维工程师根据故障工单中的故障描述文本，凭借自身的专业知识，手动从一线收集的数据中选择出一些KPI、设备告警、设备日志等参数数据。进一步地，对选择出来的这些数据进行异常检测和相互佐证，从而分析出故障根因所在，对故障网络设备的修复提供指导性意见。这种通过人工手动从KPI、设备告警、设备日志等参数数据中选择出与故障描述文本相关的参数数据进行查看分析的故障检测方法，效率低速度慢，无法满足日益增加的网络需求。

现有技术中通过查找与故障描述文本具有相同的关键词的文本,并根据该文本的相关参数数据进行故障的查看分析。但相关性高的能用于协助分析故障原因的相关文本和故障描述文本中可能并没有相同的关键词。因此，通过现有的方式不能准确地查找到与故障描述文本相关联的用于协助分析故障原因的数据。

发明内容

本申请提供了一种信息输出方法及装置，能够自动地并准确地查找到与故障描述文本的相关的用于协助分析故障原因的数据。

第一方面，本申请提供了一种信息输出方法，该方法包括：获取故障描述文本，该故障描述文本用于描述网络中发生的故障；通过语义生成模型生成故障描述文本的语义向量；获取多种类型的目标数据的相关文本分别对应的语义向量，该目标数据用于协助分析故障产生的原因；计算故障描述文本的语义向量与每种目标数据的相关文本的语义向量的相关性；确定并输出第一数据，该第一数据为每种目标数据中语义向量与故障描述文本的语义向量的相关性最大的目标数据，或该第一数据为每种目标数据中语义向量与故障描述文本的语义向量的相关性大于预设阈值的目标数据。

本申请通过对比故障描述文本的语义向量与目标数据的相关文本的语义向量的相关性，可以准确地查找到与故障描述文本相关联的目标数据。比如，故障描述为“行业用户上网慢”，本申请分析出的与其相关的用于故障分析的关键性指标的名称为“下行带宽控制丢包比例”。可以看出，从字面上二者没有任何可以匹配和关联的成分，而本申请恰恰是通过语义分析挖掘学习到了“上网速度和丢包比例有关系”这样的领域知识，才实现了二者相关联的分析。因此，通过实施第一方面所描述的方法，能够自动地并且准确地查找出与故障描述文本的相关的用于协助分析故障原因的数据。

在一种可能的实施方式中，获取故障描述文本之前，还可通过语义生成模型生成多种类型的目标数据的相关文本分别对应的语义向量。

并且还可保存多种目标数据的相关文本分别对应的语义向量；相应地，获取多种目标数据的相关文本分别对应的语义向量的具体实施方式为：获取保存的多种目标数据的相关文本分别对应的语义向量。

通过实施该实施方式，可预先生成并保存多种目标数据的相关文本分别对应的语义向量，在接收故障描述文本之后，可直接用保存的多种目标数据的相关文本分别对应的语义向量与故障描述文本的语义向量进行相关性计算，从而不用在接收故障描述文本之后，临时生成多种目标数据的相关文本分别对应的语义向量。可见，通过实施该实施方式，有利于快速地计算得到故障描述文本的语义向量与每种目标数据的相关文本的语义向量的相关性。

在一种可能的实施方式中，上述语义生成模型是根据历史故障描述文本对应的词向量矩阵训练生成的，该词向量矩阵包括历史故障描述文本中各个词对应的词向量，该词向量用于表示词的语义。

通过实施该实施方式训练得到的语义生成模型，能够更加准确地表达文本的语义。

在一种可能的实施方式中，上述多种类型的目标数据包括关键性能指标、设备告警、设备日志中的至少两种；当上述目标数据为关键性能指标时，该目标数据的相关文本为关键性能指标的名称；当上述目标数据为设备告警时，该目标数据的相关文本为设备告警的标识；当上述目标数据为设备日志时，该目标数据的相关文本为设备日志的内容片段。

第二方面，本申请提供了一种语义生成模型的训练方法，该方法包括：获取训练文本对应的词向量集合，该词向量集合中包括的词向量与训练文本中的词一一对应，该词向量用于表示词的语义；根据词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵；根据词向量矩阵训练得到语义生成模型，该语义生成模型用于生成文本的语义向量。

可选的，获取训练文本对应的词向量集合之后，可将训练文本对应的词向量集合进行保存，以便后续使用词向量集合中的词向量。

可见，第二方面所描述的方法是从词汇层面的语义向句子层面的语义逐步建模得到语义生成模型，这种语义生成模型训练方式是符合语言生成的基本原理的。因此，通过实施第二方面所描述的方法训练得到的语义生成模型，能够更加准确地表达文本的语义。

在一种可能的实施方式中，根据词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵的具体实施方式为：对历史故障描述文本进行分词处理，得到历史故障描述文本对应的由至少一个词组成的词序列；从词向量集合中获取词序列包括的词对应的词向量；将词序列包括的各个词对应的词向量组成词向量矩阵。

通过实施该实施方式，可准确地将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵。

在一种可能的实施方式中，当词向量集合中不存在词序列包括的词对应的词向量时，生成随机向量作为词序列包括的词对应的词向量。

在一种可能的实施方式中，根据词向量矩阵训练得到语义生成模型的具体实施方式为：获取历史故障描述文本对应的故障设备类型；根据词向量矩阵和类别标签训练分类模型，该类别标签包括该故障设备类型；根据分类模型得到语义生成模型。

在一种可能的实施方式中，根据词向量矩阵和类别标签训练分类模型的具体实施方式为：将词向量矩阵和类别标签输入神经网络进行迭代训练，在每次迭代训练时对输入神经网络的词向量矩阵中的词向量和神经网络的参数进行调整，以生成该分类模型。通过该实施方式训练得到的语义生成模型，能够更加准确地表达文本的语义。

可选的，还可将使用最后一次迭代训练输入的词向量矩阵中的词向量更新词向量集合中相应词对应的词向量。通过实施该实施方式，能够根据带有领域知识的历史故障描述文本语料修正词向量集合中的词向量，使词向量集合中的词向量更能表达领域知识的词的语义信息。

第三方面，提供了一种信息输出装置，该信息输出装置可执行上述第一方面或第一方面可能的实施方式中的方法。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的单元。该单元可以是软件和/或硬件。基于同一发明构思，该信息输出装置解决问题的原理以及有益效果可以参见上述第一方面或第一方面可能的实施方式中以及有益效果，重复之处不再赘述。

第四方面，提供了一种模型训练装置，该模型训练装置可执行上述第二方面或第二方面可能的实施方式中的方法。该功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。该硬件或软件包括一个或多个与上述功能相对应的单元。该单元可以是软件和/或硬件。基于同一发明构思，该模型训练装置解决问题的原理以及有益效果可以参见上述第二方面或第二方面可能的实施方式中以及有益效果，重复之处不再赘述。

第五方面，提供了一种信息输出装置，该信息输出装置包括：处理器、存储器、通信接口；处理器、通信接口和存储器相连；其中，通信接口可以为收发器。通信接口用于实现与其他网元之间的通信。其中，一个或多个程序被存储在存储器中，该处理器调用存储在该存储器中的程序以实现上述第一方面或第一方面可能的实施方式中的方案，该信息输出装置解决问题的实施方式以及有益效果可以参见上述第一方面或第一方面可能的实施方式以及有益效果，重复之处不再赘述。

第六方面，提供了一种模型训练装置，该模型训练装置包括：处理器、存储器、通信接口；处理器、通信接口和存储器相连；其中，通信接口可以为收发器。通信接口用于实现与其他网元之间的通信。其中，一个或多个程序被存储在存储器中，该处理器调用存储在该存储器中的程序以实现上述第二方面或第二方面可能的实施方式中的方案，该模型训练装置解决问题的实施方式以及有益效果可以参见上述第二方面或第二方面可能的实施方式以及有益效果，重复之处不再赘述。

第七方面，提供了一种计算机程序产品，当其在计算机上运行时，使得计算机执行上述第一方面、第二方面、第一方面的可能的实施方式或第二方面的可能的实施方式中的方法。

第八方面，提供了一种信息输出装置的芯片产品，执行上述第一方面或第一方面的任意可能的实施方式中的方法。

第九方面，提供了一种模型训练装置的芯片产品，执行上述第二方面或第二方面的任意可能的实施方式中的方法。

第十方面，提了供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第一方面的方法或第一方面的可能的实施方式中的方法。

第十一方面，提了供一种计算机可读存储介质，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述第二方面的方法或第二方面的可能的实施方式中的方法。

附图说明

图1是本申请实施例提供的一种信息输出方法的流程示意图；

图2是本申请实施例提供的一种语义生成模型的训练方法的流程示意图；

图3是本申请实施例提供的一种CBOW算法采用的神经网络的示意图；

图4是本申请实施例提供的一种用于训练分类模型的神经网络的结构示意图；

图5是本申请实施例提供的一种信息输出装置的结构示意图；

图6是本申请实施例提供的一种模型训练装置的结构示意图；

图7是本申请实施例提供的另一种信息输出装置的结构示意图；

图8是本申请实施例提供的另一种模型训练装置的结构示意图。

具体实施方式

下面结合附图对本申请具体实施例作进一步的详细描述。

本申请实施例提供了一种信息输出方法及装置，能够自动确定并输出与故障描述文本的相关的用于协助分析故障原因的数据。

以下对本申请所提供的信息输出方法及装置进行详细地介绍。

请参见图1，图1是本申请实施例提供的一种信息输出方法的流程示意图。如图1所示，该信息输出方法包括如下101～105部分，其中：

101、信息输出装置获取故障描述文本。

其中，故障描述文本为对故障现象进行描述的文本，即故障描述文本用于描述网络中发生的故障。例如，故障描述文本可以为“行业用户上网慢”、“在线计费服务器(online charging system，OCS)通讯中断”等。故障描述文本可以是其他装置发送给信息输出装置的。例如，一线工程师对故障现象进行描述，得到故障描述文本，并将收集的用于协助分析故障原因的数据(如关键性能指标等)和故障描述文本以故障工单的形式发送给运维部门的信息输出装置。

102、信息输出装置通过语义生成模型生成故障描述文本的语义向量。

在一种可能的实施方式中，语义生成模型可以是根据历史故障描述文本对应的词向量矩阵训练生成的，该词向量矩阵包括历史故障描述文本中各个词对应的词向量。

可选的，语义生成模型的训练方法具体可参见下图2所描述的语义生成模型的训练方法。也就是说，信息输出装置所使用的语义生成模型可以是下图2中模型训练装置训练的语义生成模型。图1中的信息输出装置和图2中的模型训练装置可部署在同一设备或部署在不同的设备。当图1中的信息输出装置和图2中的模型训练装置部署在不同的设备中时，模型训练装置训练完语义生成模型之后可发送语义生成模型至信息输出装置，从而信息输出装置可通过接收的语义生成模型生成故障描述文本的语义向量。当图1中的信息输出装置和图2中的模型训练装置部署在相同的设备中时，信息输出装置可从模型训练装置中获取语义生成模型，从而信息输出装置可通过语义生成模型生成故障描述文本的语义向量。

当然语义生成模型也可以不通过图2所描述的方式训练生成，也可通过其他方式训练生成，本申请实施例不做限定。

在一种可能的实施方式中，信息输出装置通过语义生成模型生成故障描述文本的语义向量的具体实施方式为：

信息输出装置根据词向量集合将故障描述文本转换为词向量矩阵，再将词向量矩阵输入语义生成模型，以生成故障描述文本的语义向量，其中，该词向量集合中包括多个词向量。可选的，该词向量集合可以是下图2中的模型训练装置生成并发送至信息输出装置的。

可选的，信息输出装置根据词向量集合将故障描述文本转换为词向量矩阵的具体实施方式为：信息输出装置对故障描述文本进行分词处理，得到故障描述文本对应的由至少一个词组成的词序列；从词向量集合中获取该词序列包括的词对应的词向量；将该词序列包括的各个词对应的词向量组成故障描述文本的词向量矩阵。当词向量集合中不存在该词序列包括的词对应的词向量时，生成随机向量作为该词序列包括的词对应的词向量。

举例来说，故障描述文本包括4个词，对故障描述文本进行分词处理得到的词序列为“行业”、“用户”、“上网”、“慢”。信息输出装置从词向量集合中查找到“行业”对应词向量1、“用户”对应词向量2、“上网”对应词向量3，未查找到“慢”对应的词向量，则生成随机向量词向量4作为“慢”对应的词向量。信息输出装置将词向量1～4组成故障描述文本的词向量矩阵。再将该词向量矩阵输入语义生成模型中生成故障描述文本的语义向量。

103、信息输出装置获取多种类型的目标数据的相关文本分别对应的语义向量。

其中，该目标数据用于协助分析故障产生的原因。其中，103部分和102部分的执行顺序可以不分先后，可先执行102部分再执行103部分，或可先执行103部分再执行102部分。

在一种可能的实施方式中，该多种类型的目标数据包括关键性能指标(KPI)、设备告警、设备日志中的至少两种；当目标数据为关键性能指标时，该目标数据的相关文本为关键性能指标的名称；当目标数据为设备告警时，该目标数据的相关文本为设备告警的标识；当目标数据为设备日志时，该目标数据的相关文本为设备日志的内容片段。其中，每种类型的目标数据为多个。

例如，该多种类型的目标数据包括关键性能指标和设备告警。上述的多种类型的目标数据为100个不同的关键性能指标和20个不同的设备告警，100个关键性能指标分别为关键性能指标1～关键性能指标100。20个设备告警分别为设备告警1～20。信息输出装置获取的多种类型的目标数据的相关文本分别对应的语义向量为关键性能指标1～关键性能指标100的名称分别对应的语义向量，以及设备告警1～20的标识分别对应的语义向量。也就是说，信息输出装置会获取120个语义向量。

在一种可能的实施方式中，信息输出装置可在接收故障描述文本之前，通过语义生成模型生成多种类型的目标数据的相关文本分别对应的语义向量。

可选的，信息输出装置生成多种类型的目标数据的相关文本分别对应的语义向量之后，可保存该多种类型的目标数据的相关文本分别对应的语义向量。在接收故障描述文本之后，就可获取保存该多种目标数据的相关文本分别对应的语义向量，以便与故障描述文本的语义向量进行相关性计算。通过实施该实施方式，可预先生成并保存多种目标数据的相关文本分别对应的语义向量，在接收故障描述文本之后，可直接用保存的多种目标数据的相关文本分别对应的语义向量与故障描述文本的语义向量进行相关性计算，从而不用在接收故障描述文本之后，临时生成多种目标数据的相关文本分别对应的语义向量。可见，通过实施该实施方式，有利于快速地计算得到故障描述文本的语义向量与每种目标数据的相关文本的语义向量的相关性。

在一种可能的实施方式中，信息输出装置通过语义生成模型生成目标数据的相关文本对应的语义向量的原理与信息输出装置通过语义生成模型生成故障描述文本的语义向量的原理相同，在此不赘述。

104、信息输出装置计算故障描述文本的语义向量与每种目标数据的相关文本的语义向量的相关性。

举例来说，具有两种类型的目标数据，分别为100个不同的关键性能指标和20个不同的设备告警，100个关键性能指标分别为关键性能指标1～关键性能指标100。20个设备告警分别为设备告警1～20。信息输出装置计算故障描述文本的语义向量分别与100个关键性能指标的相关文本的语义向量的相关性，以及计算故障描述文本的语义向量分别与20个设备告警的相关文本的语义向量的相关性。因此，会得到120个相关性。

在一种可能的实施方式中，可采用向量的夹角来作为相关性的衡量，故障描述文本的语义向量与目标数据的相关文本的语义向量的相关性可表示为：

其中，cos(θ)为故障描述文本的语义向量与目标数据的相关文本的语义向量的相关性，n为故障描述文本和目标数据的相关文本的语义向量的维度数量，x _i为故障描述文本第i维的语义向量，y _i目标数据的相关文本第i维的语义向量。

105、信息输出装置确定并输出第一数据。

其中，在信息输出装置计算故障描述文本的语义向量与每种目标数据中的每种目标数据的相关文本的语义向量的相关性之后，信息输出装置确定并输出第一数据，该第一数据为该每种目标数据中语义向量与故障描述文本的语义向量相关性最大的目标数据，或该第一数据为该每种目标数据中语义向量与故障描述文本的语义向量相关性大于预设阈值的目标数据。

例如，获取的两种类型的目标数据，分别为100个不同的关键性能指标和20个不同的设备告警，100个关键性能指标分别为关键性能指标1～关键性能指标100。20个设备告警分别为设备告警1～设备告警20。故障描述文本的语义向量与关键性能指标1～关键性能指标100的相关文本的语义向量的相关性为分别为相关性1～100。相关性1为最大的相关性，则信息输出装置输出关键性能指标1。故障描述文本的语义向量与设备告警1～设备告警20的相关文本的语义向量的相关性分别为相关性101～120。相关性120为最大的相关性，则信息输出装置输出设备告警20。

再如，相关性1和相关性2为大于预设阈值的相关性，则信息输出装置输出关键性能指标1和关键性能指标2。相关性101和相关性102为大于预设阈值的相关性，则信息输出装置输出设备告警1和设备告警2。

语义向量与故障描述文本的语义向量相关性越大的目标数据，说明该目标数据与故障描述文本越相关，用户可能需要查看该目标数据以分析故障原因。例如，故障描述文本为“ocs通讯中断”，关键性指标的名称为“ocs通讯中断次数”，该故障描述文本的语义向量与关键性指标的名称的语义向量相关性很大，用户可能需要查看该关键性指标以分析故障原因。可见，通过实施图1所描述的方法，能够自动查找到与故障描述文本的相关的用于协助分析故障原因的数据。

现有技术中通过查找与故障描述文本具有相同的关键词的文本,并根据该文本的相关参数数据进行故障的查看分析。但相关性高的能用于协助分析故障原因的相关文本和故障描述文本中可能并没有相同的关键词。因此，通过现有的方式不能准确地查找到与故障描述文本相关联的用于协助分析故障原因的数据。本申请实施例通过对比故障描述文本的语义向量与目标数据的相关文本的语义向量的相关性，可以准确地查找到与故障描述文本相关联的目标数据。比如，故障描述为“行业用户上网慢”，本申请实施例分析出的与其相关的用于故障分析的关键性指标的名称为“下行带宽控制丢包比例”。可以看出，从字面上二者没有任何可以匹配和关联的成分，而本申请恰恰是通过语义分析挖掘学习到了“上网速度和丢包比例有关系”这样的领域知识，才实现了二者相关联的分析。

因此，通过实施图1所描述的方法，能够自动地并且准确地查找到与故障描述文本的相关的用于协助分析故障原因的数据。

请参见图2，图2是本申请实施例提供的一种语义生成模型的训练方法的流程示意图。如图2所示，该语义生成模型的训练方法包括如下201～203部分，其中：

201、模型训练装置获取训练文本对应的词向量集合。

其中，词向量集合中包括的词向量与训练文本中的词一一对应。例如，训练文本中包括10000个词，则词向量集合中也包括10000个词向量。该词向量用于表示词的语义。可选的，获取训练文本对应的词向量集合之后，可保存训练文本对应的词向量集合，以便后续使用词向量集合中的词向量。

训练文本即语料。在一种可能的实施方式中，训练文本可以为百科类文本。从百科类文本中学习得到的词向量具有很好的通用语义。

在一种可能的实施方式中，模型训练装置首先对训练文本进行预处理，按句切分后再对每句文本进行分词处理，得到分词后的训练文本，并通过word2vec工具或其他工具获取分词后的训练文本对应的词向量集合。

例如，训练文本为“数学是利用符号语言研究数量结构变化以及空间等概念的一门学科。我喜欢数学”。模型训练装置向将训练文本拆分为两句话，分别为“数学是利用符号语言研究数量结构变化以及空间等概念的一门学科”和“我喜欢数学”。再对这两个句子分别进行分词处理。得到分词后的训练文本为“数学是利用符号语言研究数量结构变化以及空间等概念的一门学科。我喜欢数学”。模型训练装置使用word2vec工具对分词后的训练文本进行逐句遍历，遍历结束就得到了训练文本中的每个词对应的词向量。模型训练装置将训练文本中的每个词对应的词向量组成的词向量集合进行保存。

模型训练装置可通过word2vec工具并采用CBOW算法获取分词后的训练文本对应的词向量集合。CBOW算法的思想是通过给定的上下文词来预测当前词。CBOW算法训练的目标是给定某个词的上下文时，使得该词出现的概率最大。训练结束后，每个词在输出层都得到了一个对应的词向量。尽管CBOW算法的建模思想是一个分类过程，但会生成词向量这一副产品。

例如，图3为CBOW算法采用的神经网络的示意图。如图3所示，该神经网络由三层结构构成，分别为输入层、映射层和输出层。其中，输出层包括已经构造好的哈夫曼树。哈夫曼树的一个叶子节点代表训练文本中的一个词的词向量，每个叶子节点对应的单词的词向量是随机初始化的。每个非叶节点内置一个权重向量，该向量的维度和输入层的词向量相同。

其中，输入层为某个单词w(t)周围的n-1个单词的词向量。n为窗口大小。例如，如果n取5，单词w(t)周围的n-1个单词为单词w(t)的前两个和后两个的单词。单词w(t)的前两个和后两个的单词分别为w(t-2)、w(t-1)、w(t+1)、w(t+2)。相对应的，这n-1个单词的词向量记为v(w(t-2))、v(w(t-1))、v(w(t+1))、v(w(t+2))。输入层将到这n-1个词向量传递到映射层，映射层将n-1个词向量进行相加，即将n-1个词向量的各维度对应相加。例如，映射层输入为pro(t)＝v(w(t-2))+v(w(t-1))+v(w(t+1))+v(w(t+2))。

投影层将加和得到的向量pro(t)输入到哈夫曼树的根节点。在将pro(t)输入根节点之后，会计算根节点到每个叶子节点的概率，模型的训练过程是期望能得到由根节点到达w(t)对应的叶子节点的概率最大，由于在海量的训练文本中，相同的上下文环境会多次出现，所以在遍历训练训练文本的过程中会不断修正各权重向量，达到这样的效果。对训练文本中的所有词遍历完成之后，哈夫曼树的各叶子节点对应的词向量就为训练文本的各个词对应的词向量。这里的“训练文本中的所有词”包括训练文本中重复的词。

其中，从根节点到词w(t)对应的叶子节点每次经过一个中间节点时，相当于是进行了一次二分类，分类器可以采用softmax回归分类器。其中，每次分类的分类概率为：

其中，θ _i表示第i个权重向量。pro(t)为w(t)的上下文的词向量之和，e为自然常数。

设由根节点遍历到词w(t)对应的叶子节点的路径包含了L个中间节点，这些节点上的参数组成参数向量为[θ ₁，θ ₂，θ ₃，…，θ _L]，则根节点到词w(t)对应的叶子节点的概率为每次二分类的概率的乘积，即根节点到词w(t)对应的叶子节点的概率为：

其中，P(w(t)|context(w(t)))为根节点到词w(t)对应的叶子节点的概率，

表示i从1到L逐一递增对P(context(w(t)),θ _i)连乘求积。从根节点到其他叶子节点的概率的计算方法同理，在此不赘述。

202、模型训练装置根据词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵。

具体地，模型训练装置可将大量的历史故障描述文本转换为词向量矩阵。模型训练装置根据大量的词向量矩阵训练得到语义生成模型。例如，具有历史故障描述文本1～历史故障描述文本100，可将历史故障描述文本1～历史故障描述文本100分别转换为词向量矩阵，即得到100个词向量矩阵。模型训练装置根据这100个词向量矩阵训练得到语义生成模型。

在一种可能的实施方式中，模型训练装置根据词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵的具体实施方式可以为：模型训练装置对历史故障描述文本进行分词处理，得到历史故障描述文本对应的由至少一个词组成的词序列；从词向量集合中获取该词序列包括的词对应的词向量；将该词序列包括的各个词对应的词向量组成该历史故障描述文本的词向量矩阵。当词向量集合中不存在该词序列包括的词对应的词向量时，可生成随机向量作为该词序列包括的词对应的词向量。可见，通过实施该实施方式，可准确地将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵。

举例来说，历史故障描述文本1包括4个词，对历史故障描述文本1进行分词处理得到的词序列为“行业”、“用户”、“上网”、“慢”。模型训练装置从词向量集合中查找到“行业”对应词向量1、“用户”对应词向量2、“上网”对应词向量3，未查找到“慢”对应的词向量，则生成随机向量词向量4作为“慢”对应的词向量。模型训练装置将词向量1～4组成该历史故障描述文本1的词向量矩阵1。其他历史故障描述文本2～100转换为词向量矩阵的原理与历史故障描述文本1转换为词向量矩阵的原理相同，在此不赘述。

203、模型训练装置根据词向量矩阵训练得到语义生成模型。

具体地，模型训练装置在得到词向量矩阵之后，可将词向量矩阵输入神经网络进行训练，以得到语义生成模型。该语义生成模型用于生成文本的语义向量。该语义向量用于表示文本的语义。

可见，图2所描述的方法是从词汇层面的语义向句子层面的语义逐步建模得到语义生成模型，这种语义生成模型训练方式是符合语言生成的基本原理的。因此，通过实施图2所描述的方法训练得到的语义生成模型，能够更加准确地表达文本的语义。

在一种可能的实施方式中，模型训练装置根据词向量矩阵训练得到语义生成模型的具体实施方式为：模型训练装置获取历史故障描述文本对应的故障设备类型；模型训练装置根据词向量矩阵和类别标签训练分类模型，该类别标签包括该故障设备类型；模型训练装置根据分类模型得到语义生成模型。通过实施该实施方式训练得到的语义生成模型，能够更加准确地表达文本的语义。

例如，历史故障描述文本对应的故障设备类型可以为路由器、有线设备或无线设备等。例如，历史故障描述文本描述的故障为路由器产生的故障，则历史故障描述文本对应的故障设备类型为路由器。一线工程师可收集每个故障描述文本对应的故障设备类型，然后将故障描述文本、故障描述文本对应的故障设备类型和用于协助分析故障原因的数据添加至工单中，并将工单发送给运维终端进行故障原因分析。因此，模型训练装置可从工单中获取历史故障描述文本对应的故障设备类型。

其中，训练得到的分类模型是用于生成故障描述文本对应的故障设备类型的模型。例如，将故障描述文本1对应的词向量矩阵输入分类模型，该分类模型可输出故障描述文本1对应的故障设备类型。

在一种可能的实施方式中，模型训练装置根据词向量矩阵和类别标签训练分类模型的具体实施方式为：将词向量矩阵和类别标签输入神经网络进行迭代训练，在每次迭代训练时对输入神经网络的词向量矩阵中的词向量和神经网络的参数进行调整，以生成分类模型。通过实施该实施方式，能够使训练得到的分类模型能够准确地对故障描述文本进行分类。

可选的，模型训练装置还可使用调整后的词向量矩阵中的词向量更新词向量集合中相应词对应的词向量。通过实施该可选的方式，能够根据带有领域知识的历史故障描述文本语料修正词向量集合中的词向量，使词向量集合中的词向量更能表达故障领域的词的语义信息。

举例来说，图4为一种用于训练分类模型的神经网络的结构示意图。如图4所示，该神经网络包括卷积层、池化层和全连接层。历史故障描述文本1的词向量矩阵1包括词向量{w1，w2，w3，w4，w5，w6}。每个词向量的维度为128个维度。模型训练装置得到词向量矩阵1之后，将词向量矩阵1输入神经网络。如图4所示，神经网络中的具有两个卷积核。当然在实际应用中也可以有两个以上的卷积核，本申请实施例以两个卷积核进行举例说明。左边的卷积核1对词向量矩阵1包括词向量进行两两卷积。例如，w1与w2进行卷积得到C1，w2与w3进行卷积得到C2，w3与w4进行卷积得到C3，w4与w5进行卷积得到C4，w5与w6进行卷积得到C5。右边的卷积核2对词向量矩阵1包括词向量进行三三卷积。例如，w1、w2和w3进行卷积得到C6，w2、w3和w4进行卷积得到C7，w3、w4和w5进行卷积得到C8，w4、w5和w6进行卷积得到C9。实际应用中也对其他数量的词向量进行卷积，本申请实施例以两两卷积和三三卷积进行举例说明。

可见，卷积核1可生成一个特征图(feature map)C＝[C1，C2，…，C5]，卷积核2生成一个特征图C＝[C6，C7，C8，C9]。模型训练装置得到每个卷积核生成的特征图之后，针对每个特征图，通过最大池化操作选取每个维度上的最大值作为当前卷积核生成的文本特征向量。模型训练装置将所有文本特征向量进行拼接，得到最终的历史故障描述文本1的语义向量。即如图4所示，模型训练装置从C1～C5的第一个维度中选取最大的值，从C1～C5的第2个维度中选取最大的值，从C1～C5的第3个维度中选取最大的值，依次类推，直到从C1～C5的第128个维度中选取到最大的值。模型训练装置将选取的128个维度的最大值组成卷积核1对应的文本特征向量1。同理，模型训练装置也获取卷积核2对应的文本特征向量2。模型训练装置将文本特征向量1和文本特征向量2进行拼接，得到最终的历史故障描述文本1的语义向量。

模型训练装置将得到的历史故障描述文本1的语义向量输入全连接层，并将历史故障描述文本1对应的故障设备类型(如路由器)作为类别标签，输入全连接层。模型训练装置在全连接层对历史故障描述文本1的语义向量进行分析，分析得到故障设备类型最大概率为交换机。由于历史故障描述文本1的语义向量进行分析得到的最大概率的故障设备类型(即交换机)与历史故障描述文本1对应的类别标签(即路由器)不相同，因此模型训练装置记录通过对历史故障描述文本1的语义向量进行分析得到的最大概率的故障设备类型不正确。同理，模型训练装置按照上述流程将历史故障描述文本2的词向量矩阵输入神经网络进行训练，得到历史故障描述文本2的语义向量，并在全连接层输入历史故障描述文本2对应的故障设备类型(如交换机)作为类别标签。模型训练装置对历史故障描述文本2的语义向量进行分析，分析得到故障设备类型最大概率为防火墙。因此，模型训练装置记录通过对历史故障描述文本2的语义向量进行分析得到的最大概率的故障设备类型不正确。假设具有100个历史故障描述文本，其余98个历史故障描述文本同理，均按照上述历史故障描述文本1的方式输入神经网络进行分类模型的训练。在对历史故障描述文本1～100完成第一轮训练之后，假设根据历史故障描述文本1～50对应的语义向量分析得到的最大概率的故障设备类型不正确，模型训练装置对神经网络的参数以及历史故障描述文本1～50对应的词向量矩阵中的词向量进行调整。调整完毕之后，以新词向量矩阵和神经网络的参数重新对历史故障描述文本1～100进行训练，直到根据历史故障描述文本1～100对应的语义向量分析得到的最大概率的故障设备类型与分类标签相匹配，就生成分类模型，即通过迭代训练神经网络来生成分类模型。

最后模型训练装置使用最后一轮迭代训练输入的词向量矩阵中的词向量更新词向量集合中的相应词对应的词向量。例如，历史故障描述文本1为“上网速度慢”最后一轮迭代训练之前对历史故障描述文本1对应词向量矩阵进行了调整，将“上网”对应的词向量调整为词向量1，则最后一次迭代训练完成后，使用词向量1替换词向量集合中的“上网”对应的词向量。历史故障描述文本2为“OCS通讯中断”最后一轮迭代训练之前对历史故障描述文本2对应词向量矩阵进行了调整，将“中断”对应的词向量调整为词向量2，则最后一轮迭代训练完成后，使用词向量2替换词向量集合中的“中断”对应的词向量。其他历史故障描述文本同理，在此不赘述。

在一种可能的实施方式中，模型训练装置根据分类模型得到语义生成模型的具体实施方式为：模型训练装置将分类模型中全连接层以上的部分作为语义生成模型。通过实施该实施方式生成的语义生成模型，可以准确的生成文本的语义向量。

本发明实施例可以根据上述方法示例对设备进行功能模块的划分，例如，可以对应各个功能划分各个功能模块，也可以将两个或两个以上的功能集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。需要说明的是，本发明实施例中对模块的划分是示意性的，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

请参见图5，图5是本发明实施提供的一种信息输出装置。该信息输出装置包括：获取模块501、生成模块502、计算模块503和输出模块504。其中：

获取模块501，用于获取故障描述文本；生成模块502，用于通过语义生成模型生成故障描述文本的语义向量，该故障描述文本用于描述网络中发生的故障；获取模块501，还用于获取多种类型的目标数据的相关文本分别对应的语义向量，该目标数据用于协助分析故障产生的原因；计算模块503，用于计算故障描述文本的语义向量与每种目标数据的相关文本的语义向量的相关性；输出模块504，用于确定并输出第一数据，第一数据为每种目标数据中语义向量与故障描述文本的语义向量的相关性最大的目标数据，或第一数据为每种目标数据中语义向量与故障描述文本的语义向量的相关性大于预设阈值的目标数据。

在一种可能的实施方式中，生成模块502，还用于在获取模块501获取故障描述文本之前，通过语义生成模型生成多种目标数据的相关文本分别对应的语义向量。

在一种可能的实施方式中，语义生成模型是根据历史故障描述文本对应的词向量矩阵训练生成的，词向量矩阵包括历史故障描述文本中各个词对应的词向量，该词向量用于表示词的语义。

在一种可能的实施方式中，该多种类型的目标数据包括关键性能指标、设备告警、设备日志中的至少两种；当目标数据为关键性能指标时，目标数据的相关文本为关键性能指标的名称；当目标数据为设备告警时，目标数据的相关文本为设备告警的标识；当目标数据为设备日志时，目标数据的相关文本为设备日志的内容片段。

请参见图6，图6是本发明实施提供的一种模型训练装置。该模型训练装置包括获取模块601、转换模块602和训练模块603，其中：

获取模块601，用于获取训练文本对应的词向量集合，词向量集合中包括的词向量与训练文本中的词一一对应；转换模块602，用于根据词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵；训练模块603，还用于根据词向量矩阵训练得到语义生成模型，语义生成模型用于生成文本的语义向量。

在一种可能的实施方式中，转换模块602具体用于：对历史故障描述文本进行分词处理，得到历史故障描述文本对应的由至少一个词组成的词序列；从词向量集合中获取词序列包括的词对应的词向量；将词序列包括的各个词对应的词向量组成词向量矩阵。

在一种可能的实施方式中，转换模块602还具体用于：当词向量集合中不存在词序列包括的词对应的词向量时，生成随机向量作为词序列包括的词对应的词向量。

在一种可能的实施方式中，训练模块603根据词向量矩阵训练得到语义生成模型的方式具体为：获取历史故障描述文本对应的故障设备类型；根据词向量矩阵和类别标签训练分类模型，该类别标签包括所述故障设备类型；根据分类模型得到语义生成模型。

在一种可能的实施方式中，训练模块603根据词向量矩阵和类别标签训练分类模型的方式具体为：将词向量矩阵和类别标签输入神经网络进行迭代训练，在每次迭代训练时对输入神经网络的词向量矩阵中的词向量和神经网络的参数进行调整，以生成分类模型。

请参见图7，图7是本申请实施例公开的一种信息输出装置的结构示意图。如图7所示，该信息输出装置700包括处理器701、存储器702和通信接口703。其中，处理器701、存储器702和通信接口703相连。

其中，处理器701可以是中央处理器(central processing unit，CPU)，通用处理器，协处理器，数字信号处理器(digital signal processor，DSP)，专用集成电路(application-specific integrated circuit，ASIC)，现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。该处理器701也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

其中，通信接口703用于实现与其他网元之间的通信。

其中，处理器701调用存储器702中存储的程序代码，可执行上述方法实施例中信息输出装置所执行的步骤。

请参见图8，图8是本申请实施例公开的一种模型训练装置的结构示意图。如图8所示，该模型训练装置800包括处理器801、存储器802和通信接口803。其中，处理器801、存储器802和通信接口803相连。

其中，处理器801可以是中央处理器(central processing unit，CPU)，通用处理器，协处理器，数字信号处理器(digital signal processor，DSP)，专用集成电路(application-specific integrated circuit，ASIC)，现场可编程门阵列(field programmable gate array，FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。该处理器801也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等等。

其中，通信接口803用于实现与其他网元之间的通信。

其中，处理器801调用存储器802中存储的程序代码，可执行上述方法实施例中模型训练装置所执行的步骤。

基于同一发明构思，本申请实施例中提供的各设备解决问题的原理与本申请方法实施例相似，因此各设备的实施可以参见方法的实施，为简洁描述，在这里不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

最后应说明的是：以上各实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述各实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。

Claims

一种信息输出方法，其特征在于，所述方法包括：

获取故障描述文本，所述故障描述文本用于描述网络中发生的故障；

通过语义生成模型生成所述故障描述文本的语义向量；

获取多种类型的目标数据的相关文本分别对应的语义向量，所述目标数据用于协助分析所述故障产生的原因；

计算所述故障描述文本的语义向量与每种所述目标数据的相关文本的语义向量的相关性；

确定并输出第一数据，所述第一数据为每种所述目标数据中语义向量与所述故障描述文本的语义向量的相关性最大的目标数据，或所述第一数据为每种所述目标数据中语义向量与所述故障描述文本的语义向量的相关性大于预设阈值的目标数据。
根据权利要求1所述的方法，其特征在于，所述获取故障描述文本之前，所述方法还包括：

通过所述语义生成模型生成多种类型的目标数据的相关文本分别对应的语义向量。
根据权利要求1或2所述的方法，其特征在于，所述语义生成模型是根据历史故障描述文本对应的词向量矩阵训练生成的，所述词向量矩阵包括所述历史故障描述文本中各个词对应的词向量，所述词向量用于表示词的语义。
根据权利要求1～3任意一项所述的方法，其特征在于，所述多种类型的目标数据包括关键性能指标、设备告警、设备日志中的至少两种；当所述目标数据为所述关键性能指标时，所述目标数据的相关文本为所述关键性能指标的名称；当所述目标数据为所述设备告警时，所述目标数据的相关文本为所述设备告警的标识；当所述目标数据为所述设备日志时，所述目标数据的相关文本为所述设备日志的内容片段。
一种语义生成模型的训练方法，其特征在于，所述方法包括：

获取训练文本对应的词向量集合，所述词向量集合中包括的词向量与所述训练文本中的词一一对应，所述词向量用于表示词的语义；

根据所述词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵；

根据所述词向量矩阵训练得到语义生成模型，所述语义生成模型用于生成文本的语义向量。
根据权利要求5所述的方法，其特征在于，所述根据所述词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵，包括：

对历史故障描述文本进行分词处理，得到所述历史故障描述文本对应的由至少一个词组成的词序列；

从所述词向量集合中获取所述词序列包括的词对应的词向量；

将所述词序列包括的各个词对应的词向量组成词向量矩阵。
根据权利要求6所述的方法，其特征在于，所述方法还包括：

当所述词向量集合中不存在所述词序列包括的词对应的词向量时，生成随机向量作为所述词序列包括的词对应的词向量。
根据权利要求5～7任意一项所述的方法，其特征在于，所述根据所述词向量矩阵训练得到语义生成模型，包括：

获取所述历史故障描述文本对应的故障设备类型；

根据所述词向量矩阵和类别标签训练分类模型，所述类别标签包括所述故障设备类型；

根据所述分类模型得到语义生成模型。
根据权利要求8所述的方法，其特征在于，所述根据所述词向量矩阵和所述类别标签训练分类模型，包括：

将所述词向量矩阵和所述类别标签输入神经网络进行迭代训练，在每次迭代训练时对输入所述神经网络的词向量矩阵中的词向量和所述神经网络的参数进行调整，以生成所述分类模型。
一种信息输出装置，其特征在于，所述信息输出装置包括：

获取模块，用于获取故障描述文本，所述故障描述文本用于描述网络中发生的故障；

生成模块，用于通过语义生成模型生成所述故障描述文本的语义向量；

所述获取模块，还用于获取多种类型的目标数据的相关文本分别对应的语义向量，所述目标数据用于协助分析所述故障产生的原因；

计算模块，用于计算所述故障描述文本的语义向量与每种所述目标数据的相关文本的语义向量的相关性；

输出模块，用于确定并输出第一数据，所述第一数据为每种所述目标数据中语义向量与所述故障描述文本的语义向量的相关性最大的目标数据，或所述第一数据为每种所述目标数据中语义向量与所述故障描述文本的语义向量的相关性大于预设阈值的目标数据。
根据权利要求10所述的装置，其特征在于，

所述生成模块，还用于在所述获取模块获取故障描述文本之前，通过所述语义生成模型生成多种目标数据的相关文本分别对应的语义向量。
根据权利要求10或11所述的装置，其特征在于，所述语义生成模型是根据历史故障描述文本对应的词向量矩阵训练生成的，所述词向量矩阵包括所述历史故障描述文本中各个词对应的词向量，所述词向量用于表示词的语义。
根据权利要求10～12任意一项所述的装置，其特征在于，所述多种类型的目标数据包括关键性能指标、设备告警、设备日志中的至少两种；当所述目标数据为所述关键性能指标时，所述目标数据的相关文本为所述关键性能指标的名称；当所述目标数据为所述设备告警时，所述目标数据的相关文本为所述设备告警的标识；当所述目标数据为所述设备日志时，所述目标数据的相关文本为所述设备日志的内容片段。
一种模型训练装置，其特征在于，所述模型训练装置包括：

获取模块，用于获取训练文本对应的词向量集合，所述词向量集合中包括的词向量与所述训练文本中的词一一对应；

转换模块，用于根据所述词向量集合将历史故障描述文本转换为由至少一个词向量组成的词向量矩阵；

所述训练模块，还用于根据所述词向量矩阵训练得到语义生成模型，所述语义生成模型用于生成文本的语义向量。
根据权利要求14所述的装置，其特征在于，所述转换模块具体用于：

对历史故障描述文本进行分词处理，得到所述历史故障描述文本对应的由至少一个词组成的词序列；

从所述词向量集合中获取所述词序列包括的词对应的词向量；

将所述词序列包括的各个词对应的词向量组成词向量矩阵。
根据权利要求15所述的装置，其特征在于，所述转换模块还具体用于：

当所述词向量集合中不存在所述词序列包括的词对应的词向量时，生成随机向量作为所述词序列包括的词对应的词向量。
根据权利要求14～16任意一项所述的装置，其特征在于，所述训练模块根据所述词向量矩阵训练得到语义生成模型的方式具体为：

获取所述历史故障描述文本对应的故障设备类型；

根据所述词向量矩阵和所述类别标签训练分类模型，所述类别标签包括所述故障设备类型；

根据所述分类模型得到语义生成模型。
根据权利要求17所述的装置，其特征在于，所述训练模块根据所述词向量矩阵和所述类别标签训练分类模型的方式具体为：

将所述词向量矩阵和所述类别标签输入神经网络进行迭代训练，在每次迭代训练时对输入所述神经网络的词向量矩阵中的词向量和所述神经网络的参数进行调整，以生成所述分类模型。
一种计算机程序产品，其特征在于，当其在计算机上运行时，使得计算机执行上述1～9中任意一项所述的方法。
一种计算机可读存储介质，其特征在于，计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述1～9中任意一项所述的方法。