CN113362083B

CN113362083B - 报修方法、装置、电子设备及存储介质

Info

Publication number: CN113362083B
Application number: CN202110626365.5A
Authority: CN
Inventors: 韩月娟; 鄢仁祥; 尤澜涛; 孔芳; 曹李军
Original assignee: Suzhou University; Suzhou Keda Technology Co Ltd
Current assignee: Suzhou University; Suzhou Keda Technology Co Ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2022-05-03
Anticipated expiration: 2041-06-04
Also published as: CN113362083A

Abstract

本发明涉及信息技术领域，具体涉及报修方法、装置、电子设备及存储介质，所述方法包括：获取报修文件；对所述报修文件进行语句处理，提取出相应的报修描述；将所述报修描述输入故障处理模型中，确定故障类别。由于报修描述是通过语句处理得到的，可以准确地表征报修文件的内容，同时利用故障处理模型对报修描述进行故障类别的预测，可以得到准确的故障类别，即，通过数据自动处理实现故障类别的准确确定，提高了报修效率。

Description

报修方法、装置、电子设备及存储介质

技术领域

本发明涉及信息技术领域，具体涉及报修方法、装置、电子设备及存储介质。

背景技术

对于各种设备、信息服务或系统而言，为了保证其较好的用户体验，服务方均会提供相应的售后报修服务。常用的报修方式有文件报修，例如邮件报修，现有的文件报修是用户将出现的故障进行问题描述后发送给服务方，服务方在接收到用户的报修文件后，人工识别并记录故障，后续才能形成派修单安排相应工作人员进行维修和处理。

然而，上述技术方案中需要人工对各个报修邮件中的故障进行识别，导致报修效率偏低。

发明内容

有鉴于此，本发明实施例提供了一种报修方法、装置、电子设备及存储介质，以解决报修效率偏低的问题。

根据第一方面，本发明实施例提供了一种报修方法，包括：

获取报修文件；

对所述报修文件进行语句处理，提取出相应的报修描述；

将所述报修描述输入故障处理模型中，确定故障类别。

本发明实施例提供的报修方法，由于报修描述是通过语句处理得到的，可以准确地表征报修文件的内容，同时利用故障处理模型对报修描述进行故障类别的预测，可以得到准确的故障类别，即，通过数据自动处理实现故障类别的准确确定，提高了报修效率。

结合第一方面，在第一方面第一实施方式中，所述对所述报修文件进行语句处理，提取出相应的报修描述，包括：

依次对所述报修文件中的每条语句进行编码，得到初始语句；

基于任意两条所述初始语句中各个词语之间的相似度，确定所有所述初始语句对应的词汇链；

对所述词汇链进行图数据处理，得到各个所述初始语句对应的第一目标语句；

基于所述第一目标语句进行解码，得到所述报修描述。

本发明实施例提供的报修方法，通过对报修文件中每条语句编码后得到的初始语句之间进行相似度的计算得到词汇链，再基于该词汇链进行图数据处理，通过利用表示报修文件中语句之间的关联关系的词汇链进行报修描述的确定，提高了报修描述的准确性。

结合第一方面第一实施方式，在第一方面第二实施方式中，所述基于任意两条所述初始语句中各个词语之间的相似度，确定所有所述初始语句对应的词汇链，包括：

去除所述初始语句中的非名词，得到预处理后的初始语句；

计算任意两条预处理后的初始语句中各个词语之间的相似度；

判断所述相似度是否在预设范围内；

当所述相似度在所述预设范围内时，确定所述相似度对应的两条初始语句之间存在词汇链。

本发明实施例提供的报修方法，在进行相似度计算之前，去除初始语句中的非名词，一方面可以减少数据处理量，另一方面可以保证非名词对词汇链的影响，提高了所确定出的词汇链的准确性。

结合第一方面至第一方面第二实施方式中任一项，在第一方面第三实施方式中，所述基于所述第一目标语句进行解码，得到所述报修描述，还包括：

利用所述初始语句的上下文关系，确定上下文关系网络；

对所述上下文关系网络进行图数据处理，得到各个所述初始语句对应的第二目标语句；

基于所述第一目标语句以及所述第二目标语句进行交互融合，确定目标语句；

对所述目标语句进行解码，得到所述报修描述。

本发明实施例提供的报修方法，利用上下文关系信息可以进一步缓解信息稀疏的问题，因此，在报修描述中将上下文关信息与词汇链对应的第二目标语句与第一目标语句进行结合，进行报修描述；且在具体结合过程中，使得两种进行充分交互，从而提高报修描述的整体性能。

结合第一方面第三实施方式，在第一方面第四实施方式中，所述基于所述第一目标语句以及所述第二目标语句进行交互融合，确定目标语句，包括：

将所述第一目标语句以及所述第二目标语句输入金字塔模型中，依次得到所述金字塔模型中各层的输出，所述金字塔模型包括多个隐含层；

对所述金字塔模型中所有层的输出进行融合，得到所述目标语句。

本发明实施例提供的报修方法，由于一个模型对较高的层使用更少量隐藏单元可以学习到更抽象的特征，因此，利用金字塔模型对第一目标语句以及第二目标语句进行特征提取，在学习到特征的基础上可以减少数据处理量，提高了融合效率。

结合第一方面第三实施方式，在第一方面第五实施方式中，所述对所述目标语句进行解码，得到所述报修描述，包括：

利用问题对象抽取模型对所述报修文件中的每条语句进行编码得到初始问题对象语句，并将所述初始问题对象语句与所述目标语句进行拼接，得到问题对象语句；

利用问题描述抽取模型对所述报修文件中的每条语句进行编码得到初始问题描述语句，并将所述初始问题描述语句与所述目标语句进行拼接，得到问题描述语句；

分别利用所述问题对象抽取模型以及所述问题描述抽取模型对所述问题对象语句以及所述问题描述语句进行解码，得到第一报修描述以及第二报修描述；

基于所述第一报修描述与所述第二报修描述进行拼接，得到所述报修描述。

本发明实施例提供的报修方法，由于在报修文件中既包括问题对象又包括问题描述，因此，将这两部分别进行编解码处理，可以进一步提高所得到的报修描述的准确性。

结合第一方面，在第一方面第六实施方式中，所述将所述报修描述输入故障处理模型中，确定故障类别，包括：

提取所述报修文件中的报修图像；

将所述报修描述以及所述报修图像输入所述故障处理模型中，确定所述故障类别。

本发明实施例提供的报修方法，在报修文件中既包括语句描述又包括报修图像，该报修图像可以作为故障描述的佐证，在故障识别的过程中，结合报修图像进行处理，可以进一步提高所确定的故障类别的准确性。

结合第一方面第六实施方式，在第一方面第七实施方式中，所述将所述报修描述以及所述报修图像输入所述故障处理模型中，确定所述故障类别，包括：

利用所述故障处理模型中的编码模块对所述报修描述进行编码，得到第一特征；

利用所述故障处理模型中的特征提取模块对所述报修图像进行特征提取，得到第二特征；

利用所述第一特征与所述第二特征的语义相似部分进行融合，得到第三特征；

将所述第一特征与所述第三特征进行再次融合，得到目标特征；

基于所述目标特征确定所述故障类别。

本发明实施例提供的报修方法，将报修描述与报修图像对应的特征在语义相似部分进行融合，使得模型能够进一步学习到相似的语义信息得到第三特征，再次基础上再利用第一特征与第三特征进行再次融合，可以获得报修描述与报修图像在注意力机制级的融合编码，提高了所确定的故障类别的准确性。

结合第一方面，在第一方面第八实施方式中，所述报修文件包括视频文件，所述报修方法还包括：

提取所述视频文件中的图像帧；

对提取出的所述图像帧进行特征提取，得到图像特征；

基于所述图像特征确定所述故障类别。

本发明实施例提供的报修方法，分别对视频文件中的图像帧进行特征提取，以确定故障类别，为视频流故障感知提供了条件，扩大了该报修方法的应用场景。

结合第一方面，或第一方面第八实施方式，在第一方面第九实施方式中，所述方法还包括：

基于所述故障类别生成报修单，并将所述报修单转发至目标处理人员；

接收所述目标处理人员的处理反馈，以确定故障是否处理完成。

本发明实施例提供的报修方法，通过报修单的自动生成与自动派单，可以实现整个报修流程的自动处理，提高了报修效率。

结合第二方面，本发明实施例还提供了一种报修装置，包括：

获取模块，用于获取报修文件；

处理模块，用于对所述报修文件进行语句处理，提取出相应的报修描述；

确定模块，用于将所述报修描述输入故障处理模型中，确定故障类别。

本发明实施例提供的报修装置，由于报修描述是通过语句处理得到的，可以准确地表征报修文件的内容，同时利用故障处理模型对报修描述进行故障类别的预测，可以得到准确的故障类别，即，通过数据自动处理实现故障类别的准确确定，提高了报修效率。

根据第三方面，本发明实施例提供了一种电子设备，包括：存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行第一方面或者第一方面的任意一种实施方式中所述的报修方法。

根据第四方面，本发明实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储计算机指令，所述计算机指令用于使所述计算机执行第一方面或者第一方面的任意一种实施方式中所述的报修方法。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例的报修方法的流程图；

图2是根据本发明实施例的报修方法的流程图；

图3是根据本发明实施例的报修描述的处理示意图；

图4是根据本发明实施例的报修方法的流程图；

图5是根据本发明实施例的文本与图像聚合编码模型示意图；

图6是根据本发明实施例的报修方法的架构示意图；

图7是根据本发明实施例的报修方法的流程图；

图8是根据本发明实施例的报修方法的处理示意图；

图9是根据本发明实施例的报修装置的结构框图；

图10是本发明实施例提供的电子设备的硬件结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，本发明实施例中所述的报修文件，可以是报修邮件，也可以为用户所填写的报修表格文件等等，在此对报修文件的具体形式并不做任何限定，具体可以根据实际情况进行相应的设置。

在下文的描述中，以报修文件为报修邮件为例进行。所述的报修邮件，可以在邮件正文中进行报修描述。进一步地，除了可以采用文字形式进行描述，也可以附加图像以作为佐证。关于报修邮件的形式可以根据实际需求进行设置，在此对其并不做任何限制。

根据本发明实施例，提供了一种报修方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

在本实施例中提供了一种报修方法，可用于电子设备，如电脑、手机、平板电脑等，图1是根据本发明实施例的报修方法的流程图，如图1所示，该流程包括如下步骤：

S11，获取报修文件。

电子设备提供有报修文件接收接口，利用该接口就可以接收到报修文件。例如，当报修文件为报修邮件时，电子邮箱接收到报修邮件之后，相应地，电子设备就可以获取到报修文件。

其中，电子邮箱可以是运行在电子设备上的，也可以是其他电子设备中的电子邮箱接收到用户发送的报修邮件，并将该报修邮件发送给电子设备的。在此对电子设备获取报修文件的方式并不做任何限制，具体可以依据实际情况进行相应的设置。

S12，对报修文件进行语句处理，提取出相应的报修描述。

电子设备可以利用神经网络模型的方式，对报修文件中的语句进行处理，将其转换为电子设备所能够处理的报修描述，即利用自然语言处理的方式，将报修文件中的语句转换为报修描述。

或者，电子设备可以利用图像处理的方式，先识别出报修文件中的语句，再对语句中的各个文字进行文字识别，从而也可以提取出相应的报修描述。

在本实施例中，对于电子设备采用何种方式进行报修描述的提取并不做任何限制。关于该步骤具体将在下文中进行详细描述。

S13，将报修描述输入故障处理模型中，确定故障类别。

所述的故障处理模型的输入为报修描述，输出为故障类别。由于故障处理模型是用于对输入的报修描述进行故障分类的，因此，该故障处理模型也可以认为是分类模型。

在此对故障处理模型的具体架构并不做任何限制，只需保证其能够实现故障分类的功能即可。

关于该步骤具体将在下文中进行详细描述。

本实施例提供的报修方法，由于报修描述是通过语句处理得到的，可以准确地表征报修文件的内容，同时利用故障处理模型对报修描述进行故障类别的预测，可以得到准确的故障类别，即，通过数据自动处理实现故障类别的准确确定，提高了报修效率。

在本实施例中提供了一种报修方法，可用于电子设备，如电脑、手机、平板电脑等，图2是根据本发明实施例的报修方法的流程图，如图2所示，该流程包括如下步骤：

S21，获取报修文件。

详细请参见图1所示实施例的S11，在此并不赘述。

S22，对所述报修文件进行语句处理，提取出相应的报修描述。

为下文描述方便，在此给出与报修邮件相关的定义：每一个邮件正文文本D包括若干条语句{S₁,S₂,...,S_I}，对于给定语句S_i，i∈I，S_i＝{x_i1,x_i2,...,x_iN}，x_im表示S_iS_i中的元素，m∈N。

具体地，上述S22可以包括：

S221，依次对报修文件中的每条语句进行编码，得到初始语句。

电子设备在此所采用的编码方式可以是编码模型，其输入为语句，输出为编码后的初始语句。例如，可以采用BERT-base模型对给定邮件文本中的每一条语句S_i进行编码。BERT的输入格式如下：[CLS]S_i[SEP]。经过BERT处理后，取“[CLS]”的表示作为语句S_i的初始向量，即v_i∈R^d。

电子设备依次对每一条语句S_i进行编码，得到对应的初始语句。

S222，基于任意两条初始语句中各个词语之间的相似度，确定所有初始语句对应的词汇链。

当两个语句中的词汇相似度大于阈值时，则认为它们之间存在词汇链。通过中文同义词词库或词林来计算两个词汇之间的相似度，并用得到的相似度来衡量它们之间的语义关系。

具体地，电子设备对所有初始语句进行两两组合，计算组合中各个词语之间的相似度，得到任意两条初始语句中各个词语之间的相似度。在计算出相似度之后，再将相似度与预设值进行比较，确定所有初始语句对应的词汇链，即所述报修文件对应的词汇链。

在本实施例的一些可选实施方式中，上述S222可以包括：

(1)去除初始语句中的非名词，得到预处理后的初始语句。

在抽取词汇链时，仅考虑了名词，包含普通名词(NN，NNS)和专属名词(NNP，NNPS)。即，对给定的句子进行预处理，去除其中的非名词词汇。具体在处理时，可以将初始语句中的各个词语与预设的普通名词知识库以及专属名词知识库中的词语进行搜索，判断初始语句中的词语是否属于对应的普通名词知识库或专属名词知识库；若不属于，则表示该词语为非名词词汇，则将其从初始语句中去除。

(2)计算任意两条预处理后的初始语句中各个词语的相似度。

进一步地，对于给定的两个句子S_i和S_j，遍历中S_i的每个词x_im，计算x_im和S_j中的每个词的相似度。

(3)判断相似度是否在预设范围内。

如果两个词的相似度高于预先设定的阈值

则认为两个语句之间存在词汇链，并将(I，J)添加到词汇链的集合中。

另外，作为主题信息的一种体现，由于词汇链通常存在于在距离较近的语句之间，所以在判断句子之间关系时对距离添加了限制，当两个句子的距离大于3之后，则不再判断它们之间是否存在词汇链。即，通过计算任意两条初始语句之间的距离，若距离大于预设值，则认为这两条初始语句之间不存在词汇链。即使语句中词语的相似度在预设范围内，但是只要两条语句的距离大于预设值，那么这两条语句之间仍不存在词汇链。

当相似度在所述预设范围内时，执行步骤(4)；否则，执行步骤(2)。

(4)确定相似度对应的两条初始语句之间存在词汇链。

在进行相似度计算之前，去除初始语句中的非名词，一方面可以减少数据处理量，另一方面可以保证非名词对词汇链的影响，提高了所确定出的词汇链的准确性。

基于抽取到的词汇链，电子设备将句子之间的信息进行关联，构建句子间的关联矩阵。对于任意两个句子S_i和S_j，按照其出现的先后次序形成以下四种类型的关系：

(1)前向相关(M(S_i,S_j)＝fore,i<j)：表示当前句子与位于其前方的句子之间存在关联关系；

(2)自我相关(M(S_i,S_j)＝self,i＝j)：为了在信息关联时保留当前句子的信息，可以添加了一条指向当前句子的边；

(3)后向相关(M(S_i,S_j)＝back_,i>j)：表示当前句子与位于其后方的句子间存在关联关系；

(4)无关系(M（S_i,S_j)＝none,i<j)：两个句子间不存在关联关系。

因此，对于给定文本，词汇链关系网络定义为图G(S,E_r)，其中，S是语句向量的集合，E_r是语句S_i和所有具有词汇链关联关系的边的集合。

S223，对词汇链进行图数据处理，得到各个初始语句对应的第一目标语句。

电子设备在得到词汇链，即上文所述的词汇链关系网络G(S,E_r)之后，利用图数据处理方式，对其进行处理，得到各个初始语句对应的第一目标语句。具体可以如下所示：

针对每个节点实行self-attention的注意力机制，注意力系数为：

该注意力系数表示了节点j对节点i的重要性。为了使得注意力系数更容易计算和便于比较，引入了softmax对所有的i的相邻节点j进行正则化：

在该前馈神将网络的输出层上还加入了LeakyReLU函数，这里小于零斜率为0.2。结合上述两个公式，得到完整的注意力机制：

为了稳定self-attention的学习过程，采用Multi-head Attention的k个独立注意力机制执行上述公式，然后求他们的平均：

这样就得到了边的权重，之后作为图G(S,E_r)中的顶点，语句向量v_i按如下公式进行更新：

其中，b∈R^d是可训练参数。

由此，就可以将各个初始语句处理成对应的第一目标语句。

S224，基于第一目标语句进行解码，得到报修描述。

电子设备在得到第一目标语句之后，可以利用与编码模型对应的解码模型对其进行解码，得到报修描述。或者，电子设备还可以在第一目标语句的基础上，结合其他方式处理后的第二目标语句进行解码，得到相应的报修描述。

在本实施例的一些可选实施方式中，结合图3所示，电子设备在词汇链的基础上，还结合上下文关系网络进行解码。上述S224可以包括：

(1)利用初始语句的上下文关系，确定上下文关系网络。

电子设备对报修文件中各个初始语句进行上下文关系的分析，所述的上下文关系包括前向相连、后向相连以及在同一段落里。例如，电子设备可以对报修文件中的语句的起始点与结束点，以及各个段落的结束位进行分析，就可以确定每条初始语句的前向相连、后向相连以及同一段落中的其他初始语句。

电子设备利用上述处理，就可以确定出报修文件对应的上下文关系网络。例如，对于给定对话文本D＝{S₁,S₂,...,S_I}，上下文关系网络定义为图G(S,E_c)，其中，S是语句向量的集合，E_c是语句S_i和语句S_j之间的边的集合。

(2)对上下文关系网络进行图数据处理，得到各个初始语句对应的第二目标语句。

所述的图数据处理可以采用图注意力网络进行，也可以采用其他方式进行图数据处理，具体依据实际需求进行相应的设置。

在本实施例中，以图注意力网络为例进行描述。其中，对上下文关系网络中的初始语句进行编码后，得到各自对应的语句向量。例如，对于语句S_i和语句S_j而言，其对应的语句向量为v_i以及v_j，语句向量v_i和v_j之间的边的权重计算公式如下：

其中，W₁,W₂∈R^d×d和w∈R^2d是可训练参数。进一步的，图G(S,E_c)中的顶点v_i的更新公式为：

其中，W_β∈R^d×d和b_β∈R^d是可训练参数。

由此，报修文件中的各个初始语句S_i，编码后得到初始语句向量v_i，该初始语句向量v_i在经过词汇链对应的处理后，得到第一目标语句

该初始语句向量在经过上下文关系网络对应的处理后，得到第二目标语句

(3)基于第一目标语句以及第二目标语句进行交互融合，确定目标语句。

由于文本中词汇链关系和上下文语义都会对报修描述的提取产生影响，因此，电子设备利用交互机制使两种信息进行充分交互，从而提高整体模型的性能。

其中，所述的交互融合可以是分别对第一目标语句以及第二目标语句进行特征提取，再对提取出的特征进行加权融合，得到目标语句。

在本实施例的一些可选实施方式中，所述的交互机制采用两个策略，一是金字塔模型，二是自适应融合层。具体地，上述S224的步骤(3)可以包括：

3.1)将第一目标语句以及第二目标语句输入金字塔模型中，依次得到金字塔模型中各层的输出，所述金字塔模型包括多个隐含层。

由于一个模型对较高的层使用更少量隐藏单元可以学习到更抽象的特征，电子设备构建一个金字塔模型来处理词汇链关系网络和上下文关系网络得到的语句表示。这个金字塔模型包含若干个隐层，最底端的层的隐藏单元数量最多，依次往上，上一层的隐藏单元数是下一层的一半。具体来说，语句S_i的第l层的表示向量定义如下：

其中，

和b^l是可训练参数，l∈L是层序号。

3.2)对金字塔模型中所有层的输出进行融合，得到目标语句。

为了充分融合不同抽象程度的语句表示，电子设备使用自适应融合层来融合金字塔模型中所有层的表示，得到语句S_i的最终表示r_i∈R^d：

其中，∏表示多个向量的拼接，W_r和b_r是可训练参数，Θ＝[θ₁,...,θ_L]是一个初始化权重向量，表示每一层的权重，在模型训练过程中不断学习更新。

由于一个模型对较高的层使用更少量隐藏单元可以学习到更抽象的特征，因此，利用金字塔模型对第一目标语句以及第二目标语句进行特征提取，在学习到特征的基础上可以减少数据处理量，提高了融合效率。

(4)对目标语句进行解码，得到报修描述。

电子设备在得到目标语句之后，如上文所述，再利用与编码模型对应的解码模型对目标语句进行解码，即可得到报修描述。

利用上下文关系信息可以进一步缓解信息稀疏的问题，因此，在报修描述中将上下文关信息与词汇链对应的第二目标语句与第一目标语句进行结合，进行报修描述；且在具体结合过程中，使得两种进行充分交互，从而提高报修描述的整体性能。

进一步地，在报修文件中，一般包括问题对象以及问题描述。其中，问题对象是指文本中提及的出现故障的实体，比如：网络设备、服务器、信息系统、云端账户等，它们本质上是领域内关注的命名实体，而问题描述则是针对对象进行的故障现象的描述。因此，为了保证提取出的报修描述的准确性，需要分别抽取出报修文件中的问题对象以及问题描述。具体地，将对象识别和问题描述识别都转化成一个序列标注问题，借助多任务学习框架实现对象和问题描述的联合抽取。

定义问题对象标签集为Y_O＝{BO，IO，EO，O}，问题描述标签集为Y_D＝{BD，ID，ED，O}，其中BO，IO，EO分别表示问题对象的开始元素、中间元素和终止元素，而BD，ID，ED则表示问题描述的开始元素、中间元素和终止元素，O表示其他元素。联合抽取任务就是要对S_i中的每一个元素分别打上标签集Y_O和Y_D中的标签。

作为本实施例的一种可选实施方式，结合图3所示，报修文件中的每条语句在经过编码、词汇链关系网络、上下文关系网络以及交互模块的处理之后，再分别将其与问题对象抽取模型以及问题描述抽取模型对应的语句进行拼接，得到问题对象语句以及问题描述语句。即，图3所述的处理过程可以认为是基于交互式图注意力网络的问题对象和问题描述联合抽取模型，上述S224的步骤(4)可以包括：

4.1)利用问题对象抽取模型对报修文件中的每条语句进行编码得到初始问题对象语句，并将初始问题对象语句与目标语句进行拼接，得到问题对象语句。

文本中的语句S_i，通过问题对象抽取模型编码为r_a。将由词汇链关系网络、上下文关系网络和交互模块生成的S_i的最终表示r_i拼接到r_a上，得到新的语句表示向量r_i ^a。其中，语句表示向量r_i ^a即为所述的问题对象语句。

4.2)利用问题描述抽取模型对报修文件中的每条语句进行编码得到初始问题描述语句，并将初始问题描述语句与所述目标语句进行拼接，得到问题描述语句。

文本中的语句S_i，通过问题描述抽取模型编码为r_p。将由词汇链关系网络、上下文关系网络和交互模块生成的S_i的最终表示r_i拼接到r_p上，得到新的语句表示向量r_i ^p。其中，语句表示向量r_i ^p即为所述的问题描述语句。

4.3)分别利用问题对象抽取模型以及问题描述抽取模型对问题对象语句以及问题描述语句进行解码，得到第一报修描述以及第二报修描述。

r_i ^a经过问题对象抽取模型解码模块，即用Y_O中的标签进行序列标注，得到问题对象描述语a_i。其中，所述的问题对象描述语即为所述的第一报修描述。

r_i ^p经过问题描述抽取模型解码模块，即用Y_D中的标签进行序列标注，得到观点描述语p_i。其中，所述的观点描述语即为所述的第二报修描述。

4.4)基于第一报修描述与第二报修描述进行拼接，得到报修描述。

电子设备将第一报修描述与第二报修描述进行拼接，得到报修描述；进一步地，由于报修邮件还包括有标题，因此，电子设备还可以将邮件的标题与第一报修描述、第二报修描述的文本进行拼接，得到所述的报修描述。

S23，将报修描述输入故障处理模型中，确定故障类别。

详细请参见图1所示实施例的S13，在此不再赘述。

本实施例提供的报修方法，通过对报修文件中每条语句编码后得到的初始语句之间进行相似度的计算得到词汇链，再基于该词汇链进行图数据处理，通过利用表示报修文件中语句之间的关联关系的词汇链进行报修描述的确定，提高了报修描述的准确性。

在本实施例中提供了一种报修方法，可用于电子设备，如电脑、手机、平板电脑等，图4是根据本发明实施例的报修方法的流程图，如图4所示，该流程包括如下步骤：

S31，获取报修文件。

详细请参见图2所示实施例的S21，在此不再赘述。

S32，对所述报修文件进行语句处理，提取出相应的报修描述。

详细请参见图2所示实施例的S22，在此不再赘述。

S33，将报修描述输入故障处理模型中，确定故障类别。

在报修文件中，除了语句表示以外，还可能会存在报修图像。因此，在本实施例中，输入故障处理模型中的输入数据不限于语句对应的报修描述，还包括报修图像。

以报修邮件为例，其包括三个部分：

(1)邮件标题：文字标题通常是对要故障报修内容的一个高度提炼，比如“网络问题”等；

(2)邮件文本类正文：包含对报修故障相对详细的描述，也会包含一些报修者情绪、心理状况，或是其他与故障现象无关的描述；

(3)邮件图像类正文：对故障发生时某些核心设备或现象的图像采集，以佐证的形式出现。

由此可知，邮件内容包含文本和图像两种模态。其中图像通常比较直接，与所报修问题密切相关；文本中，标题通常简短也包含了关键信息，而在文本类正文中，由于用户报修时的状态差异，以及对所遇问题的理解程度不同，因此邮件正文中给出的文本描述通常是有差异的，在进行故障分类时结合报修图像进行处理。

具体地，上述S33可以包括：

S331，提取报修文件中的报修图像。

报修图像可以是作为报修文件的附件，也可以是在正文中包含衣服或多幅图像，将其作为所描述文字的一种补充和辅助。若报修图像为多幅时，可以将其拼接为一张图作为故障处理模型的输入。

S332，将报修描述以及报修图像输入故障处理模型中，确定故障类别。

故障处理模型的输入为报修描述以及报修图像，输出为故障类别。在故障处理模型中，可以先分别针对报修描述以及报修图像进行特征提取，再将提取到的特征进行融合，最后利用融合后的特征进行故障类别的识别。

本实施例提供的报修方法，在报修文件中既包括语句描述又包括报修图像，该报修图像可以作为故障描述的佐证，在故障识别的过程中，结合报修图像进行处理，可以进一步提高所确定的故障类别的准确性。

在本实施例的一些可选实施方式中，文本类输入经过BERT进行初始的Embedding，而图像则使用ResNet-101完成图像到图像特征的映射，获取到文本和图像对应的表征向量后，核心工作就变成了两者的融合。考虑到，人类语言虽然存在差异，但认知水平相当，附带的图像所具备的语义信息与文本包含的语义信息是主题上一致的。基于此，所述故障处理模块是基于Transformer框架设计的一个基于Attention对齐的文本与图像聚合编码方法。结合图5所示，该模型包括两部分，左侧用于对报修描述进行编码，右侧用于对报修图像进行融入。上述S332可以包括：

(1)利用故障处理模型中的编码模块对报修描述进行编码，得到第一特征。

编码器可以由L个相同层堆叠组成，例如，可以采用L＝6。每层包含两个子层，第一个是多头注意力机制子层(Muti-head Attention)，第二个是前馈神经网络子层(FeedForward)，具体参见图5中左侧部分，借助它完成文本的编码。具体地，

1)前馈神经网络：

包含全连接层和激活函数(Relu)，具体公式为：FFN(x)＝(Relu(xW₁+b₁))W₂+b₂，其中b₁，W₁，W₂，b₂是前馈神经网络层待学习的参数。

2)多头注意力机制：

自注意力机制的Attention(Q,K,V)函数的本质可以描述为把一个查询(query)和(key-value)键值对的集合映射成一个output，其中query，key，value，output都是向量。输出其实是values的加权求和，其中分配给每个值的权重通过一个相关函数计算query与当前key的相关程度。即，在序列内部做attention，寻找序列内部的联系，在处理文本的时候，自注意力机制会将较高的权重分配给文本中重要的信息，其他无关紧要的信息则分配到较低的权重。

其中，缩放点乘积注意力(Scaled Dot-Product Attention)本质上是使用点积进行相似度计算。Scaled Dot-Product Attention的计算公式为：

其中，Q,K,V均为向量形式，计算Q和K的点积后除以

起到了调节作用，控制Q,K的内积不会太大，确保该attention为软分布注意力。

在此基础上，考虑到一个attention机制无法从多角度、多层面的捕获到重要的特征，所以使用多头注意力(Multi-Head Attention)机制，把多个自注意力连起来。Multi-Head Attention的计算公式如下：

MultiHead(Q,K,V)＝Concat(head₁,…,head_h)W^o

电子设备将报修描述输入到故障处理模型的编码模块中，利用编码模块对报修描述进行编码，得到第一特征。

(2)利用故障处理模型中的特征提取模块对报修图像进行特征提取，得到第二特征。

如图5所示，在文本编码的右侧增加了一个类似的图像信息的融入环节，具体为利用故障处理模型中的特征提取模块对输入的报修图像进行特征提取，得到第二特征。

(3)利用第一特征与第二特征的语义相似部分进行融合，得到第三特征。

将以句子编码得到的第一特征Q，对应于图5左侧获得的编码；图像对应的第二特征K和V；电子设备将第一特征与第二特征进行融合，即在图像中找语义相似的二部分做基于Attention的融合，得到第三特征。

(4)将所述第一特征与所述第三特征进行再次融合，得到目标特征。

图像特征获取后经过前馈神经网络，通过以句子编码为Q的Attention处理获得图像中与文本语义匹配部分的向量表征，再借助门控进行两者的融合，得到目标特征z_i。即，

z_i＝Gate₁*h_i+Gate₂*y_i

其中，Gate₁、Gate₂分别表示h_i、y_i所占的权重向量。为了得到的信息向量能进行正则化处理，设置Gate₁+Gate₂＝1。

由此，就可以获得报修描述与报修图像在Attention级上的融合编码。

(5)基于目标特征确定故障类别。

电子设备借助全连接层将得到的目标特征进行压缩，映射到对应的类别空间，最后使用softmax层作为输出层来完成故障类别标签的预测，从而实现根据邮件内容进行自动故障类别的分拣。

将报修描述与报修图像对应的特征在语义相似部分进行融合，使得模型能够进一步学习到相似的语义信息得到第三特征，再次基础上再利用第一特征与第三特征进行再次融合，可以获得报修描述与报修图像在注意力机制级的融合编码，提高了所确定的故障类别的准确性。

在本实施例的一个具体实施方式中，如图6所示，所述的报修方法首先分别对文本(标题、抽取到的问题对象及描述)和图像分别进行表征，接着将两类表征聚合成一个统一的表征，基于统一表征再借助全连接层将得到的表征进行压缩，映射到对应的类别空间，最后使用softmax层作为输出层来完成故障类别标签的预测。

在本实施例中提供了一种报修方法，所述的报修文件还包括视频，在本实施例中电子设备还对所接收到的视频进行分析，并确定相应的确定故障类别。具体地，上述的报修方法可用于电子设备，如图像采集设备、电脑、手机、平板电脑等。图7是根据本发明实施例的报修方法的流程图，需要说明的是，图7中的S41-S48可以是由电子设备处理，即，电子设备可以处理不同类别的报修文件，例如，报修邮件以及视频文件等等；也可以是，其中的S44-S46是在前端的图像处理设备中完成的，图像处理设备实时对采集到的图像帧进行故障检测，并将确定出的故障类别发送至电子设备，由电子设备生成相应的报修单；或者，也可以有图像处理设备确定故障类别，并自动向目标人员发送报修单等等，在此对其并不做任何限制，具体可以根据实际情况进行相应的设置。在本实施例中，以电子设备可以处理不同类别的报修文件为例，进行描述的，具体如图7所示，该流程包括如下步骤：

S41，获取报修文件。

详细请参见图4所示实施例的S31，在此不再赘述。

S42，对报修文件进行语句处理，提取出相应的报修描述。

详细请参见图4所示实施例的S32，在此不再赘述。

S43，将报修描述输入故障处理模型中，确定故障类别。

详细请参见图4所示实施例的S33，在此不再赘述。

S44，提取视频文件中的图像帧。

电子设备在获取到视频文件之后，可以每隔一定数量的图像帧数提取视频文件中的图像帧进行故障类别的识别；也可以是逐帧进行故障类别的识别，等等。具体如何提取视频文件中的图像帧，在本实施例中并不做任何限制，具体可以根据实际需求进行相应的设置。

S45，对提取出的图像帧进行特征提取，得到图像特征。

电子设备在提取出图像帧之后，可以利用图像处理模型进行图像特征的提取，也可以是通过图像处理的方式提取出图像帧中的特征，得到所述的图像特征。

S46，基于图像特征确定故障类别。

电子设备在得到图像特征之后，对其进行故障类别的确定。例如，可以将图像特征与各个故障类别的图像特征进行相似度对比，也可以直接利用图像处理模型进行故障类别的预测，等等，在此对其并不做任何限定。

作为本实施例的一个可选实施方式，通过对视频进行预处理，也就是通过间隔一定时间截图视频的图片，然后通过对图片特征提取，图片特征比对，如果相似度高于设定的值，则说明图片中被监控的对象有故障，并确定了故障类型。并保存该图片，作为故障图片，将其作为报修单的派单依据。具体地，在电子设备中运行有视频故障感知算法，其可以感知外形特性明显变化产生的故障，比如：在城市管理中监控垃圾桶周围的卫生状况。如果垃圾桶周围被堆放了杂物，则可以通过该算法感知到故障，派单给相应的人员进行处理。

视频故障感知算法包括模型的训练和故障的识别两个部分：

模型训练：拍摄被监控对象的大量不同故障类型发生时的各个角度的特征图片作为训练样本。然后对这些图片进行灰度化、二值化、去噪等预处理。将这些处理过的图片输入深度学习网络进行训练，并在训练过程中，不断调整深度网络参数，通过反复的训练使得参数调整到最优化，使模型的误差最小。

故障识别：通过对视频进行预处理，也就是通过间隔一定时间截取视频的图片，然后对图片进行预处理，包括对图片进行灰度化、二值化、反色、去噪、分割和大小归一化预处理。通过深度残差神经网络提取图片特征，然后与训练好的特征模型进行比对，识别图片的相似度，如果相似度高于设定的值，则说明视频截取图片出现了特征图片这种对象的该种类型的故障。

S47，基于故障类别生成报修单，并将报修单转发至目标处理人员。

电子设备在识别出故障类别之后，基于故障类别生成报修单，并利用故障类别与处理人员的对应关系，确定目标处理人员，并将该报修单转发至目标处理人员进行处理。

S48，接收目标处理人员的处理反馈，以确定故障是否处理完成。

电子设备在将报修单转发至目标处理人员之后，目标处理人员会对该报修单的处理情况进行反馈，例如，是否处理完成，是否出现派单错误。若出现派单错误，可以由目标处理人员人工进行报修单的转发，等等。具体应用的需求，可以根据实际情况进行相应的设置，在此对其并不做任何限制。

本实施例提供的报修方法，分别对视频文件中的图像帧进行特征提取，以确定故障类别，为视频流故障感知提供了条件，扩大了该报修方法的应用场景。

作为本实施例的一个具体应用实例，从软件算法角度，将电子设备中运行的程序划分为故障智能感知模块以及智能派单模块。如图8所示，故障智能告知模块用于接收报修文件，并对其进行故障识别生成报修单。再调用智能派单模块将报修单转发给处理人员。若智能报修模块无法确定处理人员，则完善智能派单模块。处理人员收到报修单，如果派单正确则进行维护，如果发现派单不正确可以反馈正确的故障类型与处理人关系给智能派单模块，同时可以转发报修单给处理人员B。智能派单模块在接受到更新请求后自动更新系统模块。处理人员在收到报修单后，都会收到智能通知模块发来的报修工单提醒。

进一步地，在电子设备运行的程序中还包括有智能通知模块。具体地，当报修单派出后，会调用智能通知模块，通知处理人员。智能通知模块还会跟踪报修单，如果报修单未规定时间内处理完毕，则会继续通知当前处理人员。处理人员处理完毕报修单后，会调用智能通知模块通知用户报修处理完成。智能通知模块有多个通知渠道，包括：手机APP提醒、微信消息提醒、短信提醒或邮件提醒。其中，通知渠道可通过系统后台设置为一种或者多种，在此对其并不做任何限制。

可选地，在电子设备运行的程序中还包括有报修通信模块，其中，对应于不同的报修方式，具有不同的报修子模块进行处理。例如，网站报修，对应于网站报修子模块；邮件报修，对应于邮件报修子模块；APP报修，对应于APP报修子模块；微信报修，对应于微信报修子模块，等等。具体在报修通信模块中设置哪些类型的子模块，可以依据实际需求进行相应的设置，在此对其并不做任何限制。

对于各个处理人员而言，其使用的电子设备上运行有报修单处理模块，处理人员A接到通知有报修单传入则登录验证身份来处理，如果传入报修单不是自己所处理的报修类型则A人员将报修单流转出去给相应的处理人员B，同时反馈并更新智能派单模块，否则A人员处理报修单。处理完毕后A人员会调用智能通知模块来通过多种渠道通知用户报修已经处理完毕。

本实施例提供的故障报修方法，通过人工智能技术可以实现故障的多渠道快速感知、即时派发工单、多途径提醒处理、工单智能流转等等，将能极大提升报修的效率，提升报修工单处理人员的工作效率。具体地，所述的故障报修方法相当于提供了一种多模态智能综合报修方案和平台，报修平台可支持邮件、视频和手工录入等多种报修方式。通过报修通信模块里的任意一种方式进行报修或故障感知，报修通信模块可以把故障信息发送给报修单接口，生成报修单。然后智能派单模块接收报修单并智能匹配人员，转给相应处理人员。然后，通过通知模块通知处理人员进行故障处理。最后处理人员处理完毕后，通知模块会以多种渠道通知用户报修处理完毕。

在本实施例中还提供了一种报修装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

本实施例提供一种报修装置，如图9所示，包括：

获取模块51，用于获取报修文件；

处理模块52，用于对所述报修文件进行语句处理，提取出相应的报修描述；

确定模块53，用于将所述报修描述输入故障处理模型中，确定故障类别。

本实施例提供的报修装置，由于报修描述是通过语句处理得到的，可以准确地表征报修文件的内容，同时利用故障处理模型对报修描述进行故障类别的预测，可以得到准确的故障类别，即，通过数据自动处理实现故障类别的准确确定，提高了报修效率。

本实施例中的报修装置是以功能单元的形式来呈现，这里的单元是指ASIC电路，执行一个或多个软件或固定程序的处理器和存储器，和/或其他可以提供上述功能的器件。

上述各个模块的更进一步的功能描述与上述对应实施例相同，在此不再赘述。

本发明实施例还提供一种电子设备，具有上述图9所示的报修装置。

请参阅图10，图10是本发明可选实施例提供的一种电子设备的结构示意图，如图10所示，该电子设备可以包括：至少一个处理器61，例如CPU(Central Processing Unit，中央处理器)，至少一个通信接口63，存储器64，至少一个通信总线62。其中，通信总线62用于实现这些组件之间的连接通信。其中，通信接口63可以包括显示屏(Display)、键盘(Keyboard)，可选通信接口63还可以包括标准的有线接口、无线接口。存储器64可以是高速RAM存储器(Random Access Memory，易挥发性随机存取存储器)，也可以是非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。存储器64可选的还可以是至少一个位于远离前述处理器61的存储装置。其中处理器61可以结合图9所描述的装置，存储器64中存储应用程序，且处理器61调用存储器64中存储的程序代码，以用于执行上述任一方法步骤。

其中，通信总线62可以是外设部件互连标准(peripheral componentinterconnect，简称PCI)总线或扩展工业标准结构(extended industry standardarchitecture，简称EISA)总线等。通信总线62可以分为地址总线、数据总线、控制总线等。为便于表示，图10中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

其中，存储器64可以包括易失性存储器(英文：volatile memory)，例如随机存取存储器(英文：random-access memory，缩写：RAM)；存储器也可以包括非易失性存储器(英文：non-volatile memory)，例如快闪存储器(英文：flash memory)，硬盘(英文：hard diskdrive，缩写：HDD)或固态硬盘(英文：solid-state drive，缩写：SSD)；存储器64还可以包括上述种类的存储器的组合。

其中，处理器61可以是中央处理器(英文：central processing unit，缩写：CPU)，网络处理器(英文：network processor，缩写：NP)或者CPU和NP的组合。

其中，处理器61还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(英文：application-specific integrated circuit，缩写：ASIC)，可编程逻辑器件(英文：programmable logic device，缩写：PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(英文：complex programmable logic device，缩写：CPLD)，现场可编程逻辑门阵列(英文：field-programmable gate array，缩写：FPGA)，通用阵列逻辑(英文：generic arraylogic,缩写：GAL)或其任意组合。

可选地，存储器64还用于存储程序指令。处理器61可以调用程序指令，实现如本申请图1、2、4以及7实施例中所示的报修方法。

本发明实施例还提供了一种非暂态计算机存储介质，所述计算机存储介质存储有计算机可执行指令，该计算机可执行指令可执行上述任意方法实施例中的报修方法。其中，所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)、随机存储记忆体(Random Access Memory，RAM)、快闪存储器(Flash Memory)、硬盘(Hard Disk Drive，缩写：HDD)或固态硬盘(Solid-State Drive，SSD)等；所述存储介质还可以包括上述种类的存储器的组合。

虽然结合附图描述了本发明的实施例，但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型，这样的修改和变型均落入由所附权利要求所限定的范围之内。

Claims

1.一种报修方法，其特征在于，包括：

获取报修文件；

对所述报修文件进行语句处理，提取出相应的报修描述；

将所述报修描述输入故障处理模型中，确定故障类别；

其中，所述对所述报修文件进行语句处理，提取出相应的报修描述，包括：

基于所述第一目标语句进行解码，得到所述报修描述。

2.根据权利要求1所述的报修方法，其特征在于，所述基于任意两条所述初始语句中各个词语之间的相似度，确定所有所述初始语句对应的词汇链，包括：

去除所述初始语句中的非名词，得到预处理后的初始语句；

判断所述相似度是否在预设范围内；

3.根据权利要求1-2中任一项所述的报修方法，其特征在于，所述基于所述第一目标语句进行解码，得到所述报修描述，还包括：

利用所述初始语句的上下文关系，确定上下文关系网络；

对所述目标语句进行解码，得到所述报修描述。

4.根据权利要求3所述的报修方法，其特征在于，所述基于所述第一目标语句以及所述第二目标语句进行交互融合，确定目标语句，包括：

5.根据权利要求3所述的方法，其特征在于，所述对所述目标语句进行解码，得到所述报修描述，包括：

6.根据权利要求1所述的报修方法，其特征在于，所述将所述报修描述输入故障处理模型中，确定故障类别，包括：

提取所述报修文件中的报修图像；

7.根据权利要求6所述的报修方法，其特征在于，所述将所述报修描述以及所述报修图像输入所述故障处理模型中，确定所述故障类别，包括：

基于所述目标特征确定所述故障类别。

8.根据权利要求1所述的报修方法，其特征在于，所述报修文件包括视频文件，所述报修方法还包括：

提取所述视频文件中的图像帧；

对提取出的所述图像帧进行特征提取，得到图像特征；

基于所述图像特征确定所述故障类别。

9.根据权利要求1或7所述的报修方法，其特征在于，所述方法还包括：

10.一种报修装置，其特征在于，包括：

获取模块，用于获取报修文件；

确定模块，用于将所述报修描述输入故障处理模型中，确定故障类别；

基于所述第一目标语句进行解码，得到所述报修描述。

11.一种电子设备，其特征在于，包括：

存储器和处理器，所述存储器和所述处理器之间互相通信连接，所述存储器中存储有计算机指令，所述处理器通过执行所述计算机指令，从而执行权利要求1-9中任一项所述的报修方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使计算机执行权利要求1-9中任一项所述的报修方法。