CN115510213A

CN115510213A - 用于作业机械的问答方法及系统、作业机械

Info

Publication number: CN115510213A
Application number: CN202211282854.4A
Authority: CN
Inventors: 宋保柱; 卢阳光; 牛寒松; 刘利明
Original assignee: Sany Heavy Machinery Ltd
Current assignee: Sany Heavy Machinery Ltd
Priority date: 2022-10-19
Filing date: 2022-10-19
Publication date: 2022-12-23

Abstract

本发明涉及作业机械技术领域，提供一种用于作业机械的问答方法及系统、作业机械，其中方法包括利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别；利用预先训练的关系抽取模型，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系；基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案。应用本方法解决了现有技术中作业机械故障诊断与维修效率较低的缺陷，实现对作业机械的故障问题进行高效率的诊断与维修。

Description

用于作业机械的问答方法及系统、作业机械

技术领域

本发明涉及作业机械技术领域，尤其涉及一种用于作业机械的问答方法及系统、作业机械。

背景技术

目前，当挖掘机等作业机械出现故障时，用户一般会通过平台进行报修，之后由平台分配维修工程师去现场进行故障诊断和维修。在故障诊断与维修的过程中，仍需要维修工程师基于个人经验对作业机械的故障做出诊断与维修，这依赖于维修工程师的个人经验水平，由于维修工程师的个人经验往往不够全面，对于没有见过的故障，诊断和维修的难度较大，这导致作业机械的故障诊断和维修效率较低。

发明内容

本发明提供一种用于作业机械的问答方法及系统、作业机械，用以解决现有技术中作业机械故障诊断与维修效率较低的缺陷，实现对作业机械的故障问题进行高效率的诊断与维修。

本发明提供一种用于作业机械的问答方法，包括：

利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；

利用预先训练的关系抽取模型，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系；

基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案，知识图谱由多个实体以及多种预设实体关系形成。

根据本发明提供的一种用于作业机械的问答方法，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系，包括：

获取故障问题的向量表示；

基于故障问题的向量表示，获得第一向量表示和第二向量表示，第一向量表示中实体作为头实体，第二向量表示中实体作为尾实体；

基于第一向量表示和第二向量表示，获得每种预设实体关系下，第一向量表示和第二向量表示之间的相关性矩阵，相关性矩阵包含各头实体与各尾实体之间的相关性；若头实体和尾实体之间的相关性满足相关性阈值，确定头实体和尾实体之间存在预设实体关系。

根据本发明提供的一种用于作业机械的问答方法，故障问题的向量表示包括句向量表示和字向量表示；基于故障问题的向量表示，获得第一向量表示和第二向量表示，包括：

获取故障问题的向量表示的前一层的向量表示；

至少将前一层的向量表示中的每个字向量表示分别加上故障问题的句向量表示，得到第一向量表示；

将故障问题的向量表示作为第二向量表示。

根据本发明提供的一种用于作业机械的问答方法，基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案，包括：

从知识图谱中获取与识别出的实体、确定的预设实体关系对应的子图；

基于子图，确定故障问题的至少一个候选答案；

基于预先统计的每个候选答案的出现次数，确定每个候选答案的出现概率；

将出现概率最大的至少一个候选答案作为故障问题的答案。

根据本发明提供的一种用于作业机械的问答方法，知识图谱是通过如下方式构建的：

获取多个初始知识图谱，各初始知识图谱是基于不同的数据源构建的；

生成每个初始知识图谱的每个节点的向量表示；

计算不同初始知识图谱中的节点的向量表示之间的相似度；

将相似度满足相似度阈值的节点合并，得到知识图谱。

根据本发明提供的一种用于作业机械的问答方法，初始知识图谱是通过如下方式构建的：

获取数据源，数据源至少包括作业机械的维修记录、维修手册、故障案例和故障经验；

利用实体识别模型，对数据源进行实体识别；

利用关系抽取模型，对数据源中识别出的实体进行多种预设实体关系的抽取；

基于实体识别的结果以及抽取的多种预设实体关系，构建初始知识图谱。

根据本发明提供的一种用于作业机械的问答方法，关系抽取模型是基于预训练模型得到的，和/或，实体识别模型是基于预训练模型得到的；

预训练模型是基于作业机械领域的自然语言预训练得到的。

根据本发明提供的一种用于作业机械的问答方法，在对输入的作业机械的故障问题进行实体识别之前，还包括：

对输入的作业机械的问题进行意图识别，意图包括故障问题、常识问答、设备操作指引和闲聊对话；

若基于意图识别的结果确定输入的问题为故障问题，利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别；

若基于意图识别的结果确定输入的问题不是故障问题，从预设的问答对中筛选出与输入的问题对应的答案。

本发明还提供一种用于作业机械的问答系统，包括：

实体识别单元，用于利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；

关系抽取单元，用于利用预先训练的关系抽取模型，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系；

答案确定单元，用于基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案，知识图谱由多个实体以及多种预设实体关系形成。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时实现如上述任一种用于作业机械的问答方法。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种用于作业机械的问答方法。

本发明还提供一种计算机程序产品，包括计算机程序，计算机程序被处理器执行时实现如上述任一种用于作业机械的问答方法。

本发明还提供一种作业机械，作业机械用于执行如上述任一种用于作业机械的问答方法，或者包括如上述的用于作业机械的问答系统，或者包括如上述的电子设备，或者包括如上述的非暂态计算机可读存储介质，或者包括如上述的计算机程序产品。

本发明提供的用于作业机械的问答方法中，通过预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，确定故障问题中存在的实体后，基于预先训练的关系抽取模型，确定在预设实体关系下故障问题中每两个实体之间的相关性，若存在两个实体的相关性满足相关性阈值，则确定这两个实体之间存在预设实体关系，这样，通过实体之间的相关性来确定是否存在预设实体关系，可以更为准确的抽取出故障问题中包含的预设实体关系，基于识别出的实体以及确定的预设实体关系，再结合预先构建的知识图谱，可以确定故障问题的答案，由于知识图谱可以将复杂的语义知识进行直观的表示，因此可以准确地找到故障问题的答案，辅助故障问题的诊断和维修，从而可以有效提高作业机械故障诊断与维修的效率。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的用于作业机械的问答方法的流程示意图之一；

图2是本发明提供的用于作业机械的问答方法的流程示意图之二；

图3是本发明提供的关系抽取模型的网络结构示意图；

图4是本发明提供的实体识别模型的网络结构示意图；

图5是本发明提供的用于作业机械的问答方法的流程示意图之三；

图6是本发明提供的用于实体对齐的流程示意图之一；

图7是本发明提供的用于作业机械的问答方法的流程示意图之四；

图8是本发明提供的用于作业机械的问答方法的流程示意图之五；

图9是本发明提供的用于作业机械的问答方法的流程示意图之六；

图10是本发明提供的用于作业机械的问答系统的结构示意图之一；

图11是本发明提供的用于作业机械的问答系统的结构示意图之二；

图12是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

当用户作业机械出现故障时，用户一般会通过平台进行报修，之后由平台分配维修工程师去现场进行检修。而维修工程师在检修过程中，对于出现的故障通常都是基于个人经验进行判断，该过程严重依赖于维修工程师的个人经验水平。

目前有一些故障辅助诊断系统，一般都是基于专家整理的部分故障案例分析，通过交互一问一答的形式，在知识库中检索对应的故障，来协助用户进行故障的诊断，对于作业机械过往产生的大量的故障记录数据没有合理化利用，且由于专家整理的故障案例完全依赖于专家的个人经验，且罗列的故障有限，因此具有片面性，此外，由专家整理的故障案例会罗列出该故障发生的所有可能，用户使用时需要按顺序排查，难度较大，专业性较强，一般只适合维修工程师学习。

并且，现有的辅助诊断系统大多只能满足对于故障类问题的问答，服务内容缺乏，并且根据用户的提问在知识库中进行完全匹配检索时，对于同一故障的不同描述，无法检索到对应答案。

基于此，本发明提供一种用于作业机械的问答方法，可以通过知识图谱将复杂的语义知识进行直观的表示，对故障问题进行实体的识别和预设实体关系的抽取，结合知识图谱，进而确定故障问题的答案，可以有效提高作业机械故障诊断与维修的效率。下面结合图1-图9描述本发明的用于作业机械的问答方法。

图1是本发明提供的用于作业机械的问答方法的流程示意图之一。

如图1所示，本实施例提供的用于作业机械的问答方法，可以由用于作业机械的问答装置执行，例如手机、平板电脑等终端，或者作业机械的车载终端，等等，该方法至少包括如下步骤：

步骤101，利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关。

步骤102，利用预先训练的关系抽取模型，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系。

步骤103，基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案，知识图谱由多个实体以及多种预设实体关系形成。

本实施例中的作业机械可以为挖掘机、桩机、搅拌机等。

知识图谱是一种用于表述真实世界中存在的各种实体概念及其关系的技术。本实施例中的实体可以包括作业机械中的故障件、现象、故障的原因以及处理方法，相对应的预设实体关系指的是两个实体之间具有的某种关系，如“现象为”、“原因为”、“方法为”等预设实体关系，具体的，可以使用预先训练的关系抽取模型对故障问题中包含的预设实体关系进行抽取，确定故障问题中识别出的实体两两之间的相关性，判断两个实体之间的相关性与相关性阈值的大小关系，若两个实体之间的相关性大于相关性阈值则两个实体之间的相关性满足相关性阈值，若两个实体之间的相关性满足相关性阈值，则确定这两个实体之间存在预设实体关系，示例性的，确定的故障问题中包含的实体为实体A和实体B，首先对实体A和实体B之间进行“现象为”的预设实体关系的判断，若两个实体之间的相关性满足相关性阈值，则确定实体A和实体B之间存在“现象为”的预设实体关系，即实体A的现象为实体B，否则，继续对实体A和实体B之间进行“原因为”的预设实体关系的判断，若两个实体之间的相关性满足相关性阈值，则确定实体A和实体B之间存在“原因为”的预设实体关系，即实体A的原因为实体B，否则，继续对实体A和实体B之间进行“方法为”的预设实体关系的判断。上述步骤中，实体A和实体B的顺序不可颠倒，也就是说可能实体A与实体B之间不存在“原因为”的预设实体关系，但实体B与实体A之间存在“原因为”的预设实体关系。

实际应用中，在接收到用户输入的作业机械的故障问题后，需要对故障问题进行信息抽取和语义理解，具体的可以通过自然语言处理(Natural Language Processing,NLP)中的自然语言理解(Natural Language Understanding,NLU)的方式进行语义理解。

在确定了实体之间的预设实体关系后，可以形成(实体，关系，实体)的三元组，确定三元组即确定了故障问题的语义，作为关键信息，此时可以基于预先构建的知识图谱确定故障问题的答案，该故障问题的答案用于辅助故障问题的诊断和维修。其中的知识图谱由多个实体以及多种预设实体关系形成，用于对所有的故障问题进行统一的、标准的及规范化的管理。

本实施例提供的用于作业机械的问答方法中，通过预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，确定故障问题中存在的实体后，基于预先训练的关系抽取模型，确定在预设实体关系下故障问题中每两个实体之间的相关性，若存在两个实体的相关性满足相关性阈值，则确定这两个实体之间存在预设实体关系，这样，通过实体之间的相关性来确定是否存在预设实体关系，可以更为准确的抽取出故障问题中包含的预设实体关系，基于识别出的实体以及确定的预设实体关系，再结合预先构建的知识图谱，可以确定故障问题的答案，由于知识图谱可以将复杂的语义知识进行直观的表示，因此可以准确地找到故障问题的答案，辅助故障问题的诊断和维修，从而可以有效提高作业机械故障诊断与维修的效率。

另外，对于简单易修不需要配件更换的故障，作业机械的用户也可以通过故障问题的答案实现自主诊断和维修，而不需要待机等待维修工程师维修，从而提高了故障诊断和维修的效率。

在示例性实施例中，在对输入的作业机械的故障问题进行实体识别之前，还需要对故障问题进行分词和词性标注。实施中，标注的词性可以是动词或名词等词性，如此，可以为故障问题的实体识别提供帮助，利于准确地进行实体识别。

在示例性实施例中，识别出故障问题中的实体以及确定预设实体关系后，可以通过槽位填充、会话策略及响应机制等方式处理整个问答的流程，同时可以将与用户进行问答的过程进行存储，在与同一个用户进行问答时，可以调用该用户的历史问答记录，综合用户输入的故障问题，获得故障问题的答案，从而实现综合判断，示例性的可以使用redis存储和调用用户的历史问答记录。

在示例性实施例中，基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案，包括：

基于子图，确定故障问题的至少一个候选答案；

将出现概率最大的至少一个候选答案作为故障问题的答案。

其中，每个候选答案的出现概率是该候选答案的出现次数与所有候选答案的出现次数总和的比值。其中，候选答案的出现次数可以反映出现频率。

实施中，可以通过贝叶斯概率在知识图谱中确定故障问题的答案，具体的，在确定实体与关系之间的三元组之后，根据故障问题中的实体以及确定的预设实体关系去知识图谱中识别相同的实体，之后将相同的实体以及相关联的实体拆分出来构成子图，在子图中可以确定故障问题的至少一个候选答案，实施中，候选答案也可以为多个，接下来可以基于预先统计的每个候选答案的出现次数，确定每个候选答案的出现概率，即先验概率，进而可以确定故障问题的答案，并向用户进行推送，示例性的，在故障问题中确定的实体为发动机和异响，进一步确定二者之间的关系为现象为，即确定的三元组为(发动机，现象为，异响)，从子图中可以确定导致发动机异响的原因有两种，其中原因A出现的次数为8次，原因B出现的次数为2次，基于此，可以确定产生发动机异响的原因为原因A的概率为80％，为原因B的概率为20％，可以确定故障问题的答案为原因A，实施中，故障问题的答案也可以确定多个，如将原因A和原因B一同确定为故障问题的答案。

在本实施例中，通过使用贝叶斯概率确定故障问题的答案，由于贝叶斯概率是从确定的分布中观测到的频率来计算概率，因此可以更为准确的确定故障问题的答案。

在示例性实施例中，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系，包括：

获取故障问题的向量表示；

具体的，故障问题的向量表示可以通过嵌入(embedding)编码生成。

图2是本发明提供的用于作业机械的问答方法的流程示意图之二。

如图2所示，在示例性实施例中，故障问题的向量表示包括句向量表示和字向量表示；基于故障问题的向量表示，获得第一向量表示和第二向量表示，包括：

步骤201、获取故障问题的向量表示的前一层的向量表示；

步骤202、至少将前一层的向量表示中的每个字向量表示分别加上故障问题的句向量表示，得到第一向量表示；

步骤203、将故障问题的向量表示作为第二向量表示。

故障问题的向量表示中，首个节点为CLS节点，即句向量表示，用于存储故障问题的完整的语句的信息，其余节点为字向量表示。由于最终得到的故障问题的向量表示中句向量表示可以更加准确地表达故障问题的整个句子的语义，因此，将故障问题的向量表示的前一层的向量表示加上故障问题的向量表示的句向量表示，得到的第一向量表示也能够更加准确地表达每个字的语义，进而对实体进行准确地表达。可以将前一层的向量表示中的每个字向量表示分别加上故障问题的句向量表示，进一步的，还可以将前一层的向量表示中的句向量表示也加上故障问题的句向量表示。

下面结合关系抽取模型的网络结构来详细介绍。

如图3所示，关系抽取模型可以包括向量表示层、交互层(图中以“+”示意)、相关性计算层(图中以“F”示意)和激活层(Sigmoid)。

向量表示层用于获得故障问题的向量表示，故障问题的向量表示包括句向量表示和字向量表示。向量表示层可以为embedding层，可以为预训练模型。

交互层用于至少将前一层的向量表示中的每个字向量表示分别加上故障问题的句向量表示，得到第一向量表示，其中的实体作为头实体，即Head，实际应用中，可以至少将头实体的每个字向量表示分别加上尾实体的句向量表示，实施中，头实体的句向量表示也可以与尾实体的句向量表示相加，也即通过结合上下文的信息综合判断实体之间的关系。

将故障问题的向量表示作为第二向量表示，其中的实体作为尾实体，即Tail。

相关性计算层用于基于第一向量表示和第二向量表示计算相关性矩阵，例如可以将第一向量表示和第二向量表示进行叉乘运算，获得不同预设实体关系下的相关性矩阵。需要说明的是，不同预设实体关系下，采用的预设网络参数不同，因此，可以得到不同的相关性矩阵。

激活层用于对相关性矩阵进行归一化，可以将叉乘的结果控制在0-1的范围之间。

示例性的，如图3所示，头实体中包括实体1-B、实体2-B、实体2-I、0以及实体3-B，其中，实体1-B代表实体1，实体2-B和实体2-I代表实体2，实体3-B代表实体3，实体2-B和实体2-I的区别在于，实体2-B为实体中的第一个字，实体2-I为实体中的第二个字，如，实体2可以为“引擎”，则实体2-B代表“引”，实体2-I代表“擎”。

在每个相关性矩阵中，可以基于该相关性矩阵中头实体的位置和尾实体的位置对应的分数(用于表征相关性的大小的分数)确定这两个实体之间的相关性。在相关性矩阵中，实体的位置以矩阵的行和列的坐标进行示意，例如，确定坐标(1,2)和坐标(1,3)为实体1与实体2的交叉点，可以基于坐标(1,2)和坐标(1,3)对应的分数和确定实体1和实体2之间的相关性，如坐标(1,2)对应的分数为0.5，坐标(1,3)对应的分数为0.3，则实体1和实体2之间的相关性为0.8(0.5+0.3＝0.8)，判断0.8是否达到相关性阈值，也可以基于坐标(1,2)和坐标(1,3)对应的分数均值确定实体1和实体2之间的相关性，如坐标(1,2)对应的分数为0.5，坐标(1,3)对应的分数为0.3，则实体1和实体2之间的相关性为0.4((0.5+0.3)/2＝0.4)，判断0.4是否达到相关性阈值，若是达到相关性阈值，则确定实体1和实体2之间存在该相关性矩阵对应的预设实体关系。实体1和实体3、实体2和实体1、实体2和实体3、实体3和实体1以及实体3和实体2之间是否存在上述预设实体关系也可以如上述示例进行判断。

在本实施例中，通过构建实体之间的相关性矩阵的方式，对故障问题中的实体之间的预设实体关系进行判断，通过相关性矩阵可以确定两个实体之间的相关性的大小，若是满足了一定的相关性阈值，则确定两个实体之间存在预设实体关系，如此，通过系统化的对实体之间的关系进行量化的分析，可以更为准确的确定实体之间的预设实体关系，进而完成关系抽取。

下面结合实体识别模型的网络结构来对实体识别的过程进行详细介绍。

在示例性实施例中，对输入的作业机械的故障问题进行实体识别，包括：

获取故障问题的向量表示；

基于故障问题的向量表示以及故障问题的上下文进行实体识别。

如图4所示，本实施例提供的实体识别模型可以包括编码层、识别层和解码层。

其中，编码层用于对故障问题进行编码，生成故障问题的向量表示。具体的，利用实体识别模型的编码层对故障问题进行embedding编码后，生成故障问题的向量表示，实施中，可以对故障问题中的每个字进行embedding编码，进而得到每个字的向量表示。因此，编码层也可以为embedding层，也可以为上述预训练模型。

识别层用于基于故障问题的向量表示以及故障问题的上下文进行实体识别，得到实体的每个字的标签输出表示。

解码层用于对实体的每个字的标签输出表示进行解码，得到每个字的输出标签，以得到识别的实体，其中的输出标签包括第一输出标签和第二输出标签，第一输出标签对应实体的开头的字，第二输出标签对应实体的开头之后的字。

由于同一个实体在不同的上下文中可能有不同的含义，因此在对故障问题进行实体识别的过程中还需要结合故障问题的上下文，示例性的，单独以“电磁阀”这一实体并不能确定是哪个位置的电磁阀，但是如果结合上下文，是可以对实体的语义分析带来一定的帮助的，据此，确定是哪个位置的电磁阀。基于此，上述识别层可以为双向LSTM模型，如此，可以利用上下文信息提高实体识别的准确性。

实际应用中，在得到故障问题中每个字的字向量表示之后，可以通过实体识别模型中的识别层，得到每个字的标签输出表示，之后可以使用实体识别模型中的解码层，如条件随机场(conditional random fields，CRF)对字的标签输出表示进行解码，如此可以得到每个字的输出标签，经过进一步解码后可以确定故障问题中的实体，也即完成了故障问题的实体识别。

参见图4的示例，对于故障问题的实体识别结果为B-故障件、I-故障件、I-故障件、B-现象和I-现象，其中的故障件指的就是发动机，现象指的是异响，故障件和现象前会带有前缀B或前缀I，其中前缀B代表是实体中的开头，前缀I代表是实体中开头之后的字。

实施中，在通过识别层得到每个字的标签输出表示后，也可以通过枚举法确定故障问题中的实体，示例性的，故障问题为“发动机异响”，可以先枚举“发”，通过与预设的实体进行对照，可以确定“发”是否为实体，再确定“发动”是否为实体，再确定“发动机”是否为实体，如此，对故障问题中所有的字进行枚举完成后，可以确定故障问题中存在的实体为“发动机”和“异响”。

在本实施例中，通过将故障问题进行向量表示，并结合上下文，可以更为准确的确定故障问题中的实体，并有效的消除歧义，提高对作业机械的故障问题进行诊断与维修的效率。

图5是本发明提供的用于作业机械的问答方法的流程示意图之三。

图6是本发明提供的用于实体对齐的流程示意图之一。

如图5和图6所示，示例性实施例中，对输入的作业机械的故障问题进行实体识别之后，还包括：

步骤501，将识别的每个实体的向量空间映射到标准高斯空间；

步骤502，在标准高斯空间中，计算实体与标准实体之间的相似度；

步骤503，若相似度达到第一设定阈值，将实体与标准实体进行标准化对齐。

对于同一种实体来说，不同的人可能会有不同的描述方式，即，可能存在口语化的表述方式，例如，通过用户A输入的故障问题识别出的实体为“马达”，通过用户B输入的故障问题识别出的实体为“引擎”，通过用户C输入的故障问题识别出的实体为“发动机”，可以看出，“马达”、“引擎”以及“发动机”，虽然表述不同，但是其指向的都是“发动机”这一实体，因此，对故障问题进行信息抽取还包括进行实体对齐，在本实施例中，就是通过实体对齐的方式，将不同用户输入的故障问题中的口语化实体与标准实体进行标准化对齐，其中标准实体可以预先定义，如将“发动机”、“马达”和“引擎”的标准实体定义为“发动机”，也可以定义为“马达”。

本实施例中，进行实体对齐可以判断两个或多个不同信息来源的实体，是否为指向真实世界中的同一个对象，如果找到了多个实体表征同一个实体，如“发动机”、“马达”和“引擎”这些实体都是表征同一个实体，需要在这些实体之间构建对齐关系，同时对实体包含的信息进行融合和聚集。

在本实施例中，可以使用向量空间映射的方法将每个实体的向量空间映射到标准高斯空间。其中，实体的向量空间和标准高斯空间之间为可逆映射的关系。实施中，可以预先设置标准高斯空间中的标准实体。

在本实施例中，通过对实体进行标准化对齐，可以更好的确定故障问题的真实语义，避免因为不同的描述方式导致无法识别实体的问题发生。

图7是本发明提供的用于作业机械的问答方法的流程示意图之四。

如图7所示，示例性实施例中，知识图谱是通过如下方式构建的：

步骤701，获取多个初始知识图谱，各初始知识图谱是基于不同的数据源构建的。

步骤702，生成每个初始知识图谱的每个节点的向量表示。

步骤703，计算不同初始知识图谱中的节点的向量表示之间的相似度。

步骤704，将相似度满足相似度阈值的节点合并，得到知识图谱。

由于知识图谱是一种用图模型来描述不同实体之间关联关系的技术方法，其本质是描述实体之间关系的语义网络。通过知识图谱，可以将复杂的语义知识进行直观的表示，因此可以将知识图谱中的每一个实体视为一个节点，实体之间的实体关系即可以视为连接节点的线路，进而可以通过节点及各节点之间的关系，推理事件发生的潜在模式。在构建知识图谱的过程中，若是使用的数据源不同，构建出的知识图谱也可能不会完全相同，因此可以通过深度学习的方式，使用多个不同的数据源构建多个初始知识图谱，再将初始知识图谱进行合并形成最终的知识图谱。

可以通过将初始知识图谱中的节点进行合并的方式，将多个初始知识图谱合并。具体的，可以对初始知识图谱中的节点进行embedding编码，得到每个节点的向量表示，通过每个节点的向量，表示计算不同的初始知识图谱中的节点之间的相似度，若两个节点之间的相似度满足相似度阈值，则将两个节点进行合并，示例性的，将相似度大于或者等于相似度阈值的两个节点进行合并，从而将相似度高的节点合并，相似度高的节点认为是同一个节点，可以进行合并。

实施中，构建出的知识图谱可以采用图形数据库进行存储，例如neo4j数据库。知识图谱具体可以采用GCN等图网络模型。

在本实施例中，通过不同的数据源分别构建初始知识图谱，再将不同的初始知识图谱通过节点合并的方式进行融合，如此可以构建更完善的知识图谱，在基于知识图谱进行确定故障问题的答案时，也可以获得更准确的答案，可以实现对作业机械的故障问题进行更高效率的诊断与维修。

示例性实施例中，初始知识图谱是通过如下方式构建的：

利用实体识别模型，对数据源进行实体识别；

客户关系管理系统中通常记录有大量的非结构化的设备故障记录，可以将这些非结构化的设备故障记录结构化后构建成知识图谱，此外，还可以将作业机械的维修手册、经典的故障案例以及由维修工程师总结的故障经验作为数据源，构建知识图谱。

获取数据源后，可以对该数据源的数据进行实体识别和关系抽取，进而构建得到该数据源下的初始知识图谱。关于实体识别和关系抽取的具体步骤可以参照上述实施例实施，此处不再赘述。

本实施例中，通过对数据源中的数据进行实体识别和关系抽取构建初始知识图谱，可以有效确定数据源中的数据的语义信息，进而使得构建的初始知识图谱更为准确。

如前所述，关系抽取模型可以是基于预训练模型得到的，实体识别模型也可以是基于预训练模型得到的。而预训练模型是基于作业机械领域的自然语言预训练得到的。

实际应用中，预训练模型可以使用作业机械领域内的大量数据来训练得到，训练得到的预训练模型为自然语言预训练模型，示例性的，可以训练得到BERT模型(Bidirectional Encoder Representation from Transformers)。可以利用预训练模型构建上述实体识别模型并利用数据源进行训练，还可以利用预训练模型构建上述关系抽取模型并利用数据源进行训练。

现有技术中的预训练模型一般都是使用各种领域的大量的开放域数据集训练获得，而本实施例中，是使用的作业机械领域内的数据训练得到预训练模型，如此，在作业机械领域内，该预训练模型能够学习到更多作业机械领域的知识，从而可以在作业机械领域中更好的发挥效果。

由于现有技术中使用的预训练模型参数量都非常巨大，导致模型运行速度非常缓慢，实际应用过程中，给用户带来了极大不便，因此，在示例性实施例中，可以使用模型蒸馏的技术完成预训练模型的训练，具体的，可以首先训练一个较大参数量的预训练模型，之后重新设计一个参数量较小的预训练模型，并利用较大参数量的预训练模型对参数量较小的预训练模型进行训练，使得参数量较小的预训练模型学习到参数量较大的预训练模型的预测概率以及知识分布，如此便完成了使用参数量更小的预训练模型实现参数量更大的预训练模型的功能。

示例性的，可以以Transformer为网络结构训练BERT预训练模型作为参数量较大的预训练模型，可以以长短期记忆网络(Long Short-Term Memory，LSTM)作为网络结构的预训练模型作为参数量较小的预训练模型。

在本实施例中使用模型蒸馏的方式可以减少预训练模型的参数量，并且极大的提高模型运行的速度，例如可以提升模型推理速度10倍以上。

图8是本发明提供的用于作业机械的问答方法的流程示意图之五。

如图8所示，在示例性实施例中，训练获得预训练模型之后，训练实体识别模型以及关系抽取模型之前，还需要对获取的数据源进行数据标注。

具体的，数据标注的过程包括：

整理词汇，即整理部分作业机械相关的术语词汇。

商讨规则，即在整理出相关的术语词汇后，共同讨论制定数据标注的规则。

尝试标注，即基于上述讨论制定的数据标注的规则，先对部分数据进行标注，基于标注的过程中反馈的问题，不断地完善规则，直至基本不在反馈问题。

标注培训，即对标注人员进行规则的培训。

分批标注，即将数据分批下发给标注人员，由标注人员对数据进行标注。

质检核准，即对标注的结果进行检验，保证数据标注的质量，其中可以使用交叉验证的方式进行检验，即将同样的数据分发给不同的人进行标注，若是不同的人数据标注的结果一致，则视为数据标注正确，若不同的人数据标注的结果不一致，则可以进行进一步的质检。

整理归档，即把检验合格的标注的数据进行整合，用于实体识别模型以及关系抽取模型的训练。

其中的数据标注指的就是对故障问题中的实体以及实体间的预设实体关系进行标注。具体的，可以是将数据源的数据标注上预定义的标签。

实际应用中，可以通过小批量标注加大批量机器自动抽取的技术完成实体识别模型以及关系抽取模型的构建，其中，小批量标注指的是使用人工标注的方式对数据源中的部分数据进行手动标注，具体的，可以人工整理技术词汇并讨论确定数据标注的规则，再基于小批量标注的过程中反馈的问题不断完善数据标注的规则，数据标注的规则完善后即可以初步构建实体识别模型以及关系抽取模型，进一步的，可以使用机器辅助标注，即以人工标注为主，使用初步构建的实体识别模型以及关系抽取模型为人工标注提供参考，如此，在数据标注的过程中，可以对实体识别模型和关系抽取模型进行进一步的完善。

实施中，大批量机器自动抽取指的是，在机器辅助标注的过程中，可以对数据源中的所有数据分批次的完成数据标注，如此可以基于数据标注的过程中遇到的问题再次对实体识别模型以及关系抽取模型进行调整。

实施中，数据标注过程中可以对数据标注的结果进行质检以及交叉验证，以保证数据标注的质量，其中的交叉验证指的是将同样的数据分发给不同的人进行标注，若是不同的人数据标注的结果一致，则视为数据标注正确，若不同的人数据标注的结构不一致，则可以进行进一步的质检，最终确定数据标注的结果。

本实施例中通过小批量标注加大批量机器自动抽取的方式最终训练得到实体识别模型以及关系抽取模型，打破了传统的知识图谱构建过程中，所有的数据都是由人工进行整理的限制，打通和制定了标准化的知识图谱和数据标注流程，通过人工标注加机器辅助标注的方式可以加快实体识别模型以及关系抽取模型的训练速度，并且提升实体识别模型以及关系抽取模型的准确度。

示例性实施例中，在对输入的作业机械的故障问题进行实体识别之前，还包括：

也就是说，本实施例提供的用于作业机械的问答方法不仅可以对用户输入的故障问题进行问答，还可以对常识问答、设备操作指引和闲聊对话等问题做出回复。

实际应用中，可以预先设置关于常识问答、设备操作指引和闲聊对话等问题的问答对并进行存储，在用户输入问题后，首先通过意图识别模型对用户输入问题的意图进行识别，并根据意图的不同，自动跳转至对应的问答的具体机制对问题进行处理，若确定用户输入的问题为故障问题，则依照上述实施例提供的方法进行处理，具体包括：利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；利用预先训练的关系抽取模型，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系；基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案。

若是确定输入的问题不是故障问题，则根据预先设置的关于常识问答、设备操作指引和闲聊对话等问题的问答对中筛选与输入的问题对应的答案。问答对中包括标准问题和对应的答案。可以计算输入的问题与问答对中的标准问题的匹配程度(如语义相似度)，若满足匹配程度阈值，则标准问题对应的答案为输入的问题对应的答案。

实施中，筛选出与输入的问题对应的答案后，可以使用自然语言生成技术(Natural Language Generating,NLG)对用户进行回答。具体的，可以自动的将与输入的问题对应的答案进行语句顺序以及语法逻辑等方面的修改后，生成人类可以理解的自然语言。

在基于问答对筛选与输入的问题对应的答案的过程中，可以使用召回排序的方式确定输入的问题对应的答案，具体的，召回排序指的是根据用户输入的问题从预先生成的问答对中快速召回与输入的问题相对应的答案，再经过匹配程度的排序后，可以将若干个答案按照顺序推送给用户。实施中，可以采用多路召回加排序的方式确定输入的问题对应的答案，多路召回指的是使用不同的策略从多个角度进行召回，如此可以使筛选出来的与输入的问题对应的答案更加准确。

实际应用中，意图识别模型也可以基于预训练模型训练得到。

在本实施例中，不仅可以对作业机械的故障问题进行回答，还可以实现闲聊对话、常识问答以及设备操作指引等功能，可以有效提高服务质量，可以有效解决一般用户不会系统的学习作业机械操作手册，遇到不会操作的问题时，查找困难的问题。

图9是本发明提供的用于作业机械的问答方法的流程示意图之六。

如图9所示，在一个具体的实施例中，用户输入问题后，经过问题预处理、自然语言理解、会话管理以及图计算步骤后可以得到问题对应的答案，其中问题预处理包括中文分词、语义消歧、词性标注、文字纠错、句法分析以及敏感词过滤，自然语言理解包括意图识别、实体识别、关系抽取以及实体对齐，会话管理包括槽位填充、状态跟踪、会话策略、状态存储、响应机制以及应急机制，图计算包括信息检索、子图生成、概率计算、自然语言生成、重排序以及结果返回。

下面对本发明提供的用于作业机械的问答系统进行描述，下文描述的用于作业机械的问答系统与上文描述的用于作业机械的问答方法可相互对应参照。

图10是本发明提供的用于作业机械的问答系统的结构示意图之一。

图11是本发明提供的用于作业机械的问答系统的结构示意图之二。

如图10所示，本实施例提供的用于作业机械的问答系统包括：

实体识别单元1001，用于利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；

关系抽取单元1002，用于利用预先训练的关系抽取模型，针对每种预设实体关系，确定在预设实体关系下故障问题中每两个实体的相关性，若两个实体的相关性满足相关性阈值，确定两个实体之间存在预设实体关系；

答案确定单元1003，用于基于识别出的实体、确定的预设实体关系以及预先构建的知识图谱，确定故障问题的答案，知识图谱由多个实体以及多种预设实体关系形成。

如图11所示，本实施例提供的用于作业机械的问答系统包括数据层、技术层、接入层和应用层，其中应用层设置于终端设备，示例性的，终端设备可以为手机或电脑等，接入层、技术层和数据层设置于服务器端，接入层用户实现终端和服务器端的交互。

其中技术层中的敏感词过滤指的是通过规则上的匹配，过滤掉预先定义的敏感词，示例性的可以为涉黄涉暴之类的敏感词。

子图生成指的是根据用户输入的问题中的实体去知识图谱中识别相同的实体以及相关联的实体，将其从知识图谱中拆分出来即为子图。

子句拆分指的是一句话中可能含有多个问题，将多个问题拆分开。

状态跟踪指的是对用户的历史问答记录进行跟踪。

槽位填充指的是将提取出的两个实体填充成三元组的形式。示例性的，故障件和现象都是关键的槽位，其中更为关键的是现象，若是提取出的实体中只有故障件，则需要对用户进行追问现象，若是提取出的实体中只有现象，则可以不对用户追问故障件。

数据层中的人工中台指的是总服务器。

人工启发指的是人为制定规则，示例性的在关系抽取模型训练过程中的标注人员对数据进行标注即人工启发。

在示例性实施例中，关系抽取单元1002具体用于：

获取故障问题的向量表示；

在示例性实施例中，关系抽取单元1002具体用于：

获故障问题的向量表示的前一层的向量表示；

将故障问题的向量表示作为第二向量表示。

在示例性实施例中，答案确定单元1003具体用于：

基于子图，确定故障问题的至少一个候选答案；

将出现概率最大的至少一个候选答案作为故障问题的答案。

在示例性实施例中，还包括实体对齐单元，实体对齐单元具体用于：

将识别的每个实体的向量空间映射到标准高斯空间；

在标准高斯空间中，计算实体与标准实体之间的相似度；

若相似度达到第一设定阈值，将实体与标准实体进行标准化对齐。

在示例性实施例中，知识图谱是通过如下方式构建的：

生成每个初始知识图谱的每个节点的向量表示；

计算不同初始知识图谱中的节点的向量表示之间的相似度；

将相似度满足相似度阈值的节点合并，得到知识图谱。

在示例性实施例中，初始知识图谱是通过如下方式构建的：

利用实体识别模型，对数据源进行实体识别；

在示例性实施例中，关系抽取模型是基于预训练模型得到的，和/或，实体识别模型是基于预训练模型得到的；

预训练模型是基于作业机械领域的自然语言预训练得到的。

在示例性实施例中，还包括意图识别单元，意图识别单元具体用于：

图12示例了一种电子设备的实体结构示意图，如图12所示，该电子设备可以包括：处理器(processor)1210、通信接口(Communications Interface)1220、存储器(memory)1230和通信总线1240，其中，处理器1210，通信接口1220，存储器1230通过通信总线1240完成相互间的通信。处理器1210可以调用存储器1230中的逻辑指令，以执行用于作业机械的问答方法，该方法包括：利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；

此外，上述的存储器1230中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，计算机程序被处理器执行时，计算机能够执行上述各方法所提供的用于作业机械的问答方法，该方法包括：利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的用于作业机械的问答方法，该方法包括：利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，实体与作业机械的故障相关；

本发明还提供一种作业机械，作业机械用于执行如上述各实施例所提供的用于作业机械的问答方法，或者包括各实施例所提供的用于作业机械的问答系统，或者包括各实施例所提供的电子设备，或者包括各实施例所提供的非暂态计算机可读存储介质，或者包括各实施例所提供的计算机程序产品。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims

1.一种用于作业机械的问答方法，其特征在于，包括：

利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，所述实体与所述作业机械的故障相关；

利用预先训练的关系抽取模型，针对每种预设实体关系，确定在所述预设实体关系下所述故障问题中每两个所述实体的相关性，若两个所述实体的相关性满足相关性阈值，确定两个所述实体之间存在所述预设实体关系；

基于识别出的所述实体、确定的所述预设实体关系以及预先构建的知识图谱，确定所述故障问题的答案，所述知识图谱由多个所述实体以及多种所述预设实体关系形成。

2.根据权利要求1所述的用于作业机械的问答方法，其特征在于，所述针对每种预设实体关系，确定在所述预设实体关系下所述故障问题中每两个所述实体的相关性，若两个所述实体的相关性满足相关性阈值，确定两个所述实体之间存在所述预设实体关系，包括：

获取所述故障问题的向量表示；

基于所述故障问题的向量表示，获得第一向量表示和第二向量表示，所述第一向量表示中所述实体作为头实体，所述第二向量表示中所述实体作为尾实体；

基于所述第一向量表示和所述第二向量表示，获得每种所述预设实体关系下，所述第一向量表示和所述第二向量表示之间的相关性矩阵，所述相关性矩阵包含各所述头实体与各所述尾实体之间的相关性；若所述头实体和所述尾实体之间的相关性满足所述相关性阈值，确定所述头实体和所述尾实体之间存在所述预设实体关系。

3.根据权利要求2所述的用于作业机械的问答方法，其特征在于，所述故障问题的向量表示包括句向量表示和字向量表示；所述基于所述故障问题的向量表示，获得第一向量表示和第二向量表示，包括：

获取所述故障问题的向量表示的前一层的向量表示；

至少将所述前一层的向量表示中的每个字向量表示分别加上所述故障问题的句向量表示，得到所述第一向量表示；

将所述故障问题的向量表示作为所述第二向量表示。

4.根据权利要求1至3任一项所述的用于作业机械的问答方法，其特征在于，所述基于识别出的所述实体、确定的所述预设实体关系以及预先构建的知识图谱，确定所述故障问题的答案，包括：

从所述知识图谱中获取与识别出的所述实体、确定的所述预设实体关系对应的子图；

基于所述子图，确定所述故障问题的至少一个候选答案；

基于预先统计的每个所述候选答案的出现次数，确定每个所述候选答案的出现概率；

将出现概率最大的至少一个所述候选答案作为所述故障问题的答案。

5.根据权利要求1至3任一项所述的用于作业机械的问答方法，其特征在于，所述知识图谱是通过如下方式构建的：

获取多个初始知识图谱，各所述初始知识图谱是基于不同的数据源构建的；

生成每个所述初始知识图谱的每个节点的向量表示；

计算不同所述初始知识图谱中的所述节点的向量表示之间的相似度；

将相似度满足相似度阈值的所述节点合并，得到所述知识图谱。

6.根据权利要求5所述的用于作业机械的问答方法，其特征在于，所述初始知识图谱是通过如下方式构建的：

获取所述数据源，所述数据源至少包括所述作业机械的维修记录、维修手册、故障案例和故障经验；

利用所述实体识别模型，对所述数据源进行实体识别；

利用所述关系抽取模型，对所述数据源中识别出的所述实体进行多种所述预设实体关系的抽取；

基于所述实体识别的结果以及抽取的多种所述预设实体关系，构建所述初始知识图谱。

7.根据权利要求6所述的用于作业机械的问答方法，其特征在于，所述关系抽取模型是基于预训练模型得到的，和/或，所述实体识别模型是基于预训练模型得到的；

所述预训练模型是基于所述作业机械领域的自然语言预训练得到的。

8.根据权利要求1至3任一项所述的用于作业机械的问答方法，其特征在于，在所述对输入的作业机械的故障问题进行实体识别之前，还包括：

对输入的作业机械的问题进行意图识别，所述意图包括故障问题、常识问答、设备操作指引和闲聊对话；

若基于所述意图识别的结果确定输入的问题为所述故障问题，利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别；

若基于所述意图识别的结果确定输入的问题不是所述故障问题，从预设的问答对中筛选出与所述输入的问题对应的答案。

9.一种用于作业机械的问答系统，其特征在于，包括：

实体识别单元，用于利用预先训练的实体识别模型，对输入的作业机械的故障问题进行实体识别，所述实体与所述作业机械的故障相关；

关系抽取单元，用于利用预先训练的关系抽取模型，针对每种预设实体关系，确定在所述预设实体关系下所述故障问题中每两个所述实体的相关性，若两个所述实体的相关性满足相关性阈值，确定两个所述实体之间存在所述预设实体关系；

答案确定单元，用于基于识别出的所述实体、确定的所述预设实体关系以及预先构建的知识图谱，确定所述故障问题的答案，所述知识图谱由多个所述实体以及多种所述预设实体关系形成。

10.一种作业机械，其特征在于，所述作业机械用于执行如权利要求1至8任一项所述用于作业机械的问答方法，或者包括如权利要求9所述的用于作业机械的问答系统。