CN110659366A

CN110659366A - 语义解析方法、装置、电子设备以及存储介质

Info

Publication number: CN110659366A
Application number: CN201910902505.XA
Authority: CN
Inventors: 杨振宇
Original assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Current assignee: Guangdong Oppo Mobile Telecommunications Corp Ltd
Priority date: 2019-09-24
Filing date: 2019-09-24
Publication date: 2020-01-07

Abstract

本申请公开了一种语义解析方法、装置、电子设备以及存储介质，涉及电子设备技术领域。所述方法包括：获取待查询语句，对待查询语句进行实体识别，获取待查询语句中的目标实体，将目标实体与知识图谱进行实体链接，获得与目标实体对应的实体内容，基于实体内容对待查询语句进行意图分析，获得与待查询语句对应的至少一个意图分类。本申请实施例提供的语义解析方法、装置、电子设备以及存储介质通过先定位目标实体，通过实体链接从知识图谱中获取目标实体对应的实体内容，再对实体内容进行意图分析获得至少一个意图分类，从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。

Description

语义解析方法、装置、电子设备以及存储介质

技术领域

本申请涉及电子设备技术领域，更具体地，涉及一种语义解析方法、装置、电子设备以及存储介质。

背景技术

随着科学技术的发展，电子设备的使用越来越广泛，功能越来越多，已经成为人们日常生活中的必备之一。目前，电子设备可以用于接收用户的输入并基于输入识别用户的意图，但是，电子设备在应用到某些特定领域时，难以做到意图的准确识别，导致推送给用户的资源过多，用户体验不佳的问题。

发明内容

鉴于上述问题，本申请提出了一种语义解析方法、装置、电子设备以及存储介质，以解决上述问题。

第一方面，本申请实施例提供了一种语义解析方法，所述方法包括：获取待查询语句；对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体；将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容；基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类。

第二方面，本申请实施例提供了一种语义解析装置，所述装置包括：待查询语句获取模块，用于获取待查询语句；目标实体获取模块，用于对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体；实体内容获得模块，用于将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容；意图分类获得模块，用于基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类。

第三方面，本申请实施例提供了一种电子设备，包括存储器和处理器，所述存储器耦接到所述处理器，所述存储器存储指令，当所述指令由所述处理器执行时所述处理器执行上述方法。

第四方面，本申请实施例提供了一种计算机可读取存储介质，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行上述方法。

本申请实施例提供的语义解析方法、装置、电子设备以及存储介质，获取待查询语句，对待查询语句进行实体识别，获取待查询语句中的目标实体，将目标实体与知识图谱进行实体链接，获得与目标实体对应的实体内容，基于实体内容对待查询语句进行意图分析，获得与待查询语句对应的至少一个意图分类，从而通过先定位目标实体，再通过实体链接从知识图谱中获取目标实体对应的实体内容，再对实体内容进行意图分析获得至少一个意图分类，从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它的附图。

图1示出了本申请一个实施例提供的语义解析方法的流程示意图；

图2示出了本申请又一个实施例提供的语义解析方法的流程示意图；

图3示出了本申请的图2所示的语义解析方法的步骤S220的流程示意图；

图4示出了本申请的图2所示的语义解析方法的步骤S250的流程示意图；

图5示出了本申请的图4所示的语义解析方法的步骤S252的流程示意图；

图6示出了本申请实施例提供的语义解析装置的模块框图；

图7示出了本申请实施例用于执行根据本申请实施例的语义解析方法的电子设备的框图；

图8示出了本申请实施例的用于保存或者携带实现根据本申请实施例的语义解析方法的程序代码的存储单元。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。

媒体垂域(音乐、视频、电台)是语音助手的重点技能，同时也是技术难度很高的领域，因此，为了获取多渠道的影音资源，打造语音助手深度个性化影音场景，需要对媒体垂域进行研发。其中，媒体垂域的语义理解由于实体强依赖性和实体复杂性，使得无法仅靠通用的文本分类技术实现意图理解及槽位提取。

其中，发明人经过研究发现，媒体垂域的意图识别有三个挑战：

(1)实体复杂性带来的过召回和定位问题：其中，从数字资源诞生至今，已产生大量资源，仅音乐领域：QQ音乐有约1500w的媒体资源、网易云音乐有约500w的媒体资源，其中，不同于传统人名、地名、机构名等实体识别任务，媒体资源的命名没有清晰固定的组成规则，其存在大量与生活场景、名词、动词相关的片段，且很多资源名本身便可成句。例如：“打电话”、“短信”、“闹钟”、“下一首”都可以是歌名。因此，通过词典匹配会误命中大量资源，造成过召回和定位的问题。

(2)实体信息嵌入问题，如何将实体识别后的信息嵌入到意图理解模型中，也为系统带来了较大的挑战：为解决实体嵌入的问题，目前的电子设备厂商采用的方式是基于常见问题解答(frequently asked questions，FQA)技术完成对音乐垂域的构建，其主要思想为给定用户文本，搜索出最相似的音乐资源，其整体架构分为：意图抽取、知识库搜索排序、槽位抽取、路径选择及打分、线上数据反馈等几个模块。具体地：1、对用户文本进行预处理及特征抽取；2、从知识库中召回相似歌曲，使用learn to rank排序确定用户想听的歌名；3、根据歌名抽取槽位(slot)，获取实体信息；4、通过构建实体特征，利用梯度下降树(gradient boosting decision tree，GBDT)模型打分完成对实体嵌入信息的引用；5、使用用户反馈优化LTR及打分模型。

然而，上述方式仍然存在过召回的问题和架构冗余的问题。具体地，由于使用全用户文本进行资源召回，并且资源名称复杂度高，因此存在大部分用户文本都能召回资源实体的情况，在后续分类过程中会导致非媒体资源被召回，无法解决实体复杂性带来的过召回的问题。使用搜索+LTR解决用户文本的实体识别，和词典匹配+规则没有本质性差异，且将用户文本的意图识别与资源消岐杂糅在一起，不利于扩展，需要大量的训练语料及用户反馈数据进行优化，造成架构冗余的问题。

(3)无法支持后续的媒体垂域问答。

针对上述问题，发明人经过长期的研究发现，并提出了本申请实施例提供的语义解析方法、装置、电子设备以及存储介质，通过先定位目标实体，再通过实体链接从知识图谱中获取目标实体对应的实体内容，再对实体内容进行意图分析获得至少一个意图分类，从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。其中，具体的语义解析方法在后续的实施例中进行详细的说明。

请参阅图1，图1示出了本申请一个实施例提供的语义解析方法的流程示意图。所述语义解析方法用于通过先定位目标实体，再通过实体链接从知识图谱中获取目标实体对应的实体内容，再对实体内容进行意图分析获得至少一个意图分类，从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。在具体的实施例中，所述语义解析方法应用于如图6所示的语义解析装置200以及配置有所述语义解析装置200的电子设备100(图7)。下面将以电子设备为例，说明本实施例的具体流程，当然，可以理解的，本实施例所应用的电子设备可以为移动终端、平板电脑、穿戴式电子设备等，在此不做限定。下面将针对图1所示的流程进行详细的阐述，所述语义解析方法具体可以包括以下步骤：

步骤S110：获取待查询语句。

在一些实施方式中，用户可以在电子设备输入询问内容(query)，电子设备可以获取询问内容，并将询问内容作为待查询语句。其中，待查询语句可以是文本查询语句，也可以是语音查询语句，当待查询语句为文本查询语句时，用户可以通过电子设备的文本输入框中输入待查询语句，可以通过外设输入文本输入装置输入待查询语句，例如，可以通过键盘、鼠标、触控笔等输入待查询语句；当待查询语句为语音查询语句时，用户可以通过电子设备的拾音器输入待查询语句，例如通过麦克风输入待查询语句等。可选地，在本实施例中，电子设备获取的待查询语句为用户输入的语音信息，如电子设备获取的待查询语句为用户通过语音助手输入的语音信息。

例如，当用户输入的语音信息为“我要听七里香”时，则电子设备可以将“我要听七里香”确定为待查询语句；当用户输入的语音信息为“我要听悲伤的歌”时，则电子设备可以将“我要听悲伤的歌”确定为待查询语句；当用户输入的语音信息为“播放七里香”时，则电子设备可以将“播放七里香”确定为待查询语句等，在此不再赘述。

步骤S120：对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体。

其中，实体识别也称命名实体识别(named entity，NE)，是指在文档集合中识别出特定类型的事物名称或符号的过程。在一些实施方式中，电子设备可以通过命名实体识别(named-entity recognition，NER)对待查询语句进行实体识别，以获取该待查询语句中的目标实体，以解决仅通过词典匹配造成上下文不相关的问题，提升目标实体获取的准确率。

例如，当待查询语句为“我要听七里香”时，则对“我要听七里香”进行实体识别，获取所述待查询语句中的目标实体为“七里香”；当待查询语句为“我要听悲伤的歌”时，则对“我要听悲伤的歌”进行实体识别，获取所述待查询语句中的目标实体为“悲伤的歌”、“歌”、“悲伤”；当待查询语句为“播放七里香”时，则对“播放七里香”进行实体识别，获取所述待查询语句中的目标实体为“七里香”等，在此不再赘述。

步骤S130：将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容。

其中，知识图谱(knowledge graph/vault)是显示知识发展进程与结构关系的一系列不同的图形，通过可视化技术描述知识资源对应的特征信息，挖掘、分析、构建、绘制和显示特征信息及它们之间的相互联系，知识图谱中，各个特征之间形成网状结构，以清楚表达各个领域中对应实体之间的关联和实体所对应分类之间的关联。

其中，实体链接(entity linking，EL)是指将文本中的实体提及映射到给定的知识库(KB)，于本实施例中，是指将目标实体映射到知识图谱。在一些实施方式中，各个领域的知识图谱不同，因此，在将目标实体与知识图谱进行实体链接之前，可以先识别该目标实体所属的领域，并获取与该目标实体所属的领域对应的知识图谱，再将该目标实体与对应领域的知识图谱进行实体链接，以获得与该目标实体对应的实体内容。例如，若目标实体所属的领域为音乐领域，则可以获取音乐领域的知识图谱，再将该目标实体与音乐领域的知识图谱进行实体链接，以获得与该目标实体对应的实体内容。

例如，若目标实体为“七里香”，知识图谱为音乐领域对应的知识图谱，那么，将“七里香”与音乐领域对应的知识图谱进行实体链接后，可以获得与“七里香”对象的实体内容，其中，该实体内容可以包括“歌曲-七里香，演唱者-周杰伦”等，在此不做限定。

在一些实施方式中，电子设备可以通过实体链接(named-entity linking，NEL)将目标实体与知识图谱进行实体链接，以获得与目标实体对应的实体内容。可以理解的是，在本实施例中，是通过将目标实体与知识图谱进行实体链接，相较于将待查询语句与知识图谱进行识别链接的方式，可以降低资源过召回的问题。另外，本实施例通过抽象出NEL模块，使得整体架构在不更改模型的情况下能够快速支持资源更新、干预资源类别等。

步骤S140：基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类。

在一些实施方式中，电子设备在获取实体内容后，可以基于该实体内容对待查询语句进行意图分析，获得与该待查询语句对应的至少一个意图分类。其中，该至少一个意图分类可以包括：看电影、看电视剧、看综艺、听音乐等，在此不做限定。例如，若实体内容为“歌曲-七里香，演唱者-周杰伦”，则对实体内容“歌曲-七里香，演唱者-周杰伦”进行意图分析，可以获得与该待查询语句对应的意图分类为“听周杰伦的七里香”。

作为一种方式，可以对实体内容进行语义分析以实现对待查询语句的意图分析，将语义分析获得的至少一个分析结果作为该待查询语句对应的至少一个意图分类，以实现获得待查询语句对应的至少一个意图分类。

作为另一种方式，可以将实体内容输入已训练的意图分类模型，获得该已训练的意图分类模型输出的至少一个分类结果，将该至少一个分类结果作为待查询语句对应的至少一个意图分类，以实现获得待查询语句对应的至少一个意图分类。具体地，该已训练的意图分类模型可以由SVM(Support Vector Machine，支持向量机)模型、神经网络模型或者随机森林模型等分类模型训练获得，通过机器学习实现用户意图分类，有效提高用户意图分类的准确性，从而提高智能问答的准确度。例如，将实体内容作为模型输入单层神经网络模型的输入，所述实体内容对应的意图分类作为所述单层神经网络模型的输出，基于多组所述实体内容和对应的意图类别对所述单层神经网络模型进行训练，得到所述意图分类模型。

本申请一个实施例提供的语义解析方法，获取待查询语句，对待查询语句进行实体识别，获取待查询语句中的目标实体，将目标实体与知识图谱进行实体链接，获得与目标实体对应的实体内容，基于实体内容对待查询语句进行意图分析，获得与待查询语句对应的至少一个意图分类，从而通过先定位目标实体，再通过实体链接从知识图谱中获取目标实体对应的实体内容，再对实体内容进行意图分析获得至少一个意图分类，从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。

请参阅图2，图2示出了本申请又一个实施例提供的语义解析方法的流程示意图。下面将针对图2所示的流程进行详细的阐述，所述语义解析方法具体可以包括以下步骤：

步骤S210：获取待查询语句。

其中，步骤S210的具体描述请参阅步骤S110，在此不再赘述。

步骤S220：通过序列标注模型在所述待查询语句中框定待验证实体。

其中，序列标注包括自然语言处理中的分词、词性标注、命名实体识别、关键词抽取、词义角色标注等，在进行序列标注时可以给定特定的标签集合，以进行序列标注。具体而言，序列标注就是给定一个序列，对序列中的每一个元素做一个标记，或者说给每一个元素打一个标签，而其中命名实体识别、中文分词和词性标注等这些基本的自然语言处理都属于序列标注的范畴。

在一些实施方式中，电子设备在获取待查询语句后，可以通过序列标注模型在待查询语句中框定待验证实体，其中，待验证实体的数量可以为一个或多个，在此不做限定。其中，电子设备可以通过Bilstm+CRF模型进行命名实体识别以及待验证实体的框定，Bilstm+CRF模型的输入层是一个将文本序列中的每个汉字利用预先训练好的字向量进行向量化，作为Bi-LSTM层的输入。之后利用一个双向的LSTM(Bi-LSTM)对输入序列进行encode操作，也就是进行特征提取操作，由于双向LSTM将序列正向和逆向均进行了遍历，相较于单向LSTM可以提取到更多的特征，因此，采用双向LSTM的效果要比单向的LSTM效果好。在经过双向LSTM层之后，可以使用一个CRF层进行decode，将Bi-LSTM层提取到的特征作为输入，然后利用CRF从这些特征中计算出序列中每一个元素的标签。

CRF是机器学习的方法，机器学习中困难的一点就是如何选择和构造特征。Bi-LSTM属于深度学习方法，深度学习的优势在于不需要人为的构造和选择特征，模型会根据训练语料自动的选择构造特征。因此采用Bi-LSTM进行特征的选择构造，然后采用CRF根据得到的特征进行decode，得到最终的序列标注的结果，从而实现在待查询语句中框定待验证实体。

请参阅图3，图3示出了本申请的图2所示的语义解析方法的步骤S220的流程示意图。下面将针对图3所示的流程进行详细的阐述，所述方法具体可以包括以下步骤：

步骤S221：拟合所述待查询语句的上下文句法，获得拟合结果。

在一些实施方式中，为了解决词典匹配上下文不相关的问题，可以弱化对实体的拟合。在本实施例中，可以仅拟合待查询语句的上下文句法，获得拟合结果，以仅可能减少对资源实体词的拟合，进一步地解决词典匹配上下文不相关的问题。

步骤S222：基于所述拟合结果从所述待查询语句中抽取所述待验证实体。

进一步地，在获得拟合结果后，可以基于拟合结果从待查询语句中抽取可能为实体的片段作为待验证实体。作为一种方式，可以通过Bilstm+CRF模型从待查询语句中抽取可能为实体的片段作为待验证实体。

步骤S230：基于预设实体校验规则对所述待验证实体进行筛选，从所述待验证实体中确定满足所述预设实体校验规则的所述目标实体。

在一些实施方式中，电子设备获取的待验证实体的数量可以为一个或多个。其中，当待验证实体的数量为一个时，可以判断该一个待验证实体是否满足实体校验规则，当该一个待验证实体不满足实体校验规则时，可以提示用户重新输入待查询语句，例如，电子设备可以输入文本提示信息、语音提示信息或闪烁灯提示信息的方式提示用户重新输入待查询语句；当该一个待验证实体满足实体校验规则时，可以将该一个待验证实体确定为目标实体。当待验证实体的数量为多个时，可以分别判断该多个待验证实体是否满足实体校验规则，并基于判断结果对多个待验证实体进行筛选，其中，当多个待验证实体均不满足实体校验规则时，可以提示用户重新输入待查询语句；当多个待验证实体中仅一个待验证实体满足实体校验规则时，可以将满足实体校验规则的一个待验证实体确定为目标实体；当多个待验证实体中的部分待验证实体满足实体校验规则时，可以将部分待验证实体确定为目标实体，或者对部分待验证实体进行再筛选，并基于再筛选结果确定目标实体。

在一些实施方式中，该实体校验规则可以是表征为合法的实体，也就是说，判断待验证实体是否满足实体校验规则，可以是判断待验证实体是否为合法的实体，其中，当判断结果表征待验证实体不是合法的实体时，可以确定该待验证实体不满足预设校验规则，则不能将该待验证实体确定为目标实体，当判断结果表征待验证实体是合法的实体时，可以确定该待验证实体满足预设校验规则，则可以将待验证实体确定为目标实体。

例如，该实体校验规则可以为【歌手】【歌曲】或者【歌曲】【歌手】，那么，当待验证实体为【歌手】【歌曲】或者【歌曲】【歌手】时，可以确定待验证实体合法，则满足实体校验规则，可以将待验证实体确定为目标实体，当待验证实体为【歌手】【歌手】或者【歌曲】【歌曲】，可以确定待验证实体不合法，则不满足实体校验规则，不能将该待验证实体确定为目标实体。例如，当待验证实体为【周杰伦】【七里香】时，表征待验证实体为【歌手】【歌曲】，可以确定待验证实体合法，满足实体校验规则，可以将【周杰伦】【七里香】确定为目标实体；当待验证实体为【星期天】【七里香】，可以认为待验证实体为【歌曲】【歌曲】，可以确定待验证实体不合法，不满足实体校验规则，不能将【星期天】【七里香】确定为目标实体。

当然，在一些实施方式中，还可以通过其他更多的方式判断待验证实体是否满足实体校验规则，例如，还可以通过词典匹配加槽位校验的方式判断待验证实体是否满足实体校验规则，在此不再赘述。

步骤S240：将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容。

其中，步骤S240的具体描述请参阅步骤S130，在此不再赘述。

步骤S250：将所述实体内容嵌入意图分类模型，以通过所述意图分类模型对所述待查询语句进行意图分类和意图消岐。

在一些实施方式中，电子设备在获取实体内容后，可以将实体内容嵌入意图分类模型，以通过意图分类模型对待查询语句进行意图分类和意图消岐，以达到精准分类的目的。作为一种方式，该意图分类模型可借助谷歌开源工具Tensorflow实现，其中实体内容嵌入层使用Tensorflow自带的映射工具将各词映射成为向量形式；卷积层对输入的向量进行卷积操作，并进行特征提取；池化层对卷积层的输出向量再次提取，得到最重要的向量；输出层利用softmax分类器进行分类计算，计算出各个类别的概率，概率最大的类别即为本次输入语句的意图分类，从而实现对待查询语句的意图分类和意图消岐，另外，本实施例通过实体内容的嵌入，是的框架具有较高的准召。

请参阅图4，图4示出了本申请的图2所示的语义解析方法的步骤S250的流程示意图。下面将针对图4所示的流程进行详细的阐述，所述方法具体可以包括以下步骤：

步骤S251：将所述实体内容映射为分布式表达，获得第一词向量。

在一些实施方式中，电子设备在获取实体内容后，可以将实体内容映射为分布式表达(distributed embedding)，获得实体内容对应的词向量，记为第一词向量，以实现可以将实体内容以词向量的形式嵌入意图分类模型。

步骤S252：将所述第一词向量嵌入所述意图分类模型。

进一步地，在获得第一词向量后，可以将第一词向量嵌入意图分类模型，以通过意图分类模型对待查询语句进行意图分类和意图消岐。在一些实施方式中，可以通过Attention BiLSTM模型将实体内容映射为分布式表达，获得第一词向量，并将第一词向量嵌入意图分类模型，以通过意图分类模型对待查询语句进行意图分类和意图消岐。具体地，Attention BiLSTM模型可以包括：输入层(input layer)、embedding层、LSTM层、Attention层以及输出层(output layer)，其中，输入层指的是输入的句子，对于中文，指的是对句子分好的词，于本实施例中，输入层指的是输入的实体内容；embedding层指的是将句子中的每一个词映射成固定长度的向量；LSTM层指的是利用双向的LSTM对embedding向量计算，实际上是双向LSTM通过对词向量的计算，从而得到更高级别的句子的向量；Attention层指的是对双向LSTM的结果使用Attention加权；输出层(output layer)指的是输出具体的结果，即输出的。

请参阅图5，图5示出了本申请的图4所示的语义解析方法的步骤S252的流程示意图。下面将针对图5所示的流程进行详细的阐述，所述方法具体可以包括以下步骤：

步骤S2521：将所述待查询语句映射为分布式表达，获得第二词向量。

在一些实施方式中，电子设备还可以将待查询语句映射为分布式表达，获得待查询语句对应的词向量，记为第二词向量，以实现可以将待查询语句以词向量的形式嵌入意图分类模型。

步骤S2522：将所述第一词向量和所述第二词向量拼接并嵌入所述意图分类模型。

进一步地，在获得第一词向量和第二词向量后，可以将第一词向量金额第二词向量进行拼接，并在拼接后嵌入意图分类模型，以通过意图分类模型对待查询语句进行意图分类和意图消岐。在一些实施方式中，可以通过Attention BiLSTM模型将实体内容映射为分布式表达，获得第一词向量，将待查询语句映射为分布式表达，获得第二词向量，并将第一词向量和第二词向量嵌入意图分类模型，以通过意图分类模型对待查询语句进行意图分类和意图消岐，以提升意图分类和意图消岐的效果。在一些实施方式中，可以将第一词向量和第二词向量进行点积计算得分，以基于得到高低确定意图分类，即得分高的意图大于得分低的意图。

步骤S260：获取与所述待查询语句对应的至少一个意图分类。

可以理解的是，基于上述方式，可以简化架构复杂度，NER模型训练语料可以通过策略批量构建，对冷启动友好。另外，本实施例的整体架构是基于垂域知识问答的架构来完成的，因此，在后续只需要在意图分类模型中分出问答意图，再根据槽位便可以实现垂域知识问答的流程。

步骤S270：基于所述至少一个意图分类和所述目标实体，获得至少一个查询语句。

步骤S280：基于所述至少一个查询语句查询与所述待查询语句对应的至少一个解答信息。

在一些实施方式中，电子设备在获取用户的至少一个意图分类和目标实体后，可以根据至少一个意图分类和目标实体生成至少一个查询语句，再基于至少一个查询语句查询与待查询语句对应的至少一个解答信息，例如从意图分类对应的领域的知识库中查找与待查询语句对应的至少一个解答信息，以实现解答的信息的准确快速获取。作为一种方式，假设至少一个意图分类包括“听音乐”，目标实体包括“七里香”，则可以基于“听音乐”和“七里香”从音乐库中查找歌曲七里香，并将歌曲七里香作为解答信息进行推送。

本申请又一个实施例提供的语义解析方法，获取待查询语句，通过序列标注模型在待查询语句中框定待验证实体，基于预设实体校验规则对待验证实体进行筛选，从待验证实体中确定满足预设实体校验规则的目标实体。将目标实体与知识图谱进行实体链接，获得与目标实体对应的实体内容，将实体内容嵌入意图分类模型，以通过意图分类模型对待查询语句进行意图分类和意图消岐，获取与待查询语句对应的至少一个意图分类，基于至少一个意图分类和目标实体，获得至少一个查询语句，基于至少一个查询语句查询与待查询语句对应的至少一个解答信息。相较于图1所示的语义解析方法，本实施例还通过序列标注模型框定待验证实体，解决词典匹配上下文不相关的问题，通过预设实体校验规则从待验证实体中确定目标实体，解决实体复杂性带来的过召回问题，通过意图分类模型对待查询语句进行意图分类，以达到精准分类的目的。

请参阅图6，图6示出了本申请实施例提供的语义解析装置200的模块框图。下面将针对图6所示的框图进行阐述，所述语义解析装置200包括：待查询语句获取模块210、目标实体获取模块220、实体内容获得模块230以及意图分类获得模块240，其中：

待查询语句获取模块210，用于获取待查询语句。

目标实体获取模块220，用于对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体。进一步地，所述目标实体获取模块220包括：待验证实体框定子模块和目标实体确定子模块，其中：

待验证实体框定子模块，用于通过序列标注模型在所述待查询语句中框定待验证实体。进一步地，所述待验证实体框定子模块包括：拟合结果获得单元和待验证实体抽取单元，其中：

拟合结果获得单元，用于拟合所述待查询语句的上下文句法，获得拟合结果。

待验证实体抽取单元，用于基于所述拟合结果从所述待查询语句中抽取所述待验证实体。

目标实体确定子模块，用于基于预设实体校验规则对所述待验证实体进行筛选，从所述待验证实体中确定满足所述预设实体校验规则的所述目标实体。

实体内容获得模块230，用于将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容。

意图分类获得模块240，用于基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类。进一步地，所述意图分类获得模块240包括：实体内容嵌入子模块和意图分类获取子模块，其中：

实体内容嵌入子模块，用于将所述实体内容嵌入意图分类模型，以通过所述意图分类模型对所述待查询语句进行意图分类和意图消岐。进一步地，所述实体内容嵌入子模块包括：第一词向量获得单元和第一词向量嵌入单元，其中：

第一词向量获得单元，用于将所述实体内容映射为分布式表达，获得第一词向量。

第一词向量嵌入单元，用于将所述第一词向量嵌入所述意图分类模型。进一步地，所述第一词向量嵌入单元包括：第二词向量获得子单元和词向量嵌入子单元，其中：

第二词向量获得子单元，用于将所述待查询语句映射为分布式表达，获得第二词向量。

词向量嵌入子单元，用于将所述第一词向量和所述第二词向量拼接并嵌入所述意图分类模型。

意图分类获取子模块，用于获取与所述待查询语句对应的至少一个意图分类。

进一步地，所述语义解析装置200还包括：查询语句获得模块和解答信息查询模块，其中：

查询语句获得模块，用于基于所述至少一个意图分类和所述目标实体，获得至少一个查询语句。

解答信息查询模块，用于基于所述至少一个查询语句查询与所述待查询语句对应的至少一个解答信息。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述装置和模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，模块相互之间的耦合可以是电性，机械或其它形式的耦合。

另外，在本申请各个实施例中的各功能模块可以集成在一个处理模块中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。

请参阅图7，其示出了本申请实施例提供的一种电子设备100的结构框图。该电子设备100可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本申请中的电子设备100可以包括一个或多个如下部件：处理器110、存储器120以及一个或多个应用程序，其中一个或多个应用程序可以被存储在存储器120中并被配置为由一个或多个处理器110执行，一个或多个程序配置用于执行如前述方法实施例所描述的方法。

其中，处理器110可以包括一个或者多个处理核。处理器110利用各种接口和线路连接整个电子设备100内的各个部分，通过运行或执行存储在存储器120内的指令、程序、代码集或指令集，以及调用存储在存储器120内的数据，执行电子设备100的各种功能和处理数据。可选地，处理器110可以采用数字信号处理(Digital Signal Processing，DSP)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)、可编程逻辑阵列(ProgrammableLogic Array，PLA)中的至少一种硬件形式来实现。处理器110可集成中央处理器(CentralProcessing Unit，CPU)、图形处理器(Graphics Processing Unit，GPU)和调制解调器等中的一种或几种的组合。其中，CPU主要处理操作系统、用户界面和应用程序等；GPU用于负责显示内容的渲染和绘制；调制解调器用于处理无线通信。可以理解的是，上述调制解调器也可以不集成到处理器110中，单独通过一块通信芯片进行实现。

存储器120可以包括随机存储器(Random Access Memory，RAM)，也可以包括只读存储器(Read-Only Memory)。存储器120可用于存储指令、程序、代码、代码集或指令集。存储器120可包括存储程序区和存储数据区，其中，存储程序区可存储用于实现操作系统的指令、用于实现至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现下述各个方法实施例的指令等。存储数据区还可以存储终端100在使用中所创建的数据(比如电话本、音视频数据、聊天记录数据)等。

请参阅图8，其示出了本申请实施例提供的一种计算机可读存储介质的结构框图。该计算机可读介质300中存储有程序代码，所述程序代码可被处理器调用执行上述方法实施例中所描述的方法。

计算机可读存储介质300可以是诸如闪存、EEPROM(电可擦除可编程只读存储器)、EPROM、硬盘或者ROM之类的电子存储器。可选地，计算机可读存储介质300包括非易失性计算机可读介质(non-transitory computer-readable storage medium)。计算机可读存储介质300具有执行上述方法中的任何方法步骤的程序代码310的存储空间。这些程序代码可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。程序代码310可以例如以适当形式进行压缩。

综上所述，本申请实施例提供的语义解析方法、装置、电子设备以及存储介质，获取待查询语句，对待查询语句进行实体识别，获取待查询语句中的目标实体，将目标实体与知识图谱进行实体链接，获得与目标实体对应的实体内容，基于实体内容对待查询语句进行意图分析，获得与待查询语句对应的至少一个意图分类，从而通过先定位目标实体，再通过实体链接从知识图谱中获取目标实体对应的实体内容，再对实体内容进行意图分析获得至少一个意图分类，从而解决过召回的问题以及实现支持媒体垂域知识问答的效果。

最后应说明的是：以上实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不驱使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims

1.一种语义解析方法，其特征在于，所述方法包括：

获取待查询语句；

对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体；

将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容；

基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类。

2.根据权利要求1所述的方法，其特征在于，所述基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类，包括：

将所述实体内容嵌入意图分类模型，以通过所述意图分类模型对所述待查询语句进行意图分类和意图消岐；

获取与所述待查询语句对应的至少一个意图分类。

3.根据权利要求2所述的方法，其特征在于，所述将所述实体内容嵌入意图分类模型，包括：

将所述实体内容映射为分布式表达，获得第一词向量；

将所述第一词向量嵌入所述意图分类模型。

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

将所述待查询语句映射为分布式表达，获得第二词向量；

所述将所述第一词向量嵌入所述意图分类模型，包括：

将所述第一词向量和所述第二词向量拼接并嵌入所述意图分类模型。

5.根据权利要求1所述的方法，其特征在于，所述对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体，包括：

通过序列标注模型在所述待查询语句中框定待验证实体；

基于预设实体校验规则对所述待验证实体进行筛选，从所述待验证实体中确定满足所述预设实体校验规则的所述目标实体。

6.根据权利要求5所述的方法，其特征在于，所述通过序列标注模型在所述待查询语句中框定待验证实体，包括：

拟合所述待查询语句的上下文句法，获得拟合结果；

基于所述拟合结果从所述待查询语句中抽取所述待验证实体。

7.根据权利要求1-6任一项所述的方法，其特征在于，所述基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类之后，还包括：

基于所述至少一个意图分类和所述目标实体，获得至少一个查询语句；

基于所述至少一个查询语句查询与所述待查询语句对应的至少一个解答信息。

8.一种语义解析装置，其特征在于，所述装置包括：

待查询语句获取模块，用于获取待查询语句；

目标实体获取模块，用于对所述待查询语句进行实体识别，获取所述待查询语句中的目标实体；

实体内容获得模块，用于将所述目标实体与知识图谱进行实体链接，获得与所述目标实体对应的实体内容；

意图分类获得模块，用于基于所述实体内容对所述待查询语句进行意图分析，获得与所述待查询语句对应的至少一个意图分类。

9.一种电子设备，其特征在于，包括存储器和处理器，所述存储器耦接到所述处理器，所述存储器存储指令，当所述指令由所述处理器执行时所述处理器执行如权利要求1-7任一项所述的方法。

10.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-7任一项所述的方法。