WO2023246558A1

WO2023246558A1 - 语义理解方法、装置、介质及设备

Info

Publication number: WO2023246558A1
Application number: PCT/CN2023/099842
Authority: WO
Inventors: 荣希; 杜智敏; 范炜彬
Original assignee: 深圳Tcl新技术有限公司
Priority date: 2022-06-23
Filing date: 2023-06-13
Publication date: 2023-12-28
Also published as: CN114970562A

Abstract

本申请实施例提供一种语义理解方法、装置、介质及设备，该方法包括：计算待处理事件与预设事件模板的第一匹配度；对待处理事件进行语句扩充得到相似事件；计算相似事件与预设事件模板的第二匹配度；根据第一匹配度和第二匹配度得到第一结果和第二结果，取较大者的预设事件模板进行语义理解。本申请能提升对话系统识别能力。

Description

语义理解方法、装置、介质及设备

本申请要求于2022年06月23日提交中国专利局、申请号为202210717359.5、发明名称为“语义理解方法、装置、介质及设备”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及一种语义理解方法、装置、介质及设备。

背景技术

随着人工智能技术的发展，智能语音交互因其最符合人类的交流习惯而被认为是最自然的交互方式。用户可以通过语音输入请求，装载了语音识别功能的设备首先将用户的语音输入信号转换成文字，再通过后续的一系列自然语言处理流程分析用户的意图，最后根据理解的用户意图响应相应的功能。

如何让机器正确理解用户意图成为了语音交互系统中的一大难点。由于用户有着自己的表达习惯，同样地请求有可能存在好几种表达方式，而语音交互系统由于语料库有限使其无法做到精准识别用户意图，造成误解用户意图或不理解用户意图，导致交互体验感差。

申请内容

本申请实施例提供一种语义理解方法、装置、介质及设备，能够在当前语料库不满足以识别用户意图的情况下，快速生成大量相似语句用于话术泛化，提升对话系统对用户意图的识别能力，进而提升语音交互体验。

本申请实施例一方面提供了一种语义理解方法，包括：

对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；

将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；

将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；

根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板，以对所述待处理事件进行语义理解。

在本申请实施例所述的语义理解方法中，所述根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，包括：

根据所述相似事件及待处理事件预先分配的不同权重值，分别对所述第一匹配度与第二匹配度进行加权计算，得到第一结果和第二结果。

在本申请实施例所述的语义理解方法中，在所述取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板，以对所述待处理事件进行语义理解之后，所述方法还包括：

将所述第一结果与第二结果中的较大者对应的相似事件存入所述语义增强模型的样本数据库中，作为新增的训练样本。

在本申请实施例所述的语义理解方法中，在所述取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解之后，所述方法还包括：

基于Lexparser句法分析工具将语句扩充操作得到的相似事件转换为新增的预设事件模板，将所述新增的预设事件模板存入用于存储预设事件模板的数据库中，以更新所述数据库。

在本申请实施例所述的语义理解方法中，所述语义增强模型包括语句生成器及语句判别器，其中所述语句生成器用于基于训练样本生成相似事件，所述语句判别器用于判别所述相似事件对应的标签真伪。

在本申请实施例所述的语义理解方法中，所述预设事件模板包含至少两个词语字典及与各个词语字典对应的词槽，且每个词语字典在所述预设事件模板中有对应的词语标签，所述词语标签用于指示所述词语字典的词语属性。

在本申请实施例所述的语义理解方法中，所述方法还包括：

将所述待处理事件中包含的至少两个关键词填充至所述目标事件模板的对应词槽，得到目标模板文件；

将所述目标模板文件输入至应答引擎中进行事件检索操作，输出与所述待处理事件对应的目标答案。

在本申请实施例所述的语义理解方法中，在所述得到所述待处理事件包含的至少两个关键词之后，所述方法还包括：

记录所述至少两个关键词在所述待处理事件中的第一排列顺序。

在本申请实施例所述的语义理解方法中，所述预设事件模板中的至少两个词语字典按照预设的第二排列顺序进行排序；所述将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度，包括：

获取所述待处理事件的第一文本特征向量，及所述预设事件模板的第二文本特征向量；

根据所述第一文本特征向量与第二文本特征向量，计算所述待处理事件与预设事件模板的文本特征相似度值；

根据所述第一排列顺序获取所述待处理事件的第一时序特征向量，根据所述第二排列顺序获取所述预设事件模板的第二时序特征向量；

根据所述第一时序特征向量及第二时序特征向量，计算所述待处理事件与预设事件模板的时序特征相似度值；

将所述文本特征相似度值与时序特征相似度值相加得到所述第一匹配度。

在本申请实施例所述的语义理解方法中，在所述输出与所述待处理事件对应的目标答案之后，所述方法还包括：

将所述目标答案以预设的展示形式反馈给用户。

相应的，本申请实施例另一方面还提供了一种语义理解装置，包括：

事件获取模块，用于对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；

语义增强模块，用于将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；

匹配计算模块，用于将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；

目标选择模块，用于根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板，以对所述待处理事件进行语义理解。

相应的，本申请实施例另一方面还提供了一种存储介质，所述存储介质存储有多条指令，所述指令适于处理器进行加载，以执行如上所述的语义理解方法。

相应的，本申请实施例另一方面还提供了一种终端设备，包括处理器和存储器，所述存储器存储有多条指令，所述处理器加载所述指令以执行如上所述的语义理解方法。

本申请实施例提供了一种语义理解方法、装置、介质及设备，该方法通过对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板，以对所述待处理事件进行语义理解。本申请实施例能够在当前语料库不满足以识别用户意图的情况下，快速生成大量相似语句用于话术泛化，提升对话系统对用户意图的识别能力，进而提升语音交互体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的语义理解方法的流程示意图。

图2为本申请实施例提供的语义理解方法的另一流程示意图。

图3为本申请实施例提供的语义理解装置的结构示意图。

图4为本申请实施例提供的语义理解装置的另一结构示意图。

图5为本申请实施例提供的终端设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有付出创造性劳动前提下所获得的所有其他实施例，都属于本申请的保护范围。

本申请实施例提供一种语义理解方法，所述语义理解方法可以应用于终端设备中。所述终端设备可以是智能手机、电脑等设备。

需要解释的是，由于用户有着自己的表达习惯，同样地请求有可能存在好几种表达方式，而语音交互系统由于语料库有限使其无法做到精准识别用户意图，造成误解用户意图或不理解用户意图，导致交互体验感差。

为了解决上述技术问题，本申请实施例提供一种语义理解方法。利用本申请实施例提供的语义理解方法，能够在当前语料库不满足以识别用户意图的情况下，快速生成大量相似语句用于话术泛化，提升对话系统对用户意图的识别能力，进而提升语音交互体验。

实施例1

请参阅图1-图2，图1为本申请实施例提供的语义理解方法的流程示意图。图2为本申请实施例提供的语义理解方法的另一流程示意图。所述语义理解方法，应用于终端设备中，所述方法可以包括以下步骤：

步骤101，对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度。

在本实施例中，用户可以向语音输入设备输入一段语音数据，或者向文字输入设备(例如物理键盘或者虚拟键盘)输入一段文字数据来触发待处理事件。可以理解的是，本方案还可以通过语音输入设备，例如通过智能语音助手连接智能化设备，实现通过语音指令控制智能化设备(例如空调)开启关闭或者根据具体指令做出响应操作。

需要解释的是，上述待处理事件具体指一段语音数据或者一段文字数据。由于实际应用中，待处理事件通常不可避免地包含影响语义理解的干扰词语，如“你好”、“请问”等词语，为了避免干扰词语对语义理解的影响，在本实施例中通过对待处理事件进行一系列的预处理操作，例如分词，pos词性标注，去除停用词等，在此不做限定。

在得到预处理后的待处理事件后，将预处理后的待处理事件与预存在数据库中的预设事件模板进行匹配计算得到第一匹配度，由于预设事件模板根据第一匹配度判断数据库中是否存在与待处理事件匹配的目标事件模板，进而根据匹配得到的目标事件模板判断待处理事件的用户意图。在一些实施例中，第一匹配度的计算方式可以通过计算待处理事件与预设事件模板之间的相似度值得到。应当理解的是，针对于相似度值的算法属于本领域成熟的技术，并且不属于本方案的改进发明点，因此在此不做赘述。

需要解释的是，上述预设事件模板是预存在数据库中的多个模板文件，用于识别待处理事件所反映的用户意图。预设事件模板包含至少两个词语字典及与各个词语字典对应的词槽，且每个词语字典在预设事件模板中有对应的词语标签，词语标签用于指示词语字典的词语属性(例如位置、时间、意图等)。

示例性地，词语字典A在预设词语字典中以词语标签a进行显示，a可以是“location(位置)”、“time(时间)”和“intent(意图)”等，并且词语字典A在预设时间模板中作为词语标签a的词语集合，其中包含了例如“深圳”、“珠海”等地理位置词语。

通过设置多个包含词语字典及词语属性的预设事件模板，每个预设事件模板中的词语字典及词语属性按照特定规则进行排布，且每个预设事件模板都是唯一的。当待处理事件为“今天深圳天气”时，首先将该文字数据拆分为“今天”、“深圳”和“天气”三个关键词，然后将拆分后的三个关键词分别与数据库中的预设时间模板中的词语字典进行匹配，选出相似度值超过预设阈值的目标事件模板，由于目标事件模板中各个词语字典都有其对应的词语标签，假设匹配到的目标词语模板恰好包含了“今天”、“深圳”和“天气”三个关键词的词语字典，此时根据匹配到的词语字典对应的词语标签分别是“时间”、“位置”和“意图”，说明该待处理事件对应的用户意图是询问深圳今天的天气情况，并且该用户意图同时确定了多个维度，根据待处理事件得到的用户意图便可有针对性地找到与之匹配度最高的目标答案。相比较于现有技术通过收集大量数据构建语料库，在此基础上用有监督的机器学习方法训练深度学习模型用于分析用户意图的方式，本方案不仅专注于文字特征的重合度，还关注了词语的词语属性，能够更好地分析出用户的用户意图。

步骤102，将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件。

在本实施例中，由于数据库中的预设事件模板是人为设定的，始终无法做到包含所有可能性，从而造成当用户输入的待处理事件无法被识别到与之相匹配的目标事件模板时，将会导致用户提出的问答请求(即待处理事件)变成无效请求，影响用户的体验感。因此，为了解决该问题，本方案通过将待处理事件输入至预训练好的语义增强模型进行语句扩充操作，得到基于待处理事件扩充的相似事件。示例性地，若待处理事件表示为一段文字“亮度调低”，则在经过语义扩充操作后可生成若干个相似事件，例如“屏幕亮度调低一些”、“调低屏幕亮度”等能够被系统识别并匹配到目标词语模板的相似事件，从而弥补数据库中原始的预设事件模板的数量有限的不足，进而提升系统对用户意图的识别准确度。

需要说明的是，语义增强模型可以基于bert或simbert等其他中文预训练模型进行训练得到。语义增强模型具体包括语句生成器及语句判别器，其中语句生成器用于基于训练样本生成相似事件，语句判别器用于判别所述相似事件对应的标签真伪。

步骤103，将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度。

在本实施例中，通过将待处理事件或相似事件与预设事件模板进行匹配操作，并计算得到第二匹配度。根据第二匹配度判断数据库中是否存在与相似事件匹配的目标事件模板，进而根据匹配得到的目标事件模板判断相似事件的用户意图，进而通过相似事件推断用户当前提出的问答请求对应的意图。在一些实施例中，第二匹配度的计算方式可以通过计算相似事件与预设事件模板之间的相似度值得到。应当理解的是，关于相似度值的算法属于本领域成熟的技术，并且不属于本方案的改进发明点，因此不做赘述。

步骤104，根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板，以对所述待处理事件进行语义理解。

在本申请提供的一种实施例中取第一匹配度和第二匹配度中的较大者对应的预设事件模板作为目标事件模板。在本申请提供的另一种实施例中，考虑到第二匹配度是通过预测得到，无法确保其真实性，存在不能完全代替用户的真实意图的情况，由相似事件从数据库中匹配得到的预设事件模板的准确性不一定会大于由待处理事件匹配得到的预设事件模板。为了减少预测带来的误差，本方案通过设置预设规则对第一匹配度与第二匹配度进行处理，得到第一结果与第二结果，取第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板。上述预设规则可以根据实际业务情况进行设置，在此不做限定。

进一步地，根据相似事件及待处理事件预先分配的不同权重值，分别对第一匹配度与第二匹配度进行加权计算，便可得到上述第一结果和第二结果。示例性地，相似事件的权重值是0.8，待处理事件的权重值是0.2。上述权重值的分配可以根据实际业务情况进行设置，在此不做限定。

通过给相似事件及待处理事件分配不同的权重值，以综合评估第一匹配度与第二匹配度的大小，避免由于正常情况下相似事件对应的第二匹配度会明显大于待处理事件对应的第一匹配度，造成识别结果可信性不高。即通过设定权重值能够减少通过预测相似事件的方式所带来的误差。

进一步地，在得到上述目标事件模板后，编可以对用户输出的待处理事件进行语义理解。由于目标事件模板中各个词语字典都有其对应的词语标签，假设匹配到的目标词语模板恰好包含了“今天”、“深圳”和“天气”三个关键词的词语字典，此时根据匹配到的词语字典对应的词语标签分别是“时间”、“位置”和“意图”，说明该待处理事件对应的用户意图是询问深圳今天的天气情况。

综上所述，本申请实施例能够在当前语料库不满足识别用户意图的情况下，快速生成大量相似语句用于话术泛化，提升对话系统对用户的意图识别能力，进而能够顺应不同用户的表达习惯，不需要求用户必须按照特定模板来发出请求，便可以做到精准识别用户意图，避免由于误解用户意图或不理解用户意图，导致交互体验感差的问题发生。

实施例2

本申请实施例提供的语义理解方法还包括以下步骤：

在所述取第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对待处理事件进行语义理解之后，将第一结果与第二结果中的较大者对应的相似事件存入语义增强模型的样本数据库中，作为新增的训练样本。

基于此实施例，语义增强模型训练好之后，通过以周或月为单位，以数据为闭环，不断训练迭代并更新模型。例如语义增强模型的更新频率为每周或每月一次，在保证线上服务稳定的同时持续迭代提升效果。

实施例3

本申请实施例提供的语义理解方法还包括以下步骤：

在所述取第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对待处理事件进行语义理解之后，基于Lexparser句法分析工具将语句扩充操作得到的相似事件转换为新增的预设事件模板，将新增的预设事件模板存入用于存储预设事件模板的数据库中，以更新数据库，提升匹配准确性。

需要说明的是，用于存储预设事件模板的数据库更新频率可以是按照每月或每周一周，也可以是其他自定义方式，使得在保证线上服务稳定的同时持续迭代提升效果。

需要解释的是，Lexparser句法分析工具是基于规则推导的事件结构分析。用户表达的一类query(即文中提到的待处理事件)通常符合某种模式，把具有相同模式的query归纳起来变成一种模板的形式。使用模板来描述用户需求具有较强的可控性且准确率较高，属于一种比较使用的基于规则的query分析方法。由于Lexparser句法分析工具目的在于将语句扩充操作得到的相似事件转换为新增的预设事件模板，在此不做赘述。

实施例4

本申请实施例提供的语义理解方法还包括以下步骤：

将所述待处理事件中包含的至少两个关键词填充至所述目标事件模板的对应词槽，得到目标模板文件。应当理解的是，关键词的提取方式属于本领域常规技术手段，例如通过TF-IDF算法(Term Frequency-Inverse Document Frequency，词频-逆文档频次算法)从预先转化为文本格式的待处理事件中进行提取。

将目标模板文件输入至应答引擎中进行事件检索操作，输出与待处理事件对应的目标答案。

在本实施例中，应答引擎可以根据在目标模板文件中各个关键词对应的词语标签快速定位到对应的数据库，并根据各个关键词从数据库中获取对应的目标答案，提升用户的请求响应速度。需要说明的是，应答引擎可以基于第三方应答引擎实现，在此不做赘述。

在另一实施例中，还可以将目标答案以预设的展示形式反馈给用户，例如将目标答案以语音的形式反馈给用户，扩大方案的适用范围和增加用户的可选方案。

实施例5

本申请实施例提供的语义理解方法还包括以下步骤：

在所述得到所述待处理事件包含的至少两个关键词之后，记录所述至少两个关键词在所述待处理事件中的第一排列顺序。

由于同一词语在句子中的位置顺序不同可能会造成整个句子表达的意思不同，因此，基于本实施例，通过区分关键词在待处理事件中的第一排列顺序，能够进一步地提升用户的用户意图。

具体地，通过获取待处理事件的第一文本特征向量，及预设事件模板的第二文本特征向量；根据第一文本特征向量与第二文本特征向量，计算待处理事件与预设事件模板的文本特征相似度值；根据第一排列顺序获取待处理事件的第一时序特征向量，根据第二排列顺序获取预设事件模板的第二时序特征向量；根据第一时序特征向量及第二时序特征向量，计算待处理事件与预设事件模板的时序特征相似度值；将文本特征相似度值与时序特征相似度值相加得到第一匹配度。

上述所有可选技术方案，可以采用任意结合形成本申请的可选实施例，在此不再一一赘述。

具体实施时，本申请不受所描述的各个步骤的执行顺序的限制，在不产生冲突的情况下，某些步骤还可以采用其它顺序进行或者同时进行。

由上可知，本申请实施例提供的语义理解方法通过对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解。本申请实施例能够在当前语料库不满足识别用户意图的情况下，快速生成大量相似语句用于话术泛化，提升对话系统对用户意图的识别能力，进而能够顺应不同用户的表达习惯，不需要求用户必须按照特定模板来发出请求，便可以做到精准识别用户意图，避免由于误解用户意图或不理解用户意图，导致交互体验感差的问题发生。

本申请实施例还提供一种语义理解装置，所述语义理解装置可以集成在终端设备中。所述终端设备可以是智能手机、平板电脑等设备。

请参阅图3，图3为本申请实施例提供的语义理解装置的结构示意图。语义理解装置30可以包括：

事件获取模块31，用于对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；

语义增强模块32，用于将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；

匹配计算模块33，用于将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；

目标选择模块34，用于根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解。

在一些实施例中，所述目标选择模块34，用于根据所述相似事件及待处理事件预先分配的不同权重值，分别对所述第一匹配度与第二匹配度进行加权计算，得到第一结果和第二结果。

在一些实施例中，所述装置还包括新增模块，用于将所述第一结果与第二结果中的较大者对应的相似事件存入所述语义增强模型的样本数据库中，作为新增的训练样本。

在一些实施例中，所述装置还包括更新模块，用于基于Lexparser句法分析工具将语句扩充操作得到的相似事件转换为新增的预设事件模板，将所述新增的预设事件模板存入用于存储预设事件模板的数据库中，以更新所述数据库。

在一些实施例中，所述语义增强模型包括语句生成器及语句判别器，其中所述语句生成器用于基于训练样本生成相似事件，所述语句判别器用于判别所述相似事件对应的标签真伪。

在一些实施例中，所述预设事件模板包含至少两个词语字典及与各个词语字典对应的词槽，且每个词语字典在所述预设事件模板中有对应的词语标签，所述词语标签用于指示所述词语字典的词语属性。

在一些实施例中，所述装置还包括应答模块，用于将所述待处理事件中包含的至少两个关键词填充至所述目标事件模板的对应词槽，得到目标模板文件；

在一些实施例中，所述装置还包括记录模块，用于记录所述至少两个关键词在所述待处理事件中的第一排列顺序。

在一些实施例中，所述装置还包括反馈模块，用于将所述目标答案以预设的展示形式反馈给用户。

具体实施时，以上各个模块可以作为独立的实体来实现，也可以进行任意组合，作为同一或若干个实体来实现。

由上可知，本申请实施例提供的语义理解装置30，通过事件获取模块31对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；语义增强模块32将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；匹配计算模块33将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；目标选择模块34根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解。

请参阅图4，图4为本申请实施例提供的语义理解装置的另一结构示意图，语义理解装置30包括存储器120、一个或多个处理器180、以及一个或多个应用程序，其中该一个或多个应用程序被存储于该存储器120中，并配置为由该处理器180执行；该处理器180可以包括事件获取模块31、语义增强模块32，匹配计算模块33以及目标选择模块34。例如，以上各个部件的结构和连接关系可以如下：

存储器120可用于存储应用程序和数据。存储器120存储的应用程序中包含有可执行代码。应用程序可以组成各种功能模块。处理器180通过运行存储在存储器120的应用程序，从而执行各种功能应用以及数据处理。此外，存储器120可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地，存储器120还可以包括存储器控制器，以提供处理器180对存储器120的访问。

处理器180是装置的控制中心，利用各种接口和线路连接整个终端的各个部分，通过运行或执行存储在存储器120内的应用程序，以及调用存储在存储器120内的数据，执行装置的各种功能和处理数据，从而对装置进行整体监控。可选的，处理器180可包括一个或多个处理核心；优选的，处理器180可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等。

具体在本实施例中，处理器180会按照如下的指令，将一个或一个以上的应用程序的进程对应的可执行代码加载到存储器120中，并由处理器180来运行存储在存储器120中的应用程序，从而实现各种功能：

本申请实施例还提供一种终端设备。所述终端设备可以是智能手机、电脑、平板电脑等设备。

请参阅图5，图5示出了本申请实施例提供的终端设备的结构示意图，该终端设备可以用于实施上述实施例中提供的语义理解方法。该终端设备1200可以为智能手机或平板电脑。

如图5所示，终端设备1200可以包括RF(Radio Frequency，射频)电路110、包括有一个或一个以上(图中仅示出一个)计算机可读存储介质的存储器120、输入单元130、显示单元140、传感器150、音频电路160、传输模块170、包括有一个或者一个以上(图中仅示出一个)处理核心的处理器180以及电源190等部件。本领域技术人员可以理解，图5中示出的终端设备1200结构并不构成对终端设备1200的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。其中：

RF电路110用于接收以及发送电磁波，实现电磁波与电信号的相互转换，从而与通讯网络或者其他设备进行通讯。RF电路110可包括各种现有的用于执行这些功能的电路元件，例如，天线、射频收发器、数字信号处理器、加密/解密芯片、用户身份模块(SIM)卡、存储器等等。RF电路110可与各种网络如互联网、企业内部网、无线网络进行通讯或者通过无线网络与其他设备进行通讯。

存储器120可用于存储软件程序以及模块，如上述实施例中语义理解方法对应的程序指令/模块，处理器180通过运行存储在存储器120内的软件程序以及模块，从而执行各种功能应用以及数据处理，可以根据终端设备所处的当前场景来自动选择振动提醒模式来进行语义理解，既能够保证会议等场景不被打扰，又能保证用户可以感知来电，提升了终端设备的智能性。存储器120可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器120可进一步包括相对于处理器180远程设置的存储器，这些远程存储器可以通过网络连接至终端设备1200。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

输入单元130可用于接收输入的数字或字符信息，以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。具体地，输入单元130可包括触敏表面131以及其他输入设备132。触敏表面131，也称为触控显示屏或者触控板，可收集用户在其上或附近的触控操作(比如用户使用手指、触笔等任何适合的物体或附件在触敏表面131上或在触敏表面131附近的操作)，并根据预先设定的程式驱动相应的连接装置。可选的，触敏表面131可包括触控检测装置和触控控制器两个部分。其中，触控检测装置检测用户的触控方位，并检测触控操作带来的信号，将信号传送给触控控制器；触控控制器从触控检测装置上接收触控信息，并将它转换成触点坐标，再送给处理器180，并能接收处理器180发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触敏表面131。除了触敏表面131，输入单元130还可以包括其他输入设备132。具体地，其他输入设备132可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。

显示单元140可用于显示由用户输入的信息或提供给用户的信息以及终端设备1200的各种图形用户接口，这些图形用户接口可以由图形、文本、图标、视频和其任意组合来构成。显示单元140可包括显示面板141，可选的，可以采用LCD(Liquid Crystal Display，液晶显示器)、OLED(Organic Light-Emitting Diode,有机发光二极管)等形式来配置显示面板141。进一步的，触敏表面131可覆盖显示面板141，当触敏表面131检测到在其上或附近的触控操作后，传送给处理器180以确定触控事件的类型，随后处理器180根据触控事件的类型在显示面板141上提供相应的视觉输出。虽然在图5中，触敏表面131与显示面板141是作为两个独立的部件来实现输入和输出功能，但是在某些实施例中，可以将触敏表面131与显示面板141集成而实现输入和输出功能。

终端设备1200还可包括至少一种传感器150，比如光传感器、运动传感器以及其他传感器。具体地，光传感器可包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板141的亮度，接近传感器可在终端设备1200移动到耳边时，关闭显示面板141和/或背光。作为运动传感器的一种，重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；至于终端设备1200还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器，在此不再赘述。

音频电路160、扬声器161，传声器162可提供用户与终端设备1200之间的音频接口。音频电路160可将接收到的音频数据转换后的电信号，传输到扬声器161，由扬声器161转换为声音信号输出；另一方面，传声器162将收集的声音信号转换为电信号，由音频电路160接收后转换为音频数据，再将音频数据输出处理器180处理后，经RF电路110以发送给比如另一终端，或者将音频数据输出至存储器120以便进一步处理。音频电路160还可能包括耳塞插孔，以提供外设耳机与终端设备1200的通信。

终端设备1200通过传输模块170(例如Wi-Fi模块)可以帮助用户收发电子邮件、浏览网页和访问流式媒体等，它为用户提供了无线的宽带互联网访问。虽然图5示出了传输模块170，但是可以理解的是，其并不属于终端设备1200的必须构成，完全可以根据需要在不改变发明的本质的范围内而省略。

处理器180是终端设备1200的控制中心，利用各种接口和线路连接整个手机的各个部分，通过运行或执行存储在存储器120内的软件程序和/或模块，以及调用存储在存储器120内的数据，执行终端设备1200的各种功能和处理数据，从而对手机进行整体监控。可选的，处理器180可包括一个或多个处理核心；在一些实施例中，处理器180可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器180中。

终端设备1200还包括给各个部件供电的电源190，在一些实施例中，电源可以通过电源管理系统与处理器180逻辑相连，从而通过电源管理系统实现管理放电、以及功耗管理等功能。电源190还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。

尽管未示出，终端设备1200还可以包括摄像头(如前置摄像头、后置摄像头)、蓝牙模块等，在此不再赘述。具体在本实施例中，终端设备1200的显示单元140是触控屏显示器，终端设备1200还包括有存储器120，以及一个或者一个以上的程序，其中一个或者一个以上程序存储于存储器120中，且经配置以由一个或者一个以上处理器180执行一个或者一个以上程序包含用于进行以下操作的指令：

事件获取指令，用于对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；

语义增强指令，用于将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；

匹配计算指令，用于将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；

目标选择指令，用于根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解。

在一些实施例中，所述目标选择指令，用于根据所述相似事件及待处理事件预先分配的不同权重值，分别对所述第一匹配度与第二匹配度进行加权计算，得到第一结果和第二结果。

在一些实施例中，所述程序还包括新增指令，用于将所述第一结果与第二结果中的较大者对应的相似事件存入所述语义增强模型的样本数据库中，作为新增的训练样本。

在一些实施例中，所述程序还包括更新指令，用于基于Lexparser句法分析工具将语句扩充操作得到的相似事件转换为新增的预设事件模板，将所述新增的预设事件模板存入用于存储预设事件模板的数据库中，以更新所述数据库。

在一些实施例中，所述程序还包括应答指令，用于将所述待处理事件中包含的至少两个关键词填充至所述目标事件模板的对应词槽，得到目标模板文件；

在一些实施例中，所述程序还包括记录指令，用于记录所述至少两个关键词在所述待处理事件中的第一排列顺序。

在一些实施例中，所述程序还包括反馈指令，用于将所述目标答案以预设的展示形式反馈给用户。

本申请实施例还提供一种终端设备。所述终端设备可以是智能手机、电脑等设备。

由上可知，本申请实施例提供了一种终端设备1200，所述终端设备1200执行以下步骤：

本申请实施例还提供一种存储介质，所述存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，所述计算机执行上述任一实施例所述的语义理解方法。

需要说明的是，对本申请所述语义理解方法而言，本领域普通测试人员可以理解实现本申请实施例所述语义理解方法的全部或部分流程，是可以通过计算机程序来控制相关的硬件来完成，所述计算机程序可存储于一计算机可读存储介质中，如存储在终端设备的存储器中，并被该终端设备内的至少一个处理器执行，在执行过程中可包括如所述语义理解方法的实施例的流程。其中，所述存储介质可为磁碟、光盘、只读存储器(ROM，Read Only Memory)、随机存取记忆体(RAM，Random Access Memory)等。

对本申请实施例的所述语义理解装置而言，其各功能模块可以集成在一个处理芯片中，也可以是各个模块单独物理存在，也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中，所述存储介质譬如为只读存储器，磁盘或光盘等。

以上对本申请实施例所提供的语义理解方法、装置、介质及设备进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

一种语义理解方法，其中，包括：

对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；

将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；

将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；

根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板，以对所述待处理事件进行语义理解。
如权利要求1所述的语义理解方法，其中，所述根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，包括：

根据所述相似事件及待处理事件预先分配的不同权重值，分别对所述第一匹配度与第二匹配度进行加权计算，得到第一结果和第二结果。
如权利要求1所述的语义理解方法，其中，所述相似事件的权重大于所述待处理事件的权重值。
如权利要求2所述的语义理解方法，其中，在所述取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解之后，所述方法还包括：

将所述第一结果与第二结果中的较大者对应的相似事件存入所述语义增强模型的样本数据库中，作为新增的训练样本。
如权利要求1所述的语义理解方法，其中，在所述取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解之后，所述方法还包括：

基于Lexparser句法分析工具将语句扩充操作得到的相似事件转换为新增的预设事件模板，将所述新增的预设事件模板存入用于存储预设事件模板的数据库中，以更新所述数据库。
如权利要求5所述的语义理解方法，其中，所述语义增强模型包括语句生成器及语句判别器。
如权利要求6所述的语义理解方法，其中，所述语句生成器用于基于训练样本生成相似事件，所述语句判别器用于判别所述相似事件对应的标签真伪。
如权利要求1所述的语义理解方法，其中，所述预设事件模板包含至少两个词语字典及与各个词语字典对应的词槽，且每个词语字典在所述预设事件模板中有对应的词语标签，所述词语标签用于指示所述词语字典的词语属性。
如权利要求8所述的语义理解方法，其中，所述方法还包括：

将所述待处理事件中包含的至少两个关键词填充至所述目标事件模板的对应词槽，得到目标模板文件；

将所述目标模板文件输入至应答引擎中进行事件检索操作，输出与所述待处理事件对应的目标答案。
如权利要求9所述的语义理解方法，其中，所述关键词通过TF-IDF算法从预先转化为文本格式的待处理事件中进行提取。
如权利要求9所述的语义理解方法，其中，所述将所述目标模板文件输入至应答引擎中进行事件检索操作，输出与所述待处理事件对应的目标答案，包括：

将所述目标模板文件输入至应答引擎中，所述应答引擎根据在目标模板文件中各个关键词对应的词语标签定位到对应的数据库，并根据各个关键词从数据库中获取对应的目标答案。
如权利要求11所述的语义理解方法，其中，在所述得到所述待处理事件包含的至少两个关键词之后，所述方法还包括：

记录所述至少两个关键词在所述待处理事件中的第一排列顺序。
如权利要求12所述的语义理解方法，其中，所述预设事件模板中的至少两个词语字典按照预设的第二排列顺序进行排序。
如权利要求13所述的语义理解方法，其中，所述将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度，包括：

获取所述待处理事件的第一文本特征向量，及所述预设事件模板的第二文本特征向量；

根据所述第一文本特征向量与第二文本特征向量，计算所述待处理事件与预设事件模板的文本特征相似度值；

根据所述第一排列顺序获取所述待处理事件的第一时序特征向量，根据所述第二排列顺序获取所述预设事件模板的第二时序特征向量；

根据所述第一时序特征向量及第二时序特征向量，计算所述待处理事件与预设事件模板的时序特征相似度值；

将所述文本特征相似度值与时序特征相似度值相加得到所述第一匹配度。
如权利要求1所述的语义理解方法，其中，在所述输出与所述待处理事件对应的目标答案之后，所述方法还包括：

将所述目标答案以预设的展示形式反馈给用户。
一种语义理解装置，其中，包括：

事件获取模块，用于对获取到的待处理事件进行预处理，并将预处理后的待处理事件与预设事件模板进行匹配计算，得到第一匹配度；

语义增强模块，用于将所述待处理事件输入至预训练好的语义增强模型进行语句扩充，得到所述待处理事件的相似事件；

匹配计算模块，用于将所述相似事件或所述待处理事件与所述预设事件模板进行匹配计算，得到第二匹配度；

目标选择模块，用于根据预设规则对所述第一匹配度和所述第二匹配度进行计算，分别得到第一结果和第二结果，取所述第一结果与第二结果中的较大者对应的预设事件模板作为目标事件模板对所述待处理事件进行语义理解。
如权利要求16所述的语义理解装置，其中，所述目标选择模块，用于根据所述相似事件及待处理事件预先分配的不同权重值，分别对所述第一匹配度与第二匹配度进行加权计算，得到第一结果和第二结果。
如权利要求17所述的语义理解装置，其中，所述装置还包括新增模块，用于将所述第一结果与第二结果中的较大者对应的相似事件存入所述语义增强模型的样本数据库中，作为新增的训练样本。
一种计算机可读存储介质，其中，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行权利要求1至15任一项所述的语义理解方法。
一种终端设备，其中，包括处理器和存储器，所述存储器存储有多条指令，所述处理器加载所述指令以执行权利要求1至15任一项所述的语义理解方法。