CN109977401A

CN109977401A - 一种基于神经网络的语义识别方法

Info

Publication number: CN109977401A
Application number: CN201910199654.4A
Authority: CN
Inventors: 王诗俊; 吴粤
Original assignee: Shanghai Fire Merchants Intelligent Technology Co Ltd
Current assignee: Shanghai Fire Merchants Intelligent Technology Co Ltd
Priority date: 2019-03-15
Filing date: 2019-03-15
Publication date: 2019-07-05

Abstract

本发明公开了一种基于神经网络的语义识别方法，包括：接收语音数据，识别语音数据获得识别文本；将识别文本输入预置的第一神经网络模型得到语义文本；将语义文本输入预置的第二神经网络模型得到语义文本的语义不确定度；若语义不确定度大于预设的不确定度阈值，输出语义文本；若语义不确定度不大于不确定度阈值，将识别文本输入预置的跟问模型得到跟问文本，并输出跟问文本。本发明通过将语义不确定度与不确定度阈值进行对比可清楚的知道语义文本与用户意图的符合程度，对于符合程度高的情况，输出用户的意图，对于符合程度不高的情况，通过跟问模型输出跟问文本，对于用户意图识别不高的情况有了较好的解决方案，支持多轮对话，提高了用户体验。

Description

一种基于神经网络的语义识别方法

技术领域

本发明涉及语音识别领域，具体为一种基于神经网络的语义识别方法。

背景技术

随着科技的高速发展，语音识别在技术上的进步实现了用户与智能设备语音交互，使得用户与智能设备的口语沟通变得自然和方便。

目前智能设备上的对话系统中已经引入了动作语义理解技术，从而自然语言对话系统已成为人们普遍使用的一种沟通工具。其中，实现自然语言对话系统的基本技术可以分为两大类，基于规则的方法和基于统计的方法。其中，基于规则的方法是指根据定义的语法规则、词性和构词与构句规则等，使用计算机语言进行描述；基于统计的方法是指采用深度学习和大数据，构建单轮对话系统，并自动生成对话。

现在的对话系统多数只能做单轮对话，可以帮助用户完成一些简单的任务，如问天气、查路线。而实际上，人们在生活中需求场景并非是这样简单且单一的，而是多样化且复杂的。在实际使用中，现有的对话系统识别对于用户意图的识别能力不高，经常会出现因为无法判别用户意图而出现无法回答用户的情况，或者出现答非所问或重复回答的情况，使得对话系统的构建对话的内容太过局限和死板，用户体验不高。

发明内容

本发明的目的在于提供一种基于神经网络的语义识别方法，以解决上述背景技术中存在的问题。

为实现上述目的，本发明提供如下技术方案：一种基于神经网络的语义识别方法，包括：

接收语音数据，识别所述语音数据获得识别文本；

将所述识别文本输入预置的第一神经网络模型得到语义文本；

将所述语义文本输入预置的第二神经网络模型得到所述语义文本的语义不确定度；

判断所述语义不确定度是否大于预设的不确定度阈值；

若所述语义不确定度大于预设的不确定度阈值，输出所述语义文本；

若所述语义不确定度不大于所述不确定度阈值，将所述识别文本输入预置的跟问模型得到跟问文本，并输出所述跟问文本。

进一步地，所述第一神经网络模型通过如下方式进行训练：

从语义库中抽取训练语义；

抽取所述训练语义的训练语句；

采用所述训练语句训练第一神经网络模型。

进一步地，所述将所述语义文本输入预置的第二神经网络模型得到所述语义文本的语义不确定度，包括：将所述语义文本输入所述第二神经网络；随机数生成器生成随机数n，随机将所述第二神经网络模型的n个隐藏层节点的数值设为0，计算出输出层的输出结果的方差值，即得到了所述语义不确定度。

进一步地，所述跟问模型为生成式对抗网络中的生成模型。

进一步地，所述生成模型通过如下方式进行训练：

从跟问语句库中抽取训练语句及所述训练语句对应的跟问语句；

将所述训练语句输入所述生成模型得到模拟语句；

通过判别模型对比所述跟问语句与所述模拟语句，得到所述跟问语句与所述模拟语句的对比值，将所述对比值反馈至所述生成模型，以使所述生成模型和所述判别模型基于互相对抗过程循环更新；

当所述对比值不大于预设的判别阈值时，通过所述生成模型生成所述识别文本的所述跟问文本。

进一步地，循环更新所述生成模型包括：

采用第一目标函数和随机梯度下降法循环更新所述生成模型，所述第一目标函数为：其中，θ表示所述生成模型的参数，D表示所述判别模型，Z表示所述模拟语句，m表示采样容量，i表示采样点。

进一步地，循环更新所述判别模型包括：

采用第二目标函数和随机梯度上升法循环更新所述判别模型，所述第二目标函数为：其中，θ表示所述生成模型的参数，D表示所述判别模型，Z表示所述模拟语句，m表示采样容量，i表示采样点。

进一步地，θ的计算公式为：

其中，c为所述生成模型的输入，x为所述生成模型的输出，P为所述生成模型的概率分布函数，R为所述判别模型的输出。

进一步地，采用第一损失函数训练所述生成模型，所述第一损失函数为：其中，c为所述生成模型的输入，x为所述生成模型的输出，P为所述生成模型的概率分布函数，R为所述判别模型的输出。

与现有技术相比，本发明的有益效果是：本发明通过第二神经网络模型对识别文本的语义文本计算语义不确定度，通过将语义不确定度与不确定度阈值进行对比可清楚的知道语义文本与用户意图的符合程度，对于符合程度高的情况，输出用户的意图，对于符合程度不高的情况，通过跟问模型输出跟问文本，对于用户意图识别不高的情况有了较好的解决方案，支持多轮对话，提高了用户体验。

附图说明

图1为本发明的流程框图；

图2为本发明中跟问模型的训练步骤流程框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供一种基于神经网络的语义识别方法，包括：

步骤S101，接收语音数据，识别语音数据获得识别文本，并执行步骤S102；当接收到用户输入的语音数据时，本发明实施例将对于该语音数据进行识别，得到识别文本，其中使用的识别方法为现有技术，在此不详述其具体方法。

步骤S102，将识别文本输入预置的第一神经网络模型得到语义文本，并执行步骤S103；其中，第一神经网络模型为长短期记忆模型(Long Short-Term Memory，LSTM)。

需要说明的是，第一神经网络模型通过如下方式进行训练：

从语义库中抽取训练语义；

抽取训练语义的训练语句；

采用训练语句训练第一神经网络模型。

步骤S103，将语义文本输入预置的第二神经网络模型得到语义文本的语义不确定度，并执行步骤S104；其中，第二神经网络模型为带有dropout算法的长短期记忆模型(LongShort-Term Memory，LSTM)；

语义不确定度的计算过程如下：将语义文本输入第二神经网络后，随机数生成器生成随机数n，随机将第二神经网络模型的n个隐藏层节点的数值设为0，计算出输出层的输出结果的方差值，即得到了语义不确定度。

步骤S104，判断语义不确定度是否大于预设的不确定度阈值；若是，则执行步骤S105；若否，则执行步骤S106；

步骤S105，输出语义文本；

步骤S106，将识别文本输入预置的跟问模型得到跟问文本，并输出跟问文本。其中，如图2所示，跟问模型为生成式对抗网络中的生成模型，其训练方法具有如下步骤：

步骤S201，从跟问语句库中抽取训练语句及训练语句对应的跟问语句，并执行步骤S202；

步骤S202，将训练语句输入生成模型得到模拟语句，并执行步骤S203；

步骤S203，通过判别模型对比跟问语句与模拟语句，得到跟问语句与模拟语句的对比值，将对比值反馈至生成模型并更新判别模型，并执行步骤S204；

需要说明的是，跟问语句的数据分布与跟问语句的数据分布和模拟语句的数据分布的和的比值，该比值可以代表跟问语句的数据分布和模拟语句的数据分布的差别。

具体的，判别模型为可迭代更新的深度神经网络模型，其判别能力随着一次次的迭代更新逐渐增强。将跟问语句和模拟语句输入该判别模型，可计算出跟问语句的数据分布和模拟语句的数据分布的差别，即得到跟问语句和模拟语句的对比值。

步骤S204，判断跟问语句和模拟语句的对比值是否不大于预设的判别阈值；若是，则执行步骤S205；若否，则执行S206；

步骤S205，通过生成模型生成识别文本的跟问文本；

步骤S206，根据跟问语句和模拟语句的对比值更新生成模型，并通过更新后的生成模型生成模拟语句，并执行步骤S204。

需要说明的是，循环更新生成模型包括：

采用第一目标函数和随机梯度下降法循环更新所述生成模型，第一目标函数为：

其中，θ表示生成模型的参数，D表示判别模型，Z表示模拟语句，m表示采样容量，i表示采样点。

需要说明的是，循环更新判别模型包括：

采用第二目标函数和随机梯度上升法循环更新所述判别模型，第二目标函数为：

进一步地，本实施例中采用增强学习的方法对生成模型进行训练，其中，θ的计算公式为：

其中，c为生成模型的输入，x为生成模型的输出，P为生成模型的概率分布函数，R为判别模型的输出。

基于上述任意实施例，采用第一损失函数训练生成模型，第一损失函数为：其中，c为生成模型的输入，x为生成模型的输出，P为生成模型的概率分布函数，R为判别模型的输出。

基于上述任意实施例，需要说明的是，当跟问语句和模拟语句的对比值不大于预设的阈值时，判别模型停止更新，但生成模型依然保持循环更新状态。当然，也可以为生成模型设置停止更新的阈值，使其在满足预设条件时停止更新。

具体的，跟问语句和模拟语句的对比值为：跟问语句数据分布P_data(x)与跟问语句数据分布P_data(x)和模拟语句数据分布P_g(x)的和的比值，可用下述公式进行表示：

其中，为跟问语句和模拟语句的对比值，当等于预设的阈值时，即判别模型已判别不出跟问语句数据分布P_data(x)和模拟语句数据分布P_g(x)的区别，即认为跟问语句数据分布P_data(x)和模拟语句数据分布P_g(x)一致，即生成模型可生成真实数据。其中，一般将该阈值设置为0.5，因此当不大于0.5时，跟问语句数据分布P_data(x)和模拟语句数据分布P_g(x)一致；因此当大于0.5时，跟问语句数据分布P_data(x)和模拟语句数据分布P_g(x)还存在区别，那么需要继续循环更新，直至不大于0.5。

对于本领域技术人员而言，显然本发明不限于上述示范性实施例的细节，而且在不背离本发明的精神或基本特征的情况下，能够以其他的具体形式实现本发明。因此，无论从哪一点来看，均应将实施例看作是示范性的，而且是非限制性的，本发明的范围由所附权利要求而不是上述说明限定，因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

此外，应当理解，虽然本说明书按照实施方式加以描述，但并非每个实施方式仅包含一个独立的技术方案，说明书的这种叙述方式仅仅是为清楚起见，本领域技术人员应当将说明书作为一个整体，各实施例中的技术方案也可以经适当组合，形成本领域技术人员可以理解的其他实施方式。

Claims

1.一种基于神经网络的语义识别方法，其特征在于，包括：

接收语音数据，识别所述语音数据获得识别文本；

判断所述语义不确定度是否大于预设的不确定度阈值；

若所述语义不确定度大于所述不确定度阈值，输出所述语义文本；

2.根据权利要求1所述的方法，其特征在于，所述第一神经网络模型通过如下方式进行训练：

从语义库中抽取训练语义；

抽取所述训练语义的训练语句；

采用所述训练语句训练第一神经网络模型。

3.根据权利要求1所述的方法，其特征在于，所述将所述语义文本输入预置的第二神经网络模型得到所述语义文本的语义不确定度，包括：将所述语义文本输入所述第二神经网络；随机数生成器生成随机数n，随机将所述第二神经网络模型的n个隐藏层节点的数值设为0，计算出输出层的输出结果的方差值，即得到了所述语义不确定度。

4.根据权利要求1所述的方法，其特征在于，所述跟问模型为生成式对抗网络中的生成模型。

5.根据权利要求4所述的方法，其特征在于，所述生成模型通过如下方式进行训练：

将所述训练语句输入所述生成模型得到模拟语句；

6.根据权利要求5所述的方法，其特征在于，循环更新所述生成模型包括：

7.根据权利要求1所述的方法，其特征在于，循环更新所述判别模型包括：

8.根据权利要求6或7所述的方法，其特征在于，θ的计算公式为：

9.根据权利要求6所述的方法，其特征在于，采用第一损失函数训练所述生成模型，所述第一损失函数为：其中，c为所述生成模型的输入，x为所述生成模型的输出，P为所述生成模型的概率分布函数，R为所述判别模型的输出。