CN111159346A

CN111159346A - 基于意图识别的智能答疑方法、服务器及存储介质

Info

Publication number: CN111159346A
Application number: CN201911382909.7A
Authority: CN
Inventors: 郑继发
Original assignee: Shenzhen Material Control Intelligence Union Technology Co ltd
Current assignee: Shenzhen Material Control Intelligence Union Technology Co ltd
Priority date: 2019-12-27
Filing date: 2019-12-27
Publication date: 2020-05-15

Abstract

本发明公开了一种基于意图识别的智能答疑方法，应用于服务器，该方法包括获取客户端上传的第一语音数据，将第一语音数据进行转化得到文本数据，将得到的文本数据输入向量提取模型输出文本句向量，将文本句向量输入意图识别模型输出意图类型，根据输出的意图类型，从数据库中找到对应的预设答疑系统作为目标答疑系统，将该意图类型对应的文本数据发放至目标答疑系统，分别计算文本数据与目标答疑系统中各个预设答复进行相似度值计算，找出相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至客户端。本发明能够提高数据库的查询效率，减少对话系统的反馈延迟。

Description

基于意图识别的智能答疑方法、服务器及存储介质

技术领域

本发明涉及数据处理技术领域，尤其涉及一种基于意图识别的智能答疑方法、服务器及存储介质。

背景技术

随着人工智能技术的快速发展，人工智能技术越来越多地应用在生活中，例如智能答疑，用户通过文字或者语音的形式将问题传递给智能答疑终端，智能答疑终端识别用户的问题后在数据库中查找对应的答案反馈给用户。

目前大多数智能答疑终端能做到的只是当与用户进行对话时，答疑系统将根据用户的提问与预先设置在数据库中的答案进行匹配，得到相似度高的答案反馈给用户，但是，随着业务量增大，该方式会降低数据库的查询效率，增加对话系统的反馈延迟，影响用户体验。因此，如何提高数据库的查询效率，减少对话系统的反馈延迟成为了亟需解决的技术问题。

发明内容

本发明的主要目的在于提供一种基于意图识别的智能答疑方法、服务器及存储介质，旨在如何提高数据库的查询效率，减少对话系统的反馈延迟的问题。

为实现上述目的，本发明提供的一种基于意图识别的智能答疑方法，应用于服务器，该方法包括：

获取步骤：获取客户端上传的第一语音数据，利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据；

识别步骤：将所述得到的文本数据输入预先训练的向量提取模型，输出与所述文本数据对应的文本句向量，将所述文本句向量输入预先训练的意图识别模型，输出与所述文本句向量对应意图类型；

发放步骤：根据所述输出的意图类型，从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统，将该意图类型对应的文本数据发放至所述目标答疑系统；及

反馈步骤：利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算，找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。

优选地，所述向量提取模型由BERT模型训练得到，所述向量提取模型包括：

向量转化层，配置为基于输入的当前句向量序列，添加特殊符的表示向量，并根据表示向量和当前句向量序列包含的各个句向量的位置信息，对表示向量和当前句向量序列包含的各个句向量进行转化，形成向量序列；

Transformer编码器层，配置为对所述向量序列进行编码处理，得到特殊符编码向量，以及得到当前句向量序列包含的各个句向量分别对应的句编码向量；及

基于Transformer编码器的监督注意力层，至少配置为将所述特殊符编码向量的查询向量与所述特殊符编码向量的键向量之间的点积，确定为所述特殊符编码向量的监督注意力，针对每个句编码向量，将该句编码向量的键向量与所述特殊符编码向量的查询向量之间的点积，确定为该句编码向量的监督注意力，根据所述特殊符编码向量、各个句编码向量及其监督注意力，得到所述文本句向量。

优选地，所述意图识别模型由CNN模型训练得到，所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。

优选地，所述利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算包括：

利用预先确定的计分算法计算出所述文本数据中每个第一词语的得分，将所有所述第一词语按照得分大小进行排序，根据排序结果从大到小从所述文本数据中依次选取预设数量的第一词语作为第一关键词；

利用预先确定的计分算法计算出所述预设答复中每个第二词语的得分，将所有所述第二词语按照得分大小进行排序，根据排序结果从大到小从所述文本数据中依次选取预设数量的第二词语作为第二关键词。

优选地，所述计分算法为：

其中，V_i、V_j和V_k表示从所述文本数据或预设答复中提取的词语节点，S(V_i)、S(V_j)分别表示词语节点V_i、V_j的得分，W_ji表示V_i和V_j两个词语节点之间边的权重，W_jk表示V_j和V_k两个词语节点之间边的权重，In(V_i)表示指向词语节点V_i的节点集合,Out(V_j)表示词语节点V_j指向的节点集合，d表示阻尼系数。

优选地，所述相似度值计算规则采用杰卡德相似系数算法：

其中，A表示每个文本数据中所有第一关键词语构成的第一词集，B表示每个预设答复中所有第二关键词语构成的第二词集，J(A,B)表示文本数据与预设答复之间的杰卡德相似系数，A∩B表示第一词集与第二词集之间相同关键词语的总个数，A∪B表示第一词集与第二词集中所有关键词语的总个数。

为实现上述目的，本发明还进一步提供一种服务器，所述服务器包括存储器和处理器，所述存储器上存储有基于意图识别的智能答疑程序，所述基于意图识别的智能答疑程序被所述处理器执行时实现如下步骤：

优选地，所述目标提取模型为SSD模型，所述向量提取模型由BERT模型训练得到，所述向量提取模型包括：

优选地，所述计分算法为：

为实现上述目的，本发明进一步提供一种计算机可读存储介质，所述计算机可读存储介质上存储有基于意图识别的智能答疑程序，所述基于意图识别的智能答疑程序可被一个或者多个处理器执行，以实现如上所述的基于意图识别的智能答疑方法的步骤。

本发明提出的基于意图识别的智能答疑方法、服务器及存储介质，通过获取客户端上传的第一语音数据，将第一语音数据进行转化得到文本数据，将得到的文本数据输入向量提取模型输出文本句向量，将文本句向量输入意图识别模型输出意图类型，根据输出的意图类型，从数据库中找到对应的预设答疑系统作为目标答疑系统，将该意图类型对应的文本数据发放至目标答疑系统，分别计算文本数据与目标答疑系统中各个预设答复进行相似度值计算，找出相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至客户端。本发明能够提高数据库的查询效率，减少对话系统的反馈延迟。

附图说明

图1为本发明服务器较佳实施例的应用环境图；

图2为图1中基于意图识别的智能答疑程序较佳实施例的程序模块示意图；

图3为本发明基于意图识别的智能答疑方法较佳实施例的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参附图做进一步说明。

具体实施方式

为了使本发明的目的、技术本实施例及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

需要说明的是，在本发明中涉及“第一”、“第二”等的描述仅用于描述目的，而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外，各个实施例之间的技术本实施例可以相互结合，但是必须是以本领域普通技术人员能够实现为基础，当技术本实施例的结合出现相互矛盾或无法实现时应当认为这种技术本实施例的结合不存在，也不在本发明要求的保护范围之内。

本发明提供一种服务器1。

所述服务器1包括，但不仅限于，存储器11、处理器12及网络接口13。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是服务器1的内部存储单元，例如该服务器1的硬盘。存储器11在另一些实施例中也可以是服务器1的外部存储设备，例如该服务器1上配备的插接式硬盘，智能存储卡(Smart Media Card，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card)等。

进一步地，存储器11还可以既包括服务器1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于服务器1的应用软件及各类数据，例如基于意图识别的智能答疑程序10的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器11中存储的程序代码或处理数据，例如执行基于意图识别的智能答疑程序10等。

网络接口13可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该服务器与其他电子设备之间建立通信连接。

客户端可以是桌上型计算机、笔记本、平板电脑、手机等。

网络可以为互联网、云网络、无线保真(Wi-Fi)网络、个人网(PAN)、局域网(LAN)和/或城域网(MAN)。网络环境中的各种设备可以被配置为根据各种有线和无线通信协议连接到通信网络。这样的有线和无线通信协议的例子可以包括但不限于以下中的至少一个：传输控制协议和互联网协议(TCP/IP)、用户数据报协议(UDP)、超文本传输协议(HTTP)、文件传输协议(FTP)、ZigBee、EDGE、IEEE 802.11、光保真(Li-Fi)、802.16、IEEE 802.11s、IEEE 802.11g、多跳通信、无线接入点(AP)、设备对设备通信、蜂窝通信协议和/或蓝牙(BlueTooth)通信协议或其组合。

可选地，该服务器1还可以包括用户接口，用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以称为显示屏或显示单元，用于显示在服务器1中处理的信息以及用于显示可视化的用户界面。

图1仅示出了具有组件11-13以及基于意图识别的智能答疑程序10的服务器1，本领域技术人员可以理解的是，图1示出的结构并不构成对服务器1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在本实施例中，图1的基于意图识别的智能答疑程序10被处理器12执行时，实现以下步骤：

反馈步骤：利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算，找出所述相似度值最大者对应的预设答复作为目标答复转化成第二语音数据反馈至所述客户端。

关于上述步骤的详细介绍，请参照下述图2关于基于意图识别的智能答疑程序10实施例的程序模块示意图及图3关于基于意图识别的智能答疑方法实施例的方法流程示意图的说明。

参照图2所示，为图1中基于意图识别的智能答疑程序10实施例的程序模块示意图。基于意图识别的智能答疑程序10被分割为多个模块，该多个模块存储于存储器11中，并由处理器12执行，以完成本发明。本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段。

在本实施例中，所述基于意图识别的智能答疑程序10包括获取模块110、识别模块120、发放模块130及反馈模块140。

获取模块110，用于获取客户端上传的第一语音数据，利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据。

在本实施例中，服务器1通过获取客户端上传的第一语音数据后，利用预设的语音转化算法将第一语音数据进行转化得到文本数据。

其中，将第一语音数据转换成文本数据可通过动态时间归整模型(Dynamic TimeWarping,DTW)中实现。在其他实施例中，还可以是利用其他的语音识别模型得到文本数据，例如：BLSTM模型或LSTM模型。而DTW模型在对第一语音数据实施转换之前，通常都需要大量的训练样本进行训练，因此，在本实施例中，可预先对该DTW模型进行训练，具体的训练过程包括：预先采集预设数量的第一语音数据样本以及每个第一语音数据样本对应的文本数据样本，然后针对每个第一语音数据样本，将该第一语音数据样本输入到该预设的DTW模型中得到该第一语音数据样本对应的文本数据，在得到该第一语音数据样本对应的文本数据后，可将该文本数据与该第一语音数据对应的文本数据样本进行比对，并根据比对的结果对该DTW模型进行调整。经大量语音样本信息训练后的DTW模型可准确地将第一语音数据转换为对应的文本数据。

识别模块120，用于将所述得到的文本数据输入预先训练的向量提取模型，输出与所述文本数据对应的文本句向量，将所述文本句向量输入预先训练的意图识别模型，输出与所述文本句向量对应意图类型。

在本实施例中，服务器1将第一语音数据转化得到的文本数据输入预先训练的向量提取模型，输出与文本数据对应的文本句向量，将文本句向量输入预先训练的意图识别模型，输出与文本句向量对应意图类型。

其中，所述向量提取模型由BERT(Bidirectional Encoder Representation fromTransformers)模型训练得到，所述向量提取模型包括：

所述意图识别模型由CNN(Convolutional Neural Network,卷积神经网络)模型训练得到，所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。

通过上述BERT模型+CNN模型能够快速识别出文本数据代表的意图类型。

发放模块130，用于根据所述输出的意图类型，从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统，将该意图类型对应的文本数据发放至所述目标答疑系统。

在本实施例中，在识别出文本数据代表的意图类型后，即能够初步判断用户的意图，通过预先创建在数据库中由意图类型与预设答疑系统(例如闲聊系统、智能答疑系统、业务办理系统等)之间的映射关系表中找到与意图类型对应的预设答疑系统作为目标答疑系统，并将该意图类型对应的文本数据发放至该目标答疑系统进行下一步地解疑答惑。例如用户只是想简单了解常规问题“张学友是谁？”(意图类型为闲聊)，对应的关键词为“张学友”，则将该用户对应的客户端发出的文本数据发放给闲聊系统，并反馈答复“张学友是xxxx”给客户端；或者专业性较高的专业问题“治疗心脏病的药物有什么？”(意图类型为专业咨询)，对应的关键词为“心脏病、药物”，则将该用户对应的客户端发出的文本数据发放给智能答疑系统，并反馈答复“治疗心脏病的药物有xxxx”给客户端；或者是想办理业务“设置上午8点开会的闹钟”(意图类型为业务办理)，对应的关键词为“上午8点、开会”，则将该用户对应的客户端发出的文本数据发放给业务办理系统，并反馈答复“已设置今天上午8点开会的闹钟”给客户端。由于每一个目标答疑系统对应一种意图类型，对于用户提出的问题能够提供具有针对性的答复，因此能够提高答疑准确性，提高数据库的查询效率，减少对话系统的反馈延迟，提高用户体验感。

反馈模块140，用于利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算，找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。

在本实施例中，通过利用预先确定的相似度计算规则分别计算文本数据与预先存储在目标答疑系统中各个预设答复进行相似度值计算，找出相似度值最大者对应的预设答复作为目标答复转化成第二语音数据反馈至客户端。

具体地，首先利用预先确定的计分算法计算出所述文本数据中每个第一词语的得分，将所有所述第一词语按照得分大小进行排序，根据排序结果从大到小从所述文本数据中依次选取预设数量的第一词语作为第一关键词；

利用预先确定的计分算法计算出所述预设答复中每个第二词语的得分，将所有所述第二词语按照得分大小进行排序，根据排序结果从大到小从所述文本数据中依次选取预设数量的第二词语作为第二关键词；

其中，所述计分算法为：

V_i、V_j和V_k表示从所述文本数据或预设答复中提取的词语节点，S(V_i)、S(V_j)分别表示词语节点V_i、V_j的得分，W_ji表示V_i和V_j两个词语节点之间边的权重，W_jk表示V_j和V_k两个词语节点之间边的权重，In(V_i)表示指向词语节点V_i的节点集合,Out(V_j)表示词语节点V_j指向的节点集合，d表示阻尼系数。

具体地，将文本数据中的每个词语作为上述公式中的节点，对文本数据中的每个句子进行分词和词性标注处理，只保留指定词性的词语(例如：名词、动词、形容词)。构建候选关键词图G＝(V，E)，其中V由保留的指定词性的词语组成，然后采用共现关系(Co-Occurrence)构造任意两个词语之间的边，两个词语之间存在边，仅当这两个的词语在长度为K的窗口中共现，K表示窗口大小。根据上述公式，将节点之间边的权重的初值设为“1”，迭代传播权重计算各指定性词语的得分，将计算出的指定性词语的得分从大到小排序，可选取得分排前十的词语作为关键词。还可以利用投票的原理，将边作为词语之间的互相投票，经过不断迭代，每个词语的得票数会趋于稳定，然后对词语的得票数由大到小排序，可选取得票数排前六的词语作为关键词，将得到的关键词在原始文本数据中进行标记，若形成相邻词组则组合成多词关键词。

再利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算。

其中，所述相似度值计算规则采用杰卡德相似系数算法：

此外，本发明还提供一种基于意图识别的智能答疑方法。参照图3所示，为本发明基于意图识别的智能答疑方法的实施例的方法流程示意图。服务器1的处理器12执行存储器11中存储的基于意图识别的智能答疑程序10时实现基于意图识别的智能答疑方法的如下步骤：

S110，获取客户端上传的第一语音数据，利用预设的语音转化算法将所述第一语音数据进行转化得到文本数据。

S120，将所述得到的文本数据输入预先训练的向量提取模型，输出与所述文本数据对应的文本句向量，将所述文本句向量输入预先训练的意图识别模型，输出与所述文本句向量对应意图类型。

S130，根据所述输出的意图类型，从预先创建在数据库中由意图类型与预设答疑系统之间的映射关系表中找到对应的预设答疑系统作为目标答疑系统，将该意图类型对应的文本数据发放至所述目标答疑系统。

S140，利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算，找出所述相似度值最大者对应的预设答复作为目标答复并转化成第二语音数据反馈至所述客户端。

其中，所述计分算法为：

其中，所述相似度值计算规则采用杰卡德相似系数算法：

此外，本发明实施例还提出一种计算机可读存储介质，计算机可读存储介质可以是硬盘、多媒体卡、SD卡、闪存卡、SMC、只读存储器(ROM)、可擦除可编程只读存储器(EPROM)、便携式紧致盘只读存储器(CD-ROM)、USB存储器等中的任意一种或者几种的任意组合。计算机可读存储介质中包括基于意图识别的智能答疑程序10，本发明之计算机可读存储介质的具体实施方式与上述基于意图识别的智能答疑方法以及服务器1的具体实施方式大致相同，在此不再赘述。

需要说明的是，上述本发明实施例序日仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

上述本发明实施例序日仅仅为了描述，不代表实施例的优劣。通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术本实施例本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种基于意图识别的智能答疑方法，应用于服务器，其特征在于，该方法包括：

2.如权利要求1所述的基于意图识别的智能答疑方法，其特征在于，所述向量提取模型由BERT模型训练得到，所述向量提取模型包括：

3.如权利要求1所述的基于意图识别的智能答疑方法，其特征在于，所述意图识别模型由CNN模型训练得到，所述意图识别模型包括至少一个卷积层、至少一个池化层和至少一个全连接层。

4.如权利要求1所述的基于意图识别的智能答疑方法，其特征在于，所述利用预先确定的相似度计算规则分别计算所述文本数据与预先存储在所述目标答疑系统中各个预设答复进行相似度值计算包括：

5.如权利要求4所述的基于意图识别的智能答疑方法，其特征在于，所述计分算法为：

6.如权利要求1-5任一项所述的基于意图识别的智能答疑方法，其特征在于，所述相似度值计算规则采用杰卡德相似系数算法：

7.一种服务器，其特征在于，所述服务器包括存储器和处理器，所述存储器上存储有基于意图识别的智能答疑程序，所述基于意图识别的智能答疑程序被所述处理器执行时实现如下步骤：

8.如权利要求7所述的服务器，其特征在于，所述目标提取模型为SSD模型，所述向量提取模型由BERT模型训练得到，所述向量提取模型包括：

9.如权利要求8所述的服务器，其特征在于，所述计分算法为：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有基于意图识别的智能答疑程序，所述基于意图识别的智能答疑程序可被一个或者多个处理器执行，以实现如权利要求1-6中任一项所述的基于意图识别的智能答疑方法的步骤。