CN110147445A

CN110147445A - 基于文本分类的意图识别方法、装置、设备及存储介质

Info

Publication number: CN110147445A
Application number: CN201910280857.6A
Authority: CN
Inventors: 于凤英; 王健宗
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-04-09
Filing date: 2019-04-09
Publication date: 2019-08-20

Abstract

本发明公开了一种基于文本分类的意图识别方法、装置、计算机设备及存储介质，所述方法包括：获取用户的语音信息，并将语音信息转换为待识别文本信息；对待识别文本信息进行预处理，得到待分类数据，其中，预处理用于过滤待识别文本信息中的冗余信息；使用预先训练好的N个分类模型对待分类数据进行识别，并将每个分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图。本发明的技术方案在基于文本分类的意图识别中，提高了用户意图识别的准确率。

Description

基于文本分类的意图识别方法、装置、设备及存储介质

技术领域

本发明涉及信息处理领域，尤其涉及基于文本分类的意图识别方法、装置、设备及存储介质。

背景技术

基于文本分类的意图识别是自然语言处理领域中一个很重要的分支。随着人工智能技术的不断发展，基于基于文本分类的意图识别的应用场景也越来越多。在智能客服、智能问答、智能助理等应用中均有基于文本分类的意图识别处理的身影。以苹果手机中的智能助理Siri为例，Siri就是一项具有智能语音控制功能的应用，它可以理解用户所说的话和表达的意图。其中，“用户说的话”就是文本，“意图”就是分类模型的标签。

分类问题，作为机器学习领域中的常见问题，通常可以用传统的监督学习分类方法去解决。常用的分类模型有逻辑回归、支持向量机、决策树等。然而，由于基于文本分类的意图识别问题具有特殊性，即一方面，文本是由很多词组成的，每个词之间有很强的前后关联；另一方面，分类模型通常是基于特定的算法，而单一算法难以全面覆盖词之间的前后关联；因此，采用基于单一分类模型的意图识别方法进行识别时，具有一定的局限性，使得对用户意图的识别准确率不高，应用范围有限。

发明内容

本发明实施例提供一种基于文本分类的意图识别方法、装置、设备及存储介质，以解决在基于文本分类的意图识别中，用户意图识别的准确率不高的问题。

一种基于文本分类的意图识别方法，包括：

获取用户的语音信息，并将所述语音信息转换为待识别文本信息；

对所述待识别文本信息进行预处理，得到待分类数据，其中，所述预处理用于过滤所述待识别文本信息中的冗余信息；

使用预先训练好的N个分类模型对所述待分类数据进行识别，并将每个所述分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；

按照预设带权选举方式，对所述待确定用户意图集合中的所述用户意图进行置信度计算，并根据计算结果确定与所述待识别文本信息匹配的用户意图。

一种基于文本分类的意图识别装置，包括：

信息获取模块，用于获取用户的语音信息，并将所述语音信息转换为待识别文本信息；

预处理模块，用于对所述待识别文本信息进行预处理，得到待分类数据，其中，所述预处理用于过滤所述待识别文本信息中的冗余信息；

识别模块，用于使用预先训练好的N个分类模型对所述待分类数据进行识别，并将每个所述分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；

选举模块，用于按照预设带权选举方式，对所述待确定用户意图集合中的所述用户意图进行置信度计算，并根据计算结果确定与所述待识别文本信息匹配的用户意图。

一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述基于文本分类的意图识别方法。

一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述基于文本分类的意图识别方法。

上述基于文本分类的意图识别方法、装置、设备及存储介质，将用户的语音信息转换成待识别文本信息，并对待识别文本信息进行预处理，得到待分类数据；即，过滤掉待识别文本信息中的冗余信息，有利于减少冗余信息对文本分类的干扰，提高文本分类的准确度和速度；使用预先训练好的至少2个分类模型对待分类数据进行分类，得到与待识别文本信息相对应的待确定用户意图集合；然后按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图，即综合多个分类模型的分类结果，利用带权选举的方式对用户意图置信度进行加权计算，从而得到与待识别文本信息最匹配的用户意图，避免了单一算法难以全面覆盖文本之间关联性的问题；且与基于单一文本分类模型意图识别方法相比，用户意图识别的准确率更高，应用范围更广。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例的描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例中基于文本分类的意图识别方法的一应用环境示意图；

图2是本发明一实施例中基于文本分类的意图识别方法的流程图；

图3是本发明一实施例中基于文本分类的意图识别方法中步骤S2的流程图；

图4是本发明一实施例中基于文本分类的意图识别方法中进行词嵌入处理的流程图；

图5是本发明一实施例中基于文本分类的意图识别方法中步骤S4的流程图；

图6是本发明一实施例中基于文本分类的意图识别装置的示意图；

图7是本发明一实施例中计算机设备的示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的基于文本分类的意图识别方法，可应用在如图1的应用环境中，其中，服务端是提供基于文本分类的意图识别服务的计算机设备，服务端可以是服务器或服务器集群；客户端是提出意图识别需求，并从服务端获取意图识别服务的计算机终端设备或虚拟终端，包括但不限于PC机、平板电脑、智能手机、浏览器或手机APP等；客户端与服务端之间通过网络连接，网络可以是有线网络或无线网络。本发明实施例提供的基于文本分类的意图识别方法应用于服务端。

在一实施例中，如图2所示，提供了一种基于文本分类的意图识别方法，其具体实现流程包括如下步骤：

S1：获取用户的语音信息，并将语音信息转换为待识别文本信息。

用户的语音信息，即用户说的话。用户可以使用客户端将说的话转换成音频数据发送到服务端。其中，音频数据的格式包括但不限于WAV，MP3，MIDI等。例如，在智能客服的应用中，用户通过客户端输入语音信息，客户端将语音信息转换成MDI格式的音频文件，然后通过socket(套接字)发送到服务端。

待识别文本信息，是语音信息的文字表示，即，服务端对获取到的语音信息进行转换处理后得到的待识别用户意图的文本数据。待识别文本信息可以以文件的形式进行存储，文件的格式包括但不限于txt、doc等文本格式。

具体地，服务端从客户端获取语音信息后，可以通过ASR语音识别技术将语音信息进行转换处理，得到待识别文本信息。其中，ASR，即Automatic Speech Recognition，也被称为自动语音识别，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列等。

优选地，服务端可以采用基于CNN的语音分类模型对语音信息作转换处理，得到待识别文本信息。其中，CNN，即Convolutional Neural Network，卷积神经网络，是一种包含卷积计算且具有深度结构的前馈神经网络。

S2：对待识别文本信息进行预处理，得到待分类数据，其中，预处理用于过滤待识别文本信息中的冗余信息。

服务端在对待识别文本信息进行文本分类识别之前，需要过滤掉待识别文本中的冗余信息。其中，过滤掉冗余信息的数据，称为待分类数据，即服务端进行文本分类识别时的输入数据；冗余信息相当于待分类数据中无意义的噪声信息。过滤掉冗余信息，将有利减少冗余信息对文本分类的干扰，提高文本分类的准确度和速度。

举例来说，若待识别文本信息为：“嗯是我，你说吧。”，则其中的语助词和标点符号属于冗余信息，它们不影响用户意图的意思表达；因此，通过预处理后得到的待分类数据为：“是我你说”。

具体地，服务端可以使用正则表达式作为文本过滤器，对待识别文本信息进行关键字过滤，得到待分类数据。其中，正则表达式，即Regular Expression，又称规则表达式，是用来在上下文中检索或替换目标文本的处理方法。

或者，服务端采用基于Python的jieba分词工具对待识别文本信息进行过滤，得到待分类数据。其中，jieba是一款开源的基于Python的第三方中文分词工具。

S3：使用预先训练好的N个分类模型对待分类数据进行识别，并将每个分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数。

预先训练好的分类模型，是用于文本分类的分类模型。分类模型可以是基于神经网络的分类模型，或基于深度学习的分类模型，例如，BP神经网络模型、BiLSTM模型、TextCNN模型，以及Fasttext模型等，此处不做限制。

其中，BiLSTM是Bi-directional Long Short-Term Memory的缩写，是由前向LSTM(Long Short-Term Memory)与后向LSTM组合而成，前向LSTM和后向LSTM在自然语言处理任务中都常被用来建模上下文信息。BiLSTM的优势在于可以更好的捕捉文本之间的双向的语义依赖。

TextCNN模型，是基于卷积神经网络对文本进行分类的模型，TextCNN的特点在于可以捕捉文本信息之间的局部相关性。即，对于每一句话，在TextCNN模型中，可以看做是词向量维度的矩阵，因此，文本信息之间的各种可能的关联度可以方便的通过矩阵计算得到。

Fasttext是Facebook AI Reserch在2016年开源的一个分类工具，Fasttext模型可以用于文本分类。Fasttext的特点就是非常快，因为它只有一个浅层的神经网络，相比于BiLSTM模型和TextCNN模型，Fasttext识别速度要更快。

用户意图，是用户的目的或目标。以智能客服为例，用户意图包括但不限于用户需要的售后服务，如故障申报、投诉意见等；用户需要办理的业务类型，如信息查询、网上订餐、订机票等。

服务端在使用N个分类模型对待分类数据进行识别之后，每个分类模型识别出的用户意图可能不同。因此，待确定用户意图集合，即分类模型识别后得到的待确定的用户意图的数据集合。例如，对于同一个待分类数据，BiLSTM模型、TextCNN模型和Fasttext模型识别出的用户意图分别为“投诉”、“查询套餐信息”和“订餐”，则“投诉”、“查询套餐信息”和“订餐”构成待确定用户意图集合。

具体地，服务端将待分类数据作为输入数据，分别输入到不同的分类模型中，即可得到各个分类模型识别出的用户意图；然后，服务端将识别出的用户意图与识别出该用户意图的分类模型的名称进行关联存储，并将这些用户意图归集到一个数据集合中，即，将识别出的用户意图“投诉”与BiLSTM模型关联，将识别出的用户意图“查询套餐信息”与TextCNN模型关联，将识别出的用户意图“订餐”与Fasttext模型关联，并将这些识别出的用户意图存储到同一数组中。

S4：按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图。

置信度，是描述待确定用户意图与用户真实意图一致程度的度量单位。具体地，置信度可以表示为概率。例如，待确定用户意图的置信度为90％，则代表该待确定用户意图有90％的可能性与用户真实意图一致。

可以理解地，待确定用户意图中的每一个待确定用户意图都有一个置信度，并且，每一个待确定用户意图均与使用的分类模型相关。

预设带权选举方式，是指每个分类模型占有不同的权重，服务端综合每个分类模型的权重，以及每个分类模型的识别结果进行计算，并根据计算结果确定与待识别文本信息匹配的用户意图。即按照少数服从多数的总原则，以选举的方式从待确定用户意图集合中选出与用户真实意图最接近的用户意图。

举例来说，若BiLSTM模型、TextCNN模型和Fasttext模型所占的权重一样，对于同一条待识别文本信息，三个分类模型识别出的用户意图分别为：“投诉”、“查询套餐信息”和“订餐”，与之对应的概率为0.5，0.6和0.8，则以概率为0.8的用户意图为与待识别文本信息匹配的用户意图。

在本实施例中，将用户的语音信息转换成待识别文本信息，并对待识别文本信息进行预处理，得到待分类数据；即，过滤掉待识别文本信息中的冗余信息，有利于减少冗余信息对文本分类的干扰，提高文本分类的准确度和速度；使用预先训练好的至少2个分类模型对待分类数据进行分类，得到与待识别文本信息相对应的待确定用户意图集合；然后按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图，即综合多个分类模型的分类结果，利用带权选举的方式对用户意图置信度进行加权计算，从而得到与待识别文本信息最匹配的用户意图，避免了单一算法难以全面覆盖文本之间关联性的问题；且与基于单一文本分类模型意图识别方法相比，用户意图识别的准确率更高，应用范围更广。同时，在实际应用中，本实施例的方法使得识别结果的交叉验证集准确率达到91％以上，比用普通的支持向量机模型准确率高出20个百分点。

进一步地，在一实施例中，如图3所示，针对步骤S2，即对待识别文本信息进行预处理，得到待分类数据，其中，预处理用于过滤待识别文本信息中的冗余信息，具体包括如下步骤：

S21：对待识别文本信息进行分词处理，得到分词集合。

分词处理，即将文本信息切分成一个个的词或词组的过程。例如，若文本信息为“我把电脑关掉了”，则经过分词处理后得到的分词可以包括：“我”、“把”、“电”、“电脑”、“关掉”、“掉了”、“了”。

分词集合，是分词处理后得到的字或词的数据集合。例如，上例中，文本信息“我把电脑关掉了”经过分词处理后得到分词集合为：[“我”、“把”、“电”、“电脑”、“关掉”、“掉了”、“了”]。

具体地，服务端可以采用基于词典的分词方法和基于统计的分词方法对待识别文本进行分词处理。

其中，基于统计的分词方法，是在上下文中，以相邻的字同时出现的次数多少，来确定是否构成一个词。即，相邻的字同时出现的次数越多，就越可能构成一个词，因此字与字相邻出现的概率或频率能较好的反映词的可信度。基于统计的分词算法模型包括但不限于：N元文法模型(N-gram)、隐马尔科夫模型(Hidden Markov Model,HMM)等。

基于词典的分词方法，即字符串匹配法。这类算法就是使用字典，与字典中的词想匹配，来达到分词效果，时间复杂度O(N)。相较于正则表达式的文本过滤方式，基于词典的分词方法对大型的复杂文本信息的分词处理的智能程度更高，分出的词更全面。

基于词典的分词方法包括但不限于，正向最大匹配算法、邻近匹配算法、逆向最大匹配算法、双向最大匹配算法、最短路径匹配算法和基于统计的最短路径分词算法等。具体说明如下：

1)正向最大匹配算法：从待识别文本信息的左向右取待切分汉语句的m个字符作为匹配字段，m为大机器词典中最长词条个数；查找大机器词典并进行匹配。若匹配成功，则将这个匹配字段作为一个词切分出来；若匹配不成功，则将这个匹配字段的最后一个字去掉，剩下的字符串作为新的匹配字段，进行再次匹配，重复以上过程，直到切分出所有词为止。

2)邻近匹配算法：邻近匹配算法是正向最大匹配算法的改进，因为正向正向最大匹配算法对每个不存在的长字符串都要进行一次二分搜索，算法复杂度太高，可以利用同一个首字符下的词条按升序排列这一条件，在找到某个字符串后，在其后增加一个字得到一个新字串，如果新字串在词典中出现，那么新词一定在原字串的后面，且相隔位置不会太远。这样就可以加快匹配进程。

3)逆向最大匹配算法：是正向最大匹配的逆向思维，即最大匹配的顺序不是从首字母开始，而是从末尾开始；匹配不成功，将匹配字段的最前一个字去掉。

4)双向最大匹配法：双向最大匹配法是将正向最大匹配法得到的分词结果和逆向最大匹配法的到的结果进行比较，从而决定正确的分词方法。

5)最短路径匹配算法：是根据词典，找出字串中所有可能的词，也称全分词；然后构造词语切分有向无环图。这样，每一个词对应图中的一条有向边。若赋给相应的边长一个权值，然后针对该切分图，在起点到终点的所有路径中，求出最短路径，该最短路径上包含的词就是该句子的切分结果。最短路径匹配算法的规则是使切分处理的词数最少，符合汉语自身的语言规律。

6)基于统计的最短路径分词算法：是在词表中增加词的属性值，以利于进一步提高切分精度，即为每一个词给出一个权重，这样每个词在字符串的权重就不同。其中，最简单的词权重可以用词的词频表示。

优选地，在使用基于统计的分词方法进行分词处理时，服务端可以根据实际应用的需要，使用不同的预设语料库作为词典，以提高分词的准确性，从而使得后续在使用分类模型进行识别时，提高识别的准确率。其中，语料库是专业术语组成的文本数据集合。

举例来说，对于银行的智能客服，服务端需要使用金融类的语料库作为词典。其中，金融类的语料库中包括的银行、金融、证券相关的专业术语，如“保险”、“票据”、“利率”等。由于使用了金融类的语料库，服务端在对待识别文本信息进行分词处理时，不会将专业术语拆开，造成分词错误。

S22：对分词集合中的标点符号和语助词进行过滤，得到待分类数据。

语助词，即日常生活中用到的语气词、助词的统称。例如，“啊”，“呵”，“了”，“吧”，“嗯”等等。

标点符号，即逗号、冒号、引号等标点。

具体地，服务端可以将常用的语助词和标点符号作为字符数据存储到一个数据集合中；然后将数据集合中的每一个字符与分词集合中的标点符号和语助词进行比较，若两者相等，则从分词集合中删除该标点符号或语助词，直到遍历完整个数据集合，即可得到待分类数据。

在本实施例中，服务端通过多种分词方法，对待识别文本信息进行分词处理，过滤掉分词集合中的标点符号和语助词，得到待分类数据，其中，尤其采用了预设的语料库作为词典，避免专业术语在分词过程中被错误的拆分，提高了分词的准确性，从而使得后续在使用分类模型进行识别时，提高识别的准确率。

进一步地，在一实施例中，在步骤S22之后，即对分词集合中的标点符号和语助词进行过滤，得到待分类数据，还包括步骤S23，详述如下：

S23：根据预设深度学习模型的类型，对待分类数据进行词嵌入处理，得到以词向量表示的待分类数据。

词嵌入是自然语言处理NLP(Neuro-Linguistic Programming，神经语言程序学)中语言模型与表征学习技术的统称。词嵌入是把一个维数为所有词的数量的高维空间嵌入到一个维数低得多的连续向量空间中，每个单词或词组被映射为实数域上的向量，即词嵌入是一种词语的分布式表示。

经过词嵌入处理后的文本数据，可以通过代表文本数据的实数向量之间的距离，例如余弦相似度、欧氏距离等，来判断文本数据之间的语义相似度，即获取更多词语之间的相关性信息，并作为后续文本分类处理的表示基础。

深度学习模型，是基于深度学习的分类模型。例如，BiLSTM模型、TextCNN模型，Fasttext模型是属于深度学习模型。

预设深度学习模型的类型，是服务端对BiLSTM模型、TextCNN模型，Fasttext模型等分类模型的区分。其中，由于Fasttext模型是一个快速分类的浅层的神经网络，不需要做词嵌入处理，因此，服务端需要对由BiLSTM模型和TextCNN模型进行识别的待分类数据进行词嵌入处理，得到以词向量表示的待分类数据。

具体地，服务端可以采用多种词嵌入方法对待分类数据进行词嵌入处理，得到以词向量表示的待分类数据。其中，词嵌入方法包括但不限于人工神经网络、对词语同现矩阵降维、概率模型以及单词所在上下文的显式表示等，此处不做限制。

在本实施例中，服务端先根据预设深度学习模型的类型，确定需要进行词嵌入处理的待分类数据；然后，通过词嵌入方法对待分类数据进出处理，得到以词向量表示的待分类数据；由于经过词嵌入处理后的文本数据，可以通过代表文本数据的实数向量之间的距离来确定文本之间的语义相关度，因此，后续文本识别处理过程中以词向量表示的待分类数据作为输入，可以进一步覆盖文本之间的前后关联，提高识别的准确率。

进一步地，在一实施例中，针对步骤S23，即根据预设深度学习模型的类型，对待分类数据进行词嵌入处理，得到以词向量表示的待分类数据，具体包括如下步骤：

S231：根据预设深度学习模型的类型，确定词嵌入长度。

词嵌入长度，即以词向量表示的待分类数据的向量维数。

举例来说，待分类数据的长度是不一致的，即待分类数据中有的句子长，有20个字，有的句子短，有7个字；而BiLSTM模型和TextCNN模型，对输入句子的长度有要求，必须有timestep(填充步长)个字，其中，timestep即对应词嵌入长度。若输入句子的长度不足，则服务端需要对输入句子进行填充。

具体地，由于TextCNN的特点在于可以捕捉文本信息之间的局部相关性，因此，TextCNN模型的词嵌入长度可以大于BiLSTM模型。例如，将TextCNN模型的词嵌入长度确定为50，将BiLSTM模型的词嵌入长度确定为20。

S232：将待分类数据转换成词向量，并根据词嵌入长度对词向量进行填充，得到以词向量表示的待分类数据。

词向量，即以矩阵表示的待分类数据。例如，若词嵌入长度为20，待分类数据有10个字，每个字对应的向量维度为128维，则词向量为10*128维的矩阵；根据词嵌入长度，服务端需要将该词向量填充为20*128维的矩阵。

具体地，服务端可以通过Word2vec将待分类数据转换成词向量，然后，根据词嵌入长度，对词向量进行填充，得到以词向量表示的待分类数据。

其中，若词向量的维数低于词嵌入长度，则服务端对词向量进行补0处理；若词向量的维数大于词嵌入长度，则服务端需要舍去超出的字。

word2vec是google在2013年推出的一个NLP工具，它的特点是将所有的词向量化，这样词与词之间就可以定量的去度量他们之间的关系，挖掘词之间的联系。

在本实施例中，服务端根据预设深度学习模型的类型，确定分类模型对应的词嵌入长度；然后将待分类数据转换成词向量，并根据词嵌入长度对词向量进行填充，得到以词向量表示的待分类数据，使得词嵌入后的待分类数据的维数具有统一的维数，有利于提高后续分类模型进行识别时的处理速度。

进一步地，在一实施例中，用户意图包括意图标签，以及与意图标签对应的概率值。

其中，意图标签，即是服务端按照预设的命名规则对用户意图标注的字符。例如，售后相关的用户意图可以标注为T，售后服务中的故障申报可以被标注为T1，售后服务中的投诉与意见可以被标注为T2，信息查询的意图标签可以表示为C，等。可以理解地，意图标签与用户意图一一对应。

与意图标签对应的概率值，代表用户意图属于该意图标签的概率，即分类模型对待分类数据进行识别后，对用户意图的判断。

举例来说，BiLSTM模型、TextCNN模型和Fasttext模型对同一条待分类数据进行识别，得到的用户意图分别表示为：BiLSTM：(A，0.95)，TextCNN：(A，0.88)和Fasttext：(B，0.75)。其中，A、B为意图标签；0.95和0.88分别代表BiLSTM模型和TextCNN模型认为该待分类数据属于意图标签A所对应的用户意图的概率；0.75代表Fasttext模型认为该待分类数据属于意图标签B所对应的用户意图的概率。

在本实施例中，如图5所示，针对步骤S4，即按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图，具体包括如下步骤：

S41：按照预设的权重分配方式，为每个分类模型分配权值，得到每个分类模型的权值。

预设的权重分配方式，即根据分类模型的不同类别，为分类模型赋予不同的权值。其中，分类模型的不同类别，是指每个分类模型依据了不同的分类算法，从而使得不同类别的分类模型在对文本进行分类时各有侧重。

例如，BiLSTM分类模型、TextCNN分类模型和Fasttext分类模型，三者相比，BiLSTM分类模型的优势在于可以更好的捕捉文本之间双向的语义依赖；TextCNN分类模型的优势在于可以捕捉文本中的局部相关性；Fasttext分类模型的优势在于处理速度快，不需要进行词嵌入。

因此，对每个分类模型分配权值后，使得各分类模型能彼此弥补各自的不足，发挥各自的优势，从而得到更准确的识别结果。

具体地，从获取文本之间前后关联的角度出发，服务端可以为BiLSTM分类模型和TextCNN分类模型赋予更高的权值，如可以设定BiLSTM分类模型的权值为0.5，TextCNN分类模型的权值为0.4，Fasttext分类模型的权值为0.1。

在确定各分类模型的权值过程中，以BiLSTM分类模型、TextCNN分类模型和Fasttext分类模型三个分类模型为例，服务端可以先初始化将三者的权值，使三者所占权值相等；然后根据待识别文本信息所属的内容类型，按照固定的步长逐步提高其中一个分类模型的权值，同时，以固定的步长逐步减少另一分类模型的权值。

其中，待识别文本信息所属的内容类型，是指待识别文本属于哪种文体，例如，新闻报道、小说、技术性文章等。待识别文本信息所属的内容类型可以是预先设定的，服务端只需读取相应的配置文件即可得到待识别文本信息所属的内容类型。

若待识别文本信息很长，则可以利用Fasttext分类模型处理速度快的特点，提高Fasttext分类模型的权值；若待识别文本信息属于新闻报道类的文字，其前后情节关联度相对于小说类的文字更低，则可以利用TextCNN分类模型善于捕捉文本中的局部相关性的特点，提高TextCNN分类模型的权值；若若待识别文本信息属于小说类的文字，则可以利用BiLSTM分类模型善于捕捉文本之间双向语义依赖关系的特点，提高BiLSTM分类模型的权值。

具体地，服务端将BiLSTM分类模型、TextCNN分类模型和Fasttext分类模型的权值分别初始化为0.333，即三者权值相等；在对识别速度没有特别要求的情况下，Fasttext分类模型的权值保持不变；若待识别文字信息属于新闻报道类的文字，则TextCNN分类模型的权值可以增加为0.433，同时，BiLSTM分类模型的权值减少为0.233。

S42：将待确定用户意图集合中，具有相同意图标签的用户意图组成用户意图子集，得到K个用户意图子集，其中，K为小于等于N的正整数。

具体地，服务端将待确定用户意图集合中，相同的意图标签提取出来，并根据这些意图标签将对应的用户意图组成用户意图的子集。

例如，对同一待分类数据，BiLSTM分类模型、TextCNN分类模型和Fasttext分类模型识别出的用户意图分别表示为：BiLSTM：(A，0.95)，TextCNN：(A，0.88)和Fasttext：(B，0.75)，其中，意图标签只有两类，因此得到两个用户意图子集，即(A，BiLSTM：0.95，TextCNN：0.88)和(B，Fasttext：0.88)。

S43：在每个用户意图子集中，使用每个意图标签对应的分类模型的权值，对每个意图标签对应的概率值进行加权计算，得到每个用户意图子集对应的意图标签的置信度值。

置信度值，即根据分类模型的权值和与意图标签对应的概率值计算得到的值。

具体地，以BiLSTM分类模型的权值为0.5，TextCNN分类模型的权值为0.4，Fasttext分类模型的权值为0.1为例，意图标签A的置信度值为0.5*0.95+0.4*0.88，得到0.827；意图标签B的置信度值为0.88*0.1，得到0.088。

S44：根据K个置信度值之间的大小关系，确定与待识别文本信息匹配的用户意图。

具体地，从K个置信度值中选取出最大置信度值，并将该最大置信度值对应的意图标签确定为用户意图。

以步骤S43中的置信度值为例，意图标签A的置信度值大于意图标签B的置信度值，因此，意图标签A所对应的用户意图即为与待识别文本信息匹配的用户意图。

在本实施例中，服务端根据分类模型的特点，为每个分类模型设置不同的权值，并以权值对每个分类模型识别出的与意图标签对应的概率值进行加权计算，得到每个意图标签的置信度值，从而根据置信度值的大小确定与待识别文本信息匹配的用户意图，即利用了分类模型各自的特点，从实际应用的角度出发，灵活的为分类模型赋予不同的权值，从而影响最终的识别结果，大大提高了意图识别的准确度。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实施过程构成任何限定。

在一实施例中，提供一种基于文本分类的意图识别装置，该基于文本分类的意图识别装置与上述实施例中基于文本分类的意图识别方法一一对应。如图6所示，该基于文本分类的意图识别装置包括信息获取模块61、预处理模块62、识别模块63和选举模块64。各功能模块详细说明如下：

信息获取模块61，用于获取用户的语音信息，并将语音信息转换为待识别文本信息；

预处理模块62，用于对待识别文本信息进行预处理，得到待分类数据，其中，预处理用于过滤待识别文本信息中的冗余信息；

识别模块63，用于使用预先训练好的N个分类模型对待分类数据进行识别，并将每个分类模型识别出的用户意图组成待确定用户意图集合，其中，N为大于1的整数；

选举模块64，用于按照预设带权选举方式，对待确定用户意图集合中的用户意图进行置信度计算，并根据计算结果确定与待识别文本信息匹配的用户意图。

进一步地，预处理模块62，包括：

分词子模块621，用于对待识别文本信息进行分词处理，得到分词集合；

过滤子模块622，用于对分词集合中的标点符号和语助词进行过滤，得到待分类数据。

进一步地，预处理模块62，还包括：

嵌入子模块623，用于根据预设深度学习模型的类型，对待分类数据进行词嵌入处理，得到以词向量表示的待分类数据。

进一步地，嵌入子模块623，包括：

长度确定单元6231，用于根据预设深度学习模型的类型，确定词嵌入长度；

填充单元6232，用于将待分类数据转换成词向量，并根据词嵌入长度对词向量进行填充，得到以词向量表示的待分类数据。

进一步地，用户意图包括意图标签和意图标签对应的概率值，选举模块64，包括：

权重分配子模块641，用于按照预设的权重分配方式，为每个分类模型分配权值，得到每个分类模型的权值；

分组划分子模块642，用于将待确定用户意图集合中，具有相同意图标签的用户意图组成用户意图子集，得到K个用户意图子集，其中，K为小于等于N的正整数；

置信度计算子模块643，用于在每个用户意图子集中，使用每个意图标签对应的分类模型的权值，对每个意图标签对应的概率值进行加权计算，得到每个用户意图子集对应的意图标签的置信度值；

意图识别子模块644，用于根据K个置信度值之间的大小关系，确定与待识别文本信息匹配的用户意图。

关于基于文本分类的意图识别装置的具体限定可以参见上文中对于基于文本分类的意图识别方法的限定，在此不再赘述。上述基于文本分类的意图识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于文本分类的意图识别方法。

在一个实施例中，提供了一种计算机设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行计算机程序时实现上述实施例中基于文本分类的意图识别方法的步骤，例如图2所示的步骤S1至步骤S4。或者，处理器执行计算机程序时实现上述实施例中基于文本分类的意图识别装置的各模块/单元的功能，例如图6所示模块61至模块64的功能。为避免重复，这里不再赘述。

在一实施例中，提供一计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现上述方法实施例中基于文本分类的意图识别方法，或者，该计算机程序被处理器执行时实现上述装置实施例中基于文本分类的意图识别装置中各模块/单元的功能。为避免重复，这里不再赘述。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本发明所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限，RAM以多种形式可得，诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将所述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。

以上所述实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围，均应包含在本发明的保护范围之内。

Claims

1.一种基于文本分类的意图识别方法，其特征在于，所述基于文本分类的意图识别方法包括：

2.如权利要求1所述的基于文本分类的意图识别方法，其特征在于，所述对所述待识别文本信息进行预处理，得到待分类数据，包括：

对所述待识别文本信息进行分词处理，得到分词集合；

对所述分词集合中的标点符号和语助词进行过滤，得到所述待分类数据。

3.如权利要求2所述的基于文本分类的意图识别方法，其特征在于，所述对所述分词集合中的标点符号和语助词进行过滤，得到所述待分类数据之后，所述基于文本分类的意图识别方法，还包括：

根据所述预设深度学习模型的类型，对所述待分类数据进行词嵌入处理，得到以词向量表示的所述待分类数据。

4.如权利要求3所述的基于文本分类的意图识别方法，其特征在于，所述根据所述预设深度学习模型的类型，对所述待分类数据进行词嵌入处理，得到以词向量表示的所述待分类数据，包括：

根据所述预设深度学习模型的类型，确定词嵌入长度；

将所述待分类数据转换成词向量，并根据所述词嵌入长度对所述词向量进行填充，得到所述以词向量表示的所述待分类数据。

5.如权利要求1所述的基于文本分类的意图识别方法，其特征在于，所述用户意图包括意图标签和所述意图标签对应的概率值，所述按照预设带权选举方式，对所述待确定用户意图集合中的所述用户意图进行置信度计算，并根据计算结果确定与所述待识别文本信息匹配的用户意图，包括：

按照预设的权重分配方式，为每个所述分类模型分配权值，得到每个所述分类模型的权值；

将所述待确定用户意图集合中，具有相同所述意图标签的用户意图组成用户意图子集，得到K个所述用户意图子集，其中，K为小于等于N的正整数；在每个所述用户意图子集中，使用每个所述意图标签对应的分类模型的所述权值，对每个所述意图标签对应的所述概率值进行加权计算，得到每个所述用户意图子集对应的意图标签的置信度值；

根据K个所述置信度值之间的大小关系，确定与所述待识别文本信息匹配的用户意图。

6.一种基于文本分类的意图识别装置，其特征在于，所述基于文本分类的意图识别装置，包括：

7.如权利要求6所述的基于文本分类的意图识别装置，其特征在于，所述预处理模块，包括：

分词子模块，用于对所述待识别文本信息进行分词处理，得到分词集合；

过滤子模块，用于对所述分词集合中的标点符号和语助词进行过滤，得到所述待分类数据。

8.如权利要求6所述的基于文本分类的意图识别装置，其特征在于，所述预处理模块，还包括：

嵌入子模块，用于根据所述预设深度学习模型的类型，对所述待分类数据进行词嵌入处理，得到以词向量表示的所述待分类数据。

9.一种计算机设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述基于文本分类的意图识别方法。

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述基于文本分类的意图识别方法。