CN110347789A

CN110347789A - 文本意图智能分类方法、装置及计算机可读存储介质

Info

Publication number: CN110347789A
Application number: CN201910525743.3A
Authority: CN
Inventors: 王健宗; 程宁
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2019-06-14
Filing date: 2019-06-14
Publication date: 2019-10-18
Also published as: WO2020248366A1

Abstract

本发明涉及一种人工智能技术，揭露了一种文本意图智能分类方法，包括：接收原始文本集及标签集，并对所述原始文本集去除停用词及标点符号得到初级文本集，将所述初级文本集转换为词向量文本集，并将所述词向量文本集分类成训练集和测试集，将所述测试集及所述标签集输入至意图识别模型中训练，直到所述意图识别模型满足训练要求后退出训练，接收用户的文本A，并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断，并输出判断结果。本发明还提出一种文本意图智能分类装置以及一种计算机可读存储介质。本发明可以实现精准的文本意图智能分类功能。

Description

文本意图智能分类方法、装置及计算机可读存储介质

技术领域

本发明涉及人工智能技术领域，尤其涉及一种可用于智能化的文本意图分类方法、装置及计算机可读存储介质。

背景技术

目前，各个行业，特别是电商行业，智能回答系统都有了一定程度的普及。但目前的智能回答系统一般使用关键字规则或简单的检索来匹配答案后回答客户的问题，这样的回答方式往往答非所问，智能程度不够高，因此不能很好的解决客户所提出的问题，既浪费客户的时间，也浪费服务器的计算资源，并没有达到减轻人工客服压力的初衷。

发明内容

本发明提供一种文本意图智能分类方法、装置及计算机可读存储介质，其主要目的在于当用户输入文本数据时，对所述用户输入的文本进行意图判断并输出判断结果。

为实现上述目的，本发明提供的一种文本意图智能分类方法，包括：

步骤A：接收原始文本集及标签集，并对所述原始文本集去除停用词及标点符号得到初级文本集；

步骤B：将所述初级文本集转换为词向量文本集，并将所述词向量文本集分类成训练集和测试集；

步骤C：将所述训练集及所述标签集输入至预先构建的意图识别模型中训练，直到所述意图识别模型满足预设训练要求后退出训练；

步骤D：将所述测试集输入至所述意图识别模型中进行文本意图判断，计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率，若所述匹配准确率小于预设准确率，返回步骤C，若所述匹配准确率大于所述预设准确率，所述意图识别模型完成训练；

步骤E：接收用户的文本，并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断，并输出判断结果。

可选地，所述将所述初级文本集转换为词向量文本集包括：

确定所述初级文本集内每个词语ω在所述初级文本集的出现位置 Context(ω)；

基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵X_ω，并根据所述X_ω建立概率模型；

根据所述概率模型建立对数似然函数，并最大化所述对数似然函数得到所述词向量文本集。

可选地，所述概率模型为：

其中，p(ω|Context(ω))为所述概率模型，Context为所述初级文本集，ω为所述初级文本集内每个词语，表示在路径p^ω内，第j个结点对应的Huffman 编码，表示路径p^ω内，第j个非叶子结点对应的向量。

可选地，所述对数似然函数ζ：

其中，ζ为所述对数似然函数，是包含了所述初级文本集所有内容的集合，其中，所述对数似然函数ζ基于所述概率模型可进一步扩展为：

其中，l^ω表示所述路径p^ω中包括结点的数量，σ为阈值函数。

所述意图识别模型包括卷积神经网络、激活函数、损失函数，其中，所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层；

所述步骤C包括：

所述卷积神经网络接收所述训练集后，将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集，并将所述降维数据集输入至全连接层；

所述全连接层接收所述降维数据集，并结合所述激活函数计算得到训练值集合，并将所述训练值集合和所述标签集输入至所述损失函数中，所述损失函数计算出损失值，判断所述损失值与预设训练阈值的大小关系，直至所述损失值小于所述预设训练阈值时，所述意图识别模型满足所述预设训练要求并退出训练。

此外，为实现上述目的，本发明还提供一种文本意图智能分类装置，该装置包括存储器和处理器，所述存储器中存储有可在所述处理器上运行的文本意图智能分类程序，所述文本意图智能分类程序被所述处理器执行时实现如下步骤：

步骤B：将所述初级文本集输入至词向量化转换模型中得到词向量文本集，并将所述词向量文本集分类成训练集和测试集；

步骤C：将所述训练集及所述标签集输入至意图识别模型中训练，直到所述意图识别模型满足训练要求后退出训练；

步骤D：将所述测试集输入至所述意图识别模型中进行文本意图判断，计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率，若所述判断准确率小于预设准确率，返回步骤C，若判断准确率大于预设准确率，所述意图识别模型完成训练；

步骤E：接收用户的文本A，并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断，并输出判断结果。

可选地，所述将所述初级文本集转换为词向量文本集包括：

可选地，所述概率模型为：

可选地，所述对数似然函数为：

此外，为实现上述目的，本发明还提供一种计算机可读存储介质，所述计算机可读存储介质上存储有文本意图智能分类程序，所述文本意图智能分类程序可被一个或者多个处理器执行，以实现如上所述的文本意图智能分类方法的步骤。

将所述初级文本集转换为词向量文本集可以有效的提高对文本特征的采集，增加文本分类的准确率，同时意图识别模型是基于深度学习，可有效的根据所述文本特征识别出文本关键字，并基于关键字进行意图分类，因此本发明提出的文本意图智能分类方法、装置及计算机可读存储介质可以实现精准的文本意图智能分类功能。

附图说明

图1为本发明一实施例提供的文本意图智能分类方法的流程示意图；

图2为本发明一实施例提供的文本意图智能分类装置的内部结构示意图；

图3为本发明一实施例提供的文本意图智能分类装置中文本意图智能分类程序的模块示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本发明提供一种文本意图智能分类方法。参照图1所示，为本发明一实施例提供的文本意图智能分类方法的流程示意图。该方法可以由一个装置执行，该装置可以由软件和/或硬件实现。

在本实施例中，文本意图智能分类方法包括：

S1、接收原始文本集及标签集，并对所述原始文本集去除停用词及标点符号得到初级文本集。

较佳地，所述原始文本集包括各种通过文字记录下的问题，如问题A：“什么时候发货”、问题B：“为什么还没有物流信息”、问题C：“双十一是否会降价”、问题D：“近期价格是否会发生变化？”等之类的问题。

进一步地，所述标签集记录所述原始文本集内各种问题的分类结果，如问题A：“什么时候发货”和问题B：“为什么还没有物流信息”在所述标签集中被记录为“发货咨询”；问题C：“双十一是否会降价”和问题D：“近期价格是否会发生变化？”在所述标签集中被记录为“价格变动咨询”。

本发明较佳实施例，所述停用词包括那个、这个、哎呀、比如、吧、但是等，所述标点符号包括句号、逗号、问好等。进一步地，本发明通过制作中文停用词表和中文标点符号表，通过比对所述原始文本集与所述中文停用词表和中文标点符号表是否有相同部分，达到去除所述停用词及所述标点符号的目的。如问题D：“近期价格是否会发生变化？”经过去除所述停用词及所述标点符号的操作变为：“近期价格发生变化”。

S2、将所述初级文本集输入至词向量化转换模型中得到词向量文本集，并将所述词向量文本集分类成训练集和测试集。

较佳地，所述词向量化转换模型包括输入层、投影层和输出层。本发明较佳实施例将所述初级文本集输入至所述输入层，所述输入层确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω)，并将所述出现位置Context(ω)输入至所述投射层。如上述“近期价格发生变化”经过所述输入层处理后得到Context(ω₁)、Context(ω₂)、Context(ω₃)、Context(ω₄)，其中ω₁为近期，ω₂为价格，ω₃为发生，ω₄为变化，Context为所述“近期价格发生变化”，则Context(ω₁)＝p(1|4)、Context(ω₂)＝p(2|4)，依次类推。

进一步地，所述投射层基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵X_ω，并根据所述X_ω建立概率模型。所述累加求和操作得到累加求和矩阵X_ω为：

其中，V(Context(ω_i))是所述出现位置Context(ω)的矩阵表示形式，c表示所述初级文本集每个文本的词语数量，如所述“近期价格发生变化”的词语数量为4。所述概率模型为：

其中，p(ω|Context(ω))为所述概率模型，Context为所述初级文本集，ω为所述初级文本集内每个词语，表示在路径p^ω内，第j个结点对应的 Huffman编码，表示路径p^ω内，第j个非叶子结点对应的向量。所述Huffman 编码是根据数据通信知识用0、1码的不同排列来表示词语，词语称为叶子结点，各叶子结点的权值通过Huffman编码表现。如所述问题“近期价格发生变化”经过所述输入层处理后得到Context(ω₁)，其中ω₁为“近期”，则所述“近期”为所述叶子结点，通过所述Huffman编码操作后得到编码形式，所述编码形式可用00010表示，当所述“近期”为所述叶子结点时，所述“价格”、“发生”、“变化”为非叶子结点，所述叶子结点与所述非叶子结点统称为结点。

进一步地，所述输出层根据所述概率模型建立对数似然函数，并最大化所述对数似然函数得到词向量文本集，所述对数似然函数ζ为：

其中，ζ为所述对数似然函数，是包含了所述初级文本集所有内容的集合，称为语料，进一步地，所述对数似然函数ζ基于所述概率模型可进一步扩展为：

其中，l^ω表示所述路径p^ω中包括结点的数量，σ为阈值函数，所述阈值函数可用sigmoid函数。

较佳地，所述最大化所述对数似然函数的方法为：

基于所述方法最大化后得到最优化所述概率模型，基于所述最优化概率模型得到最优化累加求和矩阵X_ω，进一步地，基于所述最优化累加求和矩阵X_ω得到词向量，因此所述初级文本集可转变为词向量文本集。

较佳地，将所述词向量文本集按照8:2的数量随机划分为训练集和测试集。

S3、将所述训练集及所述标签集输入至意图识别模型中训练，直到所述意图识别模型满足训练要求后退出训练。

本发明较佳实施所述意图识别模型包括卷积神经网络，所述卷积神经网络共有十六层卷积层和十六池化层、一层全连接层。当所述卷积神经网络接收所述训练集后，将所述训练集输入至第一层卷积层，所述第一层卷积层进行卷积操作后得到第一卷积数据集输入至第一层池化层；所述第一层池化层对所述第一卷积数据集进行最大化池化操作后得到第一降维数据集输入至第二层卷积层；所述第二层卷积层再次进行所述卷积操作后得到第二卷积数据集输入至第二层池化层进行所述最大化池化操作得到第二降维数据集，以此类推，直至最终得到第十六降维数据集，将所述第十六降维数据集输入至全连接层。

较佳地，所述全连接层接收所述第十六降维数据集，并结合激活函数计算得到所述训练值集合，并将所述训练值集合和所述标签集输入至所述意图识别模型的损失函数中，所述损失函数计算出损失值，判断所述损失值与预设训练阈值的大小关系，直至所述损失值小于所述预设训练阈值时，所述意图识别模型退出训练，所述预设训练阈值一般设置为0.1。

本发明较佳实施例所述卷积层的卷积操作为：

其中ω’为输出数据，ω为输入数据，k为所述卷积层的卷积核大小，s为所述卷积操作的步幅，p为数据补零矩阵；

所述激活函数为：

其中y为所述训练值集合，e为无限不循环小数。

本发明较佳实施例所述损失值T为：

其中，n为所述标签集的大小，y_t为所述训练值集合，μ_t为所述标签集。

S4、将所述测试集输入至所述意图识别模型中进行意图判断，判断准确率和预设准确率的大小关系。

若判断准确率小于预设准确率，返回S3。

较佳地，所述意图识别模型基于所述测试集进行上述卷积操作、池化操作、激活操作后得到所述测试集的意图分类集合，依次比对所述意图分类集合与所述标签集是否相同，并计算相同的数量，将所述相同的数量除以所述测试集总数得到准确率。如所述意图识别模型将测试集中“近期价格发生变化”判断为“价格变动咨询”，与实际被分类为“价格变动咨询”一致，因此所述意图识别模型判断正确。进一步地，所述准确率一般设置为95％，当所述准确率小于95％时，重新返回S3继续训练。

若判断准确率大于预设准确率，则S5、所述意图识别模型完成训练。

S6、接收用户的文本A，并将所述文本A转变为词向量文本A输入至所述意图识别模型进行意图判断，并输出判断结果。

发明还提供一种文本意图智能分类装置。参照图2所示，为本发明一实施例提供的文本意图智能分类装置的内部结构示意图。

在本实施例中，所述文本意图智能分类装置1可以是PC(Personal Computer，个人电脑)，或者是智能手机、平板电脑、便携计算机等终端设备，也可以是一种服务器等。该文本意图智能分类装置1至少包括存储器11、处理器12，通信总线13，以及网络接口14。

其中，存储器11至少包括一种类型的可读存储介质，所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是文本意图智能分类装置1的内部存储单元，例如该文本意图智能分类装置1的硬盘。存储器 11在另一些实施例中也可以是文本意图智能分类装置1的外部存储设备，例如文本意图智能分类装置1上配备的插接式硬盘，智能存储卡(Smart MediaCard，SMC)，安全数字(Secure Digital，SD)卡，闪存卡(Flash Card) 等。进一步地，存储器11还可以既包括文本意图智能分类装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于文本意图智能分类装置1的应用软件及各类数据，例如文本意图智能分类程序01的代码等，还可以用于暂时地存储已经输出或者将要输出的数据。

处理器12在一些实施例中可以是一中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器或其他数据处理芯片，用于运行存储器 11中存储的程序代码或处理数据，例如执行文本意图智能分类程序01等。

通信总线13用于实现这些组件之间的连接通信。

网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口)，通常用于在该装置1与其他电子设备之间建立通信连接。

可选地，该装置1还可以包括用户接口，用户接口可以包括显示器 (Display)、输入单元比如键盘(Keyboard)，可选的用户接口还可以包括标准的有线接口、无线接口。可选地，在一些实施例中，显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode，有机发光二极管)触摸器等。其中，显示器也可以适当的称为显示屏或显示单元，用于显示在文本意图智能分类装置1中处理的信息以及用于显示可视化的用户界面。

图2仅示出了具有组件11-14以及文本意图智能分类程序01的文本意图智能分类装置1，本领域技术人员可以理解的是，图1示出的结构并不构成对文本意图智能分类装置1的限定，可以包括比图示更少或者更多的部件，或者组合某些部件，或者不同的部件布置。

在图2所示的装置1实施例中，存储器11中存储有文本意图智能分类程序01；处理器12执行存储器11中存储的文本意图智能分类程序01时实现如下步骤：

步骤一、接收原始文本集及标签集，并对所述原始文本集去除停用词及标点符号得到初级文本集。

步骤二、将所述初级文本集输入至词向量化转换模型中得到词向量文本集，并将所述词向量文本集分类成训练集和测试集。

较佳地，所述最大化所述对数似然函数的方法为：

较佳地，将所述词向量文本集按照8∶2的数量随机划分为训练集和测试集。

步骤三、将所述训练集及所述标签集输入至意图识别模型中训练，直到所述意图识别模型满足训练要求后退出训练。

本发明较佳实施例所述卷积层的卷积操作为：

所述激活函数为：

其中y为所述训练值集合，e为无限不循环小数。

本发明较佳实施例所述损失值T为：

步骤四、将所述测试集输入至所述意图识别模型中进行意图判断，判断准确率和预设准确率的大小关系。

若判断准确率小于预设准确率，返回步骤三。

步骤五、若判断准确率大于预设准确率，则所述意图识别模型完成训练。

步骤六、接收用户的文本A，并将所述文本A转变为词向量文本A输入至所述意图识别模型进行意图判断，并输出判断结果。

可选地，在其他实施例中，文本意图智能分类程序还可以被分割为一个或者多个模块，一个或者多个模块被存储于存储器11中，并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明，本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段，用于描述文本意图智能分类程序在文本意图智能分类装置中的执行过程。

例如，参照图3所示，为本发明文本意图智能分类装置一实施例中的文本意图智能分类程序的程序模块示意图，该实施例中，所述文本意图智能分类程序可以被分割为数据接收模块10、数据处理模块20、模型训练模块30、文本意图智能分类输出模块40示例性地：

所述数据接收模块10用于：接收原始文本集及标签集，并对所述原始文本集去除停用词及标点符号得到初级文本集。

所述数据处理模块20用于：将所述初级文本集输入至词向量化转换模型中得到词向量文本集，并将所述词向量文本集分类成训练集和测试集。

所述模型训练模块30用于：将所述训练集及所述标签集输入至意图识别模型中训练，直到所述意图识别模型满足训练要求后退出训练，将所述测试集输入至所述意图识别模型中进行文本意图判断，计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率，若所述判断准确率小于预设准确率则继续训练，若判断准确率大于预设准确率，所述意图识别模型完成训练。

所述文本意图智能分类输出模块40用于：接收用户的文本A，并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断，并输出判断结果。

上述数据接收模块10、数据处理模块20、模型训练模块30、文本意图智能分类输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同，在此不再赘述。

此外，本发明实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有文本意图智能分类程序，所述文本意图智能分类程序可被一个或多个处理器执行，以实现如下操作：

接收原始文本集及标签集，并对所述原始文本集去除停用词及标点符号得到初级文本集。

将所述初级文本集输入至词向量化转换模型中得到词向量文本集，并将所述词向量文本集分类成训练集和测试集。

将所述训练集及所述标签集输入至意图识别模型中训练，直到所述意图识别模型满足训练要求后退出训练，将所述测试集输入至所述意图识别模型中进行文本意图判断，计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率，若所述判断准确率小于预设准确率则继续训练，若判断准确率大于预设准确率，所述意图识别模型完成训练。

接收用户的文本A，并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断，并输出判断结果。

需要说明的是，上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本发明各个实施例所述的方法。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种文本意图智能分类方法，其特征在于，所述方法包括：

2.如权利要求1所述的文本意图智能分类方法，其特征在于，所述将所述初级文本集转换为词向量文本集包括：

确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω)；

3.如权利要求2所述的文本意图智能分类方法，其特征在于，所述概率模型为：

其中，p(ω|Context(ω))为所述概率模型，Context为所述初级文本集，ω为所述初级文本集内每个词语，表示在路径p^ω内，第j个结点对应的Huffman编码，表示路径p^ω内，第j个非叶子结点对应的向量。

4.如权利要求3中的文本意图智能分类方法，其特征在于，所述对数似然函数为：

5.如权利要求1至4任意一项所述的文本意图智能分类方法，其特征在于，所述意图识别模型包括卷积神经网络、激活函数、损失函数，其中，所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层；

所述步骤C包括：

6.一种文本意图智能分类装置，其特征在于，所述装置包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的文本意图智能分类程序，所述文本意图智能分类程序被所述处理器执行时实现如下步骤：

7.如权利要求6所述的文本意图智能分类装置，其特征在于，所述将所述初级文本集转换为词向量文本集包括：

8.如权利要求7所述的文本意图智能分类装置，其特征在于，

所述概率模型为：

9.如权利要求8所述的文本意图智能分类装置，其特征在于，所述对数似然函数为：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有文本意图智能分类程序，所述文本意图智能分类程序可被一个或者多个处理器执行，以实现如权利要求1至5中任一项所述的文本意图智能分类方法的步骤。