CN110347789A - 文本意图智能分类方法、装置及计算机可读存储介质 - Google Patents
文本意图智能分类方法、装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110347789A CN110347789A CN201910525743.3A CN201910525743A CN110347789A CN 110347789 A CN110347789 A CN 110347789A CN 201910525743 A CN201910525743 A CN 201910525743A CN 110347789 A CN110347789 A CN 110347789A
- Authority
- CN
- China
- Prior art keywords
- text
- training
- intended
- intention
- intelligent
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 70
- 238000012360 testing method Methods 0.000 claims abstract description 27
- 230000006870 function Effects 0.000 claims description 56
- 230000009467 reduction Effects 0.000 claims description 20
- 230000001186 cumulative effect Effects 0.000 claims description 18
- 239000011159 matrix material Substances 0.000 claims description 16
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 10
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 abstract 1
- 238000012545 processing Methods 0.000 description 12
- 230000008859 change Effects 0.000 description 10
- 230000009466 transformation Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 238000013480 data collection Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种人工智能技术,揭露了一种文本意图智能分类方法,包括:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集,将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集,将所述测试集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练,接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断,并输出判断结果。本发明还提出一种文本意图智能分类装置以及一种计算机可读存储介质。本发明可以实现精准的文本意图智能分类功能。
Description
技术领域
本发明涉及人工智能技术领域,尤其涉及一种可用于智能化的文本意图分类方法、装置及计算机可读存储介质。
背景技术
目前,各个行业,特别是电商行业,智能回答系统都有了一定程度的普及。但目前的智能回答系统一般使用关键字规则或简单的检索来匹配答案后回答客户的问题,这样的回答方式往往答非所问,智能程度不够高,因此不能很好的解决客户所提出的问题,既浪费客户的时间,也浪费服务器的计算资源,并没有达到减轻人工客服压力的初衷。
发明内容
本发明提供一种文本意图智能分类方法、装置及计算机可读存储介质,其主要目的在于当用户输入文本数据时,对所述用户输入的文本进行意图判断并输出判断结果。
为实现上述目的,本发明提供的一种文本意图智能分类方法,包括:
步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;
步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;
步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;
步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;
步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。
可选地,所述将所述初级文本集转换为词向量文本集包括:
确定所述初级文本集内每个词语ω在所述初级文本集的出现位置 Context(ω);
基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;
根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。
可选地,所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman 编码,表示路径pω内,第j个非叶子结点对应的向量。
可选地,所述对数似然函数ζ:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。
所述意图识别模型包括卷积神经网络、激活函数、损失函数,其中,所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层;
所述步骤C包括:
所述卷积神经网络接收所述训练集后,将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集,并将所述降维数据集输入至全连接层;
所述全连接层接收所述降维数据集,并结合所述激活函数计算得到训练值集合,并将所述训练值集合和所述标签集输入至所述损失函数中,所述损失函数计算出损失值,判断所述损失值与预设训练阈值的大小关系,直至所述损失值小于所述预设训练阈值时,所述意图识别模型满足所述预设训练要求并退出训练。
此外,为实现上述目的,本发明还提供一种文本意图智能分类装置,该装置包括存储器和处理器,所述存储器中存储有可在所述处理器上运行的文本意图智能分类程序,所述文本意图智能分类程序被所述处理器执行时实现如下步骤:
步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;
步骤B:将所述初级文本集输入至词向量化转换模型中得到词向量文本集,并将所述词向量文本集分类成训练集和测试集;
步骤C:将所述训练集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练;
步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率,若所述判断准确率小于预设准确率,返回步骤C,若判断准确率大于预设准确率,所述意图识别模型完成训练;
步骤E:接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断,并输出判断结果。
可选地,所述将所述初级文本集转换为词向量文本集包括:
确定所述初级文本集内每个词语ω在所述初级文本集的出现位置 Context(ω);
基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;
根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。
可选地,所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman 编码,表示路径pω内,第j个非叶子结点对应的向量。
可选地,所述对数似然函数为:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有文本意图智能分类程序,所述文本意图智能分类程序可被一个或者多个处理器执行,以实现如上所述的文本意图智能分类方法的步骤。
将所述初级文本集转换为词向量文本集可以有效的提高对文本特征的采集,增加文本分类的准确率,同时意图识别模型是基于深度学习,可有效的根据所述文本特征识别出文本关键字,并基于关键字进行意图分类,因此本发明提出的文本意图智能分类方法、装置及计算机可读存储介质可以实现精准的文本意图智能分类功能。
附图说明
图1为本发明一实施例提供的文本意图智能分类方法的流程示意图;
图2为本发明一实施例提供的文本意图智能分类装置的内部结构示意图;
图3为本发明一实施例提供的文本意图智能分类装置中文本意图智能分类程序的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本发明提供一种文本意图智能分类方法。参照图1所示,为本发明一实施例提供的文本意图智能分类方法的流程示意图。该方法可以由一个装置执行,该装置可以由软件和/或硬件实现。
在本实施例中,文本意图智能分类方法包括:
S1、接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集。
较佳地,所述原始文本集包括各种通过文字记录下的问题,如问题A:“什么时候发货”、问题B:“为什么还没有物流信息”、问题C:“双十一是否会降价”、问题D:“近期价格是否会发生变化?”等之类的问题。
进一步地,所述标签集记录所述原始文本集内各种问题的分类结果,如问题A:“什么时候发货”和问题B:“为什么还没有物流信息”在所述标签集中被记录为“发货咨询”;问题C:“双十一是否会降价”和问题D:“近期价格是否会发生变化?”在所述标签集中被记录为“价格变动咨询”。
本发明较佳实施例,所述停用词包括那个、这个、哎呀、比如、吧、但是等,所述标点符号包括句号、逗号、问好等。进一步地,本发明通过制作中文停用词表和中文标点符号表,通过比对所述原始文本集与所述中文停用词表和中文标点符号表是否有相同部分,达到去除所述停用词及所述标点符号的目的。如问题D:“近期价格是否会发生变化?”经过去除所述停用词及所述标点符号的操作变为:“近期价格发生变化”。
S2、将所述初级文本集输入至词向量化转换模型中得到词向量文本集,并将所述词向量文本集分类成训练集和测试集。
较佳地,所述词向量化转换模型包括输入层、投影层和输出层。本发明较佳实施例将所述初级文本集输入至所述输入层,所述输入层确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω),并将所述出现位置Context(ω)输入至所述投射层。如上述“近期价格发生变化”经过所述输入层处理后得到Context(ω1)、Context(ω2)、Context(ω3)、Context(ω4),其中ω1为近期,ω2为价格,ω3为发生,ω4为变化,Context为所述“近期价格发生变化”,则Context(ω1)=p(1|4)、Context(ω2)=p(2|4),依次类推。
进一步地,所述投射层基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型。所述累加求和操作得到累加求和矩阵Xω为:
其中,V(Context(ωi))是所述出现位置Context(ω)的矩阵表示形式,c表示所述初级文本集每个文本的词语数量,如所述“近期价格发生变化”的词语数量为4。所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的 Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。所述Huffman 编码是根据数据通信知识用0、1码的不同排列来表示词语,词语称为叶子结点,各叶子结点的权值通过Huffman编码表现。如所述问题“近期价格发生变化”经过所述输入层处理后得到Context(ω1),其中ω1为“近期”,则所述“近期”为所述叶子结点,通过所述Huffman编码操作后得到编码形式,所述编码形式可用00010表示,当所述“近期”为所述叶子结点时,所述“价格”、“发生”、“变化”为非叶子结点,所述叶子结点与所述非叶子结点统称为结点。
进一步地,所述输出层根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到词向量文本集,所述对数似然函数ζ为:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,称为语料,进一步地,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数,所述阈值函数可用sigmoid函数。
较佳地,所述最大化所述对数似然函数的方法为:
基于所述方法最大化后得到最优化所述概率模型,基于所述最优化概率模型得到最优化累加求和矩阵Xω,进一步地,基于所述最优化累加求和矩阵Xω得到词向量,因此所述初级文本集可转变为词向量文本集。
较佳地,将所述词向量文本集按照8:2的数量随机划分为训练集和测试集。
S3、将所述训练集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练。
本发明较佳实施所述意图识别模型包括卷积神经网络,所述卷积神经网络共有十六层卷积层和十六池化层、一层全连接层。当所述卷积神经网络接收所述训练集后,将所述训练集输入至第一层卷积层,所述第一层卷积层进行卷积操作后得到第一卷积数据集输入至第一层池化层;所述第一层池化层对所述第一卷积数据集进行最大化池化操作后得到第一降维数据集输入至第二层卷积层;所述第二层卷积层再次进行所述卷积操作后得到第二卷积数据集输入至第二层池化层进行所述最大化池化操作得到第二降维数据集,以此类推,直至最终得到第十六降维数据集,将所述第十六降维数据集输入至全连接层。
较佳地,所述全连接层接收所述第十六降维数据集,并结合激活函数计算得到所述训练值集合,并将所述训练值集合和所述标签集输入至所述意图识别模型的损失函数中,所述损失函数计算出损失值,判断所述损失值与预设训练阈值的大小关系,直至所述损失值小于所述预设训练阈值时,所述意图识别模型退出训练,所述预设训练阈值一般设置为0.1。
本发明较佳实施例所述卷积层的卷积操作为:
其中ω’为输出数据,ω为输入数据,k为所述卷积层的卷积核大小,s为所述卷积操作的步幅,p为数据补零矩阵;
所述激活函数为:
其中y为所述训练值集合,e为无限不循环小数。
本发明较佳实施例所述损失值T为:
其中,n为所述标签集的大小,yt为所述训练值集合,μt为所述标签集。
S4、将所述测试集输入至所述意图识别模型中进行意图判断,判断准确率和预设准确率的大小关系。
若判断准确率小于预设准确率,返回S3。
较佳地,所述意图识别模型基于所述测试集进行上述卷积操作、池化操作、激活操作后得到所述测试集的意图分类集合,依次比对所述意图分类集合与所述标签集是否相同,并计算相同的数量,将所述相同的数量除以所述测试集总数得到准确率。如所述意图识别模型将测试集中“近期价格发生变化”判断为“价格变动咨询”,与实际被分类为“价格变动咨询”一致,因此所述意图识别模型判断正确。进一步地,所述准确率一般设置为95%,当所述准确率小于95%时,重新返回S3继续训练。
若判断准确率大于预设准确率,则S5、所述意图识别模型完成训练。
S6、接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行意图判断,并输出判断结果。
发明还提供一种文本意图智能分类装置。参照图2所示,为本发明一实施例提供的文本意图智能分类装置的内部结构示意图。
在本实施例中,所述文本意图智能分类装置1可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备,也可以是一种服务器等。该文本意图智能分类装置1至少包括存储器11、处理器12,通信总线13,以及网络接口14。
其中,存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。存储器11在一些实施例中可以是文本意图智能分类装置1的内部存储单元,例如该文本意图智能分类装置1的硬盘。存储器 11在另一些实施例中也可以是文本意图智能分类装置1的外部存储设备,例如文本意图智能分类装置1上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card) 等。进一步地,存储器11还可以既包括文本意图智能分类装置1的内部存储单元也包括外部存储设备。存储器11不仅可以用于存储安装于文本意图智能分类装置1的应用软件及各类数据,例如文本意图智能分类程序01的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
处理器12在一些实施例中可以是一中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,用于运行存储器 11中存储的程序代码或处理数据,例如执行文本意图智能分类程序01等。
通信总线13用于实现这些组件之间的连接通信。
网络接口14可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该装置1与其他电子设备之间建立通信连接。
可选地,该装置1还可以包括用户接口,用户接口可以包括显示器 (Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在文本意图智能分类装置1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-14以及文本意图智能分类程序01的文本意图智能分类装置1,本领域技术人员可以理解的是,图1示出的结构并不构成对文本意图智能分类装置1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
在图2所示的装置1实施例中,存储器11中存储有文本意图智能分类程序01;处理器12执行存储器11中存储的文本意图智能分类程序01时实现如下步骤:
步骤一、接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集。
较佳地,所述原始文本集包括各种通过文字记录下的问题,如问题A:“什么时候发货”、问题B:“为什么还没有物流信息”、问题C:“双十一是否会降价”、问题D:“近期价格是否会发生变化?”等之类的问题。
进一步地,所述标签集记录所述原始文本集内各种问题的分类结果,如问题A:“什么时候发货”和问题B:“为什么还没有物流信息”在所述标签集中被记录为“发货咨询”;问题C:“双十一是否会降价”和问题D:“近期价格是否会发生变化?”在所述标签集中被记录为“价格变动咨询”。
本发明较佳实施例,所述停用词包括那个、这个、哎呀、比如、吧、但是等,所述标点符号包括句号、逗号、问好等。进一步地,本发明通过制作中文停用词表和中文标点符号表,通过比对所述原始文本集与所述中文停用词表和中文标点符号表是否有相同部分,达到去除所述停用词及所述标点符号的目的。如问题D:“近期价格是否会发生变化?”经过去除所述停用词及所述标点符号的操作变为:“近期价格发生变化”。
步骤二、将所述初级文本集输入至词向量化转换模型中得到词向量文本集,并将所述词向量文本集分类成训练集和测试集。
较佳地,所述词向量化转换模型包括输入层、投影层和输出层。本发明较佳实施例将所述初级文本集输入至所述输入层,所述输入层确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω),并将所述出现位置Context(ω)输入至所述投射层。如上述“近期价格发生变化”经过所述输入层处理后得到Context(ω1)、Context(ω2)、Context(ω3)、Context(ω4),其中ω1为近期,ω2为价格,ω3为发生,ω4为变化,Context为所述“近期价格发生变化”,则Context(ω1)=p(1|4)、Context(ω2)=p(2|4),依次类推。
进一步地,所述投射层基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型。所述累加求和操作得到累加求和矩阵Xω为:
其中,V(Context(ωi))是所述出现位置Context(ω)的矩阵表示形式,c表示所述初级文本集每个文本的词语数量,如所述“近期价格发生变化”的词语数量为4。所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的 Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。所述Huffman 编码是根据数据通信知识用0、1码的不同排列来表示词语,词语称为叶子结点,各叶子结点的权值通过Huffman编码表现。如所述问题“近期价格发生变化”经过所述输入层处理后得到Context(ω1),其中ω1为“近期”,则所述“近期”为所述叶子结点,通过所述Huffman编码操作后得到编码形式,所述编码形式可用00010表示,当所述“近期”为所述叶子结点时,所述“价格”、“发生”、“变化”为非叶子结点,所述叶子结点与所述非叶子结点统称为结点。
进一步地,所述输出层根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到词向量文本集,所述对数似然函数ζ为:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,称为语料,进一步地,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数,所述阈值函数可用sigmoid函数。
较佳地,所述最大化所述对数似然函数的方法为:
基于所述方法最大化后得到最优化所述概率模型,基于所述最优化概率模型得到最优化累加求和矩阵Xω,进一步地,基于所述最优化累加求和矩阵Xω得到词向量,因此所述初级文本集可转变为词向量文本集。
较佳地,将所述词向量文本集按照8∶2的数量随机划分为训练集和测试集。
步骤三、将所述训练集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练。
本发明较佳实施所述意图识别模型包括卷积神经网络,所述卷积神经网络共有十六层卷积层和十六池化层、一层全连接层。当所述卷积神经网络接收所述训练集后,将所述训练集输入至第一层卷积层,所述第一层卷积层进行卷积操作后得到第一卷积数据集输入至第一层池化层;所述第一层池化层对所述第一卷积数据集进行最大化池化操作后得到第一降维数据集输入至第二层卷积层;所述第二层卷积层再次进行所述卷积操作后得到第二卷积数据集输入至第二层池化层进行所述最大化池化操作得到第二降维数据集,以此类推,直至最终得到第十六降维数据集,将所述第十六降维数据集输入至全连接层。
较佳地,所述全连接层接收所述第十六降维数据集,并结合激活函数计算得到所述训练值集合,并将所述训练值集合和所述标签集输入至所述意图识别模型的损失函数中,所述损失函数计算出损失值,判断所述损失值与预设训练阈值的大小关系,直至所述损失值小于所述预设训练阈值时,所述意图识别模型退出训练,所述预设训练阈值一般设置为0.1。
本发明较佳实施例所述卷积层的卷积操作为:
其中ω’为输出数据,ω为输入数据,k为所述卷积层的卷积核大小,s为所述卷积操作的步幅,p为数据补零矩阵;
所述激活函数为:
其中y为所述训练值集合,e为无限不循环小数。
本发明较佳实施例所述损失值T为:
其中,n为所述标签集的大小,yt为所述训练值集合,μt为所述标签集。
步骤四、将所述测试集输入至所述意图识别模型中进行意图判断,判断准确率和预设准确率的大小关系。
若判断准确率小于预设准确率,返回步骤三。
较佳地,所述意图识别模型基于所述测试集进行上述卷积操作、池化操作、激活操作后得到所述测试集的意图分类集合,依次比对所述意图分类集合与所述标签集是否相同,并计算相同的数量,将所述相同的数量除以所述测试集总数得到准确率。如所述意图识别模型将测试集中“近期价格发生变化”判断为“价格变动咨询”,与实际被分类为“价格变动咨询”一致,因此所述意图识别模型判断正确。进一步地,所述准确率一般设置为95%,当所述准确率小于95%时,重新返回S3继续训练。
步骤五、若判断准确率大于预设准确率,则所述意图识别模型完成训练。
步骤六、接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行意图判断,并输出判断结果。
可选地,在其他实施例中,文本意图智能分类程序还可以被分割为一个或者多个模块,一个或者多个模块被存储于存储器11中,并由一个或多个处理器(本实施例为处理器12)所执行以完成本发明,本发明所称的模块是指能够完成特定功能的一系列计算机程序指令段,用于描述文本意图智能分类程序在文本意图智能分类装置中的执行过程。
例如,参照图3所示,为本发明文本意图智能分类装置一实施例中的文本意图智能分类程序的程序模块示意图,该实施例中,所述文本意图智能分类程序可以被分割为数据接收模块10、数据处理模块20、模型训练模块30、文本意图智能分类输出模块40示例性地:
所述数据接收模块10用于:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集。
所述数据处理模块20用于:将所述初级文本集输入至词向量化转换模型中得到词向量文本集,并将所述词向量文本集分类成训练集和测试集。
所述模型训练模块30用于:将所述训练集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练,将所述测试集输入至所述意图识别模型中进行文本意图判断,计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率,若所述判断准确率小于预设准确率则继续训练,若判断准确率大于预设准确率,所述意图识别模型完成训练。
所述文本意图智能分类输出模块40用于:接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断,并输出判断结果。
上述数据接收模块10、数据处理模块20、模型训练模块30、文本意图智能分类输出模块40等程序模块被执行时所实现的功能或操作步骤与上述实施例大体相同,在此不再赘述。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有文本意图智能分类程序,所述文本意图智能分类程序可被一个或多个处理器执行,以实现如下操作:
接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集。
将所述初级文本集输入至词向量化转换模型中得到词向量文本集,并将所述词向量文本集分类成训练集和测试集。
将所述训练集及所述标签集输入至意图识别模型中训练,直到所述意图识别模型满足训练要求后退出训练,将所述测试集输入至所述意图识别模型中进行文本意图判断,计算所述文本意图判断与所述标签集中内容是否相同并得到判断准确率,若所述判断准确率小于预设准确率则继续训练,若判断准确率大于预设准确率,所述意图识别模型完成训练。
接收用户的文本A,并将所述文本A转变为词向量文本A输入至所述意图识别模型进行文本意图判断,并输出判断结果。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种文本意图智能分类方法,其特征在于,所述方法包括:
步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;
步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;
步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;
步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;
步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。
2.如权利要求1所述的文本意图智能分类方法,其特征在于,所述将所述初级文本集转换为词向量文本集包括:
确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);
基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;
根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。
3.如权利要求2所述的文本意图智能分类方法,其特征在于,所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。
4.如权利要求3中的文本意图智能分类方法,其特征在于,所述对数似然函数为:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。
5.如权利要求1至4任意一项所述的文本意图智能分类方法,其特征在于,所述意图识别模型包括卷积神经网络、激活函数、损失函数,其中,所述卷积神经网络包括十六层卷积层和十六层池化层、一层全连接层;
所述步骤C包括:
所述卷积神经网络接收所述训练集后,将所述训练集输入至所述十六层卷积层和十六层池化层进行卷积操作和最大池化操作得到降维数据集,并将所述降维数据集输入至全连接层;
所述全连接层接收所述降维数据集,并结合所述激活函数计算得到训练值集合,并将所述训练值集合和所述标签集输入至所述损失函数中,所述损失函数计算出损失值,判断所述损失值与预设训练阈值的大小关系,直至所述损失值小于所述预设训练阈值时,所述意图识别模型满足所述预设训练要求并退出训练。
6.一种文本意图智能分类装置,其特征在于,所述装置包括存储器和处理器,所述存储器上存储有可在所述处理器上运行的文本意图智能分类程序,所述文本意图智能分类程序被所述处理器执行时实现如下步骤:
步骤A:接收原始文本集及标签集,并对所述原始文本集去除停用词及标点符号得到初级文本集;
步骤B:将所述初级文本集转换为词向量文本集,并将所述词向量文本集分类成训练集和测试集;
步骤C:将所述训练集及所述标签集输入至预先构建的意图识别模型中训练,直到所述意图识别模型满足预设训练要求后退出训练;
步骤D:将所述测试集输入至所述意图识别模型中进行文本意图判断,计算对所述文本意图的判断结果与所述标签集中内容的匹配准确率,若所述匹配准确率小于预设准确率,返回步骤C,若所述匹配准确率大于所述预设准确率,所述意图识别模型完成训练;
步骤E:接收用户的文本,并将所述文本转变为词向量文本输入至所述意图识别模型进行文本意图判断,并输出判断结果。
7.如权利要求6所述的文本意图智能分类装置,其特征在于,所述将所述初级文本集转换为词向量文本集包括:
确定所述初级文本集内每个词语ω在所述初级文本集的出现位置Context(ω);
基于所述出现位置Context(ω)做累加求和操作得到累加求和矩阵Xω,并根据所述Xω建立概率模型;
根据所述概率模型建立对数似然函数,并最大化所述对数似然函数得到所述词向量文本集。
8.如权利要求7所述的文本意图智能分类装置,其特征在于,
所述概率模型为:
其中,p(ω|Context(ω))为所述概率模型,Context为所述初级文本集,ω为所述初级文本集内每个词语,表示在路径pω内,第j个结点对应的Huffman编码,表示路径pω内,第j个非叶子结点对应的向量。
9.如权利要求8所述的文本意图智能分类装置,其特征在于,所述对数似然函数为:
其中,ζ为所述对数似然函数,是包含了所述初级文本集所有内容的集合,其中,所述对数似然函数ζ基于所述概率模型可进一步扩展为:
其中,lω表示所述路径pω中包括结点的数量,σ为阈值函数。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有文本意图智能分类程序,所述文本意图智能分类程序可被一个或者多个处理器执行,以实现如权利要求1至5中任一项所述的文本意图智能分类方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910525743.3A CN110347789A (zh) | 2019-06-14 | 2019-06-14 | 文本意图智能分类方法、装置及计算机可读存储介质 |
PCT/CN2019/102207 WO2020248366A1 (zh) | 2019-06-14 | 2019-08-23 | 文本意图智能分类方法、装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910525743.3A CN110347789A (zh) | 2019-06-14 | 2019-06-14 | 文本意图智能分类方法、装置及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110347789A true CN110347789A (zh) | 2019-10-18 |
Family
ID=68182177
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910525743.3A Pending CN110347789A (zh) | 2019-06-14 | 2019-06-14 | 文本意图智能分类方法、装置及计算机可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN110347789A (zh) |
WO (1) | WO2020248366A1 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111161740A (zh) * | 2019-12-31 | 2020-05-15 | 中国建设银行股份有限公司 | 意图识别模型训练方法、意图识别方法以及相关装置 |
CN112231474A (zh) * | 2020-10-13 | 2021-01-15 | 中移(杭州)信息技术有限公司 | 意图识别方法、系统、电子设备及存储介质 |
CN112269875A (zh) * | 2020-10-23 | 2021-01-26 | 中国平安人寿保险股份有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN117672227A (zh) * | 2024-01-25 | 2024-03-08 | 深圳市音随我动科技有限公司 | 基于智能音箱的问答控制方法、装置、计算机设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018010434A1 (zh) * | 2016-07-13 | 2018-01-18 | 华为技术有限公司 | 一种图像分类方法及装置 |
CN107943860A (zh) * | 2017-11-08 | 2018-04-20 | 北京奇艺世纪科技有限公司 | 模型的训练方法、文本意图的识别方法及装置 |
CN109325106A (zh) * | 2018-07-31 | 2019-02-12 | 厦门快商通信息技术有限公司 | 一种医美聊天机器人意图识别方法及装置 |
WO2019084810A1 (zh) * | 2017-10-31 | 2019-05-09 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端、计算机存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8082264B2 (en) * | 2004-04-07 | 2011-12-20 | Inquira, Inc. | Automated scheme for identifying user intent in real-time |
CN109284406B (zh) * | 2018-09-03 | 2021-12-03 | 四川长虹电器股份有限公司 | 基于差异循环神经网络的意图识别方法 |
CN109635117B (zh) * | 2018-12-26 | 2021-05-14 | 零犀(北京)科技有限公司 | 一种基于知识图谱识别用户意图方法及装置 |
-
2019
- 2019-06-14 CN CN201910525743.3A patent/CN110347789A/zh active Pending
- 2019-08-23 WO PCT/CN2019/102207 patent/WO2020248366A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018010434A1 (zh) * | 2016-07-13 | 2018-01-18 | 华为技术有限公司 | 一种图像分类方法及装置 |
WO2019084810A1 (zh) * | 2017-10-31 | 2019-05-09 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及终端、计算机存储介质 |
CN107943860A (zh) * | 2017-11-08 | 2018-04-20 | 北京奇艺世纪科技有限公司 | 模型的训练方法、文本意图的识别方法及装置 |
CN109325106A (zh) * | 2018-07-31 | 2019-02-12 | 厦门快商通信息技术有限公司 | 一种医美聊天机器人意图识别方法及装置 |
Non-Patent Citations (1)
Title |
---|
王明亚: "基于词向量的文本分类算法研究与改进", 中国优秀硕士学位论文全文数据库信息科技辑, no. 10, pages 138 - 591 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111161740A (zh) * | 2019-12-31 | 2020-05-15 | 中国建设银行股份有限公司 | 意图识别模型训练方法、意图识别方法以及相关装置 |
CN112231474A (zh) * | 2020-10-13 | 2021-01-15 | 中移(杭州)信息技术有限公司 | 意图识别方法、系统、电子设备及存储介质 |
CN112269875A (zh) * | 2020-10-23 | 2021-01-26 | 中国平安人寿保险股份有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN112269875B (zh) * | 2020-10-23 | 2023-07-25 | 中国平安人寿保险股份有限公司 | 文本分类方法、装置、电子设备及存储介质 |
CN117672227A (zh) * | 2024-01-25 | 2024-03-08 | 深圳市音随我动科技有限公司 | 基于智能音箱的问答控制方法、装置、计算机设备和介质 |
CN117672227B (zh) * | 2024-01-25 | 2024-04-05 | 深圳市音随我动科技有限公司 | 基于智能音箱的问答控制方法、装置、计算机设备和介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2020248366A1 (zh) | 2020-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110347789A (zh) | 文本意图智能分类方法、装置及计算机可读存储介质 | |
CN109871446A (zh) | 意图识别中的拒识方法、电子装置及存储介质 | |
CN108415980A (zh) | 问答数据处理方法、电子装置及存储介质 | |
CN110135942A (zh) | 产品推荐方法、装置及计算机可读存储介质 | |
CN110442857B (zh) | 情感智能判断方法、装置及计算机可读存储介质 | |
CN110032632A (zh) | 基于文本相似度的智能客服问答方法、装置及存储介质 | |
CN107644012B (zh) | 电子装置、问题识别确认方法和计算机可读存储介质 | |
CN107767259A (zh) | 贷款风险控制方法、电子装置及可读存储介质 | |
CN109298840A (zh) | 基于数据湖的数据集成方法、服务器及存储介质 | |
CN110163204A (zh) | 基于图像识别的商家监管方法、装置及存储介质 | |
CN110852785B (zh) | 用户分级方法、装置及计算机可读存储介质 | |
CN111652278B (zh) | 用户行为检测方法、装置、电子设备及介质 | |
CN110046806B (zh) | 用于客服派单的方法、装置和计算设备 | |
CN112995414B (zh) | 基于语音通话的行为质检方法、装置、设备及存储介质 | |
CN110246506A (zh) | 人声智能检测方法、装置及计算机可读存储介质 | |
CN110442711A (zh) | 文本智能化清洗方法、装置及计算机可读存储介质 | |
CN113656690B (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN112434501A (zh) | 工单智能生成的方法、装置、电子设备及介质 | |
CN110866042A (zh) | 表格智能查询方法、装置及计算机可读存储介质 | |
CN115018588A (zh) | 产品推荐方法、装置、电子设备及可读存储介质 | |
CN113360654A (zh) | 文本分类方法、装置、电子设备及可读存储介质 | |
CN113127621A (zh) | 对话模块的推送方法、装置、设备及存储介质 | |
CN113886708A (zh) | 基于用户信息的产品推荐方法、装置、设备及存储介质 | |
CN107169530A (zh) | 图片的标注方法、装置及电子设备 | |
CN111415196A (zh) | 一种广告召回方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |