CN112836025A - 一种意图识别方法及装置 - Google Patents
一种意图识别方法及装置 Download PDFInfo
- Publication number
- CN112836025A CN112836025A CN201911158972.2A CN201911158972A CN112836025A CN 112836025 A CN112836025 A CN 112836025A CN 201911158972 A CN201911158972 A CN 201911158972A CN 112836025 A CN112836025 A CN 112836025A
- Authority
- CN
- China
- Prior art keywords
- intention
- consultation information
- category
- text
- determining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3346—Query execution using probabilistic model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Probability & Statistics with Applications (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及计算机技术领域,尤其涉及一种意图识别方法及装置,获取待识别对象的对话咨询信息;将所述对话咨询信息的文本输入到预先训练的意图识别模型中,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值,其中,所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络;根据所述对应于各预设意图类别的概率值,确定所述待识别对象的意图类别,这样,能提升意图识别效率和准确性。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种意图识别方法及装置。
背景技术
随着人工智能技术的飞速发展,纳税服务步入“互联网+税务”的智能化 时代,通过人工智能和机器学习分析所有数据,在税务领域智能客服问答系统 中,能够识别出用户的意图对于理解用户提出的问题以及欲求得到的帮助具有 重要的意义,现有技术中,用户意图识别主要使用规则匹配和基于特征的机器 学习,但现有技术中的这种方法机器学习采用的网络结构单一,准确性不高, 并且扩展性较差。
发明内容
本申请实施例提供一种意图识别方法及装置,以提升用户意图识别准确性。
本申请实施例提供的具体技术方案如下:
一种意图识别方法,包括:
获取待识别对象的对话咨询信息;
将所述对话咨询信息的文本输入到预先训练的意图识别模型中,获得所述 意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨 询信息对应于各预设意图类别的概率值,其中,所述意图识别模型的网络结构 至少包括卷积神经网络、长短期记忆网络和分类网络;
根据所述对应于各预设意图类别的概率值,确定所述待识别对象的意图类 别。
可选的,所述卷积神经网络包括输入层、卷积层、池化层,则获得所述意 图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询 信息对应于各预设意图类别的概率值,具体包括:
通过所述输入层将所述对话咨询信息的文本进行分词处理,并生成各分词 对应的词向量;
通过所述卷积层对生成的各词向量进行特征提取,获得与所述各词向量对 应的各卷积特征向量;
通过所述池化层将所述各卷积特征向量中各维度按照分词顺序进行组合, 获得各重组后的卷积特征向量;
通过所述长短期记忆网络层将所述各重组后的卷积特征向量进行特征提 取,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话 咨询信息对应于各预设意图类别的概率值。
可选的,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取 后,确定的所述对话咨询信息对应于各预设意图类别的概率值,具体包括:
将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
分别通过所述卷积神经网络和所述长短期记忆网络对生成的各词向量进 行特征提取,获得各卷积特征向量和各全局特征向量;
将所述各卷积特征向量和所述各全局特征向量进行连接,并通过所述分类 网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预 设意图类别的概率值。
可选的,根据所述对应于各预设意图类别的概率值,确定所述待识别对象 的意图类别,具体包括:
将所述对应于各预设意图类别的概率值中的最大值对应的意图类别,确定 为所述待识别对象的意图类别。
可选的,所述各预设意图类别至少包括金融业务知识类、物联网业务知识 类、金税业务知识类和其他业务知识类。
可选的,确定所述待识别对象的意图类别之后,进一步包括:
根据所述待识别对象的意图类别,确定对应的业务知识数据库;
从所述对应的业务知识数据库中确定与所述对话咨询信息对应的对话咨 询答案;或,
根据所述对应的业务知识数据库,推荐与所述对话咨询信息关联的业务知 识。
一种意图识别装置,包括:
获取模块,用于获取待识别对象的对话咨询信息;
处理模块,用于将所述对话咨询信息的文本输入到预先训练的意图识别模 型中,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确 定的所述对话咨询信息对应于各预设意图类别的概率值,其中,所述意图识别 模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络;
第一确定模块,用于根据所述对应于各预设意图类别的概率值,确定所述 待识别对象的意图类别。
可选的,所述卷积神经网络包括输入层、卷积层、池化层,则获得所述意 图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询 信息对应于各预设意图类别的概率值时,处理模块具体用于:
通过所述输入层将所述对话咨询信息的文本进行分词处理,并生成各分词 对应的词向量;
通过所述卷积层对生成的各词向量进行特征提取,获得与所述各词向量对 应的各卷积特征向量;
通过所述池化层将所述各卷积特征向量中各维度按照分词顺序进行组合, 获得各重组后的卷积特征向量;
通过所述长短期记忆网络层将所述各重组后的卷积特征向量进行特征提 取,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话 咨询信息对应于各预设意图类别的概率值。
可选的,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取 后,确定的所述对话咨询信息对应于各预设意图类别的概率值时,处理模块具 体用于:
将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
分别通过所述卷积神经网络和所述长短期记忆网络对生成的各词向量进 行特征提取,获得各卷积特征向量和各全局特征向量;
将所述各卷积特征向量和所述各全局特征向量进行连接,并通过所述分类 网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预 设意图类别的概率值。
可选的,第一确定模块具体用于:
将所述对应于各预设意图类别的概率值中的最大值对应的意图类别,确定 为所述待识别对象的意图类别。
可选的,所述各预设意图类别至少包括金融业务知识类、物联网业务知识 类、金税业务知识类和其他业务知识类。
可选的,确定所述待识别对象的意图类别之后,进一步包括:
第二确定模块,用于根据所述待识别对象的意图类别,确定对应的业务知 识数据库;
第三确定模块,用于从所述对应的业务知识数据库中确定与所述对话咨询 信息对应的对话咨询答案;或,
根据所述对应的业务知识数据库,推荐与所述对话咨询信息关联的业务知 识。
一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运 行的计算机程序,所述处理器执行所述程序时实现上述意图识别方法的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处 理器执行时实现上述意图识别方法的步骤。
本申请实施例中,获取待识别对象的对话咨询信息后,通过将对话咨询信 息输入到预先训练的包括卷积神经网络、长短期记忆网络和分类网络的意图识 别模型中,获得对话咨询信息对应与各预设意图类别的概率值,进而根据对应 于各预设意图类别的概率值,确定待识别对象的意图类别,通过使用这种结合 卷积神经网络、长短期记忆网络和分类网络的意图识别模型,不仅能够保证语 序性,而且还能够增加意图识别的准确性。
附图说明
图1为本申请实施例中现有技术中人工神经网络的工作原理;
图2为本申请实施例中一种意图识别方法的流程图;
图3为本申请实施例中意图识别模型结构示意图;
图4为本申请实施例中另一种意图识别方法流程图;
图5为本申请实施例中意图识别装置结构示意图;
图6为本申请实施例中电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,并不是 全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造 性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
随着人工智能技术的飞速发展,纳税服务步入“互联网+税务”的智能化 时代,在这个智能化时代中,智能机器人对智能化起到了很大的作用,智能机 器人不仅能够实时分析用户信息的数据,例如,能够实时分析用户身份信息数 据、反馈信息数据、日期信息数据、时间信息数据、位置信息数据和其它信息 的数据,还能够通过结合实时用户信息数据和存储在客户关系管理(Customer Relationship Management,CRM)系统中的客户关系信息数据,获知更多的客 户需求。
并且通过人工智能和机器学习分析获取到的实时数据和本地客户信息数 据,智能机器人还可以预测客户的更多的需求,例如,预测用户的“下一个问 题”,也就是说,智能机器人不仅能够获知到用户实时信息数据,而且还能够 预测到下一个最可能出现的用户实时数据需求,例如,如果纳税人已经咨询增 值税办税步骤,并且咨询附近的办税厅,则智能机器人可以主动地提供办税厅 的详细地址及营业时间及联系电话等信息,如果智能机器人遇到解决不了的问 题,还可以将用户实时信息数据发送给指定的人工客服进行服务。
在现有技术的税务领域中,智能客服意图识别算法是基于规则分类和基于 模型(机器学习或深度学习)进行意图识别的,例如,聊天机器人的一个基本 机制是利用文本分类器进行意图识别的,参阅图1所示,为现有技术中人工神 经网络(Artificial NeuralNetwork,ANN)的工作原理。人工神经网络使用2 层神经元(1个隐层)和词袋(bag ofwords)方法来组织训练数据。文本分类 的方法有三种:模式匹配,传统算法和神经网络。虽然使用多项朴素贝叶斯 (Multinomial Naive Bayes,MNB)的算法是有效的,但现有技术中的这种方 法,存在着一些问题,例如MNB算法的输出是一个分值,但是当输出一个分 值时,有可能会忽略低于某个阈值的预测,这样,会导致意图识别的准确性大 大降低,并且,MNB算法只能从分类的正例样本中学习模式,也就是说,通 过MNB算法只能通过同一类别的样本得到用户意图,然而从分类的负例样本 中得到用户意图,即无法根据不属于同一类别的样本中训练出用户意图,这样 不平衡的训练数据会导致MNB分类器的分值扭曲,迫使算法按照不同分类的 数据集的大小来调整分值,并且与朴素相对应,文本分类器并不是试图理解一 个句子的意思,而只是进行分类,使用现有技术中的这种MNB算法也会降低 意图识别的准确性。
本申请实施例中,提供了一种意图识别方法,获取待识别对象的对话咨询 信息,并将待识别对象的对话咨询信息的文本输入到预先训练的包括卷积神经 网络、长短期记忆网络和分类网络的意图识别模型中,然后意图识别模型能够 将对话咨询信息的文本中的特征进行提取,并根据提取的特征确定对话咨询信 息对应于各预设意图类别的概率值,进而能够根据对应于各预设意图类别的概 率值,确定待识别对象的意图类别,通过这种方法,不仅能够文本的语序性, 还可以根据输出的概率值确定最接近的意图类别,能够提高意图识别的准确性。
基于上述实施例,参阅图2所示,为本申请实施例中一种意图识别方法的 流程图,具体包括:
步骤200:获取待识别对象的对话咨询信息。
本申请实施例中,在获取待识别对象的对话咨询信息时,可以通过用户输 入的文本进而获取待识别对象的对话咨询信息,也可以通过例如录音功能获取 待识别对象的对话咨询信息,本申请实施例中对获取待识别对象的对话咨询信 息的方式并不进行限制。
进一步地,本申请实施例中在获取待识别对象的对话咨询信息时,可以为 获取待识别对象的对话咨询信息设置时间区域值,例如,将时间区域值设置为 5秒,也就是说,获取待识别对象在5秒内输入的对话咨询信息,本申请实施 例中对此并不进行限制。
步骤210:对对话咨询信息进行语义识别,确定对话咨询信息对应于各预 设意图类别的概率值。
其中,各预设意图类别至少包括金融业务知识类、物联网业务知识类、金 税业务知识类和其他业务知识类。
具体地,执行步骤210时,包括:
S1:将对话咨询信息的文本输入到预先训练的意图识别模型中。
其中,预先训练的意图识别模型的网络结构至少包括卷积神经网络、长短 期记忆网络和分类网络,卷积神经网络包括输入层、卷积层、池化层。
本申请实施例中,对话咨询信息的文本可以是待识别对象输入的问题,当 接收到待识别对象输入的问题后,则将该问题输入到预先训练的意图识别模型 中,本申请实施例中对此并不进行限制。
其中,待识别对象输入的问题可以是,例如,“POS机交易时密码键盘发 出“嘀嘀嘀”的响声,导致交易无法完成,需要怎么处理”,本申请实施例中 对此并不进行限制。
S2:获得意图识别模型对对话咨询信息的文本进行特征提取后,确定的对 话咨询信息对应于各预设意图类别的概率值。
具体地,执行步骤S2时,提供了以下两种实施方式:
第一种实施方式:执行步骤S2时具体包括:
A1、通过输入层将对话咨询信息的文本进行分词处理,并生成各分词对应 的词向量。
本申请实施例中,输入层包括一个向量空间模型,即word2vec,该word2vec 是用一个一层的神经网络把one-hot形式的稀疏词向量映射称为一个n维(n 一般为几百)的稠密向量的向量空间模型,因此,word2vec能够完成词向量表 示,即将实际的文本内容变成计算机能识别的表示形式,即n维的词向量。
也就是说,在本申请实施例中,输入层将对话咨询信息的文本进行分词处 理,将完整的对话咨询信息的文本分为一个一个分词,然后将分词经过 word2vec向量空间模型进行转换,将各分词转换为与其一一对应的各分词对应 的词向量。
A2、通过卷积层对生成的各词向量进行特征提取,获得与各词向量对应的 各卷积特征向量。
A3、通过池化层将各卷积特征向量中各维度按照分词顺序进行组合,获得 各重组后的卷积特征向量。
本申请实施例中,经过卷积层后可以获得多个卷积结果,即各卷积特征向 量,进而能够通过池化层对经过卷积层后得到的各卷积特征向量进行采样。
A4、通过长短期记忆网络层将各重组后的卷积特征向量进行特征提取,并 通过分类网络映射为一维向量,根据一维向量,确定对话咨询信息对应于各预 设意图类别的概率值。
其中,本申请实施例中的分类网络可以为softmax网络,softmax网络能够 进行意图识别分类,完成意图识别。
本申请实施例中,首先长短期记忆网络层能够将各重组后的卷积特征向量 进行特征提取,获得经由长短期记忆网络层输出的特征向量。
然后将经由长短期记忆网络层输出的特征向量经由全连接层映射得到输 出向量,即一维向量,并根据一维向量,确定对话咨询信息对应于各预设意图 类别的概率值。
例如,当输入的问题为“POS机交易时密码键盘发出“嘀嘀嘀”的响声, 导致交易无法完成,需要怎么处理”时,该输入的问题经过特征提取和映射, 确定出该输入的问题对应与各预设意图类别的概率值,即,金融业务知识类的 概率值为60%,物联网业务知识类20%、金税业务知识类10%和其他业务知识 类10%,本申请实施例中对此并不进行限制。
第二种实施方式:本申请实施例中,在执行步骤S2时,还可以具体包括:
A1、将对话咨询信息的文本进行分词处理,并生成各分词对应的词向量。
A2、分别通过卷积神经网络和长短期记忆网络对生成的各词向量进行特征 提取,获得各卷积特征向量和各全局特征向量。
其中,长短期记忆网络能够捕捉时序信息。
A3、将各卷积特征向量和各全局特征向量进行连接,并通过分类网络映射 为一维向量,根据一维向量,确定对话咨询信息对应于各预设意图类别的概率 值。
步骤220:根据对应于各预设意图类别的概率值,确定待识别对象的意图 类别。
执行步骤220时,具体包括:将对应于各预设意图类别的概率值中的最大 值对应的意图类别,确定为待识别对象的意图类别。
本申请实施例中,可以将意图类别分为金融业务知识类、物联网业务知识 类、金税业务知识类和其他业务知识类,本申请实施例中对意图类别的分类方 式和种类并不进行限制。
例如,当输入的问题为“POS机交易时密码键盘发出“嘀嘀嘀”的响声, 导致交易无法完成,需要怎么处理”,金融业务知识类的概率值为60%,物联 网业务知识类20%、金税业务知识类10%和其他业务知识类10%,因此,概率 值中的最大值为金融业务知识类,则能够确定待识别对象的意图类别为金融业 务知识类,本申请实施例中对此并不进行限制。
本申请实施例中,执行步骤220后,即可以根据其意图类别,准确针对性 地回复用户或推荐相关信息,具体地,本申请实施例中提供了几种可能的实施 方式:
第一种方式:S1:根据待识别对象的意图类别,确定对应的业务知识数据 库。
例如,确定待识别对象的意图类别为金融业务知识类,则能够确定对应的 业务知识数据库为金融业务知识数据库,本申请实施例中对此并不进行限制。
S2:从对应的业务知识数据库中确定与对话咨询信息对应的对话咨询答案。
本申请实施例中的这种方法,当识别出意图后,到对应的意图识别库中查 找答案,能够在一定程度上减少搜索时间。
例如,当确定为,则根据问题,确定对应的答案,根据问题“POS机交易 时密码键盘发出“嘀嘀嘀”的响声,导致交易无法完成,需要怎么处理”对应 的答案为“可能是POS机密码键盘故障,可联系服务热线进行报修”,本申请 实施例中对此并不进行限制。
第二种方式:当确定出对应的业务知识数据库后,本申请实施例中还提供 了另一种可能的实施方式,具体地,根据所对应的业务知识数据库,推荐与对 话咨询信息关联的业务知识。
本申请实施例中,将获取到的待识别对象的对话咨询信息输入到预先训练 的意图识别模型中,该意图识别模型的网络结构至少包括卷积神经网络、长短 期记忆网络和分类网络,通过结合卷积神经网络和长短期记忆网络结构,进而 生成对话咨询信息对应与各预设意图类别的概率值,并确定待识别对象的意图 类别,不仅能保证输入的对话咨询信息的文本的语序性,还能够提升意图识别 的准确性。
基于上述实施例,参阅图3所示,为本申请实施例中意图识别模型结构示 意图,该意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和 分类网络。
其中,卷积神经网络结构中至少包括输入层、卷积层和池化连接层,长短 期记忆网络结构中至少包括双向Bi-LSTM隐藏层、双向Bi-LSTM输出层、平 均池化层和输出层。
本申请实施例中,意图识别模型中的卷积神经网络在提取卷积特征向量和 关系抽取方法中占有很大的优势,并且,卷积神经网络是一种分层递归的网络 结构。
输入层:用于将获取到的对话咨询信息的文本进行特征进行分词处理,并 生成各分词对应的词向量。
本申请实施例中,利用向量空间模型word2vec训练方法完成词向量表示 过程,即,将实际的文本内容变成计算机能识别的表示形式,在本申请实施例 中,表现为将实际接收到的各分词转换为各分词向量。
具体地,本申请实施例中,提供了一种可能的实施方式,即对于给定各分 词长度为n的对话咨询信息,生成各分词对应的词向量,则对话咨询信息可以 表示为S=x1x2,...,xn,其中xi代表对话咨询信息中第i个分词的词向量,本申请 实施例中对此并不进行限制。
卷积层:用于对生成的各词向量进行特征提取,获得与各词向量对应的各 卷积特征向量。
本申请实施例中,卷积层的作用是对输入的矩阵向量进行特征的提取,也 就是说,卷积层是对生成的各词向量进行特征提取,本申请实施例中提供了 一种可能的实施方式,即利用不同大小的过滤窗口提取各分词向量的特征, 本申请实施例中对此并不进行限制。
具体地,假设通过滤波器将窗口大小设为m以及可加偏置进行卷积,而后 由卷积核提取对话咨询信息的特征,则提取后的各卷积特征向量可以表示为:
ci=f(w·xi:i+m-1+b)。
其中,ci为经过卷积操作后对应的第i个特征值,f(·)为本层卷积核函数的 选择,w为滤波器里的权重矩阵,其中w∈Rh*m,h*m为选取的滤波器的大小, b∈R为偏置矩阵,xi:i+m-1为由对话咨询信息的文本中的第i个词到i+m-1个词的 长度,采用多个滤波器来进行学习。经过卷积层后,得到特征矩阵c表示为: c=[c1,c2,...,cn-h+1]T其中,c∈Rn-h+1。
池化连接层:用于将各卷积特征向量中各维度按照分词顺序进行组合,获 得各重组后的卷积特征向量。
具体地,在通过卷积层的卷积操作后可以获得多个卷积结果,因此需要通 过池化层对经过卷积层后得到的各卷积特征向量进行采样,本申请实施例中可 以使用最大池化(max-pooling)的方法,并按照取最大值, 过滤出特征值中的最优特征进行卷积结果的合并处理。
池化连接层主要用来将局部的上下文特征向量映射成固定长度的全局特 征向量,使得仅保留具备特征向量中最具代表性的特征。这样就能将多个特征 合并为一个特征,实现了特征的聚合统计,降低了特征的维度,减少了优化的 参数,从而利用输入数据提取出最优局部特征。
本申请实施例中,输入层、卷积层和池化连接层为CNN的结构部分,这 三部分能够对对话咨询信息的文本进行深层特征提取并得到各卷积特征向量, 利用的是CNN在关系抽取方法中的优势,但是若仅使用CNN,那么在特征提 取过程中就无法能够很好地考虑输入的对话咨询信息的文本的语序问题,例如 智能客服机器人输入的对话咨询信息,当智能客服机器人输入的对话咨询信息 被转换为各词向量时,由于对话咨询信息的文本可能较短,且文本中的词语的 先后语序关系对文本的实际含义影响较大,因此,当仅使用CNN确定意图类 别时,可能会降低意图识别的准确性。
因此,为了更好地对文本语序关系建模,并且考虑到对话咨询信息的文本 中的上下文语序关系会对语义的造成一定的影响,例如:“税盘一直用的很好, 但是最近会报一个错误:...”这个对话咨询信息首先提到税盘的这个关键词, 但是其实说的是软件报了一个错误,语义的重点是报错信息处。类似这种对话 咨询信息在智能客服问答系统中有一定的占比,本申请实施例中结合了双向长 短时记忆(Bi-directional Long Short-TermMemory,Bi-LSTM)网络,此网络 考虑文本特性、用户的表达方式和特点等特征,符合意图识别的需求。Bi-LSTM 模型能有效解决长时依赖的问题,并且该Bi-LSTM模型能同时利用上下文对 目标进行预测,Bi-LSTM模型不仅对文本的语序关系具有良好的建模能力,而 且当用户输入的文本较长时,可以有效处理文本的长期依赖问题,并且,双向 长短时记忆Bi-LSTM能访问过去的信息同时,访问未来的信息,可以从正向、 反向两个方向提取句子中的词汇,予以信息得到更丰富、更深入的信息,对于 用户识别意图是非常有益的,同时充分考虑后向语料对当前语料的语义影响性, 进而能够使对话咨询信息更丰富,意图识别更准确。
本申请实施例中意图识别模型的长短期记忆网络具体包括:长短期记忆网 络层。
进一步地,该长短期记忆网络中还可以包括输入层,该输入层与CNN中 的输入层不同的是,生成的词向量是按照顺序依次送入到对应的Cell中,以保 证用户文本的语序性。
长短期记忆网络层:用于将各重组后的卷积特征向量进行特征提取。
本申请实施例中,由双向Bi-LSTM隐藏层和双向Bi-LSTM输出层共同组 成长短期记忆网络层。
进一步地,本申请实施例中,在长短期记忆网络层前,还可以包括Bi-LSTM 模型的输入层,该模型输入层与CNN中不同的是,词向量按照顺序依次送入 到对应的Cell中,以保证用户文本的语序性。
本申请实施例中,长短期记忆网络层由一系列重复的记忆Cell组成,每 一个Cell接收上一时刻隐层ht-1的输出以及当前时刻的外部输入xt。每一个Cell 由输入门it,遗忘门ft和输出门ot组成。其工作流程具体如下:
输入门选择需要记忆的信息,即控制当前输入xt以及前一时刻隐层输出ht-1进入新的Cell的信息量,公式it=σ(wi·xt+wi·ht-1+bi),其中σ代表激活函 数sigmoid,其通过非线性变化将结果映射到(0,1)区间内。
遗忘门选择需要遗忘的信息,公式ft=σ(wf·xt+wf·ht-1+bf)。
Cell变换更新:变换输入和前一状态到最新状态,其中tanh代表双曲线正 切函数。
qt=tanh(wq·xt+wq·ht-1+bq)
输出门用来控制输出的信息量。
ot=σ(wo·xt+wo·ht-1+bo)。
Bi-LSTM模型是由t时刻的输入词xt,细胞状态Ct,临时细胞状态隐 层状态ht,遗忘门ft,输入门it,输出门ot组成。通过对细胞状态中信息遗忘 和记忆新的信息使得对后续时刻计算有用的信息得以传递,而无用的信息被丢 弃,并在每个时间步都会输出隐层状态ht,其中遗忘,记忆与输出由通过上个 时刻的隐层状态ht-1和当前输入xt计算出来的遗忘门ft,输入门it,输出门ot来 控制。
当前单元状态Ct的生成是由通过计算之前单元状态的权重和由这个单元 所生成的当前信息决定。对于很多对话咨询信息的文本的处理任务,考虑上下 文信息是十分有必要的,由于Bi-LSTM网络通过引入第二层网络结构来扩展 单向的LSTM网络,而隐藏的连接在相反的时间顺序流动。所以,Bi-LSTM可 以利用前后文的对话咨询信息文本,保证了在时间序列上过去和未来的信息都 能考虑,也就是说Bi-LSTM能访问过去的信息同时,访问未来的信息,可以 从正向、反向两个方向提取对话咨询信息的文本中的各分词,能够得到更丰富、 更深入的信息,这对于提升意图识别的准确性是非常有益的。
联合CNN及Bi-LSTM,利用CNN捕捉局部特征的优势以及Bi-LSTM能 够捕捉时序信息的特点,其中,池化层将每个特征向量通过将卷积后的每个向 量Ci,通过将卷积后的每个feature map第i维对应的元素顺序相连得到,如 得到n-h+1个卷积特征向量,每个特征向量根据卷积的先 后顺序进行重新组合,保证文本的语序性。进而将特征向量依次送入Bi-LSTM 的Cell中,得到最后一个隐层ht的输出作为最终的句子表示,交由Sogtmax层 得到识别结果。
进一步地,本申请实施例中的意图识别模型还有平均池化层,能够将提取 的各卷积特征向量进行采样。
输出层:即全连接层,将通过长短期记忆网络层将各重组后的卷积特征向 量进行特征提取后的特征映射为一维向量,并根据一维向量,确定对话咨询信 息对应于各预设意图类别的概率值。
在税务领域智能客服问答系统中,能够识别出用户的意图对于理解用户的 提出的问题及欲求得到的帮助具有重要的意义,但是现有技术中的意图识别方 法主要使用规则匹配和基于特征的机器学习,这种方法不仅费时费力,并且扩 展性也较差。本申请实施例中采用的意图识别方法依旧将意图识别看成一个分 类任务,意图识别库中对应的分类金融、金税、物联网及其他等专业知识分类。 基于专业知识库分类管理方法,将意图识别看成为一个4分类的问题,使用本 申请实施例中的这种方法,可以根据用户的意图类别,采取相应的场景或者业 务的回复推荐策略,增强智能客服回复问答推荐的精度,识别出用户潜在的意 图,针对性回复用户,推荐相关性较高的回复给用户,用户的满意度一定程度 上得到提升,准确识别纳税人意图有助于了解纳税人潜在的需求,辅助事件预 测以及判断事件走向,并且还可以提升意图识别的有效性和识别率。
通过本申请实施例中的这种方法将模型进行训练,能够获得意图识别库, 该意图识别库中至少包括对应的问题、答案和意图类别,在使用的过程中,可 以将获取到的对话咨询信息输入意图识别模型中,获得意图识别模型对对话咨 询信息的文本进行特征提取后,确定对话咨询信息对应与各预设意图类别的概 率值,并根据概率值中的最大值对应的意图类别,确定待识别对象的意图类别, 即通过本申请实施例中的这种意图识别模型,能够根据纳税人咨询问答的过程 中予以信息确定纳税人想咨询哪类知识,即判断纳税人在表达咨询的意图。表 1为本申请实施例中的意图识别库数据信息(现已存在相关知识7000余条、拓 展问题11000多个),本申请实施例中对意图识别库中的数据信息并不进行限 制。
表1.
本申请实施例中的这种意图识别模型,是联合CNN及Bi-LSTM结合而成 的,利用CNN捕捉局部特征的优势以及Bi-LSTM能够捕捉时序信息的优点, 该模型包含了输入层、卷积层、池化连接层、双向Bi-LSTM隐藏层、双向 Bi-LSTM输出层、平均池化层和输出层,将该模型应用在获取到的对话咨询信 息的文本上,由于CNN卷积层的卷积核的宽度和词向量维度相同,通过CNN 对对话咨询信息的文本信息特征提取,因用户的意图识别需要由前面若干输入 和后面若干输入共同决定,因此将提取后的特征输入到Bi-LSTM模型双向 Bi-LSTM隐藏层和双向Bi-LSTM输出层进行特征提取,并将各卷积词向量根 据卷积的先后顺序进行重新组合,保证文本的语序性,进而将向量依次送入 Bi-LSTM的Cell中,得到最后一个隐层ht的输出作为最终的特征向量,并通 过平均池化层和输出层映射为一维向量,根据一维向量,确定对话咨询信息对 应于各预设意图类别的概率值,不仅提高了意图识别效率,还能够进一步提升 对话咨询信息回复的精确度。
基于上述实施例,参阅图4所示,为本申请实施例中另一种意图识别方法 流程图。
相较于目前税务领域智能客服用户意图识别问题,本申请实施例中的这种 方法,利用智能客服税务知识库咨询的大数据问题作为对话咨询信息的文本, 对其进行局部特征信息抽取以获取深层文本信息,然后通过不同卷积核卷积后 生成特征向量进行维度组合,并且同时将生成的词向量输入Bi-LSTM进行表 示学习,获得全局特征向量,该特征向量保留了文本卷积后的上下文关系,通 过对不同特征向量的相同位置元素进行组合,生成新的向量集合代替原有的词 向量输入,利用Bi-LSTM的循环输入结构以及上下文信息保留和传递机制, 得到最终的文本向量表示,分别结合了CNN在特征提取和LSTM在语义理解 方面的优势,在用户意图识别中可以达到比较满意的效果,并且能够提升意图 识别的准确性,下面对本申请实施例中的这种意图识别方法进行详细阐述。
步骤400:开始。
步骤401:获取待识别对象的对话咨询信息。
步骤402:将对话咨询信息的文本进行分词处理,并生成各分词对应的词 向量。
步骤403:通过卷积神经网络对生成的各词向量进行特征提取,获得各卷 积特征向量。
步骤404:通过长短期记忆网络对生成的各词向量进行特征提取,获得各 全局特征向量。
其中,步骤403和步骤404是同时进行的,也就是说,将各分词对应的词 向量输入到卷积神经网络的同时,也将各分词对应的词向量输入到长短期记忆 网络中。
步骤405:将各卷积特征向量和各全局特征向量进行连接,并通过分类网 络映射为一维向量,根据一维向量,确定对话咨询信息对应于各预设意图类别 的概率值。
步骤406:结束。
本申请实施例中,利用CNN提取词向量的各卷积特征向量,利用BiLSTM 提取词向量中与文本,上下文相关的全局特征向量,能够保证文本的语序性, 增加了模型的准确性然后通过池化层将各卷积特征向量和全局特征向量进行 采样,获得最终特征向量,最后通过全连接层将最终特征向量映射为一维向量, 并确定对话咨询信息对应于各预设意图类别的概率值,进而确定意图类别,这 样,能够提高意图识别效率。
基于同一发明构思,本申请实施例中还提供了一种意图识别装置,该意图 识别装置可以是硬件结构、软件模块、或硬件结构加软件模块。基于上述实施 例,参阅图5所示,为本申请实施例中意图识别装置结构示意图,具体包括:
获取模块500,用于获取待识别对象的对话咨询信息;
处理模块510,用于将所述对话咨询信息的文本输入到预先训练的意图识 别模型中,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后, 确定的所述对话咨询信息对应于各预设意图类别的概率值,其中,所述意图识 别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络;
第一确定模块520,用于根据所述对应于各预设意图类别的概率值,确定 所述待识别对象的意图类别。
可选的,所述卷积神经网络包括输入层、卷积层、池化层,则获得所述意 图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询 信息对应于各预设意图类别的概率值时,处理模块510具体用于:
通过所述输入层将所述对话咨询信息的文本进行分词处理,并生成各分词 对应的词向量;
通过所述卷积层对生成的各词向量进行特征提取,获得与所述各词向量对 应的各卷积特征向量;
通过所述池化层将所述各卷积特征向量中各维度按照分词顺序进行组合, 获得各重组后的卷积特征向量;
通过所述长短期记忆网络层将所述各重组后的卷积特征向量进行特征提 取,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话 咨询信息对应于各预设意图类别的概率值。
可选的,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取 后,确定的所述对话咨询信息对应于各预设意图类别的概率值时,处理模块510 具体用于:
将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
分别通过所述卷积神经网络和所述长短期记忆网络对生成的各词向量进 行特征提取,获得各卷积特征向量和各全局特征向量;
将所述各卷积特征向量和所述各全局特征向量进行连接,并通过所述分类 网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预 设意图类别的概率值。
可选的,第一确定模块520具体用于:
将所述对应于各预设意图类别的概率值中的最大值对应的意图类别,确定 为所述待识别对象的意图类别。
可选的,所述各预设意图类别至少包括金融业务知识类、物联网业务知识 类、金税业务知识类和其他业务知识类。
可选的,确定所述待识别对象的意图类别之后,进一步包括:
第二确定模块530,用于根据所述待识别对象的意图类别,确定对应的业 务知识数据库;
第三确定模块540,用于从所述对应的业务知识数据库中确定与所述对话 咨询信息对应的对话咨询答案;或,
根据所述对应的业务知识数据库,推荐与所述对话咨询信息关联的业务知 识。
基于上述实施例,参阅图6所示为本申请实施例中电子设备的结构示意图。
本申请实施例提供了一种电子设备,该电子设备可以包括处理器610 (CenterProcessing Unit,CPU)、存储器620、输入设备630和输出设备640 等,输入设备630可以包括键盘、鼠标、触摸屏等,输出设备640可以包括显 示设备,如液晶显示器(Liquid CrystalDisplay,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器620可以包括只读存储器(ROM)和随机存取存储器(RAM),并 向处理器610提供存储器620中存储的程序指令和数据。在本申请实施例中, 存储器620可以用于存储本申请实施例中任一种意图识别方法的程序。
处理器610通过调用存储器620存储的程序指令,处理器610用于按照获 得的程序指令执行本申请实施例中任一种意图识别方法。
基于上述实施例,本申请实施例中,提供了一种计算机可读存储介质,其 上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意方法实施 例中的意图识别方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计 算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结 合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包 含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、 CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请的方法、设备(系统)、和计算机程序产品的流 程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方 框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框 的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理 机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其 他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程 或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设 备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个 流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使 得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处 理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个 流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申 请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及 其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (14)
1.一种意图识别方法,其特征在于,包括:
获取待识别对象的对话咨询信息;
将所述对话咨询信息的文本输入到预先训练的意图识别模型中,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值,其中,所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络;
根据所述对应于各预设意图类别的概率值,确定所述待识别对象的意图类别。
2.如权利要求1所述的方法,其特征在于,所述卷积神经网络包括输入层、卷积层、池化层,则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值,具体包括:
通过所述输入层将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
通过所述卷积层对生成的各词向量进行特征提取,获得与所述各词向量对应的各卷积特征向量;
通过所述池化层将所述各卷积特征向量中各维度按照分词顺序进行组合,获得各重组后的卷积特征向量;
通过所述长短期记忆网络层将所述各重组后的卷积特征向量进行特征提取,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预设意图类别的概率值。
3.如权利要求1所述的方法,其特征在于,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值,具体包括:
将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
分别通过所述卷积神经网络和所述长短期记忆网络对生成的各词向量进行特征提取,获得各卷积特征向量和各全局特征向量;
将所述各卷积特征向量和所述各全局特征向量进行连接,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预设意图类别的概率值。
4.如权利要求1所述的方法,其特征在于,根据所述对应于各预设意图类别的概率值,确定所述待识别对象的意图类别,具体包括:
将所述对应于各预设意图类别的概率值中的最大值对应的意图类别,确定为所述待识别对象的意图类别。
5.如权利要求1所述的方法,其特征在于,所述各预设意图类别至少包括金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类。
6.如权利要求1-5任一项所述的方法,其特征在于,确定所述待识别对象的意图类别之后,进一步包括:
根据所述待识别对象的意图类别,确定对应的业务知识数据库;
从所述对应的业务知识数据库中确定与所述对话咨询信息对应的对话咨询答案;或,
根据所述对应的业务知识数据库,推荐与所述对话咨询信息关联的业务知识。
7.一种意图识别装置,其特征在于,包括:
获取模块,用于获取待识别对象的对话咨询信息;
处理模块,用于将所述对话咨询信息的文本输入到预先训练的意图识别模型中,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值,其中,所述意图识别模型的网络结构至少包括卷积神经网络、长短期记忆网络和分类网络;
第一确定模块,用于根据所述对应于各预设意图类别的概率值,确定所述待识别对象的意图类别。
8.如权利要求7所述的装置,其特征在于,所述卷积神经网络包括输入层、卷积层、池化层,则获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值时,处理模块具体用于:
通过所述输入层将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
通过所述卷积层对生成的各词向量进行特征提取,获得与所述各词向量对应的各卷积特征向量;
通过所述池化层将所述各卷积特征向量中各维度按照分词顺序进行组合,获得各重组后的卷积特征向量;
通过所述长短期记忆网络层将所述各重组后的卷积特征向量进行特征提取,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预设意图类别的概率值。
9.如权利要求7所述的装置,其特征在于,获得所述意图识别模型对所述对话咨询信息的文本进行特征提取后,确定的所述对话咨询信息对应于各预设意图类别的概率值时,处理模块具体用于:
将所述对话咨询信息的文本进行分词处理,并生成各分词对应的词向量;
分别通过所述卷积神经网络和所述长短期记忆网络对生成的各词向量进行特征提取,获得各卷积特征向量和各全局特征向量;
将所述各卷积特征向量和所述各全局特征向量进行连接,并通过所述分类网络映射为一维向量,根据所述一维向量,确定所述对话咨询信息对应于各预设意图类别的概率值。
10.如权利要求7所述的装置,其特征在于,第一确定模块具体用于:
将所述对应于各预设意图类别的概率值中的最大值对应的意图类别,确定为所述待识别对象的意图类别。
11.如权利要求7所述的装置,其特征在于,所述各预设意图类别至少包括金融业务知识类、物联网业务知识类、金税业务知识类和其他业务知识类。
12.如权利要求7-11任一项所述的装置,其特征在于,确定所述待识别对象的意图类别之后,进一步包括:
第二确定模块,用于根据所述待识别对象的意图类别,确定对应的业务知识数据库;
第三确定模块,用于从所述对应的业务知识数据库中确定与所述对话咨询信息对应的对话咨询答案;或,
根据所述对应的业务知识数据库,推荐与所述对话咨询信息关联的业务知识。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-6任一项所述方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1-6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911158972.2A CN112836025A (zh) | 2019-11-22 | 2019-11-22 | 一种意图识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911158972.2A CN112836025A (zh) | 2019-11-22 | 2019-11-22 | 一种意图识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112836025A true CN112836025A (zh) | 2021-05-25 |
Family
ID=75921810
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911158972.2A Pending CN112836025A (zh) | 2019-11-22 | 2019-11-22 | 一种意图识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112836025A (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326351A (zh) * | 2021-06-17 | 2021-08-31 | 湖北亿咖通科技有限公司 | 一种用户意图确定方法及装置 |
CN113792140A (zh) * | 2021-08-12 | 2021-12-14 | 南京星云数字技术有限公司 | 文本处理方法、装置及计算机可读存储介质 |
CN113886563A (zh) * | 2021-10-25 | 2022-01-04 | 北京达佳互联信息技术有限公司 | 问题推荐方法、装置、电子设备及存储介质 |
CN114155835A (zh) * | 2021-12-06 | 2022-03-08 | 哈尔滨工程大学 | 一种融合全局场景与局部事件信息的音频语意概述方法 |
CN114490994A (zh) * | 2022-03-28 | 2022-05-13 | 北京沃丰时代数据科技有限公司 | 对话管理方法及装置 |
CN115170210A (zh) * | 2022-09-06 | 2022-10-11 | 深圳市明源云科技有限公司 | 售楼处的接待方法、电子设备及可读存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180329884A1 (en) * | 2017-05-12 | 2018-11-15 | Rsvp Technologies Inc. | Neural contextual conversation learning |
CN109635271A (zh) * | 2018-10-22 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 一种用户意图识别方法、客服服务系统、装置及电子设备 |
CN110245348A (zh) * | 2019-05-17 | 2019-09-17 | 北京百度网讯科技有限公司 | 一种意图识别方法及系统 |
-
2019
- 2019-11-22 CN CN201911158972.2A patent/CN112836025A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180329884A1 (en) * | 2017-05-12 | 2018-11-15 | Rsvp Technologies Inc. | Neural contextual conversation learning |
CN109635271A (zh) * | 2018-10-22 | 2019-04-16 | 阿里巴巴集团控股有限公司 | 一种用户意图识别方法、客服服务系统、装置及电子设备 |
CN110245348A (zh) * | 2019-05-17 | 2019-09-17 | 北京百度网讯科技有限公司 | 一种意图识别方法及系统 |
Non-Patent Citations (2)
Title |
---|
谢金宝等: "基于语义理解注意力神经网络的多元特征融合中文文本分类", 《电子与信息学报》, vol. 40, no. 5, pages 1258 - 1265 * |
钱岳等: "聊天机器人中用户出行消费意图识别方法", 《中国科学:信息科学》, vol. 47, no. 8, pages 997 - 1007 * |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113326351A (zh) * | 2021-06-17 | 2021-08-31 | 湖北亿咖通科技有限公司 | 一种用户意图确定方法及装置 |
CN113792140A (zh) * | 2021-08-12 | 2021-12-14 | 南京星云数字技术有限公司 | 文本处理方法、装置及计算机可读存储介质 |
CN113886563A (zh) * | 2021-10-25 | 2022-01-04 | 北京达佳互联信息技术有限公司 | 问题推荐方法、装置、电子设备及存储介质 |
CN114155835A (zh) * | 2021-12-06 | 2022-03-08 | 哈尔滨工程大学 | 一种融合全局场景与局部事件信息的音频语意概述方法 |
CN114155835B (zh) * | 2021-12-06 | 2022-07-08 | 哈尔滨工程大学 | 一种融合全局场景与局部事件信息的音频语意概述方法 |
CN114490994A (zh) * | 2022-03-28 | 2022-05-13 | 北京沃丰时代数据科技有限公司 | 对话管理方法及装置 |
CN115170210A (zh) * | 2022-09-06 | 2022-10-11 | 深圳市明源云科技有限公司 | 售楼处的接待方法、电子设备及可读存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110609891B (zh) | 一种基于上下文感知图神经网络的视觉对话生成方法 | |
WO2021232589A1 (zh) | 基于注意力机制的意图识别方法、装置、设备及存储介质 | |
CN112836025A (zh) | 一种意图识别方法及装置 | |
CN110069709B (zh) | 意图识别方法、装置、计算机可读介质及电子设备 | |
EP3884426B1 (en) | Action classification in video clips using attention-based neural networks | |
CN109766557B (zh) | 一种情感分析方法、装置、存储介质及终端设备 | |
CN108563624A (zh) | 一种基于深度学习的自然语言生成方法 | |
CN112287090A (zh) | 一种基于知识图谱的金融问题反问方法及系统 | |
CN111666400A (zh) | 消息获取方法、装置、计算机设备及存储介质 | |
EA038264B1 (ru) | Способ создания модели анализа диалогов на базе искусственного интеллекта для обработки запросов пользователей и система, использующая такую модель | |
CN115577080A (zh) | 一种问题回复匹配方法、系统、服务器及存储介质 | |
CN115270807A (zh) | 网络用户的情感倾向判定方法、装置、设备及存储介质 | |
CN117668199A (zh) | 一种智能客服问答预测及推荐对话生成方法及装置 | |
CN113535928A (zh) | 基于注意力机制下长短期记忆网络的服务发现方法及系统 | |
US11941594B2 (en) | User interaction artificial intelligence chat engine for integration of automated machine generated responses | |
US20230351170A1 (en) | Automated processing of feedback data to identify real-time changes | |
CN113887214A (zh) | 基于人工智能的意愿推测方法、及其相关设备 | |
Sineglazov et al. | Comparative Analysis of Text Vectorization Methods | |
CN114036267A (zh) | 对话方法及系统 | |
CN113946649A (zh) | 调解预案的提供方法、训练方法、相关装置及存储介质 | |
CN111259860A (zh) | 基于数据自驱动的多阶特征动态融合手语翻译方法 | |
CN117828060B (zh) | 一种基于语义识别的在线问答方法、系统和存储介质 | |
US12099534B1 (en) | Optimization using interactive content equivalence | |
US11822564B1 (en) | Graphical user interface enabling interactive visualizations using a meta-database constructed from autonomously scanned disparate and heterogeneous sources | |
US11928128B2 (en) | Construction of a meta-database from autonomously scanned disparate and heterogeneous sources |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |