CN110096570A - 一种应用于智能客服机器人的意图识别方法及装置 - Google Patents

一种应用于智能客服机器人的意图识别方法及装置 Download PDF

Info

Publication number
CN110096570A
CN110096570A CN201910281032.6A CN201910281032A CN110096570A CN 110096570 A CN110096570 A CN 110096570A CN 201910281032 A CN201910281032 A CN 201910281032A CN 110096570 A CN110096570 A CN 110096570A
Authority
CN
China
Prior art keywords
dialog text
text
user
intended
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910281032.6A
Other languages
English (en)
Other versions
CN110096570B (zh
Inventor
汤毅平
龚雪飞
周彬
杜柏圣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Xingyun Digital Technology Co Ltd
Original Assignee
Suningcom Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suningcom Group Co Ltd filed Critical Suningcom Group Co Ltd
Priority to CN201910281032.6A priority Critical patent/CN110096570B/zh
Publication of CN110096570A publication Critical patent/CN110096570A/zh
Priority to PCT/CN2019/109122 priority patent/WO2020206957A1/zh
Priority to CA3176868A priority patent/CA3176868A1/en
Application granted granted Critical
Publication of CN110096570B publication Critical patent/CN110096570B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking

Abstract

本发明公开了一种应用于智能客服机器人的意图识别方法及装置,属于人工智能技术领域,方法:包括S0:获取用户的对话文本;S2:判断对话文本中是否包含意图,若包含,则执行步骤S4,若未包含,则结束处理,若无法判断,则执行步骤S3;S3:将对话文本进行上下文扩展,在步骤S3之后,执行步骤S4;S4:识别对话文本中的命名实体集合,并确定命名实体集合关联的意图知识点;S5:将对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息;S6:使用Ensemble框架对意图知识点和多个语义信息进行合并调优,得到用户意图。本发明实施例实现了智能客服机器人快速准确地识别出用户意图,为机器人准确回答用户问题提供保障。

Description

一种应用于智能客服机器人的意图识别方法及装置
技术领域
本发明涉及人工智能技术领域,特别涉及一种应用于智能客服机器人的意图识别方法及装置。
背景技术
随着业务的快速发展,人工智能技术突飞猛进,客服机器人的出现,能有效分担人工客服工作量,节省企业用人成本,能突破时间、人力、地域限制,提供7*24小时不间断咨询服务,缓解人工客服的痛点。客服机器人可以接受用户提出的各种问题,客服机器人高效可用的关键之一是能否根据用户给出的信息判断出用户的真实意图。
尽管客服机器人在近些年的发展十分迅速,但是由于其涉及到用户的交互数据,具有较高的敏感性,在对话文本中,具有意图的文本少之又少,而传统的意图识别工作面临着对聊天文本语义理解不够深入,无法在用户较短的对话文本中快速准确理解用户意图等诸多挑战。
因此,如何保证智能客服机器人快速准确地理解用户意图,以便快速精准的对用户的问题进行解答,是目前亟需解决的问题。
发明内容
有鉴于此,本发明实施例提供了一种应用于智能客服机器人的意图识别方法及装置,用以实现智能客服机器人快速准确地识别出用户意图,为机器人准确回答用户的问题提供保障。
本发明实施例提供的技术方案如下:
第一方面,提供了一种应用于智能客服机器人的意图识别方法,所述方法包括步骤:
S0:获取用户的对话文本;
S2:判断所述对话文本中是否包含意图,若包含,则执行步骤S4,若未包含,则结束处理,若无法判断,则执行步骤S3;
S3:将所述对话文本进行上下文扩展,在步骤S3之后,执行步骤S4;以及
S4:识别所述对话文本中的命名实体集合,并确定所述命名实体集合关联的意图知识点;
S5:将所述对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息;
S6:使用Ensemble框架对所述意图知识点和所述多个语义信息进行合并调优,得到用户意图。
进一步地,所述步骤S2之前,所述方法还包括步骤:
S1:对所述对话文本进行文本纠错。
进一步地,所述步骤S1具体包括:
对所述对话文本进行分词,并识别所述对话文本中的错误分词;
获取所述错误分词对应的纠错词;
将所述纠错词替换所述对话文本中的错误分词。
进一步地,所述步骤S3具体包括:
以一个session为单位保存用户会话信息;
联系所述对话文本的上下文信息,判断用户意图是否改变,其中,所述上下文信息包括所述对话文本的上下文的意图识别结果;
当用户意图未改变时,利用所述上下文的近义词对所述对话文本进行扩展。
进一步地,所述步骤S4具体包括:
根据预设的词典对所述对话文本进行分词处理,得到多个分词;
将所述多个分词与预设的实体词库进行匹配,得到所述命名实体集合;
在预设的知识库中确定出与所述命名实体集合相关的意图知识点。
进一步地,所述步骤S5具体包括:
将所述对话文本进行分词处理,得到多个分词;
计算所述多个分词的词向量,并分布式表示所述多个分词的词向量;
将分布式表示的所述多个分词的词向量输入至所述多个语义分类模型,以输出所述多个语义信息。
进一步地,所述步骤S6具体包括:
根据所述意图知识点、所述多个语义信息以及所述多个语义信息各自对应的预设权重,通过Ensemble框架确定最终的用户意图。
第二方面,提供了一种应用于智能客服机器人的意图识别装置,所述装置包括:
文本获取模块,用于获取用户的对话文本;
意图判断模块,用于判断所述对话文本中是否包含意图,若包括,则执行实体匹配模块的处理,若未包含,则结束处理,若无法判断,则执行文本扩展模块的处理;
所述文本扩展模块,用于将所述对话文本进行上下文扩展,并针对扩展后的所述对话文本执行实体匹配模块的处理;
所述实体匹配模块,用于识别所述对话文本中的命名实体集合,并确定所述命名实体集合关联的意图知识点;
语义预测模块,用于将所述对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息;
合并调优模块,用于使用Ensemble框架对所述意图知识点和所述多个语义信息进行合并调优,得到用户意图。
进一步地,所述装置还包括:
所述装置还包括:
文本纠错模块,用于对所述对话文本进行文本纠错。
进一步地,所述文本纠错模块具体用于:
对所述对话文本进行分词,并识别所述对话文本中的错误分词;
获取所述错误分词对应的纠错词;
将所述纠错词替换所述对话文本中的错误分词。
进一步地,所述文本扩展模块具体用于:
以一个session为单位保存用户会话信息;
联系所述对话文本的上下文信息,判断用户意图是否改变,其中,所述上下文信息包括所述对话文本的上下文的意图识别结果;
当用户意图未改变时,利用所述上下文的近义词对所述对话文本进行扩展。
进一步地,所述实体匹配模块具体用于:
根据预设的词典对所述对话文本进行分词处理,得到多个分词;
将所述多个分词与预设的实体词库进行匹配,得到所述命名实体集合;
在预设的知识库中确定出与所述命名实体集合相关的意图知识点。
进一步地,所述语义预测模块具体用于:
将所述对话文本进行分词处理,得到多个分词;
计算所述多个分词的词向量,并分布式表示所述多个分词的词向量;
将分布式表示的所述多个分词的词向量输入至所述多个语义分类模型,以输出所述多个语义信息。
进一步地,所述合并调优模块具体用于:
根据所述意图知识点、所述多个语义信息以及所述多个语义信息各自对应的预设权重,通过Ensemble框架确定最终的用户意图。
与现有技术相比,本发明的有益效果在于:
1、在无法判断对话文本是否包含意图时,通过将对话文本进行上下文扩展,能够补全用户对话文本中的意图信息;
2、通过对对话文本采用分布式词向量进行表示和深度学习模型进行深层特征挖掘,抽取特征的同时充分考虑词语间语义关联;
3、通过采用Ensemble框架,对实体匹配结果以及语义预测结果进行合并调优,得到用户意图,实现更为快速准确地识别出用户意图,提高了识别用户意图的准确率,降低用户意图识别的误差和不全面,从而为客服机器人正确回答用户问题提供了保障。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了一种应用于智能客服机器人的意图识别方法的流程图;
图2示出了图1中步骤S1的具体实现流程图;
图3示出了图1中步骤S3的具体实现流程图;
图4示出了图1中步骤S4的具体实现流程图;
图5示出了图1中步骤S5的具体实现流程图;
图6示出了一种应用于智能客服机器人的意图识别装置的框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种应用于智能客服机器人的意图识别方法,该方法通过将对话文本进行上下文扩展,并结合实体匹配识别和语义信息预测,得到用户意图,能够更为快速准确地识别出用户意图,提高了识别用户意图的准确率,降低用户意图识别的误差和不全面,从而为客服机器人正确回答用户问题提供了保障。
可以理解的是,本发明实施例提供的方法可以应用于任意智能的终端中,该终端包括但不限于台式计算机、个人计算机、智能手机、平板电脑等等。
另外,需要说明的是,在本发明的描述中,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
实施例一
本发明实施例提供了一种应用于智能客服机器人的意图识别方法,参照图1所示,该方法包括如下步骤:
S0:获取用户的对话文本。
其中,用户对话可以为语音或文本,当对话为语音时,可以在本发明实施例执行之前将用户对话由语音转换为文本。此外,对话文本可以是长文本,也可以是短文本,本发明实施例对此不作具体限定。
S1:对对话文本进行文本纠错。
其中,参照图2所示,步骤S1的具体实现过程可以包括:
S11:对对话文本进行分词,并识别对话文本中的错误分词。
S12:获取错误分词对应的纠错词,并将纠错词替换对话文本中的错误分词。
具体的,可以基于错别字词典获取错误分词对应的纠错词,具体来说,针对错误分词,计算自定义标准词库中每一词语对应的纠错置信度,并将纠错置信度大于预设阈值的词语作为纠错词。此外,还可以采用编辑距离或语言模型等方式获取错误分词对应的纠错词,本实施例中具体的获取过程不作具体限定。
在上述步骤S12中,纠错词主要用于纠正识别文本中的错误分词。例如,若识别文本“大树据应用案例”中的一个错误分词为“大树据”,对应的纠错词为“大数据”。
需要说明的是,步骤S1为可选过程。
本实施例中,通过对对话文本进行文本纠错,把有组词错误的对话文本转换成合乎领域逻辑的正确表述,从而能够更准确地识别用户意图。
S2:判断对话文本中是否包含意图,若包含,则执行步骤S4,若未包含,则结束处理,若无法判断,则执行步骤S3。
其中,有意图的对话文本和无意图的对话文本表达在用词、句式上存在较大的差异,因此可以尝试直接使用一些模板匹配的方式进行判断用户对话是有意图对话还是无意图对话。
其中,步骤S2中判断对话文本中是否包含意图的具体实现过程可以包括:
在对话文本中查找是否存在于预设模板相匹配的字组,若存在,则判定对话文本中包含意图,若不存在,则判定对话文本中未包含意图,其中,预设模板可以采用正则表达式的模式。
此外,由于客服机器人中用户表达的文本可能是只有几个词的对话文本,导致用户表达十分模糊不清,采用步骤S2的过程可能无法判断用户对话是否包含意图时,则需要对对话文本进行上下文扩展。
S3:将对话文本进行上下文扩展,在步骤S3之后,执行步骤S4。
其中,参照图3所示,步骤S3的具体实现过程可以包括:
S31:以一个session为单位保存用户会话信息,联系对话文本的上下文信息,判断用户意图是否改变,其中,上下文信息包括对话文本的上下文的意图识别结果。
具体的,对难于判断是否含有意图的对话文本可以通过联系上下文的相关信息,以一个session为单位,采用一个session中保存的会话信息,合并用户之前输入的多个对话文本,判断意图是否改变。
S32:当用户意图未改变时,利用上下文的近义词对对话文本进行扩展。
具体的,提取上下文中的关键词,得到近义词集合,使用近义词集合来对对话文本进行扩展。
本实施例中,对无法判断是否包含意图的对话文本通过进行上下文扩展,能够丰富对话文本中的意图信息,便于后续能够准确识别出用户意图。
S4:识别对话文本中的命名实体集合,并确定命名实体集合关联的意图知识点。
其中,参照图4所示,步骤S4的具体实现过程可以包括:
S41:根据预设的词典对对话文本进行分词处理,得到多个分词。
具体的,按照预设的词典,采用预设分词方式对对话文本进行分词处理,得到多个字符或者字符序列,从得到的字符序列中筛选出具有实际语义的字符或者字符序列作为分词结果。其中,预设的分词方式可以是基于字符匹配、基于语义理解或者基于统计的分词方式等。
S42:将多个分词与预设的实体词库进行匹配,得到命名实体集合。
具体的,针对多个分词中的每一分词,计算实体词库中每一命名实体与该分词之间的匹配度,并将匹配度大于预设阈值的命名实体作为与该分词相匹配的命名实体。此处,可以采用基于汉明距离的相似度计算实体词库中每一命名实体与该分词之间的匹配度。
例如,对用户对话文本中的一个分词“上海”、“60岁”,可以从实体词库中匹配得到“上海”的命名实体“地区”,“60岁”的命名实体“年龄”。
S43:在预设的知识库中确定出与命名实体集合相关的意图知识点。
本实施例中,多个实体对应一个意图知识点,意图知识点用于指示意图信息,其中,可以预先根据历史积累的客服与用户的聊天数据,收集和整理出规范的意图知识点,在对每个意图知识点确定对应的多个实体,通过对实体词库的匹配,可以得到用户意图的初步预测。
具体的,计算命名实体集合与知识库中的每一意图知识点之间的相关性,确定知识库中与命名实体集合相关联的意图知识点。
S5:将对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息。
其中,参照图5所示,步骤S5的具体实现过程可以包括:
S51:将对话文本进行分词处理,得到多个分词。
具体的,该步骤的具体过程与步骤S41相同,此处不再加以赘述。
S52:计算多个分词的词向量,并分布式表示多个分词的词向量。
具体的,可以通过Word2Vec模型获得词语单元对应的词向量,并进行词向量的分布式表示。
其中,Word2Vec是一种word embedding的自然语言处理NLP的具体手段,它可以通过学习文本来用词向量的方式表征词的语义信息,即通过一个嵌入空间(低维)使得语义上相似的单词在该空间内的距离很近。
S53:将分布式表示的多个分词的词向量输入至多个语义分类模型,以输出多个语义信息。
其中,步骤S5中的多个语义分类模型的训练过程分别包括如下:
a、获取数据库中的问答数据,并对问答数据进行预处理,并对预处理后的问答数据进行标注。
其中,问答数据包括领域人工客服在问答用户问题时积累的问答对信息。
具体的,可以使用关键词提取以及模板规则对问答数据进行预处理,过滤掉部分无意图数据,在预处理后的问答数据上由标注人员进行语义标注。
例如,领域内的语义分类可以细分成包括话费、礼品卡、理财、零钱宝等多种分类,由标注人员对问答数据进行预先标注。
b、采用线下预训练的方式,将标注后的问答数据划分为训练集和测试集。
c、对训练集中的问答句采用词向量分布表示,在深度神经网络中进行训练,并利用测试集对训练后的深度神经网络进行测试,构建出预测精度满足精度阈值的语义分类模型。
其中,上述的多个语义分类模型可以使用采用TextCNN、RNN、LSTM、CAPsNet等多种深度学习语义分类模型,本领域技术人员可以理解的是,模型训练策略可以采用相应网络的常规策略,在此不再描述。
在使用训练集对深度神经网络进行训练后,可以使用测试集对训练后的多个深度神经网络分别进行测试,评估深度神经网络的预测准确率,依据模型预测准确率调整深度神经网络的网络参数,以构建出预测精度满足精度阈值的语义分类模型。
本发明实施例中,通过对标注好语义分类的问答数据采用词向量分布表示,并采用深度学习模型进行深层特征挖掘,抽取特征的同时充分考虑词语间语义关联,得到语义分类模型。由此可以使用多个语义分类模型对采用词向量分布表示的用户对话文本进行语义信息的快速、准确地预测。
S6:使用Ensemble框架对意图知识点和多个语义信息进行合并调优,得到用户意图。
具体的,根据所述意图知识点、所述多个语义信息以及所述多个语义信息各自对应的预设权重,通过Ensemble框架确定最终的用户意图。
其中,Ensemble框架的基本思想是充分运用不同分类算法各种的优势,取长补短,组合形成一个强大的分类框架。把多个分类器合并起来结果,来实现最优的组合。
本发明实施例提供的应用于智能客服机器人的意图识别方法,在无法判断对话文本是否包含意图时,通过将对话文本进行上下文扩展,能够补全用户对话文本中的意图信息;通过对对话文本采用分布式词向量进行表示和深度学习模型进行深层特征挖掘,抽取特征的同时充分考虑词语间语义关联;通过采用Ensemble框架,对实体匹配结果以及语义预测结果进行合并调优,得到用户意图,实现更为快速准确地识别出用户意图,提高了识别用户意图的准确率,降低用户意图识别的误差和不全面,从而为客服机器人正确回答用户问题提供了保障。
实施例二
作为对实施例一中应用于智能客服机器人的意图识别方法的实现,本发明实施例提供了一种应用于智能客服机器人的意图识别装置,参照图6所示,该装置包括:
文本获取模块60,用于获取用户的对话文本;
意图判断模块62,用于判断对话文本中是否包含意图,若包括,则执行实体匹配模块的处理,若未包含,则结束处理,若无法判断,则执行文本扩展模块63的处理;
文本扩展模块63,用于将对话文本进行上下文扩展,并针对扩展后的对话文本执行实体匹配模块的处理;
实体匹配模块64,用于识别对话文本中的命名实体集合,并确定命名实体集合关联的意图知识点;
语义预测模块65,用于将对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息;
合并调优模块66,用于使用Ensemble框架对意图知识点和语义信息进行合并调优,得到用户意图。
进一步地,装置还包括:
文本纠错模块61,用于对对话文本进行文本纠错。
进一步地,文本纠错模块61具体用于:
对对话文本进行分词,并识别对话文本中的错误分词;
获取错误分词对应的纠错词;
将纠错词替换对话文本中的错误分词。
进一步地,文本扩展模块63具体用于:
以一个session为单位保存用户会话信息;
联系对话文本的上下文信息,判断用户意图是否改变,其中,上下文信息包括对话文本的上下文的意图识别结果;
当用户意图未改变时,利用上下文的近义词对对话文本进行扩展。
进一步地,实体匹配模块64具体用于:
根据预设的词典对对话文本进行分词处理,得到多个分词;
将多个分词与预设的实体词库进行匹配,得到命名实体集合;
在预设的知识库中确定出与命名实体集合相关的意图知识点。
进一步地,语义预测模块65具体用于:
将对话文本进行分词处理,得到多个分词;
计算多个分词的词向量,并分布式表示多个分词的词向量;
将分布式表示的多个分词的词向量输入至多个语义分类模型,以输出多个语义信息。
进一步地,合并调优模块66具体用于:
根据意图知识点、多个语义信息以及多个语义信息各自对应的预设权重,通过Ensemble框架确定最终的用户意图。
本实施例提供的应用于智能客服机器人的意图识别学习装置,与本发明实施例所提供的应用于智能客服机器人的意图识别方法属于同一发明构思,可执行本发明任意实施例所提供的应用于智能客服机器人的意图识别方法,具备执行应用于智能客服机器人的意图识别方法相应的功能模块和有益效果。未在本实施例中详尽描述的技术细节,可参见本发明实施例提供的应用于智能客服机器人的意图识别方法,此处不再加以赘述。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关联的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (14)

1.一种应用于智能客服机器人的意图识别方法,其特征在于,包括步骤:
S0:获取用户的对话文本;
S2:判断所述对话文本中是否包含意图,若包含,则执行步骤S4,若未包含,则结束处理,若无法判断,则执行步骤S3;
S3:将所述对话文本进行上下文扩展,在步骤S3之后,执行步骤S4;
S4:识别所述对话文本中的命名实体集合,并确定所述命名实体集合关联的意图知识点;
S5:将所述对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息;
S6:使用Ensemble框架对所述意图知识点和所述多个语义信息进行合并调优,得到用户意图。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2之前,所述方法还包括步骤:
S1:对所述对话文本进行文本纠错。
3.根据权利要求2所述的方法,其特征在于,所述步骤S1具体包括:
对所述对话文本进行分词,并识别所述对话文本中的错误分词;
获取所述错误分词对应的纠错词;
将所述纠错词替换所述对话文本中的错误分词。
4.根据权利要求1至3任意一项所述的方法,其特征在于,所述步骤S3具体包括:
以一个session为单位保存用户会话信息;
联系所述对话文本的上下文信息,判断用户意图是否改变,其中,所述上下文信息包括所述对话文本的上下文的意图识别结果;
当用户意图未改变时,利用所述上下文的近义词对所述对话文本进行扩展。
5.根据权利要求1至3任意一项所述的方法,其特征在于,所述步骤S4具体包括:
根据预设的词典对所述对话文本进行分词处理,得到多个分词;
将所述多个分词与预设的实体词库进行匹配,得到所述命名实体集合;
在预设的知识库中确定出与所述命名实体集合相关的意图知识点。
6.根据权利要求1至3任意一项所述的方法,其特征在于,所述步骤S5具体包括:
将所述对话文本进行分词处理,得到多个分词;
计算所述多个分词的词向量,并分布式表示所述多个分词的词向量;
将分布式表示的所述多个分词的词向量输入至所述多个语义分类模型,以输出所述多个语义信息。
7.根据权利要求1至3任意一项所述的方法,其特征在于,所述步骤S6具体包括:
根据所述意图知识点、所述多个语义信息以及所述多个语义信息各自对应的预设权重,通过Ensemble框架确定最终的用户意图。
8.一种应用于智能客服机器人的意图识别装置,其特征在于,包括:
文本获取模块,用于获取用户的对话文本;
意图判断模块,用于判断所述对话文本中是否包含意图,若包括,则执行实体匹配模块的处理,若未包含,则结束处理,若无法判断,则执行文本扩展模块的处理;
所述文本扩展模块,用于将所述对话文本进行上下文扩展,并针对扩展后的所述对话文本执行实体匹配模块的处理;
所述实体匹配模块,用于识别所述对话文本中的命名实体集合,并确定所述命名实体集合关联的意图知识点;
语义预测模块,用于将所述对话文本采用分布式词向量进行表示,并使用预先训练的多个语义分类模型进行预测,得到多个语义信息;
合并调优模块,用于使用Ensemble框架对所述意图知识点和所述多个语义信息进行合并调优,得到用户意图。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
文本纠错模块,用于对所述对话文本进行文本纠错。
10.根据权利要求9所述的装置,其特征在于,所述文本纠错模块具体用于:
对所述对话文本进行分词,并识别所述对话文本中的错误分词;
获取所述错误分词对应的纠错词;
将所述纠错词替换所述对话文本中的错误分词。
11.根据权利要求8至10任意一项所述的装置,其特征在于,所述文本扩展模块具体用于:
以一个session为单位保存用户会话信息;
联系所述对话文本的上下文信息,判断用户意图是否改变,其中,所述上下文信息包括所述对话文本的上下文的意图识别结果;
当用户意图未改变时,利用所述上下文的近义词对所述对话文本进行扩展。
12.根据权利要求8至10任意一项所述的装置,其特征在于,所述实体匹配模块具体用于:
根据预设的词典对所述对话文本进行分词处理,得到多个分词;
将所述多个分词与预设的实体词库进行匹配,得到所述命名实体集合;
在预设的知识库中确定出与所述命名实体集合相关的意图知识点。
13.根据权利要求8至10任意一项所述的装置,其特征在于,所述语义预测模块具体用于:
将所述对话文本进行分词处理,得到多个分词;
计算所述多个分词的词向量,并分布式表示所述多个分词的词向量;
将分布式表示的所述多个分词的词向量输入至所述多个语义分类模型,以输出所述多个语义信息。
14.根据权利要求8至10任意一项所述的装置,其特征在于,所述合并调优模块具体用于:
根据所述意图知识点、所述多个语义信息以及所述多个语义信息各自对应的预设权重,通过Ensemble框架确定最终的用户意图。
CN201910281032.6A 2019-04-09 2019-04-09 一种应用于智能客服机器人的意图识别方法及装置 Active CN110096570B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201910281032.6A CN110096570B (zh) 2019-04-09 2019-04-09 一种应用于智能客服机器人的意图识别方法及装置
PCT/CN2019/109122 WO2020206957A1 (zh) 2019-04-09 2019-09-29 一种应用于智能客服机器人的意图识别方法及装置
CA3176868A CA3176868A1 (en) 2019-04-09 2019-09-29 Intent identifying method and device for application to intelligent customer service robot

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910281032.6A CN110096570B (zh) 2019-04-09 2019-04-09 一种应用于智能客服机器人的意图识别方法及装置

Publications (2)

Publication Number Publication Date
CN110096570A true CN110096570A (zh) 2019-08-06
CN110096570B CN110096570B (zh) 2021-03-30

Family

ID=67444578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910281032.6A Active CN110096570B (zh) 2019-04-09 2019-04-09 一种应用于智能客服机器人的意图识别方法及装置

Country Status (3)

Country Link
CN (1) CN110096570B (zh)
CA (1) CA3176868A1 (zh)
WO (1) WO2020206957A1 (zh)

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457709A (zh) * 2019-08-16 2019-11-15 北京一链数云科技有限公司 外呼对话处理方法、装置及服务器
CN110569331A (zh) * 2019-09-04 2019-12-13 出门问问信息科技有限公司 一种基于上下文的关联性预测方法、装置及存储设备
CN110717026A (zh) * 2019-10-08 2020-01-21 腾讯科技(深圳)有限公司 一种文本信息识别的方法、人机对话的方法及相关装置
CN110888968A (zh) * 2019-10-15 2020-03-17 浙江省北大信息技术高等研究院 客服对话意图分类方法及装置、电子设备及介质
CN111026843A (zh) * 2019-12-02 2020-04-17 北京智乐瑟维科技有限公司 一种人工智能语音外呼方法、系统及存储介质
CN111078855A (zh) * 2019-12-19 2020-04-28 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
CN111091826A (zh) * 2019-12-13 2020-05-01 中博信息技术研究院有限公司 基于深度学习和有限状态机的智能语音机器人系统
CN111160002A (zh) * 2019-12-27 2020-05-15 北京百度网讯科技有限公司 用于输出口语理解中解析异常信息的方法和装置
CN111325037A (zh) * 2020-03-05 2020-06-23 苏宁云计算有限公司 文本意图识别方法、装置、计算机设备和存储介质
CN111460122A (zh) * 2020-04-03 2020-07-28 成都晓多科技有限公司 基于深度学习的尺码识别方法与系统
CN111462752A (zh) * 2020-04-01 2020-07-28 北京思特奇信息技术股份有限公司 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
WO2020206957A1 (zh) * 2019-04-09 2020-10-15 苏宁云计算有限公司 一种应用于智能客服机器人的意图识别方法及装置
CN112148862A (zh) * 2020-10-15 2020-12-29 腾讯科技(深圳)有限公司 一种问题意图识别方法、装置、存储介质及电子设备
CN112256854A (zh) * 2020-11-05 2021-01-22 云南电网有限责任公司 一种基于ai自然语言理解的智能ai会话方法及装置
CN112364149A (zh) * 2021-01-12 2021-02-12 广州云趣信息科技有限公司 用户问题获得方法、装置及电子设备
CN112487179A (zh) * 2019-09-11 2021-03-12 珠海格力电器股份有限公司 一种口语语义理解方法、装置及系统
CN112562665A (zh) * 2020-11-30 2021-03-26 武汉海昌信息技术有限公司 一种基于信息交互的语音识别方法、存储介质及系统
CN112668333A (zh) * 2019-10-15 2021-04-16 华为技术有限公司 命名实体的识别方法和设备、以及计算机可读存储介质
CN113076403A (zh) * 2021-04-21 2021-07-06 深圳追一科技有限公司 一种用户消息处理方法及相关设备
CN113282737A (zh) * 2021-07-21 2021-08-20 中信建投证券股份有限公司 人机协作的智能客服对话方法及装置
CN113569578A (zh) * 2021-08-13 2021-10-29 上海淇玥信息技术有限公司 一种用户意图识别方法、装置和计算机设备
CN114118080A (zh) * 2021-11-10 2022-03-01 北京深维智信科技有限公司 一种从销售会话中自动识别客户意向的方法及系统
CN114118060A (zh) * 2021-11-10 2022-03-01 北京深维智信科技有限公司 一种从销售会话中自动识别关键事件的方法及系统
CN114706945A (zh) * 2022-03-24 2022-07-05 马上消费金融股份有限公司 意图识别方法、装置、电子设备及存储介质
CN116468024A (zh) * 2023-04-13 2023-07-21 重庆明度科技有限责任公司 Ai上下文生成方法
WO2024016516A1 (zh) * 2022-07-18 2024-01-25 浙大城市学院 文献数据集上知识图谱实体标注错误识别方法和系统

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112364622A (zh) * 2020-11-11 2021-02-12 杭州大搜车汽车服务有限公司 对话文本分析方法、装置、电子装置及存储介质
CN112541792A (zh) * 2020-12-22 2021-03-23 作业帮教育科技(北京)有限公司 一种挖掘用户需求的数据处理方法、装置及电子设备
CN112487827A (zh) * 2020-12-28 2021-03-12 科大讯飞华南人工智能研究院(广州)有限公司 问题回答方法及电子设备、存储装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110082688A1 (en) * 2009-10-01 2011-04-07 Samsung Electronics Co., Ltd. Apparatus and Method for Analyzing Intention
CN105487663A (zh) * 2015-11-30 2016-04-13 北京光年无限科技有限公司 一种面向智能机器人的意图识别方法和系统
US20160179970A1 (en) * 2012-06-12 2016-06-23 Microsoft Technology Licensing, Llc Disambiguating intents within search engine result pages
CN107193865A (zh) * 2017-04-06 2017-09-22 上海奔影网络科技有限公司 人机交互中自然语言意图理解方法及装置
CN108763510A (zh) * 2018-05-30 2018-11-06 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN108874782A (zh) * 2018-06-29 2018-11-23 北京寻领科技有限公司 一种层次注意力lstm和知识图谱的多轮对话管理方法
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN109461039A (zh) * 2018-08-28 2019-03-12 厦门快商通信息技术有限公司 一种文本处理方法及智能客服方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180052885A1 (en) * 2016-08-16 2018-02-22 Ebay Inc. Generating next user prompts in an intelligent online personal assistant multi-turn dialog
CN108363690A (zh) * 2018-02-08 2018-08-03 北京十三科技有限公司 基于神经网络的对话语义意图预测方法及学习训练方法
CN108829757B (zh) * 2018-05-28 2022-01-28 广州麦优网络科技有限公司 一种聊天机器人的智能服务方法、服务器及存储介质
CN110096570B (zh) * 2019-04-09 2021-03-30 苏宁易购集团股份有限公司 一种应用于智能客服机器人的意图识别方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110082688A1 (en) * 2009-10-01 2011-04-07 Samsung Electronics Co., Ltd. Apparatus and Method for Analyzing Intention
US20160179970A1 (en) * 2012-06-12 2016-06-23 Microsoft Technology Licensing, Llc Disambiguating intents within search engine result pages
CN105487663A (zh) * 2015-11-30 2016-04-13 北京光年无限科技有限公司 一种面向智能机器人的意图识别方法和系统
CN107193865A (zh) * 2017-04-06 2017-09-22 上海奔影网络科技有限公司 人机交互中自然语言意图理解方法及装置
CN108763510A (zh) * 2018-05-30 2018-11-06 北京五八信息技术有限公司 意图识别方法、装置、设备及存储介质
CN108874782A (zh) * 2018-06-29 2018-11-23 北京寻领科技有限公司 一种层次注意力lstm和知识图谱的多轮对话管理方法
CN109241251A (zh) * 2018-07-27 2019-01-18 众安信息技术服务有限公司 一种会话交互方法
CN109461039A (zh) * 2018-08-28 2019-03-12 厦门快商通信息技术有限公司 一种文本处理方法及智能客服方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
MANSHU TU: "Chinese Dialogue Intention Classification Based on Multi-Model Ensemble", 《IEEE ACCESS》 *
相洋: "问答系统的答案优化方法研究", 《中国博士学位论文全文数据库信息科技辑》 *

Cited By (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020206957A1 (zh) * 2019-04-09 2020-10-15 苏宁云计算有限公司 一种应用于智能客服机器人的意图识别方法及装置
CN110457709A (zh) * 2019-08-16 2019-11-15 北京一链数云科技有限公司 外呼对话处理方法、装置及服务器
CN110569331A (zh) * 2019-09-04 2019-12-13 出门问问信息科技有限公司 一种基于上下文的关联性预测方法、装置及存储设备
CN112487179A (zh) * 2019-09-11 2021-03-12 珠海格力电器股份有限公司 一种口语语义理解方法、装置及系统
CN110717026B (zh) * 2019-10-08 2023-09-22 腾讯科技(深圳)有限公司 一种文本信息识别的方法、人机对话的方法及相关装置
CN110717026A (zh) * 2019-10-08 2020-01-21 腾讯科技(深圳)有限公司 一种文本信息识别的方法、人机对话的方法及相关装置
CN110888968A (zh) * 2019-10-15 2020-03-17 浙江省北大信息技术高等研究院 客服对话意图分类方法及装置、电子设备及介质
WO2021073179A1 (zh) * 2019-10-15 2021-04-22 华为技术有限公司 命名实体的识别方法和设备、以及计算机可读存储介质
CN112668333A (zh) * 2019-10-15 2021-04-16 华为技术有限公司 命名实体的识别方法和设备、以及计算机可读存储介质
CN111026843B (zh) * 2019-12-02 2023-03-14 北京智乐瑟维科技有限公司 一种人工智能语音外呼方法、系统及存储介质
CN111026843A (zh) * 2019-12-02 2020-04-17 北京智乐瑟维科技有限公司 一种人工智能语音外呼方法、系统及存储介质
CN111091826B (zh) * 2019-12-13 2023-09-01 中博信息技术研究院有限公司 基于深度学习和有限状态机的智能语音机器人系统
CN111091826A (zh) * 2019-12-13 2020-05-01 中博信息技术研究院有限公司 基于深度学习和有限状态机的智能语音机器人系统
CN111078855A (zh) * 2019-12-19 2020-04-28 联想(北京)有限公司 信息处理方法、装置、电子设备及存储介质
KR20210084207A (ko) * 2019-12-27 2021-07-07 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 음성 언어 이해에서의 분석 오류 정보를 출력하는 방법과 장치
KR102382421B1 (ko) 2019-12-27 2022-04-05 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 음성 언어 이해에서의 분석 오류 정보를 출력하는 방법과 장치
CN111160002A (zh) * 2019-12-27 2020-05-15 北京百度网讯科技有限公司 用于输出口语理解中解析异常信息的方法和装置
US11482211B2 (en) 2019-12-27 2022-10-25 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for outputting analysis abnormality information in spoken language understanding
CN111325037B (zh) * 2020-03-05 2022-03-29 苏宁云计算有限公司 文本意图识别方法、装置、计算机设备和存储介质
CN111325037A (zh) * 2020-03-05 2020-06-23 苏宁云计算有限公司 文本意图识别方法、装置、计算机设备和存储介质
CN111462752B (zh) * 2020-04-01 2023-10-13 北京思特奇信息技术股份有限公司 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN111462752A (zh) * 2020-04-01 2020-07-28 北京思特奇信息技术股份有限公司 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN111460122A (zh) * 2020-04-03 2020-07-28 成都晓多科技有限公司 基于深度学习的尺码识别方法与系统
CN112148862B (zh) * 2020-10-15 2024-01-30 腾讯科技(深圳)有限公司 一种问题意图识别方法、装置、存储介质及电子设备
CN112148862A (zh) * 2020-10-15 2020-12-29 腾讯科技(深圳)有限公司 一种问题意图识别方法、装置、存储介质及电子设备
CN112256854A (zh) * 2020-11-05 2021-01-22 云南电网有限责任公司 一种基于ai自然语言理解的智能ai会话方法及装置
CN112562665A (zh) * 2020-11-30 2021-03-26 武汉海昌信息技术有限公司 一种基于信息交互的语音识别方法、存储介质及系统
CN112364149A (zh) * 2021-01-12 2021-02-12 广州云趣信息科技有限公司 用户问题获得方法、装置及电子设备
CN112364149B (zh) * 2021-01-12 2021-04-23 广州云趣信息科技有限公司 用户问题获得方法、装置及电子设备
CN113076403A (zh) * 2021-04-21 2021-07-06 深圳追一科技有限公司 一种用户消息处理方法及相关设备
CN113282737B (zh) * 2021-07-21 2021-11-12 中信建投证券股份有限公司 人机协作的智能客服对话方法及装置
CN113282737A (zh) * 2021-07-21 2021-08-20 中信建投证券股份有限公司 人机协作的智能客服对话方法及装置
CN113569578A (zh) * 2021-08-13 2021-10-29 上海淇玥信息技术有限公司 一种用户意图识别方法、装置和计算机设备
CN113569578B (zh) * 2021-08-13 2024-03-08 上海淇玥信息技术有限公司 一种用户意图识别方法、装置和计算机设备
CN114118080B (zh) * 2021-11-10 2022-09-13 北京深维智信科技有限公司 一种从销售会话中自动识别客户意向的方法及系统
CN114118060B (zh) * 2021-11-10 2022-09-27 北京深维智信科技有限公司 一种从销售会话中自动识别关键事件的方法及系统
CN114118060A (zh) * 2021-11-10 2022-03-01 北京深维智信科技有限公司 一种从销售会话中自动识别关键事件的方法及系统
CN114118080A (zh) * 2021-11-10 2022-03-01 北京深维智信科技有限公司 一种从销售会话中自动识别客户意向的方法及系统
CN114706945A (zh) * 2022-03-24 2022-07-05 马上消费金融股份有限公司 意图识别方法、装置、电子设备及存储介质
WO2024016516A1 (zh) * 2022-07-18 2024-01-25 浙大城市学院 文献数据集上知识图谱实体标注错误识别方法和系统
CN116468024A (zh) * 2023-04-13 2023-07-21 重庆明度科技有限责任公司 Ai上下文生成方法
CN116468024B (zh) * 2023-04-13 2023-09-29 重庆明度科技有限责任公司 Ai上下文生成方法

Also Published As

Publication number Publication date
CA3176868A1 (en) 2020-10-15
WO2020206957A1 (zh) 2020-10-15
CN110096570B (zh) 2021-03-30

Similar Documents

Publication Publication Date Title
CN110096570A (zh) 一种应用于智能客服机器人的意图识别方法及装置
CN108304372B (zh) 实体提取方法和装置、计算机设备和存储介质
CN107329967B (zh) 基于深度学习的问答系统以及方法
CN112101028B (zh) 一种多特征双向门控领域专家实体抽取方法及系统
CN107330011A (zh) 多策略融合的命名实体的识别方法及装置
US11113323B2 (en) Answer selection using a compare-aggregate model with language model and condensed similarity information from latent clustering
CN109033305A (zh) 问题回答方法、设备及计算机可读存储介质
CN113094578B (zh) 基于深度学习的内容推荐方法、装置、设备及存储介质
CN110717324B (zh) 裁判文书答案信息提取方法、装置、提取器、介质和设备
CN113505586A (zh) 一种融合语义分类与知识图谱的坐席辅助问答方法与系统
CN111462752B (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
CN110909542B (zh) 智能语义串并分析方法及系统
CN112417132B (zh) 一种利用谓宾信息筛选负样本的新意图识别方法
CN116166782A (zh) 一种基于深度学习的智能问答方法
CN112732871A (zh) 一种机器人催收获取客户意向标签的多标签分类方法
CN113468891A (zh) 文本处理方法以及装置
CN111984780A (zh) 多意图识别模型训练方法和多意图识别方法及相关装置
CN112052319A (zh) 一种基于多特征融合的智能客服方法及系统
CN113591463B (zh) 意图识别方法、装置、电子设备及存储介质
CN113486174A (zh) 模型训练、阅读理解方法、装置、电子设备及存储介质
CN115905187B (zh) 一种面向云计算工程技术人员认证的智能化命题系统
CN110362828B (zh) 网络资讯风险识别方法及系统
CN110287396A (zh) 文本匹配方法及装置
CN112883183B (zh) 构建多分类模型的方法、智能客服方法和相关装置及系统
CN114265931A (zh) 基于大数据文本挖掘的消费者政策感知分析方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210719

Address after: Room 834, Yingying building, 99 Tuanjie Road, yanchuangyuan, Jiangbei new district, Nanjing, Jiangsu 210000

Patentee after: Nanjing Xingyun Digital Technology Co.,Ltd.

Address before: 210000 No. 1 Suning Avenue, Xuanwu District, Nanjing City, Jiangsu Province

Patentee before: SUNING GROUP Co.,Ltd.