CN111553162B - 一种意图识别的方法以及相关装置 - Google Patents

一种意图识别的方法以及相关装置 Download PDF

Info

Publication number
CN111553162B
CN111553162B CN202010348871.8A CN202010348871A CN111553162B CN 111553162 B CN111553162 B CN 111553162B CN 202010348871 A CN202010348871 A CN 202010348871A CN 111553162 B CN111553162 B CN 111553162B
Authority
CN
China
Prior art keywords
intention
information
entity
determining
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010348871.8A
Other languages
English (en)
Other versions
CN111553162A (zh
Inventor
吴俊江
雷植程
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202010348871.8A priority Critical patent/CN111553162B/zh
Publication of CN111553162A publication Critical patent/CN111553162A/zh
Application granted granted Critical
Publication of CN111553162B publication Critical patent/CN111553162B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • G06F40/295Named entity recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Machine Translation (AREA)

Abstract

本申请公开了一种意图识别的方法以及相关装置,可以应用于智能客服的过程中。通过获取客户咨询语句;并对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息;然后基于要素信息确定客户咨询语句的初始意图;接下来不根据预设客户意图图谱对初始意图进行识别,确定目标意图范围;进而基于目标意图范围确定客户咨询语句的目标意图。从而实现基于知识图谱的意图识别过程,由于知识图谱中实体之间的对应性,使得目标意图范围更加准确,进而保证目标意图确定的准确,提高了意图识别过程的准确性。

Description

一种意图识别的方法以及相关装置
技术领域
本申请涉及计算机技术领域,尤其涉及一种意图识别的方法以及相关装置。
背景技术
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、信息检索、机器人问答系统和知识图谱等技术。
其中,自然语言处理可以应用于意图识别的过程中,即对用户输入的检索信息进行分析理解,解析出用户的意图从而有助于满足用户搜索需求的过程。
一般,意图识别的准确性影响了对用户的客户咨询语句响应的结果,然而相关技术中提出的意图识别方案往往存在意图识别准确率较低的问题。
发明内容
有鉴于此,本申请提供一种意图识别的方法,可以有效提高意图识别过程的准确性。
本申请第一方面提供一种意图识别的方法,可以应用于终端设备中包含意图识别功能的系统或程序中,具体包括:获取客户咨询语句;
对所述客户咨询语句进行语句简化处理,以得到与所述客户咨询语句对应的至少两个提取维度的要素信息,所述提取维度基于所述客户咨询语句对应的类别信息和实体信息确定;
基于所述要素信息确定所述客户咨询语句的初始意图;
根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围;
基于所述目标意图范围确定所述客户咨询语句的目标意图。
可选的,在本申请一些可能的实现方式中,所述对所述客户咨询语句进行语句简化处理,以得到与所述客户咨询语句对应的至少两个提取维度的要素信息,包括:
将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,所述要素提取模型包括文本分类分支和实体识别分支;
将所述词特征向量输入所述实体识别分支,以得到所述实体信息;
将所述词特征向量输入所述文本分类分支,以得到所述类别信息,所述类别信息用于指示所述实体信息所属的类别;
根据所述类别信息和所述实体信息确定所述要素信息。
可选的,在本申请一些可能的实现方式中,所述将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,包括:
将所述客户咨询语句输入要素提取模型,按照预设规则提取所述客户咨询语句的词特征;
对所述词特征进行编码,以得到所述词特征向量。
可选的,在本申请一些可能的实现方式中,所述将所述词特征向量输入所述实体识别分支,以得到所述实体信息,包括:
将所述词特征向量输入全连接层,以得到实体输出向量;
确定所述实体输出向量中的分类信息;
根据所述分类信息获取所述实体输出向量对应的掩模向量;
所述将所述词特征向量输入所述文本分类分支,以得到所述类别信息,包括:
将所述词特征向量和所述掩模向量输入所述文本分类分支,以得到所述类别信息。
可选的,在本申请一些可能的实现方式中,所述将所述词特征向量和所述掩模向量输入所述文本分类分支,以得到所述类别信息,包括:
对所述词特征向量和所述掩模向量输入进行计算,以得到输入词向量;
基于自注意力机制对所述输入词向量进行处理,以得到分类向量;
将所述分类向量进行归一化,以得到所述类别信息。
可选的,在本申请一些可能的实现方式中,所述基于所述要素信息确定所述客户咨询语句的初始意图,包括:
基于所述要素信息确定标注实体词;
获取所述预设客户意图图谱中对应的多个预测实体词;
根据所述标注实体词和所述预测实体词对应的编辑距离确定所述初始意图。
可选的,在本申请一些可能的实现方式中,所述基于所述要素信息确定所述客户咨询语句的初始意图,包括:
基于所述要素信息对应的第三方标识;
根据所述第三方标识确定为所述初始意图。
可选的,在本申请一些可能的实现方式中,所述根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围,包括:
基于所述初始意图确定查询索引;
根据所述查询索引遍历所述预设客户意图图谱,以确定所述目标意图范围。
可选的,在本申请一些可能的实现方式中,所述方法还包括:
获取识别记录,所述识别记录基于所述客户咨询语句确定;
根据所述识别记录中记录的至少一个相邻识别操作确定候选要素;
根据所述候选要素对所述要素信息进行更新。
可选的,在本申请一些可能的实现方式中,所述根据所述候选要素对所述要素信息进行更新,包括:
确定所述候选要素与所述要素信息中要素的要素对应关系;
根据所述要素对应关系确定要素替换项;
根据所述要素替换项对所述要素信息进行更新。
可选的,在本申请一些可能的实现方式中,所述基于所述目标意图范围确定所述客户咨询语句的目标意图,包括:
获取所述目标意图范围中包含的意图数量;
若所述意图数量满足预设条件,则将所述意图数量对应的意图确定为所述客户咨询语句的目标意图。
可选的,在本申请一些可能的实现方式中,所述意图识别的方法应用于智能客服,所述要素信息包括所述客户咨询语句对应的业务信息、功能信息和操作信息。
本申请第二方面提供一种意图识别的装置,包括:获取单元,用于获取客户咨询语句;
提取单元,用于对所述客户咨询语句进行语句简化处理,以得到与所述客户咨询语句对应的至少两个提取维度的要素信息,所述提取维度基于所述客户咨询语句对应的类别信息和实体信息确定;
确定单元,用于基于所述要素信息确定所述客户咨询语句的初始意图;
识别单元,用于根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围;
所述识别单元,还用于基于所述目标意图范围确定所述客户咨询语句的目标意图。
可选的,在本申请一些可能的实现方式中,所述提取单元,具体用于将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,所述要素提取模型包括文本分类分支和实体识别分支;
所述提取单元,具体用于将所述词特征向量输入所述实体识别分支,以得到所述实体信息;
所述提取单元,具体用于将所述词特征向量输入所述文本分类分支,以得到所述类别信息,所述类别信息用于指示所述实体信息所属的类别;
所述提取单元,具体用于根据所述类别信息和所述实体信息确定所述要素信息。
可选的,在本申请一些可能的实现方式中,所述提取单元,具体用于将所述客户咨询语句输入要素提取模型,按照预设规则提取所述客户咨询语句的词特征;
所述提取单元,具体用于对所述词特征进行编码,以得到所述词特征向量。
可选的,在本申请一些可能的实现方式中,所述提取单元,具体用于将所述词特征向量输入全连接层,以得到实体输出向量;
所述提取单元,具体用于确定所述实体输出向量中的分类信息;
所述提取单元,具体用于根据所述分类信息获取所述实体输出向量对应的掩模向量;
所述提取单元,具体用于将所述词特征向量和所述掩模向量输入所述文本分类分支,以得到所述类别信息。
可选的,在本申请一些可能的实现方式中,所述提取单元,具体用于对所述词特征向量和所述掩模向量输入进行计算,以得到输入词向量;
所述提取单元,具体用于基于自注意力机制对所述输入词向量进行处理,以得到分类向量;
所述提取单元,具体用于将所述分类向量进行归一化,以得到所述类别信息。
可选的,在本申请一些可能的实现方式中,所述确定单元,具体用于基于所述要素信息确定标注实体词;
所述确定单元,具体用于获取所述预设客户意图图谱中对应的多个预测实体词;
所述确定单元,具体用于根据所述标注实体词和所述预测实体词对应的编辑距离确定所述初始意图。
可选的,在本申请一些可能的实现方式中,所述确定单元,具体用于基于所述要素信息对应的第三方标识;
所述确定单元,具体用于根据所述第三方标识确定为所述初始意图。
可选的,在本申请一些可能的实现方式中,所述确定单元,具体用于基于所述初始意图确定查询索引;
所述确定单元,具体用于根据所述查询索引遍历所述预设客户意图图谱,以确定所述目标意图范围。
可选的,在本申请一些可能的实现方式中,所述识别单元,还用于获取识别记录,所述识别记录基于所述客户咨询语句确定;
所述识别单元,还用于根据所述识别记录中记录的至少一个相邻识别操作确定候选要素;
所述识别单元,还用于根据所述候选要素对所述要素信息进行更新。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于确定所述候选要素与所述要素信息中要素的要素对应关系;
所述识别单元,具体用于根据所述要素对应关系确定要素替换项;
所述识别单元,具体用于根据所述要素替换项对所述要素信息进行更新。
可选的,在本申请一些可能的实现方式中,所述识别单元,具体用于获取所述目标意图范围中包含的意图数量;
所述识别单元,具体用于若所述意图数量满足预设条件,则将所述意图数量对应的意图确定为所述客户咨询语句的目标意图。
本申请第三方面提供一种计算机设备,包括:存储器、处理器以及总线系统;所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行上述第一方面或第一方面任一项所述的意图识别的方法。
本申请第四方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一项所述的意图识别的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
通过获取客户咨询语句;并对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息,提取维度基于客户咨询语句对应的类别信息和实体信息确定;然后基于要素信息确定客户咨询语句的初始意图;接下来不根据预设客户意图图谱对初始意图进行识别,确定目标意图范围;进而基于目标意图范围确定客户咨询语句的目标意图。从而实现基于知识图谱的意图识别过程,由于知识图谱中实体之间的对应性,使得目标意图范围更加准确,进而保证目标意图确定的准确,提高了意图识别过程的准确性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为意图识别系统运行的网络架构图;
图2为本申请实施例提供的一种意图识别的流程架构图;
图3为本申请实施例提供的一种意图识别的方法的流程图;
图4为本申请实施例提供的一种实体提取模型的架构示意图;
图5为本申请实施例提供的一种意图识别的方法的场景示意图;
图6为本申请实施例提供的一种系统架构图;
图7为本申请实施例提供的另一种意图识别的方法的场景示意图;
图8为本申请实施例提供的一种意图识别装置的结构示意图;
图9为本申请实施例提供的一种终端设备的结构示意图。
具体实施方式
本申请实施例提供了一种意图识别的方法以及相关装置,可以应用于终端设备中包含意图识别功能的系统或程序中,通过获取客户咨询语句;并对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息,提取维度基于客户咨询语句对应的类别信息和实体信息确定;然后基于要素信息确定客户咨询语句的初始意图;接下来不根据预设客户意图图谱对初始意图进行识别,确定目标意图范围;进而基于目标意图范围确定客户咨询语句的目标意图。从而实现基于知识图谱的意图识别过程,由于知识图谱中实体之间的对应性,使得目标意图范围更加准确,进而保证目标意图确定的准确,提高了意图识别过程的准确性。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“对应于”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,对本申请实施例中可能出现的一些名词进行解释。
意图:人工智能中机器对于用户客户咨询语句的理解,并进行回复的内容或与内容相关的标签。
Cypher:一种图形数据库Neo4j的声明式查询语言,它通过模式匹配图数据库中的节点和关系,来提取信息或者修改数据;Cypher语句中允许使用变量,用来表示命名、绑定元素和参数;可以对节点、关系、标签和属性进行创建、更新和删除操作;可以管理索引和约束。
多任务学习(Multi-Task Learning,MT):目标是利用多个学习任务中所包含的有用信息来帮助为每个任务学习得到更为准确的学习器。我们假设所有任务(至少其中一部分任务)是相关的,在此基础上,我们在实验和理论上都发现,联合学习多个任务能比单独学习它们得到更好的性能。
知识图谱(Knowledge Graph):在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
命名实体识别(Named Entity Recognition,NER):用于识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等。通常包括两部分:(1)实体边界识别;(2)确定实体类别(人名、地名、机构名或其他)。
实体链指(entity linking):是指对于从文本中抽取得到的实体对象,将其链接到知识库中对应的正确实体对象的操作。其基本思想是首先根据给定的实体指称项,从知识库中选出一组候选实体对象,然后通过相似度计算将指称项链接到正确的实体对象。
条件随机场(conditional random field,CRF):用于构造在给定一组输入随机变量的条件下,另一组输出随机变量的条件概率分布模型。
应理解,本申请提供的意图识别方法可以应用于终端设备中包含功能的系统或程序中,例如智能客服,具体的,意图识别系统可以运行于如图1所示的网络架构中,如图1所示,是意图识别系统运行的网络架构图,如图可知,意图识别系统可以提供与多个信息源的意图识别过程,终端通过网络建立与服务器的连接,并向服务器发送关于用户需求的客户咨询语句,服务器在接收到客户咨询语句后根据对话的内容进行本申请提供的意图识别过程,以得到用户所要表达的目标意图,进而进行相应的回复;可以理解的是,图1中示出了多种终端设备,在实际场景中可以有更多或更少种类的终端设备参与到意图识别的过程中,具体数量和种类因实际场景而定,此处不做限定,另外,图1中示出了一个服务器,但在实际场景中,也可以有多个服务器的参与,特别是在多内容应用交互的场景中,具体服务器数量因实际场景而定。
本实施例中,服务器可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请在此不做限制。
应当注意的是,本实施例提供的意图识别方法也可以离线进行,即不需要服务器的参与,此时终端在本地与其他终端进行连接,进而进行终端之间的意图识别的过程。
可以理解的是,上述意图识别系统可以运行于个人移动终端,例如:作为知识图谱这样的应用,也可以运行于服务器,还可以作为运行于第三方设备以提供意图识别,以得到信息源的意图识别处理结果;具体的意图识别系统可以是以一种程序的形式在上述设备中运行,也可以作为上述设备中的系统部件进行运行,还可以作为云端服务程序的一种,具体运作模式因实际场景而定,此处不做限定。
自然语言处理(Nature Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、信息检索、机器人问答系统和知识图谱等技术。
其中,自然语言处理可以应用于意图识别的过程中,即对用户输入的检索信息进行分析理解,解析出用户的意图从而有助于满足用户搜索需求的过程。
一般,意图识别的准确性影响了对用户的客户咨询语句响应的结果,然而相关技术中提出的意图识别方案往往存在意图识别准确率较低的问题。
为了解决上述问题,本申请提出了一种意图识别的方法,该方法应用于图2所示的意图识别的流程框架中,如图2所示,为本申请实施例提供的一种意图识别的流程架构图,首先获取终端发送的客户咨询语句,一般为文本输入;然后将客户咨询语句如图要素提取模型从而得到要素信息,其中要素信息会根据不同的关联客户咨询语句进行更新;进一步的根据要素信息确定初始意图,进一步的基于初始意图在知识图谱中确定目标意图范围,然后基于目标意图范围确定目标意图。
可以理解的是,本申请所提供的方法可以为一种程序的写入,以作为硬件系统中的一种处理逻辑,也可以作为一种意图识别装置,采用集成或外接的方式实现上述处理逻辑。作为一种实现方式,该意图识别装置通过获取客户咨询语句;并对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息,提取维度基于客户咨询语句对应的类别信息和实体信息确定;然后基于要素信息确定客户咨询语句的初始意图;接下来不根据预设客户意图图谱对初始意图进行识别,确定目标意图范围;进而基于目标意图范围确定客户咨询语句的目标意图。从而实现基于知识图谱的意图识别过程,由于知识图谱中实体之间的对应性,使得目标意图范围更加准确,进而保证目标意图确定的准确,提高了意图识别过程的准确性。
本申请实施例提供的方案涉及人工智能的、智能问答等技术,具体通过如下实施例进行说明:
结合上述流程架构,下面将对本申请中意图识别的方法进行介绍,请参阅图3,图3为本申请实施例提供的一种意图识别的方法的流程图,本申请实施例至少包括以下步骤:
301、获取客户咨询语句。
本实施例中,客户咨询语句中可以是文本信息,也可以是语音信息,还可以是从任意形式数据中提取的用于指示用户需求的指示信息,具体信息形式因实际场景而定。
应当注意的是,本实施例中的客户咨询语句包括至少两个客户咨询语句,其中,客户咨询语句之间相关联;例如:在智能客服场景中,客户咨询语句为一段对话,该对话中存在语句之间的先后关联,以及内在要素之间的关联。
可以理解的是,客户咨询语句可以是对话场景中完整的一段对话,也可以是该对话中的部分,还可以是当前输入的一个句子内容,具体形式因实际场景而定,此处不做限定。
在一种可能的场景中,预设客户意图图谱可以是基于智能客服的业务实践,由相关人员进行构建,也可以是系统中的历史存储。
302、对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息。
本实施例中,客户咨询语句的输入可以是智能客服过程对应的客服记录中的一个对话,例如:一句回答语;客户咨询语句的输入也可以多个对话的集合,例如:一段对话;客户咨询语句的输入还可以是整个客服记录,具体组成或数量因实际场景而定,此处不做限定。
本实施例中,提取维度基于客户咨询语句对应的类别信息和实体信息确定,其中,类别信息即用于指示实体之间的关联关系,例如操作信息;而实体信息即实体指示的对象,例如:业务对象、功能对象等。另外,提取维度即基于不同的类别信息或不同的实体信息确定的,例如:要素信息包括操作(类别信息)、业务(实体信息)以及功能(实体信息)。
可以理解的是,上述要素说明仅为示例,具体的可以是两个维度或更多的维度的要素,具体数量因实际场景而定,此处不做限定。
在一种可能的场景中,对于上述业务、功能、操作之间的关系可以通过知识图谱进行关联,例如:业务代表对应的意图涉及的业务,比如零钱业务、红包业务、第三方业务等,该要素主要是实体形式;而功能要素主要是业务下涉及的功能,比如零钱业务下的充值功能、提现功能等,该要素具有两种形式,一种是如业务一般的实体形式,如直接说提现、转账等实体词,另一种是语义形式,如提不了、微信转到银行卡等这种表述,需要对句子进行语义理解并对应到相应的实体;操作要素则是功能下的具体状态如提现失败,充值失败等,表示失败这一操作状态。对每个意图进行三个要素的拆分,既可以得到对应的知识图谱。
下面,对本申请中的要素提取模型进行说明,该要素抽取模型是一个多任务学习模型。具体的,要素提取模型可以包括文本分类分支和实体识别分支,且两个分支之间共享词向量层。对应的,要素信息的确定过程可以首先提取客户咨询语句的词特征向量;然后将词特征向量输入实体识别分支,以得到实体信息;接下来将词特征向量输入文本分类分支,以得到类别信息,类别信息用于指示实体信息与类别信息的对应关系;再根据类别信息和实体信息确定要素信息。
可选的,由于一些计算机只能处理数值,而英文,汉字等等它是理解不了的,故让计算机处理自然语言的方式就是为每个词编号,每个编号就代表其对应的词,从而词特征向量提取的准确性。具体的,首先按照预设规则提取客户咨询语句的词特征;然后对词特征进行编码,以得到词特征向量。其中,编码的过程可以采用Transformer编码器,Transformer使用注意力机制来编码每个位置,并关联有关其自身的输入和输出的两个远端单词,然后可以并行化处理,因而加快训练,提高了意图识别的效率。
在实体识别分支中,由于可能存在不同类别的实体识别的情况,为保证不同类的实体之间不会相互干扰,可以添加一个实体掩模(Entity Mask)。
在一种可能的场景中,对于要素提取模型的架构可以参见图4,为本申请实施例提供的一种要素提取模型的架构示意图。具体的,首先根据客户咨询语句的特征构建特征输入A={a1,a2,...,aN},然后对输入特征进行向量化。其中,在向量化过程中,采用预训练词向量模型和随机向量矩阵两种方式进行构建,其中预训练词向量采用ngram2vec方式对相关领域语料进行训练得到对应的词向量,该词向量在训练时考虑到了ngram特征;另外,也可以采用CBOW和Skip-gram模型进行词向量的生成。从而得到词向量AE={ae1,ae2,...,aei},i=1...n其中aei∈Rd,d为向量维度,其取值可以是300,而Rd即为维度为d的向量集合。
进一步的,对输入词向量进行Transformer编码,例如使用四层的堆叠的Transformer编码器,得到Transformer的编码输出(Word_Emb):AEE={aee1,aee2,...,aeei},i=1...n。
在得到编码向量AEE后,对AEE经过一层全连接层,将词向量维度映射到输出的实体类别维度,得到输出向量ANER={aner1,aner2,...,aneri},i=1...n,其中,aner1∈Rl,l为实体类别数量,Rl为实体类别数量为l的向量集合。
然后将ANER经CRF层得到每个词实体识别的输出类别以及正对该类别得到的掩模向量(MASK),具体的掩模向量计算公式如下:
MASK={m1,m2,...,mn}
其中,lf为不为实体的标签类别。
在文本分类分支中,在得到实体的掩模向量后,对掩模和编码输出做点积操作,即对这两个向量对应位一一相乘之后求和的操作;从而得到分类任务的输入词向量CEE={cee1,cee2,...,ceen},最终通过一个自注意力机制(Self-Attention)层得到分类向量Cls_emb并经过Softmax进行归一化得到分类类别的概率分布,即类别信息,从而结合实体信息,确定实体信息中满足对应关系的要素信息。
在另一种可能的场景中,上述实体识别分支还可以是基于多个目标实体识别模型进行的,即可以使用多种的联合模型或者多个单个任务模型代替,如基于seq2seq的多任务模型、单个任务的RNN/CNN等文本分类模型、单个任务的Bilstm_Crf、Bert_Bilstm_Crf等实体抽取模型等。具体的,即将词特征向量输入多个目标实体识别模型,以得到多个目标实体;从而基于目标实体确定实体信息。
可选的,由于客户咨询语句中存在关联关系,故可以获取识别记录,识别记录即指示关联客户咨询语句之间的关系,例如:对话过程中的先后顺序;然后根据识别记录中记录的至少一个相邻识别操作确定候选要素;从而根据候选要素对要素信息进行更新。该更新的过程即根据之前的对话已经确定的要素对当前对话的要素进行更新,具体的,即确定候选要素与要素信息中要素的要素对应关系;然后根据要素对应关系确定要素替换项;根据要素替换项对要素信息进行更新。例如:候选要素(上一次对话)中包含了红包、提现等要素,而当前的要素信息中包含了红包,故可以将提现添加到当前的要素信息中,以防止要素遗漏。
303、基于要素信息确定客户咨询语句的初始意图;
本实施例中,初始意图即基于客户咨询语句得到的在知识图谱中的一个实体,通过知识图谱可以得到该实体的对应实体,即完成意图的识别过程。
可选的,由于要素信息指示的实体可能在知识图谱中为其他表现形式,故需要将要素信息映射为与知识图谱对应的标准实体词。具体的,首先基于要素信息确定标注实体词;然后获取预设客户意图图谱中对应的预测实体词。
由于标注实体词经过实体链指可能对应多个预测实体词,此时可以根据标注实体词和预测实体词对应的编辑距离确定初始意图,即选择距离较近的标注实体词作为初始意图,从而保证意图识别的准确性。
另外,对于要素信息指示的实体与当前平台不相关的情况,此时可以基于要素信息对应的第三方标识;然后根据第三方标识确定为初始意图,例如:要素信息中包含“拼多多”(第三方平台)的标识,则确定初始意图为第三方平台的链接。
可以理解的是,对于按照编辑距离确定初始意图的过程和按照第三方标识确定初始意图的过程可以出现在同一智能客服的场景中,即可以将上述两个过程进行结合,在计算编辑距离的同时也进行第三方标识的检测。
在一种可能的场景中,经过实体链指将业务实体和功能实体对应到相应的标准实体词中,其中业务实体分为两类,一类的标签是业务类,如红包、转账、零钱通等微信支付业务,该类的实体链接直接用标注实体词和预测的实体词做编辑距离,设定阈值得到最有可能的业务类型,一类标签是第三方实体类,如拼多多、酷狗等商品名,该类直接用第三方实体类别作为业务类型。
304、根据预设客户意图图谱对初始意图进行识别,确定目标意图范围。
本实施例中,预设客户意图图谱用于指示多个意图之间的关联关系,意图即用于指示实体之间的关联关系,具体的,如图5所示,为本申请实施例提供的一种意图识别的方法的场景示意图,图中示出了不同实体之间的对应关系,即当问答信息为实体1时,通过该知识图谱会关联到实体2、实体3以及实体4,进一步的根据问答信息的进一步解析对接下来的实体进行确定。
在一种可能的场景中,预设客户意图图谱可以是基于智能客服的业务实践,由相关人员进行构建,也可以是系统中的历史存储。
本实施例中,目标意图范围的确定,即对于预设客户意图图谱的遍历过程,由于预设客户意图图谱采用索引的关联方式建立。故可以基于初始意图确定查询索引;根据查询索引遍历预设客户意图图谱,以得到目标意图范围。
具体的,由于一般预设客户意图图谱基于Cypher语句构建,故可以根据得到的初始意图,构建图谱查询的Cypher语句,从图谱中查找相关意图,从而实现目标意图范围的确定。
305、基于目标意图范围确定目标意图。
本实施例中,由于目标意图范围中可能包括多个意图,此时可以对意图数量进行判定,从而确定目标意图,例如:当目标意图范围中包含的意图数量小于或等于2时,则将意图数量对应的意图确定所述目标意图。
基于步骤302中指示的要素更新的过程,若目标意图范围中包含的意图数量不满足预设条件,则可以从关联的客户咨询语句对应的要素信息中提取或替换相关的要素,进而实现对于目标意图范围的更新。
在一种可能的场景中,客户咨询语句为逐步关联的对话,此时目标意图范围相当于逐步缩小的过程,直至意图数量满足预设条件,从而实现了对于目标意图的锁定过程。
结合上述实施例可知,通过获取客户咨询语句;并对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息,提取维度基于客户咨询语句对应的类别信息和实体信息确定;然后基于要素信息确定客户咨询语句的初始意图;接下来不根据预设客户意图图谱对初始意图进行识别,确定目标意图范围;进而基于目标意图范围确定客户咨询语句的目标意图。从而实现基于知识图谱的意图识别过程,由于知识图谱中实体之间的对应性,使得目标意图范围更加准确,进而保证目标意图确定的准确,提高了意图识别过程的准确性。
下面,结合要素更新作为具体场景进行介绍,具体的可参考图6所示的架构,为本申请实施例提供的一种系统架构图。图中示出通过将客户咨询语句进行要素提取,即指示实体要素的命名实体识别过程以及指示类别信息的文本分类过程,从而得到要素信息,具体的基于要素信息确定目标意图的过程如图3所示实施例步骤303-305所示,此处不做赘述。
应当注意的是,此处得到的要素信息可以用于相邻识别操作的过程中,例如:智能客服中,下一时刻用户文本输入的意图识别。从而对下一时刻的要素信息进行更新,具体的,上述要素更新并进行意图识别的过程请参阅图7,图7为本申请实施例提供的另一种意图识别的方法的流程图,本申请实施例至少包括以下步骤:
701、获取第一对话信息。
702、将第一对话信息输入要素提取模型,以得到第一要素信息。
703、获取第二对话信息,以得到第二要素信息。
本实施例中,步骤701-步骤703的过程与图3所示实施例的步骤301-302相似,具体特征可以进行参考,此处不做赘述。
其中,第一要素信息与第二要素信息即相当于分别进行的要素信息的获取过程。
704、基于第一要素信息对第二要素信息更新。
本实施例中,对于第一要素信息中包含但第二要素信息不包含的情况,可以对第一要素信息中包含的要素信息进行相应的添加。
另外,对于第一要素信息和第二要素信息中存在相似要素的情况,可以根据第一要素信息和第二要素信息分别相较于知识图谱中标准实体的相似度进行选择,对于相似度高的进行替换补入。从而实现第二要素信息的更新过程,保证了当前语段识别的准确性。
705、基于更新后的第二要素信息确定目标意图。
本实施例中,步骤705与图3所示实施例的步骤303-305相似,具体特征可以进行参考,此处不做赘述。
结合上述实施例可见,一方面通过结合知识图谱能够实现对模糊用户描述中涉及相关意图进行锁定,为智能客服上下文问答提供支撑;二方面由于要素抽取模块通过掩模向量和多任务思想能够减少实体词对分类的影响,从而提升实体识别和文本分类的准确率;三方面通过要素信息的继承和替换等操作,结合知识图谱的网络结构,实现多轮层次的相关意图锁定,对会话的意图进行逐轮识别,对整个会话的回复而言具有更好的上下文体验。
为了更好的实施本申请实施例的上述方案,下面还提供用于实施上述方案的相关装置。请参阅图8,图8为本申请实施例提供的一种意图识别装置的结构示意图,意图识别装置800包括:
获取单元801,用于获取客户咨询语句;
提取单元802,用于对所述客户咨询语句进行语句简化处理,以得到与所述客户咨询语句对应的至少两个提取维度的要素信息,所述提取维度基于所述客户咨询语句对应的类别信息和实体信息确定;
确定单元803,用于基于所述要素信息确定所述客户咨询语句的初始意图;
识别单元804,用于根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围;
所述识别单元804,还用于基于所述目标意图范围确定所述客户咨询语句的目标意图。
可选的,在本申请一些可能的实现方式中,所述提取单元802,具体用于将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,所述要素提取模型包括文本分类分支和实体识别分支;
所述提取单元802,具体用于将所述词特征向量输入所述实体识别分支,以得到所述实体信息;
所述提取单元802,具体用于将所述词特征向量输入所述文本分类分支,以得到所述类别信息,所述类别信息用于指示所述实体信息所属的类别;
所述提取单元802,具体用于根据所述类别信息和所述实体信息确定所述要素信息。
可选的,在本申请一些可能的实现方式中,所述提取单元802,具体用于将所述客户咨询语句输入要素提取模型,按照预设规则提取所述客户咨询语句的词特征;
所述提取单元802,具体用于对所述词特征进行编码,以得到所述词特征向量。
可选的,在本申请一些可能的实现方式中,所述提取单元802,具体用于将所述词特征向量输入全连接层,以得到实体输出向量;
所述提取单元802,具体用于确定所述实体输出向量中的分类信息;
所述提取单元802,具体用于根据所述分类信息获取所述实体输出向量对应的掩模向量;
所述提取单元802,具体用于将所述词特征向量和所述掩模向量输入所述文本分类分支,以得到所述类别信息。
可选的,在本申请一些可能的实现方式中,所述提取单元802,具体用于对所述词特征向量和所述掩模向量输入进行计算,以得到输入词向量;
所述提取单元802,具体用于基于自注意力机制对所述输入词向量进行处理,以得到分类向量;
所述提取单元802,具体用于将所述分类向量进行归一化,以得到所述类别信息。
可选的,在本申请一些可能的实现方式中,所述确定单元803,具体用于基于所述要素信息确定标注实体词;
所述确定单元803,具体用于获取所述预设客户意图图谱中对应的多个预测实体词;
所述确定单元803,具体用于根据所述标注实体词和所述预测实体词对应的编辑距离确定所述初始意图。
可选的,在本申请一些可能的实现方式中,所述确定单元803,具体用于基于所述要素信息对应的第三方标识;
所述确定单元803,具体用于根据所述第三方标识确定为所述初始意图。
可选的,在本申请一些可能的实现方式中,所述确定单元803,具体用于基于所述初始意图确定查询索引;
所述确定单元803,具体用于根据所述查询索引遍历所述预设客户意图图谱,以确定所述目标意图范围。
可选的,在本申请一些可能的实现方式中,所述识别单元804,还用于获取识别记录,所述识别记录基于所述客户咨询语句确定;
所述识别单元804,还用于根据所述识别记录中记录的至少一个相邻识别操作确定候选要素;
所述识别单元804,还用于根据所述候选要素对所述要素信息进行更新。
可选的,在本申请一些可能的实现方式中,所述识别单元804,具体用于确定所述候选要素与所述要素信息中要素的要素对应关系;
所述识别单元804,具体用于根据所述要素对应关系确定要素替换项;
所述识别单元804,具体用于根据所述要素替换项对所述要素信息进行更新。
可选的,在本申请一些可能的实现方式中,所述识别单元804,具体用于获取所述目标意图范围中包含的意图数量;
所述识别单元804,具体用于若所述意图数量满足预设条件,则将所述意图数量对应的意图确定为所述客户咨询语句的目标意图。
通过获取客户咨询语句;并对客户咨询语句进行语句简化处理,以得到与客户咨询语句对应的至少两个提取维度的要素信息,提取维度基于客户咨询语句对应的类别信息和实体信息确定;然后基于要素信息确定客户咨询语句的初始意图;接下来不根据预设客户意图图谱对初始意图进行识别,确定目标意图范围;进而基于目标意图范围确定客户咨询语句的目标意图。从而实现基于知识图谱的意图识别过程,由于知识图谱中实体之间的对应性,使得目标意图范围更加准确,进而保证目标意图确定的准确,提高了意图识别过程的准确性。
本申请实施例还提供了一种终端设备,如图9所示,是本申请实施例提供的另一种终端设备的结构示意图,为了便于说明,仅示出了与本申请实施例相关的部分,具体技术细节未揭示的,请参照本申请实施例方法部分。该终端可以为包括手机、平板电脑、个人数字助理(personal digital assistant,PDA)、销售终端(point of sales,POS)、车载电脑等任意终端设备,以终端为手机为例:
图9示出的是与本申请实施例提供的终端相关的手机的部分结构的框图。参考图9,手机包括:射频(radio frequency,RF)电路910、存储器920、输入单元930、显示单元940、传感器950、音频电路960、无线保真(wireless fidelity,WiFi)模块970、处理器980、以及电源980等部件。本领域技术人员可以理解,图9中示出的手机结构并不构成对手机的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
下面结合图9对手机的各个构成部件进行具体的介绍:
RF电路910可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器980处理;另外,将设计上行的数据发送给基站。通常,RF电路910包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noiseamplifier,LNA)、双工器等。此外,RF电路910还可以通过无线通信与网络和其他设备通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(globalsystem of mobile communication,GSM)、通用分组无线服务(general packet radioservice,GPRS)、码分多址(code division multiple access,CDMA)、宽带码分多址(wideband code division multiple access,WCDMA)、长期演进(long term evolution,LTE)、电子邮件、短消息服务(short messaging service,SMS)等。
存储器920可用于存储软件程序以及模块,处理器980通过运行存储在存储器920的软件程序以及模块,从而执行手机的各种功能应用以及数据处理。存储器920可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
输入单元930可用于接收输入的数字或字符信息,以及产生与手机的用户设置以及功能控制有关的键信号输入。具体地,输入单元930可包括触控面板931以及其他输入设备932。触控面板931,也称为触摸屏,可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板931上或在触控面板931附近的操作,以及在触控面板931上一定范围内的隔空触控操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板931可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测用户的触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器980,并能接收处理器980发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板931。除了触控面板931,输入单元930还可以包括其他输入设备932。具体地,其他输入设备932可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。
显示单元940可用于显示由用户输入的信息或提供给用户的信息以及手机的各种菜单。显示单元940可包括显示面板941,可选的,可以采用液晶显示器(liquid crystaldisplay,LCD)、有机发光二极管(organic light-emitting diode,OLED)等形式来配置显示面板941。进一步的,触控面板931可覆盖显示面板941,当触控面板931检测到在其上或附近的触摸操作后,传送给处理器980以确定触摸事件的类型,随后处理器980根据触摸事件的类型在显示面板941上提供相应的视觉输出。虽然在图9中,触控面板931与显示面板941是作为两个独立的部件来实现手机的输入和输入功能,但是在某些实施例中,可以将触控面板931与显示面板941集成而实现手机的输入和输出功能。
手机还可包括至少一种传感器950,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板941的亮度,接近传感器可在手机移动到耳边时,关闭显示面板941和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别手机姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于手机还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
音频电路960、扬声器961,传声器962可提供用户与手机之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号,传输到扬声器961,由扬声器961转换为声音信号输出;另一方面,传声器962将收集的声音信号转换为电信号,由音频电路960接收后转换为音频数据,再将音频数据输出处理器980处理后,经RF电路910以发送给比如另一手机,或者将音频数据输出至存储器920以便进一步处理。
WiFi属于短距离无线传输技术,手机通过WiFi模块970可以帮助用户收发电子邮件、浏览网页和访问流式媒体等,它为用户提供了无线的宽带互联网访问。虽然图9示出了WiFi模块970,但是可以理解的是,其并不属于手机的必须构成,完全可以根据需要在不改变发明的本质的范围内而省略。
处理器980是手机的控制中心,利用各种接口和线路连接整个手机的各个部分,通过运行或执行存储在存储器920内的软件程序和/或模块,以及调用存储在存储器920内的数据,执行手机的各种功能和处理数据。可选的,处理器980可包括一个或多个处理单元;可选的,处理器980可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器980中。
手机还包括给各个部件供电的电源980(比如电池),可选的,电源可以通过电源管理系统与处理器980逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
尽管未示出,手机还可以包括摄像头、蓝牙模块等,在此不再赘述。
在本申请实施例中,该终端所包括的处理器980还具有执行如上述页面处理方法的各个步骤的功能。
本申请实施例中还提供一种计算机可读存储介质,该计算机可读存储介质中存储有意图识别指令,当其在计算机上运行时,使得计算机执行如前述图2至图6所示实施例描述的方法中意图识别装置所执行的步骤。
本申请实施例中还提供一种包括意图识别指令的计算机程序产品,当其在计算机上运行时,使得计算机执行如前述图2至图6所示实施例描述的方法中意图识别装置所执行的步骤。
本申请实施例还提供了一种意图识别系统,所述意图识别系统可以包含图8所描述实施例中的意图识别装置,或者图9所描述的终端设备。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,意图识别装置,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(read-onlymemory,ROM)、随机存取存储器(random access memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

Claims (19)

1.一种意图识别的方法,其特征在于,包括:
获取客户咨询语句;
将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,所述要素提取模型包括文本分类分支和实体识别分支;
将所述词特征向量输入所述实体识别分支,以得到实体信息,具体包括:将所述词特征向量输入全连接层,以得到实体输出向量;确定所述实体输出向量中的分类信息;根据所述分类信息获取所述实体输出向量对应的掩模向量;
将所述词特征向量输入所述文本分类分支,以得到类别信息,具体包括:对所述词特征向量和所述掩模向量进行点积操作,以得到输入词向量;基于自注意力机制对所述输入词向量进行处理,以得到分类向量;将所述分类向量进行归一化,以得到类别信息;所述类别信息用于指示所述实体信息所属的类别;
根据所述类别信息和所述实体信息,确定与所述客户咨询语句对应的至少两个提取维度的要素信息,所述提取维度基于所述客户咨询语句对应的类别信息和实体信息确定;
基于所述要素信息确定所述客户咨询语句的初始意图;
根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围;
基于所述目标意图范围确定所述客户咨询语句的目标意图。
2.根据权利要求1所述的方法,其特征在于,所述将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,包括:
将所述客户咨询语句输入要素提取模型,按照预设规则提取所述客户咨询语句的词特征;
对所述词特征进行编码,以得到所述词特征向量。
3.根据权利要求1所述的方法,其特征在于,所述基于所述要素信息确定所述客户咨询语句的初始意图,包括:
基于所述要素信息确定标注实体词;
获取所述预设客户意图图谱中对应的多个预测实体词;
根据所述标注实体词和所述预测实体词对应的编辑距离确定所述初始意图。
4.根据权利要求1所述的方法,其特征在于,所述基于所述要素信息确定所述客户咨询语句的初始意图,包括:
基于所述要素信息对应的第三方标识;
根据所述第三方标识确定为所述初始意图。
5.根据权利要求1所述的方法,其特征在于,所述根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围,包括:
基于所述初始意图确定查询索引;
根据所述查询索引遍历所述预设客户意图图谱,以确定所述目标意图范围。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取识别记录,所述识别记录基于所述客户咨询语句确定;
根据所述识别记录中记录的至少一个相邻识别操作确定候选要素;
根据所述候选要素对所述要素信息进行更新。
7.根据权利要求6所述的方法,其特征在于,所述根据所述候选要素对所述要素信息进行更新,包括:
确定所述候选要素与所述要素信息中要素的要素对应关系;
根据所述要素对应关系确定要素替换项;
根据所述要素替换项对所述要素信息进行更新。
8.根据权利要求1所述的方法,其特征在于,所述基于所述目标意图范围确定所述客户咨询语句的目标意图,包括:
获取所述目标意图范围中包含的意图数量;
若所述意图数量满足预设条件,则将所述意图数量对应的意图确定为所述客户咨询语句的目标意图。
9.根据权利要求1所述的方法,其特征在于,所述意图识别的方法应用于智能客服,所述要素信息包括所述客户咨询语句对应的业务信息、功能信息和操作信息。
10.一种意图识别的装置,其特征在于,包括:
获取单元,用于获取客户咨询语句;
提取单元,用于将所述客户咨询语句输入要素提取模型,以提取所述客户咨询语句的词特征向量,所述要素提取模型包括文本分类分支和实体识别分支;
所述提取单元,还用于将所述词特征向量输入所述实体识别分支,以得到实体信息,具体包括:将所述词特征向量输入全连接层,以得到实体输出向量;确定所述实体输出向量中的分类信息;根据所述分类信息获取所述实体输出向量对应的掩模向量;
所述提取单元,还用于将所述词特征向量输入所述文本分类分支,以得到类别信息,具体包括:对所述词特征向量和所述掩模向量进行点积操作,以得到输入词向量;基于自注意力机制对所述输入词向量进行处理,以得到分类向量;将所述分类向量进行归一化,以得到类别信息;所述类别信息用于指示所述实体信息所属的类别;
所述提取单元,还用于根据所述类别信息和所述实体信息,确定与所述客户咨询语句对应的至少两个提取维度的要素信息,所述提取维度基于所述客户咨询语句对应的类别信息和实体信息确定;
确定单元,用于基于所述要素信息确定所述客户咨询语句的初始意图;
识别单元,用于根据预设客户意图图谱对所述初始意图进行识别,确定目标意图范围;
所述识别单元,还用于基于所述目标意图范围确定所述客户咨询语句的目标意图。
11.根据权利要求10所述的装置,其特征在于,所述提取单元,具体用于将所述客户咨询语句输入要素提取模型,按照预设规则提取所述客户咨询语句的词特征;
所述提取单元,具体用于对所述词特征进行编码,以得到所述词特征向量。
12.根据权利要求10所述的装置,其特征在于,所述确定单元,具体用于基于所述要素信息确定标注实体词;
所述确定单元,具体用于获取所述预设客户意图图谱中对应的多个预测实体词;
所述确定单元,具体用于根据所述标注实体词和所述预测实体词对应的编辑距离确定所述初始意图。
13.根据权利要求10所述的装置,其特征在于,所述确定单元,具体用于基于所述要素信息对应的第三方标识;
所述确定单元,具体用于根据所述第三方标识确定为所述初始意图。
14.根据权利要求10所述的装置,其特征在于,所述识别单元,具体用于基于所述初始意图确定查询索引;
所述识别单元,具体用于根据所述查询索引遍历所述预设客户意图图谱,以确定所述目标意图范围。
15.根据权利要求10所述的装置,其特征在于,所述识别单元,还用于获取识别记录,所述识别记录基于所述客户咨询语句确定;
所述识别单元,还用于根据所述识别记录中记录的至少一个相邻识别操作确定候选要素;
所述识别单元,还用于根据所述候选要素对所述要素信息进行更新。
16.根据权利要求15所述的装置,其特征在于,所述识别单元,具体用于确定所述候选要素与所述要素信息中要素的要素对应关系;
所述识别单元,具体用于根据所述要素对应关系确定要素替换项;
所述识别单元,具体用于根据所述要素替换项对所述要素信息进行更新。
17.根据权利要求10所述的装置,其特征在于,所述识别单元,具体用于获取所述目标意图范围中包含的意图数量;
所述识别单元,具体用于若所述意图数量满足预设条件,则将所述意图数量对应的意图确定为所述客户咨询语句的目标意图。
18.一种计算机设备,其特征在于,所述计算机设备包括处理器以及存储器:
所述存储器用于存储程序代码;所述处理器用于根据所述程序代码中的指令执行权利要求1至9任一项所述的意图识别的方法。
19.一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述权利要求1至9任一项所述的意图识别的方法。
CN202010348871.8A 2020-04-28 2020-04-28 一种意图识别的方法以及相关装置 Active CN111553162B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010348871.8A CN111553162B (zh) 2020-04-28 2020-04-28 一种意图识别的方法以及相关装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010348871.8A CN111553162B (zh) 2020-04-28 2020-04-28 一种意图识别的方法以及相关装置

Publications (2)

Publication Number Publication Date
CN111553162A CN111553162A (zh) 2020-08-18
CN111553162B true CN111553162B (zh) 2023-09-22

Family

ID=72001716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010348871.8A Active CN111553162B (zh) 2020-04-28 2020-04-28 一种意图识别的方法以及相关装置

Country Status (1)

Country Link
CN (1) CN111553162B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11907665B2 (en) * 2020-05-11 2024-02-20 Rajiv Trehan Method and system for processing user inputs using natural language processing
CN111813899A (zh) * 2020-08-31 2020-10-23 腾讯科技(深圳)有限公司 基于多轮会话的意图识别方法及装置
CN112015921B (zh) * 2020-09-15 2024-04-16 重庆广播电视大学重庆工商职业学院 一种基于学习辅助知识图谱的自然语言处理方法
CN112749761A (zh) * 2021-01-22 2021-05-04 上海机电工程研究所 基于注意力机制和循环神经网络的敌方作战意图识别方法及系统
CN112906367B (zh) * 2021-02-08 2024-10-18 上海宏原信息科技有限公司 消费者文本的信息提取结构,标注方法和识别方法
CN112905765B (zh) * 2021-02-09 2024-06-18 联想(北京)有限公司 一种信息处理方法及装置
CN113064997B (zh) * 2021-04-22 2024-05-07 中国平安财产保险股份有限公司 基于bert模型的意图分析方法、装置、设备及介质
CN113220828B (zh) * 2021-04-28 2023-07-21 平安科技(深圳)有限公司 意图识别模型处理方法、装置、计算机设备及存储介质
CN115510196B (zh) * 2021-06-07 2024-07-23 马上消费金融股份有限公司 知识图谱的构建方法、问答方法、装置和存储介质
CN114281959B (zh) * 2021-10-27 2024-03-19 腾讯科技(深圳)有限公司 语句处理的方法、装置、设备、介质及计算机程序产品
CN114490971B (zh) * 2021-12-30 2024-04-05 重庆特斯联智慧科技股份有限公司 基于人机对话交互的机器人控制方法及系统
CN114168756B (zh) * 2022-01-29 2022-05-13 浙江口碑网络技术有限公司 搜索意图的查询理解方法和装置,存储介质和电子设备
CN115840808B (zh) * 2022-12-27 2023-08-11 广州汉申科技中介服务有限公司 科技项目咨询方法、装置、服务器及计算机可读存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107862005A (zh) * 2017-10-25 2018-03-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN108153901A (zh) * 2018-01-16 2018-06-12 北京百度网讯科技有限公司 基于知识图谱的信息推送方法和装置
CN108446286A (zh) * 2017-02-16 2018-08-24 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN109446306A (zh) * 2018-10-16 2019-03-08 浪潮软件股份有限公司 一种基于任务驱动的多轮对话的智能问答方法
CN109716325A (zh) * 2016-09-13 2019-05-03 微软技术许可有限责任公司 计算机化的自然语言查询意图分派
CN109885660A (zh) * 2019-02-22 2019-06-14 上海乐言信息科技有限公司 一种知识图谱赋能的基于信息检索的问答系统和方法
CN110134969A (zh) * 2019-05-27 2019-08-16 北京奇艺世纪科技有限公司 一种实体识别方法和装置
CN110570920A (zh) * 2019-08-20 2019-12-13 华东理工大学 一种基于集中注意力模型的实体、关系联合学习方法
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10395180B2 (en) * 2015-03-24 2019-08-27 International Business Machines Corporation Privacy and modeling preserved data sharing

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109716325A (zh) * 2016-09-13 2019-05-03 微软技术许可有限责任公司 计算机化的自然语言查询意图分派
CN108446286A (zh) * 2017-02-16 2018-08-24 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN107862005A (zh) * 2017-10-25 2018-03-30 阿里巴巴集团控股有限公司 用户意图识别方法及装置
CN108153901A (zh) * 2018-01-16 2018-06-12 北京百度网讯科技有限公司 基于知识图谱的信息推送方法和装置
CN109446306A (zh) * 2018-10-16 2019-03-08 浪潮软件股份有限公司 一种基于任务驱动的多轮对话的智能问答方法
CN109885660A (zh) * 2019-02-22 2019-06-14 上海乐言信息科技有限公司 一种知识图谱赋能的基于信息检索的问答系统和方法
CN110134969A (zh) * 2019-05-27 2019-08-16 北京奇艺世纪科技有限公司 一种实体识别方法和装置
CN110570920A (zh) * 2019-08-20 2019-12-13 华东理工大学 一种基于集中注意力模型的实体、关系联合学习方法
CN110659366A (zh) * 2019-09-24 2020-01-07 Oppo广东移动通信有限公司 语义解析方法、装置、电子设备以及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于多通道卷积神经网的实体关系抽取;肜博辉 等;《计算机应用研究》;第34卷(第03期);689-692 *

Also Published As

Publication number Publication date
CN111553162A (zh) 2020-08-18

Similar Documents

Publication Publication Date Title
CN111553162B (zh) 一种意图识别的方法以及相关装置
CN110599557B (zh) 图像描述生成方法、模型训练方法、设备和存储介质
CN110490213B (zh) 图像识别方法、装置及存储介质
CN110162770B (zh) 一种词扩展方法、装置、设备及介质
CN111177371B (zh) 一种分类方法和相关装置
CN113821589B (zh) 一种文本标签的确定方法及装置、计算机设备和存储介质
CN111597804B (zh) 一种实体识别模型训练的方法以及相关装置
CN111709398A (zh) 一种图像识别的方法、图像识别模型的训练方法及装置
CN111651604B (zh) 基于人工智能的情感分类方法和相关装置
CN112214605A (zh) 一种文本分类方法和相关装置
CN113761122A (zh) 一种事件抽取方法、相关装置、设备及存储介质
CN113850078B (zh) 基于机器学习的多意图识别方法、设备及可读存储介质
CN114840499B (zh) 一种表描述信息的生成方法、相关装置、设备及存储介质
CN113407738B (zh) 一种相似文本检索方法、装置、电子设备和存储介质
CN110781274A (zh) 一种问答对生成的方法与装置
CN114428842A (zh) 一种扩充问答库的方法、装置、电子设备及可读存储介质
CN116975295B (zh) 一种文本分类方法、装置及相关产品
CN115730047A (zh) 一种智能问答方法、设备、装置及存储介质
CN113342944A (zh) 一种语料泛化方法、装置、设备及存储介质
CN114840563B (zh) 一种字段描述信息的生成方法、装置、设备及存储介质
CN113536743B (zh) 一种文本处理方法和相关装置
CN114398482A (zh) 一种词典构造方法、装置、电子设备及存储介质
CN113821609A (zh) 一种答案文本的获取方法及装置、计算机设备和存储介质
CN113569043A (zh) 一种文本类别确定方法和相关装置
CN115455160B (zh) 一种多文档阅读理解方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40027852

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant