CN112989003B - 意图识别方法、装置、处理设备及介质 - Google Patents

意图识别方法、装置、处理设备及介质 Download PDF

Info

Publication number
CN112989003B
CN112989003B CN202110359907.7A CN202110359907A CN112989003B CN 112989003 B CN112989003 B CN 112989003B CN 202110359907 A CN202110359907 A CN 202110359907A CN 112989003 B CN112989003 B CN 112989003B
Authority
CN
China
Prior art keywords
intention
atomic
dialog
target
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110359907.7A
Other languages
English (en)
Other versions
CN112989003A (zh
Inventor
黄诗磊
张聪
范长杰
胡志鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202110359907.7A priority Critical patent/CN112989003B/zh
Publication of CN112989003A publication Critical patent/CN112989003A/zh
Application granted granted Critical
Publication of CN112989003B publication Critical patent/CN112989003B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Computation (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Machine Translation (AREA)

Abstract

本发明提供一种意图识别方法、装置、处理设备及介质,涉及数据处理技术领域。该方法包括:获取输入的待识别对话;采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果;原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;根据第一意图分类结果,确定待识别对话对应的第一目标原子意图;对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果;若匹配结果为待识别对话中具有第一关键词,则从预先创建的第一目标原子意图的多个意图中,确定具有第一关键词的意图为待识别对话的目标意图。显著减少了所需的训练语料的数量,提高了用户体验。

Description

意图识别方法、装置、处理设备及介质
技术领域
本发明涉及数据处理技术领域,具体而言,涉及一种意图识别方法、装置、处理设备及介质。
背景技术
随着人工智能技术的发展,智能对话已经应用在越来越多的行业和领域。意图识别可以用于判断对话语句的意图,意图识别也成为了智能对话中必不可少的一部分。
相关技术中,人工编写每个意图的标注语料获取多个意图的标注语料;根据多个意图的标注语料训练得到多分类模型,采用多分类模型对输入的对话语句进行分类得到对话语句对应的意图。
但是,相关技术中,需要人工编写每个意图的标注语料,增加了人工编写标注语料的负担,降低了用户的体验。
发明内容
本发明的目的在于,针对上述现有技术中的不足,提供一种意图识别方法、装置、处理设备及介质,以便解决相关技术中,需要人工编写每个意图的标注语料,增加了人工编写标注语料的负担,降低了用户的体验的问题。
为实现上述目的,本发明实施例采用的技术方案如下:
第一方面,本发明实施例提供了一种意图识别方法,包括:
获取输入的待识别对话;
采用预设的原子意图模型,对所述待识别对话进行分类处理,确定所述待识别对话的第一意图分类结果;所述原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;
根据所述第一意图分类结果,确定所述待识别对话对应的第一目标原子意图;
对所述待识别对话和所述第一目标原子意图进行关键词匹配,得到匹配结果;
若所述匹配结果为所述待识别对话中具有第一关键词,则从预先创建的所述第一目标原子意图的多个意图中,确定具有所述第一关键词的意图为所述待识别对话的目标意图。
可选的,所述对所述待识别对话和所述第一目标原子意图进行关键词匹配,得到匹配结果之前,所述方法还包括:
创建所述每个原子意图对应的多个意图,每个意图中具有一组预设关键词。
可选的,所述创建所述每个原子意图对应的多个意图,包括:
获取输入的意图创建话术;
根据所述意图创建话术,从所述多个原子意图中确定第二目标原子意图;
获取针对所述第二目标原子意图输入的第二关键词;
根据所述第二目标原子意图、所述第二关键词,创建所述第二目标原子意图对应的一个意图,所述一个意图中具有所述第二关键词。
可选的,所述根据所述意图创建话术,从所述多个原子意图中确定第二目标原子意图,包括:
采用所述原子意图模型,对所述意图创建话术进行分类处理,确定所述意图创建话术的第二意图分类结果;
根据所述第二意图分类结果,确定所述第二目标原子意图。
可选的,所述第二意图分类结果包括:所述多个原子意图的创建分类概率,所述每个原子意图的创建分类概率用于指示所述意图创建话术被分类为所述每个原子意图的概率;
所述根据所述第二意图分类结果,确定所述第二目标原子意图,包括:
根据所述多个原子意图的创建分类概率,确定所述第二目标原子意图。
可选的,所述根据所述多个原子意图的分类概率,确定所述第二目标原子意图,包括:
展示所述多个原子意图的分类概率;
根据输入的原子意图选择操作,确定所述第二目标原子意图。
可选的,所述第一意图分类结果包括:所述多个原子意图的对话分类概率,所述每个原子意图的对话分类概率用于指示所述待识别对话被分类为所述每个原子意图的概率;
所述根据所述第一意图分类结果,确定所述待识别对话对应的第一目标原子意图,包括:
根据所述多个原子意图的对话分类概率,选择对话分类概率最高的一个原子意图为所述第一目标原子意图。
可选的,所述采用预设的原子意图模型,对所述待识别对话进行分类处理,确定所述待识别对话的第一意图分类结果之前,所述方法还包括:
对预设的意图数据库中的各个意图进行主宾缺失处理,得到所述多个原子意图。
可选的,所述意图数据库包括:预设业务图谱中的业务意图,和/或,预设知识图谱中的知识意图。
第二方面,本发明实施例还提供了一种意图识别装置,包括:
获取模块,用于获取输入的待识别对话;
处理模块,用于采用预设的原子意图模型,对所述待识别对话进行分类处理,确定所述待识别对话的第一意图分类结果;所述原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;
第一确定模块,用于根据所述第一意图分类结果,确定所述待识别对话对应的第一目标原子意图;
匹配模块,用于对所述待识别对话和所述第一目标原子意图进行关键词匹配,得到匹配结果;
第二确定模块,用于若所述匹配结果为所述待识别对话中具有第一关键词,则从预先创建的所述第一目标原子意图的多个意图中,确定具有所述第一关键词的意图为所述待识别对话的目标意图。
可选的,所述装置还包括:
创建模块,用于创建所述每个原子意图对应的多个意图,每个意图中具有一组预设关键词。
可选的,所述创建模块,还用于获取输入的意图创建话术;根据所述意图创建话术,从所述多个原子意图中确定第二目标原子意图;获取针对所述第二目标原子意图输入的第二关键词;根据所述第二目标原子意图、所述第二关键词,创建所述第二目标原子意图对应的一个意图,所述一个意图中具有所述第二关键词。
可选的,所述创建模块,还用于采用所述原子意图模型,对所述意图创建话术进行分类处理,确定所述意图创建话术的第二意图分类结果;根据所述第二意图分类结果,确定所述第二目标原子意图。
可选的,所述第二意图分类结果包括:所述多个原子意图的创建分类概率,所述每个原子意图的创建分类概率用于指示所述意图创建话术被分类为所述每个原子意图的概率;
所述创建模块,还用于根据所述多个原子意图的创建分类概率,确定所述第二目标原子意图。
可选的,所述创建模块,还用于展示所述多个原子意图的分类概率;根据输入的原子意图选择操作,确定所述第二目标原子意图。
可选的,所述第一意图分类结果包括:所述多个原子意图的对话分类概率,所述每个原子意图的对话分类概率用于指示所述待识别对话被分类为所述每个原子意图的概率;
所述第一确定模块,还用于根据所述多个原子意图的对话分类概率,选择对话分类概率最高的一个原子意图为所述第一目标原子意图。
可选的,所述装置还包括:
第一处理模块,用于对预设的意图数据库中的各个意图进行主宾缺失处理,得到所述多个原子意图。
可选的,所述意图数据库包括:预设业务图谱中的业务意图,和/或,预设知识图谱中的知识意图。
第三方面,本发明实施例还提供了一种处理设备,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面任一项所述的意图识别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述第一方面任一项所述的意图识别方法。
本发明的有益效果是:本发明实施例提供一种意图识别方法,包括:获取输入的待识别对话;采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果;原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;根据第一意图分类结果,确定待识别对话对应的第一目标原子意图;对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果;若匹配结果为待识别对话中具有第一关键词,则从预先创建的第一目标原子意图的多个意图中,确定具有第一关键词的意图为待识别对话的目标意图。原子意图模型是基于多个原子意图的训练语料训练得到的,每个原子意图可以对应一类意图,每类意图有相应的训练语料,无需针对每个意图编写训练语料,显著减少了所需的训练语料的数量,提高了用户体验。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明实施例提供的一种意图识别方法的流程示意图;
图2为本发明实施例提供的一种意图识别方法的流程示意图;
图3为本发明实施例提供的一种意图识别方法的流程示意图;
图4为本发明实施例提供的一种意图识别方法的流程示意图;
图5为本发明实施例提供的一种意图识别装置的结构示意图;
图6为本发明实施例提供的一种处理设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
相关技术中,人工编写每个意图的标注语料获取多个意图的标注语料;根据多个意图的标注语料训练得到多分类模型,采用多分类模型对输入的对话语句进行分类得到对话语句对应的意图。针对相关技术中,需要人工编写每个意图的标注语料,增加了人工编写标注语料的负担,降低了用户的体验的问题。本申请实施例提供一种意图识别方法,原子意图模型是基于多个原子意图的训练语料训练得到的,每个原子意图可以对应一类意图,每类意图有相应的训练语料,无需针对每个意图编写训练语料,显著减少了所需的训练语料的数量,提高了用户体验。
本申请实施例提供一种意图识别方法,其执行主体可以为处理设备,处理设备可以为终端或者服务器,例如,终端可以为台式电脑、笔记本电脑、平板电脑、智能手机中的任一个,处理设备还可以为其他类型具备处理功能的设备,本申请实施例对此不进行具体限制。以下以处理设备为执行主体,对本申请实施例提供的意图识别方法进行解释说明。
图1为本发明实施例提供的一种意图识别方法的流程示意图,如图1所示,该方法包括:
S101、获取输入的待识别对话。
其中,待识别对话可以为对话语句。对话语句可以为预设领域中的语句,例如,预设领域可以为下述领域中的任意一个:游戏领域、购物领域、检索领域等等,当然预设领域还可以为其他领域,本申请实施例对此不进行具体限制。
在一些实施方式中,处理设备可以响应用户的输入操作获取待识别对话。其中,该输入操作可以触控操作,也可以为采用外接设备例如鼠标、键盘输入的操作,还可以为语音输入的操作。
可选的,用户可以通过平台界面输入待识别对话。
S102、采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果。
其中,原子意图模型可以为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图。多个原子意图可以为高频、可复用的原子意图。
在一些实施方式中,可以采用预设的语言模型对待识别对话进行预处理,得到待识别对话对应的句向量,将待识别对话对应的句向量输入预设的原子意图模型中,预设的原子意图模型可以对待识别对话对应的句向量进行分类处理,得到待识别对话的第一意图分类结果。
需要说明的是,预设的语言模型可以包括第一语言模型和第二语言模型。采用第一语言模型可以获取待识别对话中每个字的字向量,继而将多个字向量的平均值作为第一句向量;采用第一语言模型可以获取待识别对话中每个词的词向量,继而将多个词向量的平均值作为第二句向量,句向量可以包括第一句向量和第二句向量。
当然,预设的原子意图模型也可以直接对待识别对话进行处理,本申请实施例对此不进行具体限制。
S103、根据第一意图分类结果,确定待识别对话对应的第一目标原子意图。
在一种可能的实施方式中,第一意图分类结果中可以包括原子意图模型输出的一个原子意图,处理设备可以直接将该输出的原子意图作为第一目标原子意图。
在另一种可能的实施方式中,第一意图分类结果中可以包括原子意图模型输出的多个原子意图,以及各原子意图与待识别对话匹配的匹配结果,继而处理设备采用确定算法,根据多个原子意图和多个匹配结果,从多个原子意图中确定第一目标原子意图。
S104、对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果。
其中,预先创建的第一目标原子意图可以对应多个意图,每个意图具有对应的至少一个关键词。
在一些实施方式中,处理设备可以提取待识别对话中的对话关键词,判断对话关键词与第一目标原子意图中多个意图对应的关键词是否匹配,得到匹配结果。
S105、若匹配结果为待识别对话中具有第一关键词,则从预先创建的第一目标原子意图的多个意图中,确定具有第一关键词的意图为待识别对话的目标意图。
其中,第一目标原子意图的多个意图可以称为私有意图,待识别对话的目标意图可以为第一目标原子意图的多个意图中的一个意图。
在本申请实施例中,第一目标原子意图的多个意图中有一个意图对应的关键词包括第一关键词,当待识别对话的对话关键词也包括第一关键词时,可以确定具有第一关键词的意图为待识别对话的目标意图。
另外,每个意图可以绑定相应的操作,当确定目标意图后,可以执行目标意图所绑定的操作。可选的,绑定的操作可以为展示操作或者播放音频操作,例如,当确定目标意图后,处理设备可以执行目标意图所绑定的展示操作,实现向用户展示对话答复信息,以实现对于待识别对话的答复。其中,对话答复信息可以为文字信息、图片信息、视频信息等等。
综上所述,本发明实施例提供一种意图识别方法,包括:获取输入的待识别对话;采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果;原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;根据第一意图分类结果,确定待识别对话对应的第一目标原子意图;对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果;若匹配结果为待识别对话中具有第一关键词,则从预先创建的第一目标原子意图的多个意图中,确定具有第一关键词的意图为待识别对话的目标意图。原子意图模型是基于多个原子意图的训练语料训练得到的,每个原子意图可以对应一类意图,每类意图有相应的训练语料,无需针对每个意图编写训练语料,显著减少了所需的训练语料的数量,提高了用户体验。
而且,原子意图减轻了用户编写训练语料的负担。提升了意图识别平台和系统的易用性。基于多个原子意图的训练语料训练得到原子意图模型,继而基于原子意图模型和关键词获取多个意图,在更新时,无需对原子意图模型进行重新训练,用户仅需要对关键词信息进行更新,便可以得到更新后的多个意图,可以实现快速应用,提升了系统更新的实时性。满足了用户快速体验意图识别功能、即时验证更新后逻辑的需求。在实际应用中,意图识别方法可以应用在对话机器人中,可以改善对话机器人的更新实时性。
当原子意图为“***的联系方式”时,对应的训练语料可以为“你知道联系方式吗”、“我该如何联系呢”、“怎么能联系”等成分缺失的语料,其中,介绍的内容可以为某公司、某组织、某人物等等。当原子意图为“介绍***”时,对应的训练语料可以为“可以给我介绍一下吗”,“能不能介绍一下”,“我想了解一下”等成分缺失的语料,联系方式可以为某公司、某组织、某人物的联系方式。
可选的,在上述S104中对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果的过程之前,方法还可以包括:
创建每个原子意图对应的多个意图,每个意图中具有一组预设关键词。
其中,一组预设关键词可以包括至少一个关键词,当关键词的数量为多个时,一组预设关键词可以表征含义相同的多个关键词。
在一些实施方式中,处理设备可以获取输入的针对每个原子意图的一组预设关键词,根据该一组预设关键词和该原子意图确定原子意图对应的一意图;处理设备可以获取针对每个原子意图的又一组预设关键词,根据该又一组预设关键词和该原子意图确定原子意图对应的又一意图;同理地,可以实现创建每个原子意图对应的多个意图。
可选的,图2为本发明实施例提供的一种意图识别方法的流程示意图,如图2所示,上述创建每个原子意图对应的多个意图的过程,可以包括:
S201、获取输入的意图创建话术。
其中,意图创建话术可以为完整对话语句。
需要说明的是,可以响应用户的输入操作获取意图创建话术,也可以从预设位置处的文件中自动获取意图创建话术,还可以采用其他方式获取意图创建话术,本申请实施例对此不进行具体限制。
S202、根据意图创建话术,从多个原子意图中确定第二目标原子意图。
在本申请实施例中,处理设备可以从多个原子意图中确定与意图创建话术最为匹配的原子意图,为第二目标原子意图。
S203、获取针对第二目标原子意图输入的第二关键词。
其中,处理设备可以响应用户的输入操作获取第二关键词。
可选的,第二关键词可以包括意图创建话术中的关键词,也可以包括与意图创建话术中的关键词含义相同的关键词,还可以包括其他与意图创建话术的关键词无必然联系的关键词。
S204、根据第二目标原子意图、第二关键词,创建第二目标原子意图对应的一个意图,一个意图中具有第二关键词。
在一种可能的实施方式中,处理设备可以根据第二目标原子意图、第二关键词,创建第二目标原子意图对应的一个意图,则一个意图中具有第二关键词;也可以根据第二目标原子意图、第二关键词、第二关键词的近义词,创建第二目标原子意图对应的一个意图,则一个意图中具有第二关键词、第二关键词的近义词。
另外,处理设备还可以获取针对第二目标原子意图输入的其他关键词,处理设备还可以根据第二目标原子意图、其他关键词,创建第二目标原子意图对应的又一个意图,又一个意图中具有其他关键词。
例如,意图创建话术可以为“介绍一下A公司”,则第二目标原子意图可以为“介绍***”,第二关键词可以为“A公司”,则第二目标原子意图对应的一个意图可以为“介绍A公司”。
当然,第二关键词也可以包括“A公司”和“A1公司”,其中,“A1公司”为“A公司”的近义词,第二目标原子意图的一个意图“介绍A公司”对应的关键词为“A公司”和“A1公司”。
在实际应用过程,待识别对话可以为“能否给我介绍一下A公司”,待识别对话的第一意图分类结果可以为“介绍***”,待识别对话的关键词为“A公司”,待识别对话的关键词“A公司”也为意图“介绍A公司”的关键词,则可以确定意图“介绍A公司”为目标意图;待识别对话可以为“能否给我介绍一下A1公司”,待识别对话的关键词为“A1公司”,确定待识别对话的关键词“A1公司”也为意图“介绍A公司”的关键词,也可以确定意图“介绍A公司”为目标意图。
可选的,图3为本发明实施例提供的一种意图识别方法的流程示意图,如图3所示,上述S202中根据意图创建话术,从多个原子意图中确定第二目标原子意图的过程,可以包括:
S301、采用原子意图模型,对意图创建话术进行分类处理,确定意图创建话术的第二意图分类结果。
可选的,处理设备可以采用预设的语言模型对意图创建话术进行预处理,得到意图创建话术对应的句向量,将意图创建话术对应的句向量输入预设的原子意图模型中,预设的原子意图模型可以对意图创建话术对应的句向量进行分类处理,得到意图创建话术的第一意图分类结果。
需要说明的是,预设的语言模型可以包括第一语言模型和第二语言模型。采用第一语言模型可以获取意图创建话术中每个字的字向量,继而将多个字向量的平均值作为第一句向量;采用第一语言模型可以获取意图创建话术中每个词的词向量,继而将多个词向量的平均值作为第二句向量,句向量可以包括第一句向量和第二句向量。
当然,处理设备也可以直接对意图创建话术进行分类处理,本申请实施例对此不进行具体限制。
S302、根据第二意图分类结果,确定第二目标原子意图。
在本申请实施例中,第二意图分类结果中可以包括输出的一个原子意图,可以直接将该输出的一个原子意图作为第二目标原子意图。
当然,第二意图分类结果中也可以包括多个原子意图、以及各原子意图的匹配结果,处理设备可以根据各原子意图与意图创建话术的匹配结果,从多个原子意图中确定第二目标原子意图。
综上所述,采用原子意图模型,对意图创建话术进行分类处理,确定意图创建话术的第二意图分类结果;根据第二意图分类结果,确定第二目标原子意图。使得确定第二目标原子意图更加准确。
可选的,第二意图分类结果包括:多个原子意图的创建分类概率,每个原子意图的创建分类概率用于指示意图创建话术被分类为每个原子意图的概率;
上述S302中根据第二意图分类结果,确定第二目标原子意图的过程,可以包括:
根据多个原子意图的创建分类概率,确定第二目标原子意图。
其中,处理设备可以自动根据多个原子意图的创建分类概率,确定第二目标原子意图;也可以响应输入的针对第二目标原子意图的确定操作,确定第二目标原子意图。
在本申请实施例中,处理设备可以将创建分类概率大于预设分类概率的原子意图,作为第二目标原子意图;处理设备还可以对多个原子意图的创建分类概率进行排序,得到排序后的多个创建分类概率,将排序后的多个创建分类概率中预设位数的创建分类概率对应的原子意图,确定为第二目标原子意图,处理设备还可以采用其他方式,根据多个原子意图的创建分类概率,确定第二目标原子意图,本申请实施例对此不进行具体限制。
另外,处理设备可以采用由小至大或者由大至小的方式对创建分类概率进行排序。
可选的,图4为本发明实施例提供的一种意图识别方法的流程示意图,如图4所示,上述根据多个原子意图的分类概率,确定第二目标原子意图的过程,可以包括:
S401、展示多个原子意图的分类概率。
其中,处理设备可以展示多个原子意图、以及各个原子意图的分类概率。
需要说明的是,处理设备可以以文字的方式展示多个原子意图的分类概率,也可以以表格的方式展示多个原子意图的分类概率,还可以以结构化图形的方式展示多个原子意图的分类概率。
另外,可以向用户展示多个原子意图的分类概率,用户可以获知多个原子意图的分类概率。
S402、根据输入的原子意图选择操作,确定第二目标原子意图。
其中,原子意图选择操作可以为触控操作,也可以为采用处理设备的外接设备例如鼠标或者键盘输入的操作,还可以为其他类型的操作,本申请实施例对此不进行具体限制。
例如,原子意图选择操作可以为触控操作时,触控操作可以为针对多个原子意图中第二目标原子意图的单击操作或者双击操作,处理设备可以响应输入的触控操作确定第二目标原子意图。
综上所述,展示多个原子意图的分类概率;根据输入的原子意图选择操作,确定第二目标原子意图。使得第二目标原子意图的确定更加灵活。
可选的,第一意图分类结果包括:多个原子意图的对话分类概率,每个原子意图的对话分类概率用于指示待识别对话被分类为每个原子意图的概率;
上述S103中根据第一意图分类结果,确定待识别对话对应的第一目标原子意图的过程,可以包括:
根据多个原子意图的对话分类概率,选择对话分类概率最高的一个原子意图为第一目标原子意图。
在一种可能的实施方式中,处理设备可以对多个原子意图的对话分类概率进行由大至小的排序,得到排序后的多个对话分类概率;继而将排序后的多个对话分类概率中首个对话分类概率对应的原子意图,作为第一目标原子意图。
在另一种可能的实施方式中,处理设备可以对多个原子意图的对话分类概率进行由小至大的排序,得到排序后的多个对话分类概率;继而将排序后的多个对话分类概率中最后一个对话分类概率对应的原子意图,作为第一目标原子意图。
当然,处理设备还可以将排序后的多个对话分类概率,第预设位数个对话分类概率对应的原子意图,作为第一目标原子意图。
综上所述,根据多个原子意图的对话分类概率,选择对话分类概率最高的一个原子意图为第一目标原子意图,使得原子意图模型与待识别对话最为匹配的第一目标原子意图,以便后续获取与待识别对话最为匹配的目标意图。
可选的,上述S102中采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果的过程之前,方法还可以包括:
对预设的意图数据库中的各个意图进行主宾缺失处理,得到多个原子意图。
在本申请实施例中,处理设备可以对预设的意图数据库中的各个意图进行主语缺失处理,也可以对预设的意图数据库中的各个意图进行宾语缺失处理,还可以对预设的意图数据库中的各个意图进行主语和宾语缺失处理。
例如,“介绍***”是宾语缺失情况下获取的原子意图;“***的联系方式”是主语缺失情况下获取的原子意图。
可选的,处理设备可以对业务中常用的意图进行抽象,得到多个原子意图,该多个原子意图可以在不同的业务和项目中实现复用。
可选的,意图数据库包括:预设业务图谱中的业务意图,和/或,预设知识图谱中的知识意图。
其中,预设知识图谱中的知识意图可以为以表格或者结构化的图形所表示的知识意图。
需要说明的是,意图数据库可以仅包括预设业务图谱中的业务意图,或者预设知识图谱中的知识意图,也可以同时包括预设业务图谱中的业务意图和预设知识图谱中的知识意图。
在本申请实施例中,意图数据库包括:预设业务图谱中的业务意图,和/或,预设知识图谱中的知识意图,使得意图数据库中的意图更加丰富、灵活。
综上所述,本申请实施例提供一种意图识别方法,包括:获取输入的待识别对话;采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果;原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;根据第一意图分类结果,确定待识别对话对应的第一目标原子意图;对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果;若匹配结果为待识别对话中具有第一关键词,则从预先创建的第一目标原子意图的多个意图中,确定具有第一关键词的意图为待识别对话的目标意图。原子意图模型是基于多个原子意图的训练语料训练得到的,每个原子意图可以对应一类意图,每类意图有相应的训练语料,无需针对每个意图编写训练语料,显著减少了所需的训练语料的数量,提高了用户体验。
而且,原子意图减轻了用户编写训练语料的负担。提升了意图识别平台和系统的易用性。基于多个原子意图的训练语料训练得到原子意图模型,继而基于原子意图模型和关键词获取多个意图,在更新时,无需对原子意图模型进行重新训练,仅对关键词进行更新,便可以得到更新后的多个意图,可以实现快速应用,提升了系统更新的实时性。满足了用户快速体验意图识别功能、即时验证更新后逻辑的需求。
下述对用以执行本申请所提供的意图识别方法的意图识别装置、电子设备及介质等进行说明,其具体的实现过程以及技术效果参见上述意图识别方法的相关内容,下述不再赘述。
图5为本发明实施例提供的一种意图识别装置的结构示意图,如图5所示,该意图识别装置可以包括:
获取模块501,用于获取输入的待识别对话;
处理模块502,用于采用预设的原子意图模型,对待识别对话进行分类处理,确定待识别对话的第一意图分类结果;原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;
第一确定模块503,用于根据第一意图分类结果,确定待识别对话对应的第一目标原子意图;
匹配模块504,用于对待识别对话和第一目标原子意图进行关键词匹配,得到匹配结果;
第二确定模块505,用于若匹配结果为待识别对话中具有第一关键词,则从预先创建的第一目标原子意图的多个意图中,确定具有第一关键词的意图为待识别对话的目标意图。
可选的,装置还包括:
创建模块,用于创建每个原子意图对应的多个意图,每个意图中具有一组预设关键词。
可选的,创建模块,还用于获取输入的意图创建话术;根据意图创建话术,从多个原子意图中确定第二目标原子意图;获取针对第二目标原子意图输入的第二关键词;根据第二目标原子意图、第二关键词,创建第二目标原子意图对应的一个意图,一个意图中具有第二关键词。
可选的,创建模块,还用于采用原子意图模型,对意图创建话术进行分类处理,确定意图创建话术的第二意图分类结果;根据第二意图分类结果,确定第二目标原子意图。
可选的,第二意图分类结果包括:多个原子意图的创建分类概率,每个原子意图的创建分类概率用于指示意图创建话术被分类为每个原子意图的概率;
创建模块,还用于根据多个原子意图的创建分类概率,确定第二目标原子意图。
可选的,创建模块,还用于展示多个原子意图的分类概率;根据输入的原子意图选择操作,确定第二目标原子意图。
可选的,第一意图分类结果包括:多个原子意图的对话分类概率,每个原子意图的对话分类概率用于指示待识别对话被分类为每个原子意图的概率;
第一确定模块503,还用于根据多个原子意图的对话分类概率,选择对话分类概率最高的一个原子意图为第一目标原子意图。
可选的,装置还包括:
第一处理模块,用于对预设的意图数据库中的各个意图进行主宾缺失处理,得到多个原子意图。
可选的,意图数据库包括:预设业务图谱中的业务意图,和/或,预设知识图谱中的知识意图。
上述装置用于执行前述实施例提供的方法,其实现原理和技术效果类似,在此不再赘述。
以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific Integrated Circuit,简称ASIC),或,一个或多个微处理器(digital singnal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,简称FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(CentralProcessing Unit,简称CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,简称SOC)的形式实现。
图6为本发明实施例提供的一种处理设备的结构示意图,如图6所示,该处理设备可以包括:处理器601、存储器602。
存储器602用于存储程序,处理器601调用存储器602存储的程序,以执行上述方法实施例。具体实现方式和技术效果类似,这里不再赘述。
可选地,本发明还提供一种程序产品,例如计算机可读存储介质,包括程序,该程序在被处理器执行时用于执行上述方法实施例。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取存储器(英文:Random Access Memory,简称:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种意图识别方法,其特征在于,包括:
获取输入的待识别对话;
采用预设的原子意图模型,对所述待识别对话进行分类处理,确定所述待识别对话的第一意图分类结果;所述原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;
根据所述第一意图分类结果,确定所述待识别对话对应的第一目标原子意图;
对所述待识别对话和所述第一目标原子意图进行关键词匹配,得到匹配结果;
若所述匹配结果为所述待识别对话中具有第一关键词,则从预先创建的所述第一目标原子意图的多个意图中,确定具有所述第一关键词的意图为所述待识别对话的目标意图;
在所述采用预设的原子意图模型,对所述待识别对话进行分类处理,确定所述待识别对话的第一意图分类结果之前,所述方法还包括:
对预设的意图数据库中的各个意图进行主宾缺失处理,得到所述多个原子意图。
2.根据权利要求1所述的方法,其特征在于,所述对所述待识别对话和所述第一目标原子意图进行关键词匹配,得到匹配结果之前,所述方法还包括:
创建所述每个原子意图对应的多个意图,每个意图中具有一组预设关键词。
3.根据权利要求2所述的方法,其特征在于,所述创建所述每个原子意图对应的多个意图,包括:
获取输入的意图创建话术;
根据所述意图创建话术,从所述多个原子意图中确定第二目标原子意图;
获取针对所述第二目标原子意图输入的第二关键词;
根据所述第二目标原子意图、所述第二关键词,创建所述第二目标原子意图对应的一个意图,所述一个意图中具有所述第二关键词。
4.根据权利要求3所述的方法,其特征在于,所述根据所述意图创建话术,从所述多个原子意图中确定第二目标原子意图,包括:
采用所述原子意图模型,对所述意图创建话术进行分类处理,确定所述意图创建话术的第二意图分类结果;
根据所述第二意图分类结果,确定所述第二目标原子意图。
5.根据权利要求4所述的方法,其特征在于,所述第二意图分类结果包括:所述多个原子意图的创建分类概率,所述每个原子意图的创建分类概率用于指示所述意图创建话术被分类为所述每个原子意图的概率;
所述根据所述第二意图分类结果,确定所述第二目标原子意图,包括:
根据所述多个原子意图的创建分类概率,确定所述第二目标原子意图。
6.根据权利要求5所述的方法,其特征在于,所述根据所述多个原子意图的分类概率,确定所述第二目标原子意图,包括:
展示所述多个原子意图的分类概率;
根据输入的原子意图选择操作,确定所述第二目标原子意图。
7.根据权利要求1所述的方法,其特征在于,所述第一意图分类结果包括:所述多个原子意图的对话分类概率,所述每个原子意图的对话分类概率用于指示所述待识别对话被分类为所述每个原子意图的概率;
所述根据所述第一意图分类结果,确定所述待识别对话对应的第一目标原子意图,包括:
根据所述多个原子意图的对话分类概率,选择对话分类概率最高的一个原子意图为所述第一目标原子意图。
8.根据权利要求1所述的方法,其特征在于,所述意图数据库包括:预设业务图谱中的业务意图,和/或,预设知识图谱中的知识意图。
9.一种意图识别装置,其特征在于,包括:
获取模块,用于获取输入的待识别对话;
处理模块,用于采用预设的原子意图模型,对所述待识别对话进行分类处理,确定所述待识别对话的第一意图分类结果;所述原子意图模型为预先根据多个原子意图的训练语料进行训练得到模型,每个原子意图对应一类意图;
第一确定模块,用于根据所述第一意图分类结果,确定所述待识别对话对应的第一目标原子意图;
匹配模块,用于对所述待识别对话和所述第一目标原子意图进行关键词匹配,得到匹配结果;
第二确定模块,用于若所述匹配结果为所述待识别对话中具有第一关键词,则从预先创建的所述第一目标原子意图的多个意图中,确定具有所述第一关键词的意图为所述待识别对话的目标意图;
所述装置还包括:
第一处理模块,用于对预设的意图数据库中的各个意图进行主宾缺失处理,得到所述多个原子意图。
10.一种处理设备,其特征在于,包括:存储器和处理器,所述存储器存储有所述处理器可执行的计算机程序,所述处理器执行所述计算机程序时实现上述权利要求1-8任一项所述的意图识别方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,所述计算机程序被读取并执行时,实现上述权利要求1-8任一项所述的意图识别方法。
CN202110359907.7A 2021-04-01 2021-04-01 意图识别方法、装置、处理设备及介质 Active CN112989003B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110359907.7A CN112989003B (zh) 2021-04-01 2021-04-01 意图识别方法、装置、处理设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110359907.7A CN112989003B (zh) 2021-04-01 2021-04-01 意图识别方法、装置、处理设备及介质

Publications (2)

Publication Number Publication Date
CN112989003A CN112989003A (zh) 2021-06-18
CN112989003B true CN112989003B (zh) 2023-04-18

Family

ID=76338968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110359907.7A Active CN112989003B (zh) 2021-04-01 2021-04-01 意图识别方法、装置、处理设备及介质

Country Status (1)

Country Link
CN (1) CN112989003B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113468307B (zh) * 2021-06-30 2023-06-30 网易(杭州)网络有限公司 文本处理方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241255A (zh) * 2018-08-20 2019-01-18 华中师范大学 一种基于深度学习的意图识别方法
CN111078846A (zh) * 2019-11-25 2020-04-28 青牛智胜(深圳)科技有限公司 一种基于业务场景的多轮对话体系构建方法及系统
CN112560505A (zh) * 2020-12-09 2021-03-26 北京百度网讯科技有限公司 一种对话意图的识别方法、装置、电子设备及存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108446286B (zh) * 2017-02-16 2023-04-25 阿里巴巴集团控股有限公司 一种自然语言问句答案的生成方法、装置及服务器
CN109840276A (zh) * 2019-02-12 2019-06-04 北京健康有益科技有限公司 基于文本意图识别的智能对话方法、装置和存储介质
CN110287283B (zh) * 2019-05-22 2023-08-01 中国平安财产保险股份有限公司 意图模型训练方法、意图识别方法、装置、设备及介质
CN111611383A (zh) * 2020-05-26 2020-09-01 深圳壹账通智能科技有限公司 用户意图的识别方法、装置、计算机设备及存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109241255A (zh) * 2018-08-20 2019-01-18 华中师范大学 一种基于深度学习的意图识别方法
CN111078846A (zh) * 2019-11-25 2020-04-28 青牛智胜(深圳)科技有限公司 一种基于业务场景的多轮对话体系构建方法及系统
CN112560505A (zh) * 2020-12-09 2021-03-26 北京百度网讯科技有限公司 一种对话意图的识别方法、装置、电子设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Rey-Long Liu.Intention Classification for Retrieval of Health Questions. International Journal of Knowledge Content Development &amp Technology.2017,全文. *

Also Published As

Publication number Publication date
CN112989003A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
CN109284399B (zh) 相似度预测模型训练方法、设备及计算机可读存储介质
CN110765244A (zh) 获取应答话术的方法、装置、计算机设备及存储介质
CN111027327A (zh) 机器阅读理解方法、设备、存储介质及装置
CN110276023B (zh) Poi变迁事件发现方法、装置、计算设备和介质
CN111062217B (zh) 语言信息的处理方法、装置、存储介质及电子设备
CN111191000B (zh) 一种智能语音机器人的对话管理方法、装置和系统
CN110019742B (zh) 用于处理信息的方法和装置
CN113495900A (zh) 基于自然语言的结构化查询语言语句获取方法及装置
CN111783471B (zh) 自然语言的语义识别方法、装置、设备及存储介质
CN111274797A (zh) 用于终端的意图识别方法、装置、设备及存储介质
CN111177351A (zh) 基于规则的自然语言表达意图获取方法、装置和系统
CN110765342A (zh) 信息查询方法及装置、存储介质、智能终端
CN108776677B (zh) 平行语句库的创建方法、设备及计算机可读存储介质
CN111553150A (zh) 自动化api接口文档解析配置方法、系统、装置及存储介质
CN112579733A (zh) 规则匹配方法、规则匹配装置、存储介质及电子设备
CN107844531B (zh) 答案输出方法、装置和计算机设备
CN112989003B (zh) 意图识别方法、装置、处理设备及介质
CN111400340A (zh) 一种自然语言处理方法、装置、计算机设备和存储介质
CN112818096A (zh) 对话生成方法及其装置
CN112199958A (zh) 概念词序列生成方法、装置、计算机设备及存储介质
CN116186219A (zh) 一种人机对话交互方法方法、系统及存储介质
CN115881108A (zh) 语音识别方法、装置、设备及存储介质
CN115292492A (zh) 意图分类模型的训练方法、装置、设备及存储介质
CN111159403B (zh) 一种智能课堂感知的方法及系统
CN110532565B (zh) 语句处理方法及装置、以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant