CN116127010A - 意图识别方法、装置、电子设备及存储介质 - Google Patents
意图识别方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN116127010A CN116127010A CN202211469065.1A CN202211469065A CN116127010A CN 116127010 A CN116127010 A CN 116127010A CN 202211469065 A CN202211469065 A CN 202211469065A CN 116127010 A CN116127010 A CN 116127010A
- Authority
- CN
- China
- Prior art keywords
- intention
- target
- sentence
- determining
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 91
- 230000011218 segmentation Effects 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 11
- 239000013598 vector Substances 0.000 claims description 85
- 230000008451 emotion Effects 0.000 claims description 40
- 238000013145 classification model Methods 0.000 claims description 39
- 230000004044 response Effects 0.000 claims description 24
- 230000008909 emotion recognition Effects 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000008569 process Effects 0.000 description 27
- 239000013604 expression vector Substances 0.000 description 14
- 238000004891 communication Methods 0.000 description 9
- 230000036651 mood Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 238000003058 natural language processing Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 206010006326 Breath odour Diseases 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种意图识别方法、装置、电子设备及存储介质,该意图识别方法包括:对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息;根据上下文信息对目标句子进行意图识别得到目标意图标签。本申请的技术方案能够实现意图识别的实时性,同时提高了识别到的意图标签的准确率。
Description
技术领域
本申请涉及自然语言处理技术领域,具体涉及一种意图识别方法、装置、电子设备及存储介质。
背景技术
在客服与客户进行会话的过程中,客户可能会向客服表达多个意图,在一些情况下,需要准确识别并记录客户所表达的多个意图以供下游工作人员处理或方便后续的其他工作。一般地,可以通过人工记忆的方式记录会话过程中客户所表达的多个意图,但这种方式容易出现记错、漏记的情况。除此之外,也可以利用多意图分类模型对会话内容进行分类以得到多个意图,这种方式对模型的要求高,训练成本高,尤其在会话长度较长时,模型的分类效果差,难以得到准确的多个意图。
发明内容
有鉴于此,本申请实施例提供了一种意图识别方法、装置、电子设备及存储介质,能够实现意图识别的实时性,同时提高了识别到的意图标签的准确率。
第一方面,本申请的实施例提供了一种意图识别方法,包括:对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,上下文信息包括满足预设数量要求的多个句子;根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签。
第二方面,本申请的实施例提供了一种意图识别装置,包括:切词模块,用于对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;第一确定模块,用于确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;计算模块,用于分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;第二确定模块,用于在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,上下文信息包括满足预设数量要求的多个句子;识别模块,用于根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签。
第三方面,本申请的实施例提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器,其中,处理器用于执行上述第一方面所述的意图识别方法。
第四方面,本申请的实施例提供了一种计算机可读存储介质,存储介质存储有计算机程序,计算机程序用于执行上述第一方面所述的意图识别方法。
第五方面,本申请的实施例提供了一种计算机程序产品,所述计算机程序产品中包括指令,所述指令被计算机设备的处理器执行时,使得所述计算机设备能够执行上述第一方面所述的意图识别方法。
本申请实施例提供了一种意图识别方法、装置、电子设备及存储介质,通过确定目标句子中是否存在与关键词表中的关键词相似度高的词语,并在目标句子存在与关键词表中的关键词相似度高的词语时,确定目标句子的上下文信息,进而根据上下文信息对目标句子进行意图识别得到意图标签。由于本申请实施例可以对目标句子进行意图识别,因此可以在会话过程中,实时并持续地对客户所表达的句子进行意图识别,实现意图识别的实时性,进而实现对客服热线下的长文本进行实时的多意图识别。本申请实施例通过确定目标句子对应的目标词语中,是否存在和关键词表中的关键词具有相同字的词语,并在目标词语中存在和关键词表中的关键词具有相同字的词语时,将具有相同字的词语确定为候选词语,这样可以从目标词语中筛选出候选词语,计算候选词语与关键词之间的相似度,如此可以提高意图识别的效率。进一步地,本申请实施例通过计算候选词语与至少部分关键词之间的相似度值,并在相似度值中存在大于或等于第一预设阈值的相似度值时,对目标句子进行意图识别,这样可以提高意图识别方法的泛化性,且可以避免未对包含客户意图的句子进行意图识别的情况,避免遗漏意图标签。此外,本申请实施例通过确定目标句子的上下文信息,并根据上下文信息对目标句子进行意图识别,可以缩短每次进行意图识别的文本长度,降低识别难度,提高最终得到的意图标签的准确率。
附图说明
图1所示为本申请一示例性实施例提供的意图识别系统的系统架构示意图。
图2所示为本申请一示例性实施例提供的意图识别方法的流程示意图。
图3所示为本申请另一示例性实施例提供的意图识别方法的流程示意图。
图4所示为本申请一示例性实施例提供的意图识别装置的结构示意图。
图5所示为本申请一示例性实施例提供的用于执行意图识别方法的电子设备的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
相关技术
在客户与客服沟通交流时,客户可能会在一通会话中表达出多个意图。例如,在电销场景中,客户会向客服提出希望“购买”、“签约”、“续订”、“咨询购买条件”等多个意图;在资源获取场景中,客户会向客服提出“提前还款”、“延期还款”、“注销账户”、“利息减免”等多个意图。客服需要根据客户在会话过程中表达的意图,为当前工单记录意图标签供下游工作人员处理。而当会话长度较长,客户表达的意图较多时,通过客服记忆的方式为当前工单记录意图标签,对客服来说难度较大,如对客服的记忆力以及业务知识掌握程度等要求高;而且,通过这种方式记录意图标签容易出错且难以记录全部的意图,即意图标签的准确率难以保证,且容易出现遗漏意图标签的情况。
除了通过客服记忆的方式记录意图标签外,也可以采用多意图分类模型对整通会话进行分类,以得到多个意图标签,但是这种方式对模型的要求较高。如在一些情况下,整通会话经过语音转文本后的文本长度高达五千字以上,如果采用庞大的深度学习模型作为分类器,训练成本高、推理性能差、提单效率低。
针对上述技术问题,本申请实施例通过对会话过程中来源于客户的目标句子进行切词处理得到至少一个词语,并在关键词表中对至少一个词语进行检索,当检索到某个词语与某个关键词的相似度满足预设阈值时,根据该词语定位包含目标句子的上下文信息,并根据上下文信息识别目标句子的意图标签。这样可以在会话过程中实时根据局部会话内容识别客户的意图,如此可以提高针对整通会话的多意图识别效率。
示例性系统
图1所示为本申请一示例性实施例提供的意图识别系统100的系统架构示意图,如图1所示,系统100包括:用户终端设备110、外呼设备120以及意图识别设备130。
以电销场景为例,用户终端设备110可以是手机、平板、个人计算机、个人数字助理等设备,可以实现用户/客户与客服之间的沟通。客服可以是人工客服或智能客服,外呼设备120可以包括服务器或固定电话等设备。例如,客服可通过外呼设备120拨打客户的电话,与用户终端设备110通过网络建立通信连接,使得客户和客服可以进行会话。意图识别设备130可以与外呼设备120通过网络建立通信连接,用于实时监听客户与客服的会话内容,并在关键词表中对会话中来源于客户的目标句子中的词语进行检索。当检索到目标句子中某个词语与某个关键词的相似度满足预设阈值时,根据该词语定位包含目标句子的上下文信息,进而根据上下文信息识别目标句子的意图标签。意图识别设备130可将识别的意图标签实时反馈给客服,以便客服根据当前的意图标签调整沟通策略,或在当前的意图标签可靠性不高时,便于客服通过反问等方式向客户再次确认当前的意图。在会话结束时,意图识别设备130可以得到整通会话对应的多个意图标签。这里,意图识别设备130可以是独立于外呼设备120的计算设备,或集成在外呼设备120上的计算设备。
在其他场景中,外呼设备120也可以接通用户终端设备110的呼叫,以与用户终端设备110建立通信连接,使得客户和客服可以进行会话。可选地,客服与客户之间可以通过语音的方式进行会话,意图识别设备130可以将语音信息转化为文本信息;可选地,客服与客户之间也可以通过文本的方式进行会话。
应理解,上述应用场景仅是为了便于理解本申请的精神和原理而示出,本申请的实施例并不限于此。相反,本申请的实施例可以应用于可能适用的任何场景。
示例性方法
图2所示为本申请一示例性实施例提供的意图识别方法的流程示意图。图2的方法可由计算设备(例如,图1中的意图识别设备130,或其他电子设备)执行。如图2所示,该意图识别方法包括如下内容。
210:对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语。
当前会话文本可以是客户与客服实时会话时的沟通文本,随着会话的进行,当前会话文本包含的句子数量不断增加。在本次会话结束时,可以得到完整的会话文本。
例如,客户可与客服通过文本的方式进行会话,会话中的文本信息即构成当前会话文本。或者,客户可与客服通过语音的方式进行会话,可以将会话中的语音信息转化为文本信息,以得到当前会话文本。
当前会话文本中包括来源于客户的句子以及来源于客服的句子。目标句子可以是当前会话文本中来源于客户的句子,随着会话的进行,可以依次将来源于客户的句子作为目标句子,并基于目标句子执行后续的意图识别过程。或者,可以以一定的步长确定会话中客户所表达的多个句子中的目标句子,如步长为2,针对客户所表达的多个句子,可以每隔一个句子确定一个目标句子以进行意图识别。
可选地,目标句子也可以是当前会话文本中来源于客服的句子,随着会话的进行,可以依次将来源于客服的句子作为目标句子,并基于目标句子执行后续的意图识别过程。或者,可以以一定的步长确定会话中客服所表达的多个句子中的目标句子。
可选地,目标句子也可以是当前会话文本中任一句子,随着会话的进行,可以依次将当前会话文本中的句子作为目标句子,并基于目标句子执行后续的意图识别过程。或者,可以以一定的步长确定会话中多个句子中的目标句子。
应理解,会话中目标句子的确定规则可以根据实际应用需要进行设置,只要可以保证客户在整个会话中的多个意图均被识别出即可。
切词处理可以将目标句子拆分成一个或多个目标词语。切词处理的方法可以是结巴分词法或其他方法,本申请实施例对此不作限制。
220:确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语。
预设的关键词表可以包括多个意图标签分别对应的关键词,每个意图标签可以对应一个或多个关键词。预设的关键词表可以是根据大量的历史会话文本预先构建的,如对历史会话文本进行意图标签的标注,并从历史会话文本中提取对应的关键词。
候选词语可以是从目标词语中挑选的。具体地,目标句子中的目标词语可能是一个或多个,针对每个目标词语,可以确定预设的关键词表中是否存在与该目标词语具有相同字的关键词,如果存在,则将该目标词语确定为候选词语。
例如,在构建预设的关键词表时,可以根据关键词中字的字频统计,建立字到词(关键词)的倒排索引。在对目标句子进行意图识别时,针对每个目标词语,通过字到词的倒排索引方式在关键词表中进行检索。若检索结果为空,则表明关键词表中不存在该目标词语中的字,可以认为关键词表中存在与该目标词语语义相近的关键词的可能性也低,该目标词语可被筛除。若检索结果不为空,则表明关键词表中存在该目标词语中的字,可以认为关键词表中存在与该目标词语语义相近的关键词的可能性高,该目标词语可作为候选词语。
230:分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值。
相似度值可以表征候选词语与关键词之间的语义相似程度。具体地,可以通过余弦距离、欧式距离或其他方法计算候选词语与关键词之间的相似度值。
候选词语的数量可以是一个或多个,针对每个候选词语,可以分别计算至少部分关键词和该候选词语之间的相似度值,进而得到全部候选词语对应的至少一个相似度值。
在一示例中,针对每个候选词语,可以分别计算该候选词语与关键词表中每个关键词之间的相似度值,得到多个相似度值。
在另一示例中,针对每个候选词语,可以在关键词表中确定与该候选词语具有相同字的至少一个关键词,分别计算该候选词语与具有相同字的至少一个关键词之间的相似度值,得到至少一个相似度值。
240:在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,上下文信息包括满足预设数量要求的多个句子。
上下文信息可以是包含目标句子的文本信息,具体可以根据目标句子的位置从当前会话文本中选取上下文信息。上下文信息所包含的句子数量满足预设数量要求,这样可以得到长度适中的上下文信息,方便基于该上下文信息的内容识别目标句子的意图,降低意图识别的难度,避免上下文信息过长、包含内容较多,而对目标句子的意图识别过程造成干扰。
确定目标句子的上下文信息的触发条件是,至少一个相似度值中存在大于或等于第一预设阈值的相似度值。
例如,候选词语的数量为一个,该候选词语对应的相似度值中如果存在大于或等于第一预设阈值的相似度值,则确定目标句子的上下文信息。
再例如,候选词语的数量为多个,多个候选词语对应的相似度值中如果存在大于或等于第一预设阈值的相似度值,则确定目标句子的上下文信息。也就是说,只要有一个候选词语对应的相似度值中存在大于或等于第一预设阈值的相似度值,则确定目标句子的上下文信息。
具体地,如果多个候选词语对应的相似度值中存在大于或等于第一预设阈值的相似度值,则表明该目标句子中包含意图的可能性很大,需要基于该目标句子识别用户的意图。例如,为了准确识别客户的意图,可以结合目标句子的上下文信息对目标句子包含的意图进行识别。如果多个候选词语对应的相似度值中不存在大于或等于第一预设阈值的相似度值,则表明该目标句子中包含意图的可能性很小,即该目标句子有可能是客户闲聊的内容,可以不用基于该目标句子进行意图识别,如此可提高意图识别效率。
本申请实施例通过计算候选词语与至少部分关键词之间的相似度值,并在相似度值中存在大于或等于第一预设阈值的相似度值时,对目标句子进行意图识别,这样可以根据语义相似度的大小来确定与关键词匹配的词语,而不用依靠强匹配的方式(词语必须与关键词一致)来确定与关键词匹配的词语,即不用依靠正则匹配来确定与关键词匹配的词语。如此,可以提高意图识别方法的泛化性。
应理解,本申请实施例中的第一预设阈值以及预设数量可以根据实际应用场景的需要进行设置。
250:根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签。
在本实施例中,如果某个候选词语与某个关键词之间的相似度值大于或等于第一预设阈值,可以表明目标句子中包含的客户意图可能与关键词对应的意图标签代表的意图一致。但是,在实际会话中,仅根据客户的一句话可能会误解客户的意图,即客户的意图可能需要通过上下文信息才能准确理解。因此,本实施例基于目标句子可定位包含目标句子的上下文信息,并基于上下文信息对目标句子进行识别意图,可以提高意图识别的准确率。
意图识别过程可以是利用自然语言处理模型对上下文信息进行分析,进而识别出目标句子的意图,得到目标意图标签。
具体地,可以利用意图分类模型对上下文信息进行分析,意图分类模型输出的结果可以包括对应的目标意图标签。例如,意图分类模型可以对多种意图进行分类,每次分类可以输出一种意图标签。不同的上下文信息输入意图分类模型可以得到不同的意图标签。本实施例中的意图分类模型可以是BERT多分类模型或其他自然语言处理模型。
可选地,利用意图分类模型对上下文信息进行分析可以得到多个意图对应的分数,多个意图为意图分类模型可以识别的意图。根据多个意图对应的分数可确定目标意图标签。例如,意图分类模型可以识别三种意图标签,利用意图分类模型对上下文信息进行分类可以输出三个意图标签对应的分数,计算设备可以将最大分数对应的意图标签作为输出的目标意图标签。或者,意图分类模型可以将最大分数对应的意图标签作为目标意图标签输出,即意图分类模型可以输出多个意图标签对应的分数以及识别出的目标意图标签。
通过实时对会话中客户所表达的句子进行分析,可以在会话结束时得到整个会话对应的多个意图标签。多个意图标签可以作为整个会话的标签结果传递给下游业务,下游业务例如可以是质检、样本构建等,质检具体可以是根据标签结果对客服在整个会话中的表现进行评估;样本构建可以是根据标签结果提取该会话中的局部信息得到样本,该样本可用于训练可识别某些意图标签的模型。
本申请实施例提供了一种意图识别方法,通过确定目标句子中是否存在与关键词表中的关键词相似度高的词语,并在目标句子存在与关键词表中的关键词相似度高的词语时,确定目标句子的上下文信息,进而根据上下文信息对目标句子进行意图识别得到意图标签。由于本申请实施例可以对目标句子进行意图识别,因此可以在会话过程中,实时并持续地对客户所表达的句子进行意图识别,实现意图识别的实时性,进而实现对客服热线下的长文本进行实时的多意图识别。本申请实施例通过确定目标句子对应的目标词语中,是否存在和关键词表中的关键词具有相同字的词语,并在目标词语中存在和关键词表中的关键词具有相同字的词语时,将具有相同字的词语确定为候选词语,这样可以从目标词语中筛选出候选词语,计算候选词语与关键词之间的相似度,如此可以提高意图识别的效率。进一步地,本申请实施例通过计算候选词语与至少部分关键词之间的相似度值,并在相似度值中存在大于或等于第一预设阈值的相似度值时,对目标句子进行意图识别,这样可以提高意图识别方法的泛化性,且可以避免未对包含客户意图的句子进行意图识别的情况,避免遗漏意图标签。此外,本申请实施例通过确定目标句子的上下文信息,并根据上下文信息对目标句子进行意图识别,可以缩短每次进行意图识别的文本长度,降低识别难度,提高最终得到的意图标签的准确率。
根据本申请一实施例,预设的关键词表包括多个聚类簇,每个聚类簇包括至少一个关键词分别对应的至少一个第一表示向量;分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值,包括:确定候选词语对应的第二表示向量;分别计算多个聚类簇中每个聚类簇的中心表示向量与第二表示向量之间的距离,得到多个距离值,其中,中心表示向量为聚类簇中至少一个第一表示向量的加权和;将多个距离值中最小距离值对应的聚类簇确定为目标聚类簇,并将目标聚类簇中的至少一个关键词确定为至少部分关键词;分别计算至少部分关键词对应的第一表示向量与第二表示向量之间的相似度值,得到至少一个相似度值。
具体地,关键词表中的关键词可以通过向量进行表示。例如,可以通过模型确定每个关键词对应的第一表示向量,该模型可以是Simcse无监督对比学习模型(可称为同义词挖掘模型)或其他自然语言处理模型。针对多个关键词对应的多个第一表示向量可以进行聚类,如关键词表对应的意图标签数量为K,可以以空间中K个点为中心进行聚类,将第一表示向量空间划分为K个聚类簇,每个聚类簇对应一个中心表示向量。
中心表示向量为对应聚类簇中至少一个第一表示向量的加权和,例如,中心表示向量可以是对应聚类簇中至少一个第一表示向量的平均值。
关键词表可以包括多个聚类簇,每个聚类簇可以包括一个关键词或多个关键词对应的第一表示向量,分在同一聚类簇中的多个第一表示向量对应的关键词在语义上可以是相似的。
在确定候选词语与关键词之间的相似度值时,可以先确定候选词语对应的第二表示向量,进而计算第二表示向量分别与每个聚类簇对应的中心表示向量之间的距离值,得到多个距离值。距离值可以是基于余弦距离、欧氏距离或其他方法获得。进一步地,可以将多个距离值中最小距离值对应的聚类簇作为最近邻聚类簇,即目标聚类簇。计算第二表示向量与目标聚类簇下的第一表示向量之间的相似度值,由于目标聚类簇下可包括至少一个第一表示向量,因此可得到至少一个相似度值。
与第一表示向量的获取过程类似,可以通过Simcse无监督对比学习模型对候选词语进行向量化得到第二表示向量。
例如,在一场景下,目标句子为“你们工作人员的口气很不好”,通过对目标句子进行切词处理得到多个目标词语,“你们/工作人员/的/口气/很不好”。从多个目标词语中确定的候选词语可以是“工作人员”和“口气”。进一步地,可在关键词表中,遍历多个候选词语,当遍历到“口气”这个词语时,经过Simcse无监督对比学习模型对候选词语“口气”进行向量化,并记为第二表示向量L。可对第二表示向量L分别与K个聚类簇的中心表示向量之间的距离值进行排序,将最小距离值对应的聚类簇确定为目标聚类簇。计算第二表示向量与目标聚类簇下的多个第一表示向量之间的相似度值,并在最大相似度值大于或等于第一预设阈值时,对目标句子进行意图识别。最大相似度值对应的关键词可以是“语气”,即“口气”可作为“语气”的同义词被召回。而针对“工作人员”这个候选词语,在进行相似度值计算时,其对应的最大相似度值可能小于第一预设阈值。不过由于“口气”对应的最大相似度值大于或等于第一预设阈值,因此可以对目标句子进行意图识别。
例如,对目标句子的上两句、目标句子以及目标句子的下两句进行拼接得到的上下文信息为“我想反映个问题#请问你要问什么呢#工作人员的口气特别不好你#非常抱歉给您带来不好的体验#我要反映这个情况”。由于上下文信息融合了更多场景语义信息,且融合了客户所表达的句子以及客服所表达的句子,因此可以提高后续意图识别结果的可靠性。
在本实施例中,从多个目标词语中选出候选词语的过程可以看作粗排过程;确定每个候选词语与目标聚类簇中的第一表示向量之间的相似度值,并确定多个候选词语对应的多个相似度值中是否存在大于或等于第一预设阈值的相似度值的过程,可以看作精排过程。通过粗排加精排的方式可以缩短意图识别的过程,提高意图识别的效率。
根据本申请一实施例,确定目标句子的上下文信息,包括:对当前会话文本中目标句子的上M句、目标句子以及当前会话文本中目标句子的下N句进行拼接得到上下文信息,其中,M和N为大于或等于1的整数,且M和N的和为第二预设阈值。
第二预设阈值可以根据实际应用场景的需要进行设置。M和N可以相等或不等。例如,第二预设阈值为4,M等于N,且M等于2,这样上下文信息包含的句子数量为5。
当M和N相等时,由于将目标句子设置在上下文信息的中间位置,这样可以充分考虑到与目标句子相关的前文信息以及后文信息,避免遗漏意图识别的关键信息,如此可以提高意图识别的准确率。
根据本申请一实施例,根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签,包括:利用意图分类模型中的编码网络对上下文信息中的多个句子分别进行编码,得到多个句向量;按照预设规则确定多个句向量分别对应的权重值,得到多个权重值,其中,预设规则包括目标句子对应的句向量的权重值为多个权重值中的最大值;根据多个权重值对多个句向量进行加权求和,得到上下文信息的第一文本表示向量;利用意图分类模型中的分类网络对第一文本表示向量进行分类,得到多个意图标签对应的多个分数,其中,多个意图标签为分类网络可识别的固定标签;根据多个意图标签对应的多个分数确定目标句子对应的目标意图标签。
具体地,意图分类模型可包括编码网络和分类网络。将上下文信息输入分类模型后,可以利用编码网络对上下文信息中的多个句子分别进行编码,得到多个句向量。进一步地,可按照预设规则确定多个句向量分别对应的权重值,得到多个权重值。预设规则可以是根据实际需要提前设置的,预设规则包括目标句子对应的句向量的权重值为多个权重值中的最大值。例如,预设规则可以是目标句子对应的句向量的权重值为60%,剩余句向量的权重值分别为40%与剩余句向量数量的比值。
在一示例中,可利用编码网络确定多个句向量对应的多个权重值,并根据多个权重值对多个句向量进行加权求和,得到上下文信息的第一文本表示向量。
在另一示例中,意图分类模型还可以包括其他网络,可利用该网络确定多个句向量对应的多个权重值,并对多个句向量进行加权求和,得到上下文信息的第一文本表示向量。
分类网络可以对多种意图进行分类,一次分类可以输出一种意图标签。利用分类网络对第一文本表示向量进行分类,可得到多个意图标签对应的多个分数,每个意图标签对应一个分数。分类网络可以将多个分数中最大分数对应的意图标签作为识别结果输出,可以不输出每个意图标签对应的分数。可将意图分类模型输出的意图标签确定为目标意图标签。
在本实施例中,利用意图分类模型对上下文信息进行处理得到目标意图标签,可以提高意图识别的效率与准确率。通过按照预设规则确定多个句向量分别对应的权重值,得到多个权重值,并根据多个权重值对多个句向量进行加权求和,得到上下文信息的第一文本表示向量,可以提高目标句子对第一文本表示向量的贡献程度,从而可以进一步提高意图识别的准确率。
根据本申请一实施例,根据多个意图标签对应的多个分数确定目标句子对应的目标意图标签,包括:利用分类网络将多个分数中最大分数对应的意图标签,确定为第一待确认意图标签;根据多个意图标签对应的多个分数以及预设公式,确定第一待确认意图标签对应的熵值,熵值越高表明第一待确认意图标签的可靠性越低,预设公式为 n为多个意图标签的个数,Pi为多个意图标签中第i个意图标签对应的分数;在熵值大于或等于第三预设阈值时,确定第一待确认意图标签为第二待确认意图标签;根据当前会话文本中客户对于第二待确认意图标签对应句子的应答信息,确定第二待确认意图标签是否是目标意图标签;在熵值小于第三预设阈值时,确定第一待确认意图标签为目标意图标签。
意图分类模型每次对上下文信息进行处理可以输出多个意图标签对应的分数以及基于多个意图标签对应的分数确定的意图标签。意图分类模型输出的意图标签为第一待确认意图标签。
例如,意图分类模型可以识别三种意图标签,意图分类模型输出的三个意图标签对应的分数为(0.2,0.2,0.6),0.2、0.2和0.6对应的意图标签分别为意图标签1、意图标签2和意图标签3;由于意图标签3对应的分数最高,意图分类模型基于三个意图标签对应的分数输出的意图标签为意图标签3。因为意图标签3对应的分数与其他两个意图标签对应的分数之间的差距很大,因此意图分类模型输出的意图标签的可靠性高。
再例如,意图分类模型输出的三个意图标签对应的分数为(0.3,0.3,0.2),意图分类模型基于三个意图标签对应的分数输出的意图标签为意图标签2。由于三个意图标签对应的分数之间的差距不大,因此意图分类模型输出的意图标签有可能出现错误。
具体地,可以基于每个意图标签对应的分数评价意图分类模型输出的第一待确认意图标签的可靠性。例如,可以利用每个意图标签对应的分数计算第一待确认意图标签的熵值,熵值越高表明多个意图标签对应的分数之间的差距越小,即表明第一待确认意图标签的可靠性越低。第一待确认意图标签的熵值可通过上述的预设公式计算得到,当然也可以根据实际需要设置其他的熵值计算公式,本申请实施例对此不作限制。
在本实施例中,可以根据实际需要设置第三预设阈值,在熵值小于第三预设阈值时,可将第一待确认意图标签确定为目标意图标签。在熵值大于或等于第三预设阈值时,将第一待确认意图标签确定为第二待确认意图标签。计算设备可以将第二待确认意图标签呈现给客服。第二待确认意图标签对应句子可以是问句或陈述句,是客服向客户进一步确认该意图标签对应的意图是否是客户的真实意图的句子。例如,客服可以根据第二待确认意图标签对应的意图向客户提问,计算设备可根据客户的应答信息确定第二待确认意图标签是否是目标意图标签。如果客户的回答是肯定的,则第二待确认意图标签是目标意图标签,如果客户的回答是否定的,则第二待确认意图标签不是目标意图标签,可舍弃。
在实际应用场景中,客户表述的某些句子可能不够直接或不够清楚,或者意图分类模型本身的精确度有限等,这些问题会使得意图分类模型输出的意图标签不够准确。在本实施例中,通过计算模型输出的意图标签的熵值确定该意图标签是否是待确认意图标签,即根据意图标签对应的熵值确定是否需要向客户进一步确认该意图标签的可靠性,如此可以提高目标意图标签的准确率与可靠性。
根据本申请一实施例,根据当前会话文本中客户对于第二待确认意图标签对应句子的应答信息,确定第二待确认意图标签是否是目标意图标签,包括:利用情感识别模型中的编码网络对应答信息进行编码得到应答信息对应的第二文本表示向量;利用情感识别模型中的分类网络对第二文本表示向量进行分类,得到分类结果,分类结果用于表征应答信息的情感是积极情感还是消极情感;在分类结果为积极情感时,确定第二待确认意图标签为目标意图标签。
情感识别模型可以用于识别客户在应答信息中表达的情感是积极情感还是消极情感,如积极情感可以表示应答信息是肯定的回答,消极情感可以表示应答信息是否定的回答。
具体地,情感识别模型可包括编码网络和分类网络。将应答信息输入情感识别模型后,可以利用编码网络对应答信息进行编码,得到第二文本表示向量。进一步地,分类网络可对第二文本表示向量进行分类,得到分类结果。
在一示例中,情感识别模型的训练样本可以是积极情感/“肯定”的通用表达(积极情感数据样本)和消极情感/“否定”的通用表达(消极情感数据样本)。例如,积极情感数据样本为“对,我说的就是这个意思”,这样的样本可以归为正例;消极情感数据样本为“不是,我说的不是这个意思”,这样的样本可以归为负例。通过构建正例和负例数据集对模型进行训练可以得到情感识别模型。
意图标签的熵值可以作为客服向客户反问的基础,即熵值大于或等于第三预设阈值可以看作是客服向客户提出反问的条件,以及是情感识别的触发条件或开关。例如,可以将客户针对客服反问的应答信息输入情感识别模型,情感识别模型可以输出“积极情感”/“肯定”,或输出“消极情感”/“否定”。若情感识别模型输出“积极情感”,则待确认意图标签为目标意图标签;若情感识别模型输出“消极情感”,则待确认意图标签不是目标意图标签。
例如,在一场景下,意图分类模型输出的意图标签为“注销账户”,但是该意图标签对应的熵值高于1,则表明该意图标签的可靠性低,需要客服向客户进一步确认该意图标签是否准确。如客服可反问客户“您是否确认注销账户”,而后可通过情感识别模型对客户的应答信息进行情感判断,并输出“积极情感”或“消极情感”。如果情感识别模型输出“积极情感”,则表明“注销账户”是目标意图标签;如果情感识别模型输出“消极情感”,则表明“注销账户”不是目标意图标签,可舍弃。
由于“积极情感”或“消极情感”的表达方式有很多种,因此,在本实施例中,通过情感识别模型识别客户的应答信息的情感是积极的还是消极的,可以提高对客户情感识别的准确度,进而提高获得的目标意图标签的可靠性。
根据本申请一实施例,该意图识别方法还包括:依次将目标句子之后的客户表达的多个句子确定为目标句子,重复执行根据多个意图标签对应的多个分数以及预设公式,确定第一待确认意图标签对应的熵值的步骤,得到当前会话文本对应的多个目标意图标签;按照多个目标意图标签对应的熵值由小到大的顺序,对多个目标意图标签进行排序,得到排序结果;按照预设数量K从排序结果中选择靠前的K个目标意图标签作为会话文本的意图标签。
具体地,随着会话的进行,可依次将客户表达的句子确定为目标句子,对目标句子进行切词处理得到至少一个目标词语;从至少一个目标词语中确定候选词语,并计算候选词语与关键词表中的至少部分关键词之间的相似度值,得到至少一个相似度值;在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,并根据上下文信息对目标句子进行意图识别;在意图分类模型输出的意图标签对应的熵值小于第三预设阈值时,或者,在熵值大于或等于第三预设阈值且情感识别模型输出的是积极情感时,可得到目标句子的目标意图标签。随着会话的进行,不断更新目标句子,在客服与客户的会话结束时,可以得到整个会话文本中客户所表达的多个目标意图标签。
可选地,在对目标句子的上下文信息进行分析后,可以将上下文信息之后的来源于客户的句子确定为目标句子;若没有定位目标句子的上下文信息,可以将目标句子之后的来源于客户的句子确定为目标句子。这样可以保证整个会话中来源于客户的句子都可以被考虑到,避免遗漏客户的意图,而且还可以提高意图识别的效率。
进一步地,可以从整个会话文本对应的多个目标意图标签中选取K个目标意图标签作为会话文本的意图标签。照预设数量K可以是根据实际需要预设的最终输出的意图标签的数量。例如,当前目标意图标签的数量大于预设数量K时,可以基于熵值从小到大的顺序,从多个目标意图标签中选择靠前的K个目标意图标签作为最终意图标签。
在本实施例中,通过不断更新目标句子,可以在会话过程中实时识别客户的意图,进而可为客服沟通策略的调整提供依据,而且可以避免遗漏客户的意图。进一步地,由于每次是针对会话中的局部信息进行意图识别,因此可以降低模型的训练成本,提高目标意图标签的准确率和可靠性。此外,本实施例可以输出熵值较小的目标意图标签作为最终意图标签,因此可进一步提高最终意图标签的可靠性。
根据本申请一实施例,该意图识别方法还包括:获取多个意图标签分别对应的多个历史会话样本;统计每个意图标签对应的多个历史会话样本中各个词语的词频;将词频大于或等于第四预设阈值的词语确定为意图标签对应的关键词;基于关键词构建预设的关键词表。
具体地,历史会话样本可以是标注好意图标签的文本,每个意图标签可以对应多个历史会话样本。针对每个意图标签,可以统计多个历史会话样本中各个词语的词频。针对每个词语,词频可以表示多个历史会话样本中出现该词语的历史会话样本的数量。在词频大于或等于第四预设阈值时,表明该词语对该意图标签的召回率高,可以加入关键词表。本实施例中的第四预设阈值可以根据实际需要进行设置。
例如,在构建意图标签A对应的关键词时,可先收集意图标签A对应的历史会话样本,意图标签A对应的历史会话样本的总数量为N;意图标签A对应的一个关键词为关键词B,关键词B在N个历史会话样本中的M个历史会话样本中出现,因此关键词B的标签召回率为N/M。当关键词对应的标签召回率越高时,表明包含该关键词的会话内容所表达的意图与该关键词对应的意图标签所代表的意图相一致的可能性越大,即该关键词对对应的意图标签的召回的可靠程度越高。因此,可以将标签召回率高于一定阈值的关键词加入关键词表。
以电销场景为例,可以收集分别与意图标签“工作人员态度不好”、“注销账号”以及“停止拨打电话”对应的历史会话样本。对于“工作人员态度不好”这个意图标签,在对应的历史会话样本中含有的关键词包括“态度”,“语气”等,这些关键词在“工作人员态度不好”意图标签对应的会话数据下召回率高,因此可将这些关键词加入关键词表。类似地,根据此原则可构建所有意图标签的关键词,最终得到关键词词表。
进一步地,可针对关键词表建立字到词的倒排索引,即对关键词表中的关键词按照字到词的方式进行划分,如针对“气”这个字,关键词表中包含“气”字的关键词有“语气”和“口气”,这样可以建立“气”与“语气”以及“口气”之间的对应关系。通过倒排索引的方式可以对目标句子中的多个词语进行筛选,得到候选词语。
在本实施例中,将词频大于或等于第四预设阈值的词语确定为意图标签对应的关键词,并基于该关键词构建预设的关键词表,可以提高关键词表的质量,提高意图识别的准确率。
图3所示为本申请另一示例性实施例提供的意图识别方法的流程示意图。图3实施例是图2实施例的例子,为避免重复,相同之处可参考上述实施例中的描述,此处不再赘述。如图3所示,该意图识别方法包括如下内容。
310:对当前会话文本中的目标句子进行切词处理得到至少一个词语。
目标句子可以是来源于客户的句子。
320:确定至少一个词语中是否存在候选词语。
具体地,可基于关键词表,通过字到词的倒排索引方式确定至少一个词语中是否存在和关键词表中的多个关键词具有相同字的词语。若是,则确定至少一个词语中存在候选词语,即可将具有相同字的词语确定为候选词语,并执行步骤330;否则,可执行步骤393。
330:确定候选词语对应的第二表示向量,分别计算第二表示向量与关键词表中多个聚类簇的中心表示向量之间的距离,得到多个距离值,将多个距离值中最小距离值对应的聚类簇确定为目标聚类簇,并计算目标聚类簇中至少一个第一表示向量分别与第二表示向量之间的相似度值,得到至少一个相似度值。
关键词表可以包括多个聚类簇,每个聚类簇可包括至少一个关键词对应的第一表示向量。
340:确定至少一个相似度值中是否存在大于或等于第一预设阈值的相似度值。
例如,可确定至少一个相似度值中的最大相似度值是否大于或等于第一预设阈值。若是,可执行步骤350;否则,可执行步骤393。
350:确定目标句子的上下文信息,根据上下文信息对目标句子进行意图识别得到意图标签以及意图标签对应的熵值。
上下文信息满足预设长度要求,例如可以对目标句子的上M句、目标句子以及目标句子的下N句进行拼接得到上下文信息。
意图标签对应的熵值的确定过程可以参考上述实施例中的描述。
360:确定熵值是否大于或等于第三预设阈值。
若熵值大于或等于第三预设阈值,可执行步骤370;否则,可执行步骤392。
370:确定意图标签为待确认意图标签,将当前会话文本中客户对于待确认意图标签对应句子的应答信息输入情感识别模型。
380:确定情感识别模型的输出是否为积极情感。
若情感识别模型的输出为积极情感,则可执行步骤390;否则,可执行步骤391。
390:确定待确认意图标签为目标意图标签。
391:将上下文信息之后的客户所表达的第一个句子更新为目标句子。
392:将意图标签确定为目标意图标签。
393:将目标句子之后的客户所表达的第一个句子更新为目标句子。
具体地,将目标句子之后的客户所表达的第一个句子更新为目标句子,并重复执行步骤310,开始新一轮的意图识别过程。在目标句子为会话文本中的客户所表达的最后一个句子时,可以结束上述意图识别过程,并输出多个目标意图标签。进一步地,根据多个目标意图标签对应的熵值的大小从多个目标意图标签中确定预设数量的目标意图标签为最终意图标签。可选地,在电销场景下,可以通过人工客服对输出的多个目标意图标签进行校验,以确定是否应用这些标签至最终的工单中。例如,人工客服可以根据实际情况对目标意图标签进行调整。
示例性装置
图4所示为本申请一示例性实施例提供的意图识别装置400的结构示意图。如图4所示,意图识别装置400包括:切词模块410、第一确定模块420、计算模块430、第二确定模块440以及识别模块450。
切词模块410用于对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;第一确定模块420用于确定至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将具有相同字的词语确定为候选词语;计算模块430用于分别计算预设的关键词表中的至少部分关键词和候选词语之间的相似度值,得到至少一个相似度值;第二确定模块440用于在至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定目标句子的上下文信息,上下文信息包括满足预设数量要求的多个句子;识别模块450用于根据上下文信息对目标句子进行意图识别,得到目标句子对应的目标意图标签。
本申请实施例提供了一种意图识别装置,通过确定目标句子中是否存在与关键词表中的关键词相似度高的词语,并在目标句子存在与关键词表中的关键词相似度高的词语时,确定目标句子的上下文信息,进而根据上下文信息对目标句子进行意图识别得到意图标签。由于本申请实施例可以对目标句子进行意图识别,因此可以在会话过程中,实时并持续地对客户所表达的句子进行意图识别,实现意图识别的实时性,进而实现对客服热线下的长文本进行实时的多意图识别。本申请实施例通过确定目标句子对应的目标词语中,是否存在和关键词表中的关键词具有相同字的词语,并在目标词语中存在和关键词表中的关键词具有相同字的词语时,将具有相同字的词语确定为候选词语,这样可以从目标词语中筛选出候选词语,计算候选词语与关键词之间的相似度,如此可以提高意图识别的效率。进一步地,本申请实施例通过计算候选词语与至少部分关键词之间的相似度值,并在相似度值中存在大于或等于第一预设阈值的相似度值时,对目标句子进行意图识别,这样可以提高意图识别方法的泛化性,且可以避免未对包含客户意图的句子进行意图识别的情况,避免遗漏意图标签。此外,本申请实施例通过确定目标句子的上下文信息,并根据上下文信息对目标句子进行意图识别,可以缩短每次进行意图识别的文本长度,降低识别难度,提高最终得到的意图标签的准确率。
根据本申请一实施例,预设的关键词表包括多个聚类簇,每个聚类簇包括至少一个关键词分别对应的至少一个第一表示向量;计算模块430用于:确定候选词语对应的第二表示向量;分别计算多个聚类簇中每个聚类簇的中心表示向量与第二表示向量之间的距离,得到多个距离值,其中,中心表示向量为聚类簇中至少一个第一表示向量的加权和;将多个距离值中最小距离值对应的聚类簇确定为目标聚类簇,并将目标聚类簇中的至少一个关键词确定为至少部分关键词;分别计算至少部分关键词对应的第一表示向量与第二表示向量之间的相似度值,得到至少一个相似度值。
根据本申请一实施例,第二确定模块440用于:对当前会话文本中目标句子的上M句、目标句子以及当前会话文本中目标句子的下N句进行拼接得到上下文信息,其中,M和N为大于或等于1的整数,且M和N的和为第二预设阈值。
根据本申请一实施例,识别模块450用于:利用意图分类模型中的编码网络对上下文信息中的多个句子分别进行编码,得到多个句向量;按照预设规则确定多个句向量分别对应的权重值,得到多个权重值,其中,预设规则包括目标句子对应的句向量的权重值为多个权重值中的最大值;根据多个权重值对多个句向量进行加权求和,得到上下文信息的第一文本表示向量;利用意图分类模型中的分类网络对第一文本表示向量进行分类,得到多个意图标签对应的多个分数,其中,多个意图标签为分类网络可识别的固定标签;根据多个意图标签对应的多个分数确定目标句子对应的目标意图标签。
根据本申请一实施例,识别模块450用于:利用分类网络将多个分数中最大分数对应的意图标签,确定为第一待确认意图标签;根据多个意图标签对应的多个分数以及预设公式,确定第一待确认意图标签对应的熵值,熵值越高表明第一待确认意图标签的可靠性越低,预设公式为n为多个意图标签的个数,Pi为多个意图标签中第i个意图标签对应的分数;在熵值大于或等于第三预设阈值时,确定第一待确认意图标签为第二待确认意图标签;根据当前会话文本中客户对于第二待确认意图标签对应句子的应答信息,确定第二待确认意图标签是否是目标意图标签;在熵值小于第三预设阈值时,确定第一待确认意图标签为目标意图标签。
根据本申请一实施例,识别模块450用于:利用情感识别模型中的编码网络对应答信息进行编码得到应答信息对应的第二文本表示向量;利用情感识别模型中的分类网络对第二文本表示向量进行分类,得到分类结果,分类结果用于表征应答信息的情感是积极情感还是消极情感;在分类结果为积极情感时,确定第二待确认意图标签为目标意图标签。
根据本申请一实施例,第二确定模块440还用于:依次将目标句子之后的客户表达的多个句子确定为目标句子,重复执行根据多个意图标签对应的多个分数以及预设公式,确定第一待确认意图标签对应的熵值的步骤,得到当前会话文本对应的多个目标意图标签;按照多个目标意图标签对应的熵值由小到大的顺序,对多个目标意图标签进行排序,得到排序结果;按照预设数量K从排序结果中选择靠前的K个目标意图标签作为会话文本的意图标签。
根据本申请一实施例,意图识别装置400还包括获取模块,用于:获取多个意图标签分别对应的多个历史会话样本;统计每个意图标签对应的多个历史会话样本中各个词语的词频;将词频大于或等于第四预设阈值的词语确定为意图标签对应的关键词;基于关键词构建预设的关键词表。
应当理解,上述实施例中的切词模块410、第一确定模块420、计算模块430、第二确定模块440、识别模块450以及获取模块的操作和功能可以参考上述图2或图3实施例中提供的意图识别方法中的描述,为了避免重复,在此不再赘述。
图5所示为本申请一示例性实施例提供的用于执行意图识别方法的电子设备500的框图。
参照图5,电子设备500包括处理器510;以及由存储器520所代表的存储器资源,用于存储可由处理器510执行的指令,例如应用程序。存储器520中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理器510被配置为执行指令,以执行上述意图识别方法。
电子设备500还可以包括一个电源组件被配置为执行电子设备500的电源管理,一个有线或无线网络接口被配置为将电子设备500连接到网络,和一个输入输出(I/O)接口530。可以基于存储在存储器520的操作系统操作电子设备500,例如Windows ServerTM,MacOS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
一种非临时性计算机可读存储介质,当存储介质中的指令由上述电子设备500的处理器执行时,使得上述电子设备500能够执行一种意图识别方法。
上述所有可选技术方案,可采用任意结合形成本申请的可选实施例,在此不再一一赘述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序校验码的介质。
需要说明的是,在本申请的描述中,术语“第一”、“第二”、“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本申请的描述中,除非另有说明,“多个”的含义是两个或两个以上。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换等,均应包含在本申请的保护范围之内。
Claims (11)
1.一种意图识别方法,其特征在于,包括:
对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;
确定所述至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将所述具有相同字的词语确定为候选词语;
分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值,得到至少一个相似度值;
在所述至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定所述目标句子的上下文信息,所述上下文信息包括满足预设数量要求的多个句子;
根据所述上下文信息对所述目标句子进行意图识别,得到所述目标句子对应的目标意图标签。
2.根据权利要求1所述的意图识别方法,其特征在于,所述预设的关键词表包括多个聚类簇,每个聚类簇包括至少一个关键词分别对应的至少一个第一表示向量;所述分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值,得到至少一个相似度值,包括:
确定所述候选词语对应的第二表示向量;
分别计算所述多个聚类簇中每个聚类簇的中心表示向量与所述第二表示向量之间的距离,得到多个距离值,其中,所述中心表示向量为所述聚类簇中至少一个第一表示向量的加权和;
将所述多个距离值中最小距离值对应的聚类簇确定为目标聚类簇,并将所述目标聚类簇中的至少一个关键词确定为所述至少部分关键词;
分别计算所述至少部分关键词对应的第一表示向量与所述第二表示向量之间的相似度值,得到所述至少一个相似度值。
3.根据权利要求1所述的意图识别方法,其特征在于,所述确定所述目标句子的上下文信息,包括:
对所述当前会话文本中所述目标句子的上M句、所述目标句子以及所述当前会话文本中所述目标句子的下N句进行拼接得到所述上下文信息,其中,M和N为大于或等于1的整数,且M和N的和为第二预设阈值。
4.根据权利要求1至3中任一项所述的意图识别方法,其特征在于,所述根据所述上下文信息对所述目标句子进行意图识别,得到所述目标句子对应的目标意图标签,包括:
利用意图分类模型中的编码网络对所述上下文信息中的多个句子分别进行编码,得到多个句向量;
按照预设规则确定所述多个句向量分别对应的权重值,得到多个权重值,其中,所述预设规则包括所述目标句子对应的句向量的权重值为所述多个权重值中的最大值;
根据所述多个权重值对所述多个句向量进行加权求和,得到所述上下文信息的第一文本表示向量;
利用所述意图分类模型中的分类网络对所述第一文本表示向量进行分类,得到多个意图标签对应的多个分数,其中,所述多个意图标签为所述分类网络可识别的固定标签;
根据所述多个意图标签对应的多个分数确定所述目标句子对应的目标意图标签。
5.根据权利要求4所述的意图识别方法,其特征在于,所述根据所述多个意图标签对应的多个分数确定所述目标句子对应的目标意图标签,包括:
利用所述分类网络将所述多个分数中最大分数对应的意图标签,确定为第一待确认意图标签;
根据所述多个意图标签对应的多个分数以及预设公式,确定所述第一待确认意图标签对应的熵值,所述熵值越高表明所述第一待确认意图标签的可靠性越低,所述预设公式为n为所述多个意图标签的个数,Pi为所述多个意图标签中第i个意图标签对应的分数;
在所述熵值大于或等于第三预设阈值时,确定所述第一待确认意图标签为第二待确认意图标签;
根据所述当前会话文本中所述客户对于所述第二待确认意图标签对应句子的应答信息,确定所述第二待确认意图标签是否是所述目标意图标签;
在所述熵值小于所述第三预设阈值时,确定所述第一待确认意图标签为所述目标意图标签。
6.根据权利要求5所述的意图识别方法,其特征在于,所述根据所述当前会话文本中所述客户对于所述第二待确认意图标签对应句子的应答信息,确定所述第二待确认意图标签是否是所述目标意图标签,包括:
利用情感识别模型中的编码网络对所述应答信息进行编码得到所述应答信息对应的第二文本表示向量;
利用所述情感识别模型中的分类网络对所述第二文本表示向量进行分类,得到分类结果,所述分类结果用于表征所述应答信息的情感是积极情感还是消极情感;
在所述分类结果为积极情感时,确定所述第二待确认意图标签为所述目标意图标签。
7.根据权利要求5所述的意图识别方法,其特征在于,所述方法还包括:
依次将所述目标句子之后的所述客户表达的多个句子确定为目标句子,重复执行所述根据所述多个意图标签对应的多个分数以及预设公式,确定所述第一待确认意图标签对应的熵值的步骤,得到所述当前会话文本对应的多个目标意图标签;
按照所述多个目标意图标签对应的熵值由小到大的顺序,对所述多个目标意图标签进行排序,得到排序结果;
按照预设数量K从所述排序结果中选择靠前的K个目标意图标签作为会话文本的意图标签。
8.根据权利要求1至3中任一项所述的意图识别方法,其特征在于,所述方法还包括:
获取多个意图标签分别对应的多个历史会话样本;
统计每个意图标签对应的多个历史会话样本中各个词语的词频;
将所述词频大于或等于第四预设阈值的词语确定为所述意图标签对应的关键词;
基于所述关键词构建所述预设的关键词表。
9.一种意图识别装置,其特征在于,包括:
切词模块,用于对当前会话文本中来源于客户的目标句子进行切词处理,得到至少一个目标词语;
第一确定模块,用于确定所述至少一个目标词语中,是否存在和预设的关键词表中的多个关键词具有相同字的词语,若是,则将所述具有相同字的词语确定为候选词语;
计算模块,用于分别计算所述预设的关键词表中的至少部分关键词和所述候选词语之间的相似度值,得到至少一个相似度值;
第二确定模块,用于在所述至少一个相似度值中存在大于或等于第一预设阈值的相似度值时,确定所述目标句子的上下文信息,所述上下文信息包括满足预设数量要求的多个句子;
识别模块,用于根据所述上下文信息对所述目标句子进行意图识别,得到所述目标句子对应的目标意图标签。
10.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器,
其中,所述处理器用于执行上述权利要求1至8中任一项所述的意图识别方法。
11.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1至8中任一项所述的意图识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211469065.1A CN116127010A (zh) | 2022-11-22 | 2022-11-22 | 意图识别方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211469065.1A CN116127010A (zh) | 2022-11-22 | 2022-11-22 | 意图识别方法、装置、电子设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116127010A true CN116127010A (zh) | 2023-05-16 |
Family
ID=86294515
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211469065.1A Pending CN116127010A (zh) | 2022-11-22 | 2022-11-22 | 意图识别方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116127010A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117854091A (zh) * | 2024-01-15 | 2024-04-09 | 金锋馥(滁州)科技股份有限公司 | 基于图像特征检测的包裹多面密集标签信息提取方法 |
-
2022
- 2022-11-22 CN CN202211469065.1A patent/CN116127010A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117854091A (zh) * | 2024-01-15 | 2024-04-09 | 金锋馥(滁州)科技股份有限公司 | 基于图像特征检测的包裹多面密集标签信息提取方法 |
CN117854091B (zh) * | 2024-01-15 | 2024-06-07 | 金锋馥(滁州)科技股份有限公司 | 基于图像特征检测的包裹多面密集标签信息提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110910901B (zh) | 一种情绪识别方法及装置、电子设备和可读存储介质 | |
CN109684478B (zh) | 分类模型训练方法、分类方法及装置、设备和介质 | |
CN110909165B (zh) | 数据处理方法、装置、介质及电子设备 | |
CN114357973B (zh) | 意图识别方法、装置、电子设备及存储介质 | |
US11386354B2 (en) | Information processing apparatus, information processing method, and program | |
CN113360622B (zh) | 用户对话信息的处理方法、装置及计算机设备 | |
CN111429157A (zh) | 投诉工单的评价处理方法、装置、设备及存储介质 | |
CN111597821B (zh) | 一种确定应答概率的方法及装置 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
CN116127010A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN110795531B (zh) | 一种意图识别方法、装置及存储介质 | |
CN114138947A (zh) | 文本处理方法及装置 | |
CN110197196B (zh) | 问题处理方法、装置、电子设备以及存储介质 | |
CN116127011A (zh) | 意图识别方法、装置、电子设备及存储介质 | |
CN109062900B (zh) | 一种朋友圈生成方法及装置 | |
CN114048294B (zh) | 相似人群扩展模型训练方法、相似人群扩展方法和装置 | |
CN113505293A (zh) | 信息推送方法、装置、电子设备及存储介质 | |
CN115618968B (zh) | 新意图发现方法、装置、电子设备及存储介质 | |
CN117131183B (zh) | 一种基于会话模拟的客服自动回复方法及系统 | |
CN113918690B (zh) | 对话方法以及装置 | |
CN113887245B (zh) | 一种模型训练方法及相关装置 | |
CN116089614B (zh) | 文本打标方法及装置 | |
CN116092530A (zh) | 消极服务评价的确定方法及装置 | |
CN114783416A (zh) | 基于语音自动分级的语音服务方法及语音客服服务平台 | |
CN115705362A (zh) | 对话生成方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |