CN116127008A - 用户意图的识别方法、装置、设备及可读存储介质 - Google Patents
用户意图的识别方法、装置、设备及可读存储介质 Download PDFInfo
- Publication number
- CN116127008A CN116127008A CN202211448756.3A CN202211448756A CN116127008A CN 116127008 A CN116127008 A CN 116127008A CN 202211448756 A CN202211448756 A CN 202211448756A CN 116127008 A CN116127008 A CN 116127008A
- Authority
- CN
- China
- Prior art keywords
- intention
- user
- recognition model
- feedback data
- fuzzy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 82
- 238000012549 training Methods 0.000 claims description 58
- 230000015654 memory Effects 0.000 claims description 24
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 12
- 230000011218 segmentation Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000005611 electricity Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035515 penetration Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000009278 visceral effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本说明书实施方式提供了一种用户意图的识别方法、装置、设备及可读存储介质,包括:接收用户的终端发送的对应设定问题的反馈数据;其中,所述设定问题对应有业务场景;调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图。本方案通过模型分类和多层预测的方式,相比单一的预测方式,降低了错误率;本方案通过对业务场景进行区分和细化,可以更好的将算法与业务契合,提升预测的精准性。
Description
技术领域
本说明书中实施方式关于机器学习的技术领域,尤其涉及一种用户意图的识别方法、装置、设备及可读存储介质。
背景技术
目前,随着机器学习技术的不断发展,机器学习技术也应用于人机对话领域中。人机对话是外呼机器人能够自动回复用户发出的信息,目前被广泛地应用于各个行业,提升了相关企业与用户之间的沟通效率。意图识别是人机对话过程中的重要一环。意图识别决定着整个人机对话质量的好坏。意图识别是针对用户发出的信息进行信息分类,进而针对输入的意图进行下一步的合理操作。
在现有的意图识别的技术领域中,通过现有的方法执行意图识别时,识别得到的预测意图,其准确性往往不高。
发明内容
有鉴于此,本说明书多个实施方式致力于提供一种用户意图的识别方法、装置、设备及可读存储介质,以一定程度上提升对识别得到的预测意图的准确性。
本说明书中多个实施方式提供一种用户意图的识别方法,所述方法包括:获取用户针对对应设定问题的反馈数据;其中,所述设定问题对应有业务场景;调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;其中,所述模糊意图识别模型用于判断所述反馈数据是否属于模糊意图,所述用户意图识别模型用于识别反馈数据的明确意图;根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图;其中,在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将所述用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。
本说明书中多个实施方式提供一种意图识别模型的训练方法,所述方法包括:获取对应业务场景的第一训练语料和第二训练语料;其中,所述第一训练语料和第二训练语料分别包括多个对话数据和对应的意图标签;其中,所述对话数据包括设定问题和对应的反馈数据;所述第一训练语料的意图标签表示相应对话数据的反馈数据属于模糊意图;所述第二训练语料的意图标签表示对话数据的反馈数据存在明确意图;基于所述第一训练语料训练第一初始模型得到模糊意图识别模型,和第二训练语料分别训练第二初始模型得到用户意图识别模型;其中,所述模糊意图识别模型与所述用户意图识别模型联合使用,在所述模糊意图识别模型认定反馈数据不属于模糊意图的情况下,才将用户意图识别模型输出的明确意图作为用户意图。
本说明书的一个实施方式提供一种用户意图的识别装置,所述装置包括:获取单元,其用于获取用户针对对应设定问题的反馈数据;其中,所述设定问题对应有业务场景。识别单元,其用于调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;其中,所述模糊意图识别模型用于判断所述反馈数据是否属于模糊意图,所述用户意图识别模型用于识别反馈数据的明确意图。确定单元,其用于根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图;其中,在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将所述用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。
本说明书的一个实施方式提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的用户意图的识别方法,或,所述处理器执行所述计算机程序时实现上述的意图识别模型的训练方法。
本说明书的一个实施方式提供一种计算机可读存储介质,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现上述的用户意图的识别方法,或,所述计算机程序被处理器执行时实现上述的用户意图的识别方法。
本说明书提供的多个实施方式通过模型分类和多层预测的方式,相比单一的预测方式,降低了错误率;本方案通过对业务场景进行区分和细化,可以更好的将算法与业务契合,提升了意图预测的精准性。
附图说明
图1为本说明书的一个实施方式提供的一种用户意图的识别系统的示意图。
图2为本说明书的一个实施方式提供的一种用户意图的识别方法的流程示意图。
图3为本说明书的一个实施方式提供的一种意图识别模型的训练方法的流程示意图。
图4为本说明书的一个实施方式提供的一种用户意图的识别装置的框图。
图5为本说明书的一个实施方式提供的一种电子设备的框图。
具体实施方式
在相关技术中,伴随着深度学习技术的发展和市场竞争的不断剧烈。企业希望能够将一些本来基于人工的外呼任务实现自动化和智能化。而智能外呼技术满足了这一需求。智能外呼的过程往往是通过智能外呼机器人进行实现的。在一个智能外呼的对话流程中,往往具有多个对话节点。各个对话节点可以构成一个树形的结构。在一个对话节点中可以包括预先制作好的机器人话术和用户可能存在的反馈数据,该反馈数据用于指示从一个对话节点流转到下一个对话节点。具体的,该机器人话术可以通过终端装置播放给用户。用户接收到该机器人话术之后可以进行反馈具体的数据,也可能不反馈数据。例如,在一个电销的业务场景中,在“核身”的对话节点,智能外呼机器人向用户发出“您好,请问您是X先生吗?”的话术。用户接收到该话术之后,可能会反馈例如“不是,你打错了”这样的反馈数据。智能外呼机器人可以调用预先配置的意图识别模型对该反馈信息进行识别。得到否定身份的意图标签。根据该否定身份的意图标签可以指示从该“核身”的对话节点流转到“结束语”的对话节点。在该“结束语”的对话节点,智能外呼机器人可以向用户发出“实在抱歉,打扰了”之类的结束语话术,从而结束一个智能外呼的对话流程。
在一些情况下,不同的业务场景,其业务流程话术往往具有一些特点。例如,在反诈的业务场景中,智能外呼机器人往往是发出询问和确认的话术,而用户往往作出一些简单的回答,例如,“是的”、“知道”、“是我本人”。而在非反诈的业务场景下,例如,在电销、回访以及金融等业务场景中,机器人的话术和用户的反馈信息往往具有多样化。除了这种多样化的特点。在非反诈的业务场景中,用户的反馈数据往往还存在一些无法识别意图的情况,这种无法识别的意图可以称为模糊意图。例如,同样以上述的电销的业务场景进行举列,当智能外呼机器人询问用户身份时,用户的反馈信息为“我正在开会呢”。该反馈数据的意图就比较模糊。用户可能表达的意图是“我是本人,但是正在开会”,也可能是“我不是本人,我正在开会,你不要烦我”。还可能是“我是本人,但是正在开会,我们稍后在通电话”。因此,在现有技术中,不考虑业务场景的特点,直接使用单一的意图识别模型对不同的业务场景下的用户反馈信息进行识别,这种预测方式比较单一,准确率往往不高。并且没有考虑到非反诈业务场景下,用户的反馈数据往往表达的是模糊的意图,现有的方法往往会将模糊的意图识别为确定的意图或者否定的意图。从而答非所问,因此会造成意图识别准确率低的技术问题。使得人机对话质量低下,影响用户的实际体验。
综上所述,在执行意图识别时,没有采取多分类的方式并且没有考虑到模糊意图的情况,只采用单一的预测方式,往往预测的准确率低。因为,有必要提供一种用户意图的识别方法,该方法考虑了智能外呼机器人与用户对话的业务场景,可以通过调用模糊意图识别模型和对应业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;并且在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将对应业务场景的用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。实现解决现有技术中意图识别准确性不高的技术问题。
请参阅图1和图2。本说明书的一个实施方式提供一种用户意图的识别方法。所述用户意图的识别方法可以应用于服务器中。服务器可以是具有一定运算处理能力的电子设备。比如服务器可以为分布式系统的服务器,可以是具有多个处理器、存储器、网络通信模块等协同运作的系统。服务器也可以是云服务器,或者是带人工智能技术的智能云计算服务器或智能云主机。服务器也可以是为若干服务器形成的服务器集群。或者,随着科学技术的发展,服务器还可以是能够实现说明书实施方式相应功能的新的技术手段。例如,可以是基于量子计算实现的新形态的“服务器”。所用户意图的识别方法可以包括以下步骤。
步骤S101:获取用户针对对应设定问题的反馈数据;其中,所述设定问题对应有业务场景。
在一些情况下,随着智能外呼技术与具体业务的结合以及深入,形成了诸多的业务场景。例如,反诈业务场景、电销业务场景、回访业务场景、金融业务场景等。不同的业务场景,对话流程往往不完全一样。相应的,在某一个或者某几个对话节点,对于智能外呼机器人设定的话术往往不太一样。具体的,例如,在电销业务场景中,往往具有关于推销某一商品或者服务的话术。在回访业务场景中,往往具有询问用户对某一商品或者服务的具体评价的话术。在反诈业务场景的一个完整的对话流程中,智能外呼机器人设定的话术,往往是提醒用户是否有转账,是否是本人操作等等。因此,在进行用户意图的识别时,确认问题的业务场景非常重要。
在本实施方式中,所述获取的动作可以表示为服务器通过网络获取到终端发送的用户的反馈数据。该服务器中可以配置有智能外呼系统,也可以配置文本对话客户系统。示例性地,以智能外呼系统为例,该智能外呼系统中可以包括智能外呼机器人、预先训练的用户意图识别模型和机器人话术库。所述的智能外呼机器人通过终端与用户对话,并且通过终端获取用户的反馈数据。并且将反馈数据通过网络传输至服务器中。服务器中配置的用户意图识别模型对反馈数据进行识别,得到识别结果。所述的智能外呼机器人根据该识别结果从所述机器人话术库调用对应的话术并且发送给用户。
在本实施方式中,所述终端可以是终端装置,例如,智能手机、平板电脑、笔记本电脑、台式电脑等等。所述终端还可以是配置在所述终端装置中的软件或者在线页面等等。具体的,考虑基于通话形式的人机对话的情况,所述的终端可以为智能手机。考虑基于语音信息或者文本信息交互形式的人机对话的情况,所述终端可以是配置在所述终端装置中的软件或者在线页面。
在本实施方式中,所述的设定问题可以表示为所述智能外呼机器人通过终端向用户发出的预先设置的问题语料。所述的反馈数据可以表示为用户针对所述问题语料进行反馈的数据。所述的问题语料和反馈数据可以是语音形式的数据,也可以是文本形式的数据。可以是中文语音或者文本,还可以是其他语言形式的语音或者文本。具体的,当所述的反馈数据为语音数据时,可以将接收到语音数据转化为文本数据。再对问文本数据进行分词处理。当所述的反馈数据为文本数据时,直接对文本数据进行分词处理。具体的说,可以采用现有技术中任一一种分词技术对文本数据进行分词。例如,针对文本数据“我对你们的产品没有兴趣”,可以分词为:我/对/你们的/产品/没有/兴趣/”。再针对分词处理后的文本进行向量化。例如,可以在语料库中查询词向量,从而将文本数据转化为多个高维向量的组合。具体的词向量化技术可以采用word2vec技术。
在本实施方式中,所述的业务场景可以包括有反诈业务场景、电销业务场景、回访业务场景、金融业务场景等。可以根据所述智能外呼机器人对应的标识或者所述智能外呼机器人接收到的外呼指令确定具体的业务场景。具体的,所述的标识可以是所述智能外呼机器人的ID。所述的外呼指令可以是用于调用某一类型的智能外呼机器人向目标用户拨打电话的指令。向目标用户拨打电话往往是实现上述业务场景中的目的。比如,电销业务场景往往是要实现向目标用户实现电话销售的目的。反诈业务场景往往是实现向客户传达一些信息。这些信息可以是用户的金融账户发生了数量较大金额的变动。通过向客户传达这些信息,让客户收听到这些信息,以实现反诈的目的。因此,可以根据所述智能外呼机器人对应的标识或者所述智能外呼机器人接收到的外呼指令确定具体的业务场景。
步骤S102:调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;其中,所述模糊意图识别模型用于判断所述反馈数据是否属于模糊意图,所述用户意图识别模型用于识别反馈数据的明确意图。
在一些情况下,在不同的业务场景中,用户与智能外呼机器人之间的对话往往存在一些特点或者差异性。具体的说,正如上述的反诈业务场景往往是实现向客户传达一些信息,这些信息可以是用户的金融账户发生了数量较大金额的变动。通过向客户传达这些信息,让客户收听到这些信息。以实现反诈的目的。针对智能外呼机器人向用户播放的语料,用户的反馈往往比较简单,例如,“是我本人”,“是我本人操作的”、“是的”、“不是的”、“嗯”。针对这些反馈其实带有明确的意图,但是现有技术很难区分对应的意图。具体的,在反诈场景中,在第一个对话节点,智能外呼机器人的语料为“请问是X先生吗?”用户的反馈数据为“是的”。在第二个对话节点,智能外呼机器人的语料为“请问是您本人向Y账户打100万元的款项么?”用户的反馈同样为“是的”。仅仅针对这两个“是的”,现有技术的方法很难区分对应的意图,但是针对这两个“是的”确实表明了用户的意图。在非反诈的业务场景中,智能外呼机器人的语料和用户的反馈数据往往比较复杂。而且用户的反馈数据的意图可能比较模糊。具体的,例如,在电销场景中,在一个对话节点中,智能外呼机器人的语料为“请问您有了解过我司的X么?”用户的反馈数据为“我以前用过Y”。针对该反馈数据,现有技术中的意图识别模型就很难识别对应的意图。这种模糊的意图,在非反诈的业务场景中,也比较常见。综上所述,在接收到用户的反馈数据之后,通过区分业务场景来调用对应的意图识别模型非常重要。并且筛选模糊意图也非常的重要。
在本实施方式中,所述的调用的动作可以表示为所述智能机器人根据对应的业务场景从后端调用具体对应的意图识别模型。可以是两种模型同时调用,也可以是优先调用模糊意图识别模型。所述非反诈的业务场景可以包括电销业务场景、回访业务场景、金融业务场景等。所述模糊意图识别模型可以通过预先构建的OOD(out-of-domain)语料训练得到。可以在训练阶段,把所有训练语料进行二分类,生成业务语料与OOD语料。通过业务语料训练对应的用户意图识别模型。通过OOD语料训练对应的模糊意图识别模型。也可以专门构建对应的OOD语料。例如,可以采集以往的智能外呼机器人与用户的对话数据,将其中用户反馈数据中存在的模糊意图的反馈数据标记为OOD语料。也可以从互联网中的一些社交平台,比如,知乎、微博中获取社交文本数据。从社交文本数据中提取OOD语料。相应的用户意图识别模型可以通过所述的业务语料训练得到。还可以把业务语料进一步区分成具体的业务场景下的业务语料训练对应的用户意图识别模型。
所述的明确意图可以表示为所述用户意图识别模型能够预测到的意图类别。具体的,在所述用户意图模型训练时。对于一个待训练的算法模型,例如,BERT-BASE,其输入往往是对话数据和对应的意图标签。意图标签往往具有多种类别的标签并且是预先标注好的。可以针对不同类别的标签构建对应的对话数据。例如,在电销业务场景下的一个流程节点中。智能外呼机器人的语料为“请问您了解过我司的X产品么?”。对应的用户反馈的意图标签可以有肯定的意图标签、否定的意图标签、反问身份的意图标签、甚至还可以有骂脏话的意图标签。因为在训练环节,可以根据对应的意图标签收集对应的语料来对所述的用户意图识别模型进行训练。在不同的对话节点,存在的意图标签可以相同,也可以不同。在具体执行识别时,可以根据识别到的意图标签,跳转到下一个对话节点。例如,智能外呼机器人的预料为“请问您了解过我司的X产品么?”用户的反馈数据为“是的,我了解过”。用户意图识别模型对该反馈数据进行识别,得到肯定的意图标签。智能外呼机器人根据该肯定的意图标签进行下一个对话节点。
步骤S103:根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图;其中,在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将所述非反诈场景的用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。
在一些情况下,用户的反馈数据往往存在模糊意图。特别是在上述的非反诈场景下,用户的反馈数据出现模糊意图的可能性更高。这个可能是因为非反诈场景的对话模式比较开放性,也可能是不同的人具有不同的语言习惯和思维。例如,在“核身”环节,智能外呼机器人询问用户的身份。用户的反馈数据为“我正在开会”。这个反馈数据所表达的意图模糊。若是直接使用对应该业务场景的用户意图识别模型对该反馈数据进行识别,将无法匹配到准确的意图标签。因为该模糊意图既不是肯定的意图标签、也不是否定的意图标签、也不是反问身份的意图标签、还不是骂脏话的意图标签。总之用户表达意图很模糊。针对这种情况若是直接给该模糊的意图赋予一个准确的意图。智能外呼机器人将无法正确回答,可能会导致本次业务操作失败,甚至导致用户进行投诉,给公司造成不利影响。因此,在上述的情况下,先使用模糊意图识别模型对反馈数据进行过滤,在判断不是模糊意图的情况下,再输出用户意图识别模型的识别结果。这种操作可以很大程度的提升预测的准确性。
在本实施方式中,所述的明确意图可以是上述的肯定的意图标签、否定的意图标签、反问身份的意图标签、甚至还可以是骂脏话的意图标签。
综上所述,本实施例提供的方法考虑到不同的业务场景中,用户与智能外呼机器人之间的对话存在的差异性。对接收到的反馈数据区分其对应的业务场景。并且考虑到可能接收到属于模糊意图的反馈数据。因此,通过调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别。本实施例提供的方法相对于现有技术考虑了业务场景,增加了模型分类,在执行识别时,先用模糊意图识别模型过滤一遍可能存在的模糊意图,再使用用户意图识别进行识别明确意图。本实施例提供的方法通过上述层层过滤预测方式,相比原单一的预测方式,降低了错误率;用户意图识别模型根据不同业务场景进行细化拆分,更好的将算法与业务契合,提高了预测的精准性。
在一些实施方式中,所述根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图的步骤,包括:在认定所述反馈数据属于模糊意图的情况下,将所述反馈数据的用户意图认定为模糊意图。
在一些情况下,在执行用户意图识别时,往往可能会接收到表示模糊意图的反馈数据。一旦模糊意图识别模型检测到某一反馈数据为模糊意图时,而对应该业务场景的用户意图识别模型也会有个输出结果。该输出结果可能是一个或者多个明确意图和对应的概率。相应的,该对应的概率可能会比较低。因此这种情况下,可以直接将该反馈数据的意图认定为模糊意图,用以减少判断失误的风险。
上述的方法,考虑了对话数据存在模糊意图的情况,一旦认定所述反馈数据属于模糊意图的情况下,则直接将所述反馈数据的用户意图认定为模糊意图。这种方法降低了判断失误的错误率。并且上述的方法,通过在认定所述反馈数据不属于模糊意图的情况下,再调用对应该业务场景的用户意图识别模型对所述反馈数据的意图进行识别。相对于同时调用模糊意图识别模型和用户意图识别模型对反馈数据识别的操作。降低了计算量,节省了运算资源。具有很好的实用价值。
在一些实施方式中,所述调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别的步骤,包括:调用所述模糊意图识别模型对所述反馈数据的意图进行识别;在认定所述反馈数据不属于模糊意图的情况下,再调用所述的用户意图识别模型对所述反馈数据的意图进行识别。
如上所述的,在执行用户意图识别时,往往可能会接收到表示模糊意图的反馈数据。因此,可以先调用模糊意图识别模型对所述反馈数据的意图进行识别。也即是,先使用所述的模糊意图识别模型对所述反馈数据进行第一遍的过滤。只有在认定所述反馈数据不属于模糊意图的情况下,再调用所述的用户意图识别模型对所述反馈数据的意图进行识别。这种方法相对于同时调用模糊意图识别模型和用户意图识别模型对反馈数据识别的操作。同样降低了计算量,同样节省了运算资源。具有很好的实用价值。
在一些实施方式中,所述调用所述模糊意图识别模型对所述反馈数据的意图进行识别的步骤,包括:将反馈数据输入所述模糊意图识别模型,得到所述模糊意图识别模型输出的表示反馈数据属于模糊意图的概率;所述认定所述反馈数据不属于模糊意图的情况包括:所述模糊意图的概率小于第一预设值的情况。
在一些情况下,模糊意图识别模型识别得到并不是一个百分百绝对准确的结果,更多的是可能的结果和对应的概率。因此,可以预先设定一个阈值,例如上述的第一预设值。该第一预设值是模糊意图概率的阈值。一旦模糊意图的概率超过这个阈值,则认为该反馈数据所表达意图很有可能就是模糊意图。因为相对于简单的二分类,是模糊意图或者不是模糊意图。这种通过概率和阈值的形式。可以相对提升模糊意图识别模型预测的准确性,也相应的,提升全局预测的准确性。
在一些实施方式中,所述非反诈场景的用户意图识别模型的输出结果包括多个预设的明确意图和对应的概率;所述将所述非反诈场景的用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图的步骤,包括:将所述多个预设的明确意图中概率最高的意图确定为所述反馈数据的用户意图。
在一些情况下,用户的反馈数据可能存在多种明确意图。例如,在电销的业务场景中,智能对话机器人的语料为“请问您了解过我司的X产品么?”用户的反馈数据可能为“知道,请问你们这个X产品多少钱?”。该反馈数据表达的明确意图可能包括:确定意图和询价意图。针对该两种明确意图的,在上述的反馈数据中,询价意图的概率可能更高。因此,可以直接根据该询价意图将对话节点流转到具体关于询价的对话节点中。而不需要再对用户的进行产品的介绍。因此,这种多阈值比较的方法,很好的提升了用户意图识别模型预测的准确性。具有很好的实用价值。
在一些实施方式中,在调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的意图进行识别的步骤之前,还包括:根据预先设定的意图匹配规则对所述反馈数据进行匹配,得到匹配结果;在匹配结果指示匹配失败的情况下,调用模糊意图识别模型和所述非反诈场景的用户意图识别模型对所述反馈数据的意图进行识别。
在一些情况下,可以在业务层设置意图识别规则。在具体调用模糊意图识别模型和用户意图识别模型之前。先用该意图识别规则对反馈数据进行匹配,若是可以匹配成功。则不需要再使用模糊意图识别模型和用户意图识别模型对反馈数据的意图进行识别。所述的意图匹配规则可以是基于模型的意图匹配规则。该基于模型的意图匹配规则可以通过预先配置的模板文件得到。具体的说,可以先对反馈数据进行分词操作。得到分词结果。再根据分词结果命中模板文件中具体的模板。再根据命中的模板对分词结果进行解析,得到意图,这种方法可以很好的节省计算量和系统的运算资源。并且这种具有多层次化的预测方式,可以提升全局预测的准确性。
在一些实施方式中,所述业务场景包括反诈场景和非反诈场景,所述非反诈场景包括:电销业务场景、回访业务场景或者金融业务场景;所述设定问题包括预设的机器人话术,所述反馈数据包括用户针对所述机器人话术回复的数据;在所述的业务场景为非反诈场景的情况下,调用模糊意图识别模型和对应所述非反诈场景的用户意图识别模型对所述用户针对所述机器人话术回复的数据的用户意图进行识别。
在一些情况下,正如上述的在非反诈场景的情况下出现模糊意图的可能性很高。因此,针对上述的非反诈场景,可以通过调用模糊意图识别模型和对应所述非反诈场景的用户意图识别模型对所述用户针对所述机器人话术回复的数据的用户意图进行识别。
在一些实施方式中,在所述的业务场景为反诈场景的情况下,所述一种用户意图的识别方法还包括:将所述机器人话术和所述用户针对所述机器人话术回复的数据进行拼接操作,得到拼接后的数据;调用对应于所述反诈场景下的用户意图识别模型识别所述拼接后的数据表达的用户意图。
在一些情况下,正如上述的反诈场景往往是实现向客户传达一些信息,这些信息可以是用户的金融账户发生了数量较大金额的变动。通过向客户传达这些信息,让客户收听到这些信息。以实现反诈的目的。针对智能外呼机器人向用户播放的语料,用户的反馈往往比较简单,例如,“是我本人”,“是我本人操作的”、“是的”、“不是的”、“嗯”。针对这些反馈其实带有明确的意图,但是现有技术很难区分对应的意图。在一个对话节点中,用户的反馈数据为“是的”。在另外一个对话节点中,用户的反馈数据也可能为“是的”。在语义上,都是表达的肯定的意思,但是具有不同的意图。因此,这种问题需要解决。
上述的方法,通过所述设定问题和所述设定问题对应的反馈数据进行拼接操作,使得反馈数据所表达的意图更为的完整。上述方法具有很好的实用价值,考虑到了反诈场景的特殊性。
如图3所示,本说明书的一个实施方式提供一种意图识别模型的训练方法,所述方法包括如下的步骤。
步骤S201:获取对应业务场景的第一训练语料和第二训练语料;其中,所述第一训练语料和第二训练语料分别包括多个对话数据和对应的意图标签;其中,所述对话数据包括设定问题和对应的反馈数据;所述第一训练语料的意图标签表示相应对话数据的反馈数据属于模糊意图;所述第二训练语料的意图标签表示对话数据的反馈数据存在明确意图。
步骤S202:基于所述第一训练语料训练第一初始模型得到模糊意图识别模型,和第二训练语料分别训练第二初始模型得到用户意图识别模型;其中,所述模糊意图识别模型与所述用户意图识别模型联合使用,在所述模糊意图识别模型认定反馈数据不属于模糊意图的情况下,才将用户意图识别模型输出的明确意图作为用户意图。
在一些情况下,在一个现有的智能外呼过程中,往往是强依赖智能外呼机器人话术绘制流程。不同的业务绘制不同的业务流程话术,再把每个智能外呼机器人的业务流程话术打包成一个整体来训练意图识别模型。然后根据用户的反馈数据匹配对应的对话节点与结论。在这个过程中,如果意图识别模型无法对用户的反馈信息作出精确的意图匹配,则会导致流程节点下行时与初始设计的背离,故提升意图节点识别准确率,大大影响着产品的用户体验。也正如上述的,在非反诈的业务场景中,智能外呼机器人的语料和用户的反馈数据往往比较复杂。而且用户的反馈数据的意图可能比较模糊。因此,在训练阶段,可以将训练语料区分为第一训练语料和第二训练语料。通过该第一训练语料和第二训练语料训练对应的意图识别模型。所述的第一初始模型可以采用BERT-BASE初始模型。所述的第二初始模型可以采用LR或者TESTCNN等初始模型。现有技术中,训练方式较为单一,往往采用一刀切的训练方式。没有对业务场景进行区分,并且考虑到上述的OOD语料的情况。因此,模型识别准确率往往不高。该方法对模型类型进行更精细化划分,依据不同类型的模型走不同的训练方式,使模型预测与业务更完美的契合,提升预测结论准确率。该方法把所有训练语料数据进行二分类,生成业务语料与OOD语料,来训练对应的模型。当预测请求触发此环节时,按需对请求进行分流,结论返回相比当前更快,且对服务器资源开销减少,节约了成本。
如图4所示,本说明书的一个实施方式还提供一种用户意图的识别装置。所述一种用户意图的识别装置可以包括获取单元,其用于获取用户针对对应设定问题的反馈数据;其中,所述设定问题对应有业务场景。识别单元,其用于调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;其中,所述模糊意图识别模型用于判断所述反馈数据是否属于模糊意图,所述用户意图识别模型用于识别反馈数据的明确意图。确定单元,其用于根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图;其中,在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将所述用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。
如图5所示,本说明书实施方式还提供一种电子设备,该电子设备可以是智能手机、平板电脑、电子书等能够运行应用程序的电子设备。本实施方式中的电子设备可以包括一个或多个如下部件:处理器、网络接口、内存、非易失性存储器以及一个或多个应用程序,其中一个或多个应用程序可以被存储在非易失性存储器中并被配置为由一个或多个处理器执行,一个或多个程序配置用于执行如前述方法实施例所描述的方法。
本说明书实施方式还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得,该计算机执行上述任一实施方式中的用户意图的识别方法或者意图识别模型的训练方法。
本说明书实施方式还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述任一实施方式中的用户意图的识别方法或者意图识别模型的训练方法。
可以理解,本文中的具体的例子只是为了帮助本领域技术人员更好地理解本说明书实施方式,而非限制本发明的范围。
可以理解,在本说明书中的各种实施方式中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本说明书实施方式的实施过程构成任何限定。
可以理解,本说明书中描述的各种实施方式,既可以单独实施,也可以组合实施,本说明书实施方式对此并不限定。
除非另有说明,本说明书实施方式所使用的所有技术和科学术语与本说明书的技术领域的技术人员通常理解的含义相同。本说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在限制本说明书的范围。本说明书所使用的术语“和/或”包括一个或多个相关的所列项的任意的和所有的组合。在本说明书实施方式和所附权利要求书中所使用的单数形式的“一种”、“上述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
可以理解,本说明书实施方式的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施方式的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific IntegratedCircuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施方式中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施方式所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
可以理解,本说明书实施方式中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
本领域普通技术人员可以意识到,结合本文中所公开的实施方式描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本说明书的范围。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施方式中的对应过程,在此不再赘述。
在本说明书所提供的几个实施方式中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本说明书各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本说明书的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本说明书的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种用户意图的识别方法,其特征在于,所述方法包括:
获取用户针对对应设定问题的反馈数据;其中,所述设定问题对应有业务场景;
调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;其中,所述模糊意图识别模型用于判断所述反馈数据是否属于模糊意图,所述用户意图识别模型用于识别反馈数据的明确意图;
根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图;其中,在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将所述用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。
2.根据权利要求1所述的方法,其特征在于,所述根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图的步骤,包括:
在认定所述反馈数据属于模糊意图的情况下,将所述反馈数据的用户意图认定为模糊意图。
3.根据权利要求1所述的方法,其特征在于,所述调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别的步骤,包括:
调用所述模糊意图识别模型对所述反馈数据的意图进行识别;
在认定所述反馈数据不属于模糊意图的情况下,再调用所述的用户意图识别模型对所述反馈数据的意图进行识别。
4.根据权利要求1所述的方法,其特征在于,在调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别的步骤之前,还包括:
根据预先设定的意图匹配规则对所述反馈数据进行匹配,得到匹配结果;
在匹配结果指示匹配失败的情况下,调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的意图进行识别。
5.根据权利要求1所述的方法,其特征在于,所述业务场景包括反诈场景和非反诈场景,所述非反诈场景包括:电销业务场景、回访业务场景或者金融业务场景;所述设定问题包括预设的机器人话术,所述反馈数据包括用户针对所述机器人话术回复的数据;
在所述的业务场景为非反诈场景的情况下,调用模糊意图识别模型和对应所述非反诈场景的用户意图识别模型对所述用户针对所述机器人话术回复的数据的用户意图进行识别。
6.根据权利要求5所述的方法,其特征在于,在所述的业务场景为反诈场景的情况下,所述方法还包括:
将所述机器人话术和所述用户针对所述机器人话术回复的数据进行拼接操作,得到拼接后的数据;
调用对应于所述反诈场景下的用户意图识别模型识别所述拼接后的数据表达的用户意图。
7.一种意图识别模型的训练方法,其特征在于,所述方法包括:
获取对应业务场景的第一训练语料和第二训练语料;其中,所述第一训练语料和第二训练语料分别包括多个对话数据和对应的意图标签;其中,所述对话数据包括设定问题和对应的反馈数据;所述第一训练语料的意图标签表示相应对话数据的反馈数据属于模糊意图;所述第二训练语料的意图标签表示对话数据的反馈数据存在明确意图;
基于所述第一训练语料训练第一初始模型得到模糊意图识别模型,和第二训练语料分别训练第二初始模型得到用户意图识别模型;其中,所述模糊意图识别模型与所述用户意图识别模型联合使用,在所述模糊意图识别模型认定反馈数据不属于模糊意图的情况下,才将用户意图识别模型输出的明确意图作为用户意图。
8.一种用户意图的识别装置,其特征在于,所述装置包括:
获取单元,其用于获取用户针对对应设定问题的反馈数据;其中,所述设定问题对应有业务场景;
识别单元,其用于调用模糊意图识别模型和对应所述业务场景的用户意图识别模型对所述反馈数据的用户意图进行识别;其中,所述模糊意图识别模型用于判断所述反馈数据是否属于模糊意图,所述用户意图识别模型用于识别反馈数据的明确意图;
确定单元,其用于根据所述调用模糊意图识别模型和所述用户意图识别模型的输出结果确定反馈数据的用户意图;其中,在认定所述反馈数据表达的用户意图不是模糊意图的情况下,将所述用户意图识别模型输出的明确意图确定为所述反馈数据的用户意图。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的用户意图的识别方法,或,所述处理器执行所述计算机程序时实现权利要求7所述的意图识别模型的训练方法。
10.一种计算机可读存储介质,其特征在于,所述可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的用户意图的识别方法,或,所述计算机程序被处理器执行时实现权利要求7所述的用户意图的识别方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211448756.3A CN116127008A (zh) | 2022-11-18 | 2022-11-18 | 用户意图的识别方法、装置、设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211448756.3A CN116127008A (zh) | 2022-11-18 | 2022-11-18 | 用户意图的识别方法、装置、设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116127008A true CN116127008A (zh) | 2023-05-16 |
Family
ID=86294489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211448756.3A Pending CN116127008A (zh) | 2022-11-18 | 2022-11-18 | 用户意图的识别方法、装置、设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116127008A (zh) |
-
2022
- 2022-11-18 CN CN202211448756.3A patent/CN116127008A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110704641B (zh) | 一种万级意图分类方法、装置、存储介质及电子设备 | |
CN111105782B (zh) | 会话交互处理方法、装置、计算机设备和存储介质 | |
CN112380853B (zh) | 业务场景交互方法、装置、终端设备及存储介质 | |
CN112507704B (zh) | 多意图识别方法、装置、设备及存储介质 | |
US11544721B2 (en) | Supporting automation of customer service | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
CN112364622A (zh) | 对话文本分析方法、装置、电子装置及存储介质 | |
CN112667803A (zh) | 一种文本情感分类方法及装置 | |
US20230351121A1 (en) | Method and system for generating conversation flows | |
CN111739537A (zh) | 语义识别方法、装置、存储介质及处理器 | |
CN110489517B (zh) | 虚拟助理的自动学习方法及系统 | |
CN116127008A (zh) | 用户意图的识别方法、装置、设备及可读存储介质 | |
CN113111157B (zh) | 问答处理方法、装置、计算机设备和存储介质 | |
CN113515642A (zh) | 电话营销关键断点确定方法及装置 | |
CN114254088A (zh) | 自动应答模型的构建方法和自动应答方法 | |
CN114564968A (zh) | 基于人机对话的意图识别方法、系统、终端及介质 | |
CN113407699A (zh) | 对话方法、装置、设备和存储介质 | |
CN113688222A (zh) | 基于上下文语义理解的保险销售任务话术推荐方法、系统以及设备 | |
CN112115248A (zh) | 一种从对话语料中抽取对话策略结构的方法及系统 | |
CN113676603B (zh) | 呼叫控制方法、装置、设备及存储介质 | |
CN117725185B (zh) | 智能对话生成方法及系统 | |
US20240193190A1 (en) | Automated key-value extraction using natural language intents | |
CN117915002A (zh) | 一种机器人智能外呼实现方法及系统 | |
CN115455164A (zh) | 意愿级别的识别方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |