CN112597290A - 结合上下文的意图识别方法、系统、电子设备和存储介质 - Google Patents

结合上下文的意图识别方法、系统、电子设备和存储介质 Download PDF

Info

Publication number
CN112597290A
CN112597290A CN202011557987.9A CN202011557987A CN112597290A CN 112597290 A CN112597290 A CN 112597290A CN 202011557987 A CN202011557987 A CN 202011557987A CN 112597290 A CN112597290 A CN 112597290A
Authority
CN
China
Prior art keywords
intention
target
rule
control instruction
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011557987.9A
Other languages
English (en)
Other versions
CN112597290B (zh
Inventor
邓艳江
罗超
胡泓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ctrip Computer Technology Shanghai Co Ltd
Original Assignee
Ctrip Computer Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ctrip Computer Technology Shanghai Co Ltd filed Critical Ctrip Computer Technology Shanghai Co Ltd
Priority to CN202011557987.9A priority Critical patent/CN112597290B/zh
Publication of CN112597290A publication Critical patent/CN112597290A/zh
Application granted granted Critical
Publication of CN112597290B publication Critical patent/CN112597290B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/183Speech classification or search using natural language modelling using context dependencies, e.g. language models
    • G10L15/187Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种结合上下文的意图识别方法、系统、电子设备和存储介质。意图识别方法包括:建立包括多个意图规则的意图规则库,意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;获取用户端输入的目标用户语音、以及与目标上文话术控制指令;将用户语音转换为对应的目标语音文本;将目标语音文本和目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为目标用户语音的目标意图识别结果。实现了对目标语音文本意图的自动识别,避免了误识别和无法识别的情形,提高了识别的准确程度,减少了获取、处理历史数据的时间和成本,大大提高了识别的效率。

Description

结合上下文的意图识别方法、系统、电子设备和存储介质
技术领域
本发明涉及意图识别技术领域,特别涉及一种结合上下文的意图识别方法、系统、电子设备和存储介质。
背景技术
语音客服机器人应用场景下,机器人在与人进行交流时,通过语音转换技术将语音转换为文本后,需要对文本进行语义理解,分析出用户的意图,进而让机器人根据用户的意图选择合适的对话策略,以做出响应并完成整个对话流程。目前意图识别的主要方法是转换为文本分类任务,业界通常采用规则匹配或深度学习进行分类。
对于深度学习而言,深度学习往往需要大量的训练样本,在某些领域或场景下,可提供的训练样本比较少,比如在服务机器人领域,机器人处理特定领域业务咨询过程中,涉及的训练样本较少,如果仍使用基于机器学习或者深度学习的方法进行意图识别,可能会由于数据训练样本较少使得训练出来的模型无法准确识别出用户意图,甚至无法识别用户意图,导致无法给用户提供较为准确的业务问答。
若采用规则匹配方法,由于口语转换的文本与书面文本在语法结构、表达方式等方面存在较大差异,如口语中单句话往往会伴随省略或指代,因而导致利用基于单句消息的匹配规则进行意图识别时,常常会出现因语音不全导致的误识别和无法识别的问题。如需确保能正确地识别意图,则需要结合上下文(历史消息)进行匹配,但如果完全利用历史消息的文本内容,将导致样本量的急剧增加,因为原来的样本是单句消息,加上历史消息后样本变为多句消息。同时,并非所有的意图识别都需要结合上下文,因此结合上下文文本进行意图识别的代价过大。
发明内容
本发明要解决的技术问题是为了克服现有技术中基于单句消息的匹配规则进行意图识别时常出现误识别和无法识别、在结合上下文文本进行意图识别时代价过大的缺陷,提供一种结合上下文的意图识别方法、系统、电子设备和存储介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种结合上下文的意图识别方法,包括:
建立包括多个意图规则的意图规则库,所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;
获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令;
将所述用户语音转换为对应的目标语音文本;
将所述目标语音文本和所述目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。
较佳地,在所述意图规则库中,至少部分所述意图规则配置有黑名单或白名单,所述黑名单或所述白名单中配置有相应的上文话术控制指令。
较佳地,所述将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果,包括:
从所述意图规则库中获取当前意图规则;
判断当前意图规则是否配置有黑名单或白名单;
当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时,将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配,若匹配成功,将所述当前意图规则对应的意图作为所述目标意图识别结果,若匹配不成功,则将下一个意图规则作为所述当前意图规则,并返回所述从所述意图规则库中获取当前意图规则的步骤,直至遍历所述意图规则库;
当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时,直接将下一个意图规则作为所述当前意图规则,并返回所述从所述意图规则库中获取当前意图规则的步骤,直至遍历所述意图规则库。
较佳地,所述建立包括多个意图规则的意图规则库,包括:
获取若干对话样本,各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令;
获取与各所述语音样本文本对应的正则表达式;
获取与各所述语音样本文本对应的意图;
建立各所述语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系,以构成意图规则;
根据各所述意图规则建立所述意图规则库。
较佳地,在将所述用户语音转换为对应的目标语音文本之后,所述方法还包括:
对所述目标语音文本进行纠错处理。
较佳地,在得到所述目标用户语音的目标意图识别结果之后,所述方法还包括:
根据所述目标意图识别结果,获取下一轮次话术控制指令。
本发明还提供一种结合上下文的意图识别系统,包括:
规则库建立模块,用于建立包括多个意图规则的意图规则库,所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;
输入获取模块,用于获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令;
语音转换模块,用于将所述用户语音转换为对应的目标语音文本;
意图识别模块,用于将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。
较佳地,在所述意图规则库中,至少部分所述意图规则配置有黑名单或白名单,所述黑名单或所述白名单中配置有相应的上文话术控制指令。
较佳地,所述意图识别模块包括:
规则获取单元,用于从所述意图规则库中获取当前意图规则;
判断单元,用于判断所述当前意图规则是否配置有黑名单或白名单;
第一处理单元,用于当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时,将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配,若匹配成功,将所述当前意图规则对应的意图作为所述目标意图识别结果,若匹配不成功,则将下一个意图规则作为所述当前意图规则,并重新调用所述规则获取单元,直至遍历所述意图规则库;
第二处理单元,用于当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时,直接将下一个意图规则作为所述当前意图规则,并重新调用所述规则获取单元,直至遍历所述意图规则库。
较佳地,所述规则库建立模块包括:
样本获取单元,用于获取若干对话样本,各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令;
正则表达式获取单元,用于获取与各所述语音样本文本对应的正则表达式;
意图获取单元,用于获取与各所述语音样本文本对应的意图;
规则构建单元,用于建立各所述语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系,以构成意图规则;
规则库建立单元,用于根据各所述意图规则建立所述意图规则库。
较佳地,所述语音转换模块还用于对所述目标语音文本进行纠错处理。
较佳地,所述系统还包括:话术指令获取模块,用于根据所述目标意图识别结果,获取下一轮次话术控制指令。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任意组合的结合上下文的意图识别方法。
本发明还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述任意组合的结合上下文的意图识别方法。
本发明的积极进步效果在于:
通过预先建立包括多个意图规则的意图规则库,所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系,而后将目标语音文本、以及与目标用户语音对应的目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果,由于目标用户语音的上文是基于所述上文话术控制指令生成的话术,即,上文话术控制指令可以直接反映上文的话术内容,因而基于用户语音和对应的上文话术控制指令实现的意图识别即相当于是基于上下文实现的意图识别,从而避免了因语音不全导致的误识别和无法识别的情形,提高了意图识别的准确程度,同时,采用上文话术控制指令来代替上文具体内容进行匹配,减少了获取、处理历史数据的时间和成本,大大提高了意图识别的效率。
附图说明
图1为本发明实施例1的结合上下文的意图识别方法的流程图。
图2为本发明实施例2的结合上下文的意图识别方法的流程图。
图3为本发明实施例3的结合上下文的意图识别系统的结构框图。
图4为本发明实施例4的结合上下文的意图识别系统的结构框图。
图5为本发明实施例5的电子设备的硬件结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
实施例1
发明人注意到,智能客服机器人中设有一个对话管理组件,其是机器人做出下一步对话动作决策的一个组件,该组件用于输出话术控制指令到机器人的自然语言生成模块,该自然语言生成模块将生成与话术控制指令对应的话术并返回给客人。所述话术控制指令可以作为历史消息的总结,比直接采用历史消息的原始文本语义上更明显。
基于上述内容,如图1所示,本实施例提供一种结合上下文的意图识别方法,包括:
S101、建立包括多个意图规则的意图规则库,意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;
S102、获取用户端输入的目标用户语音、以及与目标用户语音对应的目标上文话术控制指令;
S103、将用户语音转换为对应的目标语音文本;
S104、将目标语音文本和目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为目标用户语音的目标意图识别结果。
本实施例中的结合上下文的意图识别方法,通过建立包括意图与相应的正则表达式和上文话术控制指令之间的映射关系的意图规则库,并基于上文话术控制指令和目标语音文本进行规则匹配,得到目标意图识别结果。由于目标用户语音的上文是基于所述上文话术控制指令生成的话术,即,上文话术控制指令可以直接反映上文的话术内容,因而基于用户语音和对应的上文话术控制指令进行规则匹配实现的意图识别,即相当于是基于上下文实现的意图识别,避免了因语音不全导致的误识别和无法识别的情形,提高了意图识别的准确程度;同时,采用上文话术控制指令来代替上文具体内容进行匹配,减少了获取、处理历史数据的时间和成本,大大提高了意图识别的效率。
实施例2
如图2所示,本实施例的结合上下文的意图识别方法是对实施例1的进一步改进,具体地:
本实施例中,在意图规则库中,至少部分意图规则配置有黑名单或白名单,黑名单或白名单中配置有相应的上文话术控制指令。下面结合如下例1、例2对黑、白名单进行举例说明:
例1
机器人在服务过程中与客人进行如下对话:
-机器人:订单尾号是多少?
-客人:三幺五。
-机器人:房号是多少?
-客人:三幺五。
例1中,因口语表达习惯,客人在对话过程中省略了主语,客人两次回复的文本内容一样,但意图却不同。第一句“三幺五”对应的意图为“回复-订单号”,对应的上文话术控制指令是:“询问-订单号”指令;第二句“三幺五”对应的意图为“回复-房号”,对应的上文话术控制指令是:“询问-房号”指令。
对于这类场景,本实施例设置了白名单以存储与相应意图对应的上文话术控制指令。例如,在“回复-订单号”意图对应的意图规则中配置白名单,该白名单内存储有上文话术控制指令“询问-订单号”。那么,当上文话术控制指令是“询问-订单号”指令时,若客人回答纯数字话术(与“回复-订单号”意图对应的正则表达式匹配),则将客人的意图识别为“回复-订单号”意图。
例2
机器人在服务过程中与客人进行如下对话:
-机器人:客人入住了吗?
-客人:没有。
-机器人:客人没有入住,对吗?
-客人:没有。
例2中,客人两次回复的文本内容一样,但意图却不同。第一句“没有”对应的意图为“否定”,对应的上文话术控制指令是:“澄清-未入住”指令;第二句“没有”对应的意图为“肯定”,对应的上文话术控制指令也是:“澄清-未入住”指令。
对于这类场景,本实施例设置了黑白名单以存储与相应意图对应的上文话术控制指令。例如,在“否定”意图对应的意图规则中配置黑名单,该黑名单内存储有上文话术控制指令“澄清-未入住”。在“肯定”意图对应的意图规则中配置白名单,该白名单内存储有上文话术控制指令“澄清-未入住”。那么,当上文话术控制指令不是“澄清-未入住”时,“没有”被识别为“否定”,而当上文话术控制指令是“澄清-未入住”时,“没有”识别为“肯定”。
利用上文话术控制指令黑\白名单机制,一方面可以实现对上下文的利用,防止因客人口语习惯存在省略句子成分导致意图误识别;另一方面也可以实现基于上文话术控制指令对目标语音文本的意图类型进行限定,针对特殊的目标语音文本可以定制专有的意图类型。
在本实施例中,步骤S101主要包括:
S10101、获取若干对话样本,各对话样本分别包括用户输入的语音样本文本以及与语音样本文本对应的上文话术控制指令;
S10102、获取配置的与各语音样本文本对应的正则表达式;
S10103、获取配置的与各语音样本文本对应的意图;
S10104、建立各语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系,以构成意图规则;
S10105、根据各意图规则建立意图规则库。
当有意图规则配置有黑名单或白名单时,步骤S101还包括:在相应意图规则中增加黑名单或白名单。
例如,建立的意图规则库包括以下四个意图规则:
1.-id(意图规则ID):response_already_check_out_2
intentName(意图):回复-离店
ruleGroup(意图规则):
-pattern(正则表达式):"不住了|没住了"
actionWhiteList(白名单):
-ask_already_check_out(询问-已退房)
-ask_check_out(询问-退房)
-clarify_check_out(澄清-退房)
2.-id:ask_spelling_2
intentName:询问-拆字解释
ruleGroup:
-pattern:"哪一?个单"
actionWhiteList:
-info_order_name(订单名信息)
-info_spelling(信息拆字解释)
3.-id:deny_2
intentName:否定
ruleGroup:
-pattern:"不[是对]|^[^没未]{0,4}(来了|来过|过来|入住|住.{0,3}了|住过|有住|有来)"
actionWhiteList:
-clarify_not_check_in(澄清-未入住)
-clarify_none_check_in(澄清-没人入住)
4.id:affirm_4
intentName:肯定
ruleGroup:
-pattern:"[是对][的啊呀]|没有?(来|过来|入住|到|住)|没的|没有$"
contraPattern(相对模式):"对不起"
actionWhiteList:
-clarify_not_check_in(澄清-未入住)
-clarify_none_check_in(澄清-没人入住)
步骤S101基于若干对话样本,建立意图与相应的正则表达式和上文话术控制指令之间的映射关系,进一步建立配置有黑\白名单的意图规则以形成意图规则库,基于该意图规则库可以实现对目标语音文本在上下文中意图的自动识别,避免因语音不全导致的误识别和无法识别的情形,提高意图识别的准确程度,减少获取、处理历史数据的时间和成本,大大提高意图识别的效率。
在步骤S103之后,本实施例的方法还包括:
S10301对目标语音文本进行纠错处理。例如,纠错处理的具体过程如下:根据预设的标准词库,确定所述目标语音文本中的待纠错词以及与所述待纠错词对应的替换词;将所述目标语音文本中的所述待纠错词替换为对应的所述替换词。具体地,标准词库中预先设置有若干常用标准词。
在本实施例中,步骤S104包括:
S10401、从意图规则库中获取当前意图规则;
S10402、判断当前意图规则是否配置有黑名单或白名单;
S10403、当当前意图规则未配置黑名单或白名单、或者当前意图规则配置有黑名单但目标上文话术控制指令不在黑名单内、或者当前意图规则配置有白名单且目标上文话术控制指令在白名单内时(条件1),将目标语音文本和目标上文话术控制指令与当前意图规则中的正则表达式和上文话术控制指令进行匹配,若匹配成功,将当前意图规则对应的意图作为目标意图识别结果,若匹配不成功,则将下一个意图规则作为当前意图规则,并返回从意图规则库中获取当前意图规则的步骤,直至遍历意图规则库;
S10404、当当前意图规则配置有黑名单且目标上文话术控制指令在黑名单内、或者当前意图规则配置有白名单但目标上文话术控制指令不在白名单内时(条件2),直接将下一个意图规则作为当前意图规则,并返回从意图规则库中获取当前意图规则的步骤,直至遍历意图规则库。
在步骤S104之后,方法还包括:
根据目标意图识别结果,获取下一轮次话术控制指令,以将下一轮次话术控制指令发送到机器人的自然语言生成模块,该自然语言生成模块将生成与话术控制指令对应的话术并返回给客人,以便针对客人的意图识别结果进行回复,从而完成对话。
本实施例中的结合上下文的意图识别方法,通过建立意图与相应的正则表达式和上文话术控制指令之间的映射关系,进一步建立配置有黑\白名单的意图规则以形成意图规则库,并基于上文话术控制指令和目标语音文本进行规则匹配,得到目标意图识别结果,实现了对目标语音文本在上下文中意图的自动识别,基于上文话术控制指令对目标语音文本的意图类型进行限定,针对特殊的目标语音文本定制专有的意图类型,避免了因语音不全导致的误识别和无法识别的情形,提高了意图识别的准确程度,减少了获取、处理历史数据的时间和成本,大大提高了意图识别的效率。
实施例3
如图3所示,本实施例提供一种结合上下文的意图识别系统,包括:
规则库建立模块1,用于建立包括多个意图规则的意图规则库,意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;
输入获取模块2,用于获取用户端输入的目标用户语音、以及与目标用户语音对应的目标上文话术控制指令;
语音转换模块3,用于将用户语音转换为对应的目标语音文本;
意图识别模块4,用于将目标语音文本和目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为目标用户语音的目标意图识别结果。
本实施例中的结合上下文的意图识别系统,通过建立包括意图与相应的正则表达式和上文话术控制指令之间的映射关系的意图规则库,并基于上文话术控制指令和目标语音文本进行规则匹配,得到目标意图识别结果。由于目标用户语音的上文是基于所述上文话术控制指令生成的话术,即,上文话术控制指令可以直接反映上文的话术内容,因而基于用户语音和对应的上文话术控制指令进行规则匹配实现的意图识别,即相当于是基于上下文实现的意图识别,避免了因语音不全导致的误识别和无法识别的情形,提高了意图识别的准确程度;同时,采用上文话术控制指令来代替上文具体内容进行匹配,减少了获取、处理历史数据的时间和成本,大大提高了意图识别的效率。
实施例4
如图4所示,本实施例的结合上下文的意图识别系统是对实施例3的进一步改进,具体地:
本实施例中,在意图规则库中,至少部分意图规则配置有黑名单或白名单,黑名单或白名单中配置有相应的上文话术控制指令。
下面通过如下例1、例2对黑、白名单进行举例说明:
例1
机器人在服务过程中与客人进行如下对话:
-机器人:订单尾号是多少?
-客人:三幺五。
-机器人:房号是多少?
-客人:三幺五。
例1中,因口语表达习惯,客人在对话过程中省略了主语,客人两次回复的文本内容一样,但意图却不同。第一句“三幺五”对应的意图为“回复-订单号”,对应的上文话术控制指令是:“询问-订单号”指令;第二句“三幺五”对应的意图为“回复-房号”,对应的上文话术控制指令是:“询问-房号”指令。
对于这类场景,本实施例设置了白名单以存储与相应意图对应的上文话术控制指令。例如,在“回复-订单号”意图对应的意图规则中配置白名单,该白名单内存储有上文话术控制指令“询问-订单号”。那么,当上文话术控制指令是“询问-订单号”指令时,若客人回答纯数字话术(与“回复-订单号”意图对应的正则表达式匹配),则将客人的意图识别为“回复-订单号”意图。
例2
机器人在服务过程中与客人进行如下对话:
-机器人:客人入住了吗?
-客人:没有。
-机器人:客人没有入住,对吗?
-客人:没有。
例2中,客人两次回复的文本内容一样,但意图却不同。第一句“没有”对应的意图为“否定”,对应的上文话术控制指令是:“澄清-未入住”指令;第二句“没有”对应的意图为“肯定”,对应的上文话术控制指令也是:“澄清-未入住”指令。
对于这类场景,本实施例设置了黑白名单以存储与相应意图对应的上文话术控制指令。例如,在“否定”意图对应的意图规则中配置黑名单,该黑名单内存储有上文话术控制指令“澄清-未入住”。在“肯定”意图对应的意图规则中配置白名单,该白名单内存储有上文话术控制指令“澄清-未入住”。那么,当上文话术控制指令不是“澄清-未入住”时,“没有”被识别为“否定”,而当上文话术控制指令是“澄清-未入住”时,“没有”识别为“肯定”。
利用上文话术控制指令黑\白名单机制,一方面可以实现对上下文的利用,防止因客人口语习惯存在省略句子成分导致意图误识别;另一方面也可以实现基于上文话术控制指令对目标语音文本的意图类型进行限定,针对特殊的目标语音文本可以定制专有的意图类型。
规则库建立模块1包括:
样本获取单元11,用于获取若干对话样本,各对话样本分别包括用户输入的语音样本文本以及与语音样本文本对应的上文话术控制指令;
正则表达式获取单元12,用于获取与各语音样本文本对应的正则表达式;
意图获取单元13,用于获取与各语音样本文本对应的意图;
规则构建单元14,用于建立各语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系,以构成意图规则;
规则库建立单元15,用于根据各意图规则建立意图规则库。
当有意图规则配置有黑名单或白名单时,规则库建立模块1还包括:在相应意图规则中增加黑名单或白名单。
例如,建立的意图规则库包括以下四个意图规则:
1.-id:response_already_check_out_2
intentName:回复-离店
ruleGroup:
-pattern:"不住了|没住了"
actionWhiteList:
-ask_already_check_out
-ask_check_out
-clarify_check_out
2.-id:ask_spelling_2
intentName:询问-拆字解释
ruleGroup:
-pattern:"哪一?个单"
actionWhiteList:
-info_order_name
-info_spelling
3.-id:deny_2
intentName:否定
ruleGroup:
-pattern:"不[是对]|^[^没未]{0,4}(来了|来过|过来|入住|住.{0,3}了|住过|有住|有来)"
actionWhiteList:
-clarify_not_check_in
-clarify_none_check_in
4.id:affirm_4
intentName:肯定
ruleGroup:
-pattern:"[是对][的啊呀]|没有?(来|过来|入住|到|住)|没的|没有$"
contraPattern:"对不起"
actionWhiteList:
-clarify_not_check_in
-clarify_none_check_in
规则库建立模块1基于若干对话样本,建立意图与相应的正则表达式和上文话术控制指令之间的映射关系,进一步建立配置有黑\白名单的意图规则以形成意图规则库,基于该意图规则库可以实现对目标语音文本在上下文中意图的自动识别,避免因语音不全导致的误识别和无法识别的情形,提高意图识别的准确程度,减少获取、处理历史数据的时间和成本,大大提高意图识别的效率。
语音转换模块3还用于对目标语音文本进行纠错处理。例如,纠错处理的具体过程如下:根据预设的标准词库,确定所述目标语音文本中的待纠错词以及与所述待纠错词对应的替换词;将所述目标语音文本中的所述待纠错词替换为对应的所述替换词。具体地,标准词库中预先设置有若干常用标准词。
在本实施例中,意图识别模块4包括:
规则获取单元41,用于从意图规则库中获取当前意图规则;
判断单元42,用于判断当前意图规则是否配置有黑名单或白名单;
第一处理单元43,用于当当前意图规则未配置黑名单或白名单、或者当前意图规则配置有黑名单但目标上文话术控制指令不在黑名单内、或者当前意图规则配置有白名单且目标上文话术控制指令在白名单内时,将目标语音文本和目标上文话术控制指令与当前意图规则中的正则表达式和上文话术控制指令进行匹配,若匹配成功,将当前意图规则对应的意图作为目标意图识别结果,若匹配不成功,则将下一个意图规则作为当前意图规则,并重新调用规则获取单元,直至遍历意图规则库;
第二处理单元44,用于当当前意图规则配置有黑名单且目标上文话术控制指令在黑名单内、或者当前意图规则配置有白名单但目标上文话术控制指令不在白名单内时,直接将下一个意图规则作为当前意图规则,并重新调用规则获取单元,直至遍历意图规则库。
意图识别系统还包括:话术指令获取模块5,用于根据目标意图识别结果,获取下一轮次话术控制指令,以将下一轮次话术控制指令发送到机器人的自然语言生成模块,该自然语言生成模块将生成与话术控制指令对应的话术并返回给客人,以便针对客人的意图识别结果进行回复,从而完成对话。
本实施例中的结合上下文的意图识别系统,通过建立意图与相应的正则表达式和上文话术控制指令之间的映射关系,进一步建立配置有黑\白名单的意图规则以形成意图规则库,并基于上文话术控制指令和目标语音文本进行规则匹配,得到目标意图识别结果,实现了对目标语音文本在上下文中意图的自动识别,基于上文话术控制指令对目标语音文本的意图类型进行限定,针对特殊的目标语音文本定制专有的意图类型,避免了因语音不全导致的误识别和无法识别的情形,提高了意图识别的准确程度,减少了获取、处理历史数据的时间和成本,大大提高了意图识别的效率。
实施例5
图5为本发明实施例5提供的一种电子设备的结构示意图。所述电子设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现实施例1或实施例2的结合上下文的意图识别方法。图4显示的电子设备30仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图5所示,电子设备30可以以通用计算设备的形式表现,例如其可以为服务器设备。电子设备30的组件可以包括但不限于:上述至少一个处理器31、上述至少一个存储器32、连接不同系统组件(包括存储器32和处理器31)的总线33。
总线33包括数据总线、地址总线和控制总线。
存储器32可以包括易失性存储器,例如随机存取存储器(RAM)321和/或高速缓存存储器322,还可以进一步包括只读存储器(ROM)323。
存储器32还可以包括具有一组(至少一个)程序模块324的程序/实用工具325,这样的程序模块324包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
处理器31通过运行存储在存储器32中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1或实施例2的结合上下文的意图识别方法。
电子设备30也可以与一个或多个外部设备34(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(I/O)接口35进行。并且,模型生成的设备30还可以通过网络适配器36与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器36通过总线33与模型生成的设备30的其它模块通信。应当明白,尽管图中未示出,可以结合模型生成的设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
实施例6
本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1或实施例2的结合上下文的意图识别方法的步骤。
其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1或实施例2的结合上下文的意图识别方法的步骤。
其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。

Claims (14)

1.一种结合上下文的意图识别方法,其特征在于,包括:
建立包括多个意图规则的意图规则库,所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;
获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令;
将所述用户语音转换为对应的目标语音文本;
将所述目标语音文本和所述目标上文话术控制指令与各意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。
2.根据权利要求1所述的结合上下文的意图识别方法,其特征在于,在所述意图规则库中,至少部分所述意图规则配置有黑名单或白名单,所述黑名单或所述白名单中配置有相应的上文话术控制指令。
3.根据权利要求2所述的结合上下文的意图识别方法,其特征在于,所述将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果,包括:
从所述意图规则库中获取当前意图规则;
判断当前意图规则是否配置有黑名单或白名单;
当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时,将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配,若匹配成功,将所述当前意图规则对应的意图作为所述目标意图识别结果,若匹配不成功,则将下一个意图规则作为所述当前意图规则,并返回所述从所述意图规则库中获取当前意图规则的步骤,直至遍历所述意图规则库;
当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时,直接将下一个意图规则作为所述当前意图规则,并返回所述从所述意图规则库中获取当前意图规则的步骤,直至遍历所述意图规则库。
4.根据权利要求1所述的结合上下文的意图识别方法,其特征在于,所述建立包括多个意图规则的意图规则库,包括:
获取若干对话样本,各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令;
获取与各所述语音样本文本对应的正则表达式;
获取与各所述语音样本文本对应的意图;
建立各所述语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系,以构成意图规则;
根据各所述意图规则建立所述意图规则库。
5.根据权利要求1所述的结合上下文的意图识别方法,其特征在于,在将所述用户语音转换为对应的目标语音文本之后,所述方法还包括:
对所述目标语音文本进行纠错处理。
6.根据权利要求1所述的结合上下文的意图识别方法,其特征在于,在得到所述目标用户语音的目标意图识别结果之后,所述方法还包括:
根据所述目标意图识别结果,获取下一轮次话术控制指令。
7.一种结合上下文的意图识别系统,其特征在于,包括:
规则库建立模块,用于建立包括多个意图规则的意图规则库,所述意图规则包含意图与相应的正则表达式和上文话术控制指令之间的映射关系;
输入获取模块,用于获取用户端输入的目标用户语音、以及与所述目标用户语音对应的目标上文话术控制指令;
语音转换模块,用于将所述用户语音转换为对应的目标语音文本;
意图识别模块,用于将所述目标语音文本和所述目标上文话术控制指令与各所述意图规则中的正则表达式和上文话术控制指令依次进行匹配,并将匹配成功的意图规则中的意图作为所述目标用户语音的目标意图识别结果。
8.根据权利要求7所述的结合上下文的意图识别系统,其特征在于,在所述意图规则库中,至少部分所述意图规则配置有黑名单或白名单,所述黑名单或所述白名单中配置有相应的上文话术控制指令。
9.根据权利要求8所述的结合上下文的意图识别系统,其特征在于,所述意图识别模块包括:
规则获取单元,用于从所述意图规则库中获取当前意图规则;
判断单元,用于判断所述当前意图规则是否配置有黑名单或白名单;
第一处理单元,用于当所述当前意图规则未配置黑名单或白名单、或者所述当前意图规则配置有黑名单但所述目标上文话术控制指令不在所述黑名单内、或者所述当前意图规则配置有白名单且所述目标上文话术控制指令在所述白名单内时,将所述目标语音文本和所述目标上文话术控制指令与所述当前意图规则中的正则表达式和上文话术控制指令进行匹配,若匹配成功,将所述当前意图规则对应的意图作为所述目标意图识别结果,若匹配不成功,则将下一个意图规则作为所述当前意图规则,并重新调用所述规则获取单元,直至遍历所述意图规则库;
第二处理单元,用于当所述当前意图规则配置有黑名单且所述目标上文话术控制指令在所述黑名单内、或者所述当前意图规则配置有白名单但所述目标上文话术控制指令不在所述白名单内时,直接将下一个意图规则作为所述当前意图规则,并重新调用所述规则获取单元,直至遍历所述意图规则库。
10.根据权利要求7所述的结合上下文的意图识别系统,其特征在于,所述规则库建立模块包括:
样本获取单元,用于获取若干对话样本,各所述对话样本分别包括用户输入的语音样本文本以及与所述语音样本文本对应的上文话术控制指令;
正则表达式获取单元,用于获取与各所述语音样本文本对应的正则表达式;
意图获取单元,用于获取与各所述语音样本文本对应的意图;
规则构建单元,用于建立各所述语音样本文本对应的意图、正则表达式和上文话术控制指令之间的映射关系,以构成意图规则;
规则库建立单元,用于根据各所述意图规则建立所述意图规则库。
11.根据权利要求7所述的结合上下文的意图识别系统,其特征在于,所述语音转换模块还用于对所述目标语音文本进行纠错处理。
12.根据权利要求7所述的结合上下文的意图识别系统,其特征在于,所述系统还包括:话术指令获取模块,用于根据所述目标意图识别结果,获取下一轮次话术控制指令。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1-6中任一项所述的结合上下文的意图识别方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-6中任一项所述的结合上下文的意图识别方法。
CN202011557987.9A 2020-12-25 2020-12-25 结合上下文的意图识别方法、系统、电子设备和存储介质 Active CN112597290B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011557987.9A CN112597290B (zh) 2020-12-25 2020-12-25 结合上下文的意图识别方法、系统、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011557987.9A CN112597290B (zh) 2020-12-25 2020-12-25 结合上下文的意图识别方法、系统、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN112597290A true CN112597290A (zh) 2021-04-02
CN112597290B CN112597290B (zh) 2023-08-01

Family

ID=75202670

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011557987.9A Active CN112597290B (zh) 2020-12-25 2020-12-25 结合上下文的意图识别方法、系统、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112597290B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110287285A (zh) * 2019-05-31 2019-09-27 平安科技(深圳)有限公司 一种问题意图识别方法、装置、计算机设备及存储介质
WO2020211006A1 (zh) * 2019-04-17 2020-10-22 深圳市欢太科技有限公司 语音识别方法、装置、存储介质及电子设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020211006A1 (zh) * 2019-04-17 2020-10-22 深圳市欢太科技有限公司 语音识别方法、装置、存储介质及电子设备
CN110287285A (zh) * 2019-05-31 2019-09-27 平安科技(深圳)有限公司 一种问题意图识别方法、装置、计算机设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
HAIHUA XIE: "《Observable Context-Based User Intention Specification in Context-Aware Environments》", 《2011 IEEE 35TH ANNUAL COMPUTER SOFTWARE AND APPLICATIONS CONFERENCE》 *
刘娇 等: "《人机对话系统中意图识别方法综述》", 《计算机工程与应用》 *

Also Published As

Publication number Publication date
CN112597290B (zh) 2023-08-01

Similar Documents

Publication Publication Date Title
KR102297394B1 (ko) 적절한 에이전트의 자동화된 어시스턴트 호출
US10776580B2 (en) Method for providing dialogue service with chatbot assisted by human agents
CN110838288B (zh) 一种语音交互方法及其系统和对话设备
JP2020537777A (ja) 発言のユーザ意図を識別するための方法および装置
KR20190046623A (ko) 자기-학습 자연 언어 이해를 갖는 다이얼로그 시스템
US10643601B2 (en) Detection mechanism for automated dialog systems
US11907665B2 (en) Method and system for processing user inputs using natural language processing
CN110765342A (zh) 信息查询方法及装置、存储介质、智能终端
CN114120978A (zh) 情绪识别模型训练、语音交互方法、装置、设备及介质
CN112541068A (zh) 语音对话的意图识别方法、系统、设备及存储介质
CN111858854A (zh) 一种基于历史对话信息的问答匹配方法及相关装置
US20220050968A1 (en) Intent resolution for chatbot conversations with negation and coreferences
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
CN113901837A (zh) 一种意图理解方法、装置、设备及存储介质
CN112087726B (zh) 彩铃识别的方法及系统、电子设备及存储介质
CN116821290A (zh) 面向多任务对话的大语言模型训练方法和交互方法
CN112597290B (zh) 结合上下文的意图识别方法、系统、电子设备和存储介质
CN116108918A (zh) 对话预训练模型的训练方法及相关装置
US20190279623A1 (en) Method for speech recognition dictation and correction by spelling input, system and storage medium
CN114860910A (zh) 智能对话方法及系统
CN113962213A (zh) 一种多轮对话生成方法、终端及计算机可读存储介质
CN111581971B (zh) 词库的更新方法、装置、终端及存储介质
US11996098B2 (en) Missed utterance resolutions
CN110222161B (zh) 对话机器人智能应答方法及装置
JP2018159729A (ja) 対話システム構築支援装置、方法、及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant