CN109388695A - 用户意图识别方法、设备及计算机可读存储介质 - Google Patents

用户意图识别方法、设备及计算机可读存储介质 Download PDF

Info

Publication number
CN109388695A
CN109388695A CN201811137113.0A CN201811137113A CN109388695A CN 109388695 A CN109388695 A CN 109388695A CN 201811137113 A CN201811137113 A CN 201811137113A CN 109388695 A CN109388695 A CN 109388695A
Authority
CN
China
Prior art keywords
answer
reply
mode
user
question
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811137113.0A
Other languages
English (en)
Other versions
CN109388695B (zh
Inventor
赵伟伟
张超
杨海军
徐倩
杨强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN201811137113.0A priority Critical patent/CN109388695B/zh
Publication of CN109388695A publication Critical patent/CN109388695A/zh
Application granted granted Critical
Publication of CN109388695B publication Critical patent/CN109388695B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/237Lexical tools
    • G06F40/242Dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

本发明公开了一种用户意图识别方法、设备及计算机可读存储介质,该方法包括步骤:当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式;将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果;若根据所述匹配结果确定所述答案模式中至少存在一个元素与所述回复模式的元素相同,则确定所述回复模式对应的意图为所述答案对应的用户意图。本发明实现了在人机交互过程中,用户可根据自己的习惯回答问题,然后通过模式匹配快速确定用户意图,由于模式匹配准确度高、计算速度快,因此本发明提高了人机交互的效率,以及提高了人机交互过程中的智能性。

Description

用户意图识别方法、设备及计算机可读存储介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种用户意图识别方法、设备及计算机可读存储介质。
背景技术
在自动电核领域,即自动识别用户回答的问题的领域,通常机器人播放一段问题录音后,机器人需要判断用户的回答属于既定的哪个选项。例如,机器人播放录音“请问您是xxx先生么?”,既定的选项为“用户称本人”、“用户称非本人”。准确的理解用户的意图是自动电核领域的关键部分,当前所用方法有两种:第一种是机器人播放带有编号的菜单,用户通过按键输入编号(以“#”或者“*”等特定符号结尾)来与机器人交互;第二种是机器人先播放问题,然后播放限定模式的可选答案,例如机器人问:“请问您是否是xxx先生,请回答是或者不是”,用户回答限定的可选答案“是”或者“不是”,机器人通过检测关键词来完成与用户之间的交互。现有的方法虽然能通过限定菜单编号,或者限定回答关键词完成人机交互,但用户需要在机器人中通过按键输入编号,以特定符号结尾,然后机器人识别用户输入的信息来实现人机交互,从而导致人机交互效率低下;或者通过检测用户回答的特定关键词来完成人机交互,用户不能根据自己的习惯回复问题,人机交互的交互过程不够智能。
发明内容
本发明的主要目的在于提供一种用户意图识别方法、设备及计算机可读存储介质,旨在解决现有的人机交互效率低下,不够智能化的技术问题。
为实现上述目的,本发明提供一种用户意图识别方法,所述用户意图识别方法包括步骤:
当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式;
将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果;
若根据所述匹配结果确定所述答案模式中至少存在一个元素与所述回复模式的元素相同,则确定所述回复模式对应的意图为所述答案对应的用户意图。
优选地,所述当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式的步骤包括:
当提取到用户回答待回答问题的答案后,对所述答案进行分词操作,得到与所述答案对应的词序列;
若所述词序列中相邻的至少两个词组成的短语存在预设的语素词典中,则将所述短语替换为所述语素词典中对应的语素名称,以生成与所述答案对应的答案模式。
优选地,所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤之前,还包括:
检测所述答案模式与所述回复模式的结构是否相同;
若所述答案模式与所述回复模式的结构相同,则执行所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤。
优选地,所述当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式的步骤之前,还包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合。
优选地,所述获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合的步骤包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典;
根据所述语素词典生成与所述回复对应的回复模式集合。
优选地,所述获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典的步骤之后,还包括:
检测是否存在与所述待回答问题语义相似度大于预设相似度的目标问题;
当检测到存在所述目标问题后,将所述待回答问题的语素词典作为所述目标问题的语素词典。
优选地,所述获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合的步骤包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式;
在所述回复模式中删除未包含预设语素的回复模式,得到删减后的所述回复模式,并将删减后的所述回复模式作为回复模式集合存储。
优选地,所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤之后,还包括:
若根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则重新输出所述待回答问题,并计算输出所述待回答问题的输出次数;
若检测到在所述输出次数大于或者等于预设次数时,根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则确定用户意图识别失败。
此外,为实现上述目的,本发明还提供一种用户意图识别设备,所述用户意图识别设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的用户意图识别程序,所述用户意图识别程序被所述处理器执行时实现如上所述的用户意图识别方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有用户意图识别程序,所述用户意图识别程序被处理器执行时实现如上所述的用户意图识别方法的步骤。
本发明通过当提取到用户回答待回答问题的答案后,生成与该答案对应的答案模式,将答案模式与回复模式进行匹配,若根据所得的匹配结果确定答案模式中至少存在一个元素与回复模式相同,则确定回复模式对应的意图为用户回答待回答问题对应答案的用户意图。实现了在人机交互过程中,不需要在播放限定的答案让用户选择,也不需要用户通过输入特定编号来实现人机交互,用户可根据自己的习惯回答问题,然后通过模式匹配快速确定用户意图,由于模式匹配准确度高、计算速度快,因此本发明提高了人机交互的效率,以及提高了人机交互过程中的智能性。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的结构示意图;
图2是本发明用户意图识别方法第一实施例的流程示意图;
图3是本发明用户意图识别方法第二实施例的流程示意图;
图4是本发明用户意图识别方法第四实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的结构示意图。
需要说明的是,图1即可为用户意图识别设备的硬件运行环境的结构示意图。本发明实施例用户意图识别设备可以是PC,便携计算机等终端设备。
如图1所示,该用户意图识别设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的用户意图识别设备结构并不构成对用户意图识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及用户意图识别程序。其中,操作系统是管理和控制用户意图识别设备硬件和软件资源的程序,支持用户意图识别程序以及其它软件或程序的运行。
在图1所示的用户意图识别设备中,用户接口1003主要用于接收用户输入的操作指令;网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;而处理器1001可以用于调用存储器1005中存储的用户意图识别程序,并执行以下操作:
当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式;
将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果;
若根据所述匹配结果确定所述答案模式中至少存在一个元素与所述回复模式的元素相同,则确定所述回复模式对应的意图为所述答案对应的用户意图。
进一步地,所述当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式的步骤包括:
当提取到用户回答待回答问题的答案后,对所述答案进行分词操作,得到与所述答案对应的词序列;
若所述词序列中相邻的至少两个词组成的短语存在预设的语素词典中,则将所述短语替换为所述语素词典中对应的语素名称,以生成与所述答案对应的答案模式。
进一步地,所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤之前,处理器1001还可以用于调用存储器1005中存储的用户意图识别程序,并执行以下步骤:
检测所述答案模式与所述回复模式的结构是否相同;
若所述答案模式与所述回复模式的结构相同,则执行所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤。
进一步地,述当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式的步骤之前,处理器1001还可以用于调用存储器1005中存储的用户意图识别程序,并执行以下步骤:
获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合。
进一步地,所述获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合的步骤包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典;
根据所述语素词典生成与所述回复对应的回复模式集合。
进一步地,所述获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典的步骤之后,处理器1001还可以用于调用存储器1005中存储的用户意图识别程序,并执行以下步骤:
检测是否存在与所述待回答问题语义相似度大于预设相似度的目标问题;
当检测到存在所述目标问题后,将所述待回答问题的语素词典作为所述目标问题的语素词典。
进一步地,所述获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合的步骤包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式;
在所述回复模式中删除未包含预设语素的回复模式,得到删减后的所述回复模式,并将删减后的所述回复模式作为回复模式集合存储。
进一步地,所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤之后,处理器1001还可以用于调用存储器1005中存储的用户意图识别程序,并执行以下步骤:
若根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则重新输出所述待回答问题,并计算输出所述待回答问题的输出次数;
若检测到在所述输出次数大于或者等于预设次数时,根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则确定用户意图识别失败。
基于上述的结构,提出用户意图识别方法的各个实施例。
参照图2,图2为本发明用户意图识别方法第一实施例的流程示意图。
本发明实施例提供了用户意图识别方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
用户意图识别方法应用于服务器或者终端中,终端可以包括诸如手机、平板电脑、笔记本电脑、掌上电脑、个人数字助理(Personal Digital Assistant,PDA)、机器人等移动终端,以及诸如数字TV、台式计算机等固定终端。用户意图识别方法的各个实施例中,为了便于描述,以机器人为执行主体进行阐述各个实施例。用户意图识别方法包括:
步骤S10,当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式。
在智能问答场景中,机器人可通过文字或者语音的方式输出待回答问题,用户可通过语音或者文字的方式回答该待回答问题。可以理解的是,当用户通过语音的方式回答该待回答问题时,机器人通过其麦克风提取用户回答待回答问题的答案;当用户通过文字的方式回答该待回答问题时,机器人可通过用户在其显示界面提取用户回答待回答问题的答案。当机器人提取到用户回答待回答问题的答案后,生成与该答案对应的答案模式。
进一步地,步骤S10包括:
步骤a,当提取到用户回答待回答问题的答案后,对所述答案进行分词操作,得到与所述答案对应的词序列。
具体地,当机器人提取到用户回答待回答问题的答案后,机器人对所提取的答案进行分词操作,得到与该答案对应的词序列。在本实施例中,机器人可根据正向最大匹配算法、基于n元语法的分词算法和基于隐马尔可夫模型的分词算法等算法对答案进行分词操作;或者机器人也可以根据对应工作人员在其显示界面中触发的分词指令对答案进行分词操作。如若待回答问题为“是否是本人”,且用户回答的答案为“你好是我”,对应的词序列为“你好/是/我”,即得到3个词组成的词序列。
步骤b,若所述词序列中相邻的至少两个词组成的短语存在预设的语素词典中,则将所述短语替换为所述语素词典中对应的语素名称,以生成与所述答案对应的答案模式。
当机器人得到答案对应的词序列后,机器人将词序列中相邻的至少两个词组成短语,判断该短语是否存在预设的语素词典中。若机器人确定该短语存在语素词典中,机器人则将该短语替换为语素词典中对应的语素名称,生成与答案对应的答案模式。如词序列“你好/是/我”组成的短语有“你好是”、“是我”和“你好是我”。预设的语素词典是机器人预先存储的。不同问题对应的语素词典可能不一样,也可能一样。如是否类问题对应的语素词典包括肯定语素词典和否定语素词典,正确与否类问题对应的语素词典包括正确语素词典和错误语素词典等。可以理解的是,“是否是本人”、“是否是本人操作”等问题是否类问题;“是否正确”,“这样回答对吗”等问题是正确与否类问题。
在语素词典中,预先存储有对应的语素。如在“是否是本人”的肯定语素词典中,存储有“是呀”、“是是是”、“是嗯”、“是我”、“是是”、“是的”“是我呀”“是我啊”“是的呀”和“是的是的”等肯定语素;在“是否是本人”否定语素词典中,存储有“我不是”、“我是他妈妈”、“我是他爱人”、“我是她老公”、“我是他老婆”、“不是”和“不是的”等否定语素。语素名称为“肯定语素”、“否定语素”和“正确语素”等。如当词序列中至少两个词组成的短语为“是我”存在肯定语素中,则对应的答案模式为[你好肯定语素]。
进一步地,为了避免词序列中相邻的词组成的短语过长,提高生成答案模式的效率,可限制短语对应的词数量。如若词序列中相邻的n个词组成短语,可将n设置为2≤n≤10,或者设置为2≤n≤8等,其中,n为正整数。
步骤S20,将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果。
当得到答案对应的答案模式后,机器人根据待回答问题获取预先存储的,对应的回复模式集合,将答案模式与回复模式集合中存储的回复模式进行匹配,得到匹配结果。具体地,机器人将答案模式中的各个元素与回复模式的各个元素进行对比,得到匹配结果。在本实施例中,存在两种匹配结果,一种是答案模式中存在至少一个元素与回复模式的元素相同;另一种是答案模式中不存在与回复模式相同的元素。在机器人中,每一待回答问题都存在对应的回复模式集合,每一种回复模式都设置了对应的意图。
进一步地,为了提高得到匹配结果的效率,用户意图识别方法还包括:
步骤c,检测所述答案模式与所述回复模式的结构是否相同;
若所述答案模式与所述回复模式的结构相同,则执行步骤S20。
进一步地,机器人将答案模式中的各个元素与回复模式的各个元素进行对比之前,先将答案模式的结构与回复模式的结构进行匹配,以检测答案模式与回复模式的结构是否相同。当检测到答案模式的结构与回复模式的结构相同时,机器人才将答案模式中的各个元素与回复模式的各个元素进行对比,得到匹配结果。当检测到答案模式的结构与回复模式的结构不相同时,机器人确定答案模式中不存在与回复模式相同的元素。在本实施例中,只将代表语素名称的词记为元素,如“肯定语素”、“否定语素”和“正确语素”等,而不将“你好”这中词记为元素。
具体地,检测答案模式的结构与回复模式的结构是否相同的过程为:判断答案模式和回复模式中是否存在相同个数的元素。当答案模式和回复模式中存在相同个数的元素时,机器人确定答案模式和回复模式的结构相同;当答案模式和回复模式中元素个数不一致时,机器人确定答案模式的结构与回复模式的结构不相同。
步骤S30,若根据所述匹配结果确定所述答案模式中至少存在一个元素与所述回复模式的元素相同,则确定所述回复模式对应的意图为所述答案对应的用户意图。
若机器人根据匹配结果确定答案模式中至少存在一个元素与回复模式的元素相同,机器人则确定回复模式对应的意图为该答案对应的用户意图。可以理解的是,在机器人中,每一回复模式都以设定好了对应的意图。如当答案模式为[你好肯定语素],而回复模式为[你好肯定语素*],则确定答案模式与回复模式之间存在相同元素“肯定语素”。需要说明的是,回复模式中的“*”表示通配符,即该位置对应的词可以是任意词,如[你好肯定语素哈哈]与[你好肯定语素*]也是可以匹配成功的,这两个模式也存在相同的元素“肯定语素”。在其它实施例中,通配符也可以用其它符号,如“&”表示。可以理解的是,在检测答案模式的结构与回复模式的结构是否相同的过程中,不考虑回复模式中的通配符。
进一步地,若机器人根据匹配结果确定答案模式中不存在元素与回复模式的元素相同,机器人则识别答案对应的用户意图识别失败。
本实施例通过当提取到用户回答待回答问题的答案后,生成与该答案对应的答案模式,将答案模式与回复模式进行匹配,若根据所得的匹配结果确定答案模式中至少存在一个元素与回复模式相同,则确定回复模式对应的意图为用户回答待回答问题对应答案的用户意图。实现了在人机交互过程中,不需要在播放限定的答案让用户选择,也不需要用户通过输入特定编号来实现人机交互,用户可根据自己的习惯回答问题,然后通过模式匹配快速确定用户意图,由于模式匹配准确度高、计算速度快,因此本实施例提高了人机交互的效率,以及提高了人机交互过程中的智能性。
进一步地,提出本发明用户意图识别方法第二实施例。
所述用户意图识别方法第二实施例与所述用户意图识别方法第一实施例的区别在于,参照图3,用户意图识别方法还包括:
步骤S40,获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合。
机器人获取预设时长内待回答问题在目标选项下用户所有的回复,生成与该回复对应的回复模式,将该回复模式形成一个回复模式集合,并存储该回复模式集合。可以理解的是,回复即是用户回答待回答问题的答案,生成与该回复对应的回复模式与第一实施例中生成答案模式的过程一致,在本实施例中不再详细赘述。其中,预设时长可根据具体需要而设置,在本实施例中对预设时长对应的具体数值不做限制。目标选项是根据待回答问题而定的,如在“是否是本人”的问题中,对应的目标选项有“用户称是本人”,以及“用户称不是本人”的两个选项。
需要说明的是,该回复模式集合可离线生成,也可在线生成。
进一步地,获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合的步骤包括:
步骤d,获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典。
机器人获取预设时长内待回答问题在目标选型下所有的回复,并在该回复中提取出语义相同的短语,以构成对应语素词典。具体地,机器人可根据对应工作人员在其显示界面手动触发的提取指令在回复中提取出语义相同的短语,或者通过Levenshtein距离算法、Jaccard相似系数算法和TF-IDF(term frequency–inverse document frequency)算法等确定两个回复的语义是否相同,从而提取出语义相同的短语。如在“是否是本人”问句中,针对“用户称是本人”的目标选型,提取到的短语有“是呀、是啊、是嗯、是我、是是、是的是那、是零、是我呀和是我啊”,这些短语构成肯定语素词典;针对“用户称不是本人”的目标选项,提取到的短语有“我不是、我是他妈妈和我是他爱人”,这些短语构成否定语素词典。
步骤e,根据所述语素词典生成与所述回复对应的回复模式集合。
当机器人得到语素词典后,机器人为每个语素词典构建一个语素词典文件,在一个语素词典文件含有多个语素短语,并根据该语素词典生成与该回复对应的回复模式集合。可以理解的是,在生成回复模式过程中,若回复对应词序列中相邻的至少两个词组成的短语存在语素词典中,则可将该短语替换成对应的语素名称,得到回复模式。当机器人将所有的回复都转换成回复模式后,每一个目标选项对应的所有回复模式组合成一个回复模式集合。具体地,生成回复模式集合中各个回复模式的过程与生成答案模式的一致,在本实施例中不再详细赘述。进一步地,可将选项信息添加到回复模式中作为元信息。如当某个回复对应的词序列为[你好是我],对应的回复模式是[你好肯定语素],添加选项信息后,所得的回复模式为[你好是我|肯定语素]。
本实施例通过获取预设时长内待回答问题在目标选项下所有的回复,以生成与回复对应的回复模式集合,并存储回复模式集合,以便于在进行人机交互过程中,提前到用户回答问题的答案时,通过模式匹配快速确定用户意图,提高了人机交互的效率。
进一步地,为了进一步提高识别用户意图的效率,步骤S40还包括:
步骤f,获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式。
步骤h,在所述回复模式中删除未包含预设语素的回复模式,得到删减后的所述回复模式,并将删减后的所述回复模式作为回复模式集合存储。
机器人获取待回答问题在目标选项下所有的回复,以生成与该回复对应的回复模式。当得到各个回复对应的回复模式后,机器人检测所得的回复模式是否存在未包含预设语素的回复模式。若检测到回复模式中存在未包含预设语素的回复模式,机器人则删除该未包含预设语素的回复模式,得到删减后的回复模式,并将删减后的回复模式作为回复模式集合存储;若检测到回复模式中不存在未包含预设语素的回复模式,机器人则直接将所得的回复模式作为回复模式集合存储。具体地,如针对“是否是本人”这个问题,若所得的回复模式中不存在“肯定语素”,也不存在“否定语素”,则确定该回复模式中未包含预设语素。
进一步地,为了提高所得到的回复模式集合的准确率,提高识别用户意图的准确度,用户意图识别方法还包括:
步骤i,输出所述回复模式集合,以供审核人员审核所述回复模式集合。
当机器人得到回复模式集合后,机器人在其显示界面中输出该回复模式集合,以供对应的审核人员审核该回复模式集合。当审核人员审核到某个回复模式集合中的某个回复模式错误时,审核人员可删除该回复模式,也可修改该回复模式。
进一步地,提出本发明用户意图识别方法第三实施例。
所述用户意图识别方法第三实施例与所述用户意图识别方法第二实施例的区别在于,用户意图识别方法还包括:
步骤j,检测是否存在与所述待回答问题语义相似度大于预设相似度的目标问题。
步骤k,当检测到存在所述目标问题后,将所述待回答问题的语素词典作为所述目标问题的语素词典。
当机器人得到待回复问题对应的语素词典后,机器人计算其它问题与该待回复问题之间的语义相似度,并检测是否存在语义相似度大于预设相似度的其它问题,并将语义相似度大于预设相似度对应的其它问题记为目标问题。当机器人检测到存在与待回复问题语义相似度大于预设相似度的目标问题后,机器人将待回答问题的语素词典作为目标问题的语素词典,即待回答问题与目标问题共享语素词典。其中,计算语义相似度的方法包括但不限于基于向量空间模型的计算方法、基于汉明距离的计算方法和基于语义理解的计算方法。预设相似度可根据具体需要而设置,如可设置为70%,80%或者85%等。需要说明的是,该语素词典可离线生成,也可在线生成。
进一步地,当机器人侦测到工作人员在其显示界面中触发的共享语素词典的共享指令后,机器人根据该共享指令选择与待回答问题共享语素词典的目标问题,将待回答问题的语素词典与目标问题共享。
本实施例通过将待回答问题的语素词典与其它语义相同的问题进行共享,简化了各个问题对应回复模式的构建过程,重复利用已构建的语素词典,降低回复模式的构建成本,提高了回复模式的构建效率。
进一步地,提出本发明用户意图识别方法第四实施例。
所述用户意图识别方法第四实施例与所述用户意图识别方法第一、第二或第三实施例的区别在于,参照图4,用户意图识别方法还包括:
步骤S50,若根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则重新输出所述待回答问题,并计算输出所述待回答问题的输出次数。
步骤S60,若检测到在所述输出次数大于或者等于预设次数时,根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则确定用户意图识别失败。
若机器人根据匹配结果确定答案模式中未存在元素与回复模式的元素模式的元素相同,机器人则重新在其显示界面中输出该待回答问题,并计算输出待回答问题的输出次数,以及检测在输出次数大于或者等于预设次数时,是否根据匹配结果确定所得的答案模式中存在元素与回复模式中的元素相同。若机器人检测到在输出次数大于或者等于预设次数时,根据所得的匹配结果确定答案模式中都未存在元素与回复模式的元素相同,机器人则确定用户意图识别失败;若机器人检测到在输出次数大于或者等于预设次数时,根据匹配结果确定答案模式中存在元素与回复模式的元素相同,机器人则确定用户意图识别成功。其中,预设次数可根据具体需要而设置,如设置为2次、3次或者5次等。
如当预设次数设置为3次时,对应存在3个匹配结果。若机器人根据这3个匹配结果确定答案模式中都未存在元素与对应回复模式的元素的相同,机器人则确定用户意图识别失败。
进一步地,当机器人确定用户意图识别失败后,机器人在其显示界面中输出提示信息,以根据该提示信息提示用户意图识别失败。具体地,该提示信息可通过语音或者文字等形式输出。
本实施例通过在根据匹配结果确定答案模式中未存在元素与回复模式的元素相同时,重新输出待回答问题,只有在输出待回答问题的输出次数大于或者等于预设次数时,根据匹配结构确定答案模式中未存在元素与回复模式的元素相同,才确定用户意图识别失败,提高了用户意图识别的成功率。
此外,本发明实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有用户意图识别程序,所述用户意图识别程序被处理器执行时实现如上所述的奖励发送方法的步骤。
本发明计算机可读存储介质具体实施方式与上述用户意图识别方法各实施例基本相同,在此不再赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种用户意图识别方法,其特征在于,所述用户意图识别方法包括以下步骤:
当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式;
将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果;
若根据所述匹配结果确定所述答案模式中至少存在一个元素与所述回复模式的元素相同,则确定所述回复模式对应的意图为所述答案对应的用户意图。
2.如权利要求1所述的用户意图识别方法,其特征在于,所述当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式的步骤包括:
当提取到用户回答待回答问题的答案后,对所述答案进行分词操作,得到与所述答案对应的词序列;
若所述词序列中相邻的至少两个词组成的短语存在预设的语素词典中,则将所述短语替换为所述语素词典中对应的语素名称,以生成与所述答案对应的答案模式。
3.如权利要求1所述的用户意图识别方法,其特征在于,所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤之前,还包括:
检测所述答案模式与所述回复模式的结构是否相同;
若所述答案模式与所述回复模式的结构相同,则执行所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤。
4.如权利要求1所述的用户意图识别方法,其特征在于,所述当提取到用户回答待回答问题的答案后,生成与所述答案对应的答案模式的步骤之前,还包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合。
5.如权利要求4所述的用户意图识别方法,其特征在于,所述获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合的步骤包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典;
根据所述语素词典生成与所述回复对应的回复模式集合。
6.如权利要求5所述的用户意图识别方法,其特征在于,所述获取预设时长内所述待回答问题在目标选项下所有的回复,并在所述回复中提取出语义相同的短语,以构成对应的语素词典的步骤之后,还包括:
检测是否存在与所述待回答问题语义相似度大于预设相似度的目标问题;
当检测到存在所述目标问题后,将所述待回答问题的语素词典作为所述目标问题的语素词典。
7.如权利要求4所述的用户意图识别方法,其特征在于,所述获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式集合,并存储所述回复模式集合的步骤包括:
获取预设时长内所述待回答问题在目标选项下所有的回复,以生成与所述回复对应的回复模式;
在所述回复模式中删除未包含预设语素的回复模式,得到删减后的所述回复模式,并将删减后的所述回复模式作为回复模式集合存储。
8.如权利要求1至7任一项所述的用户意图识别方法,其特征在于,所述将所述答案模式与预存回复模式集合中的回复模式进行匹配,得到匹配结果的步骤之后,还包括:
若根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则重新输出所述待回答问题,并计算输出所述待回答问题的输出次数;
若检测到在所述输出次数大于或者等于预设次数时,根据所述匹配结果确定所述答案模式中未存在元素与所述回复模式的元素相同,则确定用户意图识别失败。
9.一种用户意图识别设备,其特征在于,所述用户意图识别设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的用户意图识别程序,所述用户意图识别程序被所述处理器执行时实现如权利要求1至8中任一项所述的用户意图识别方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有用户意图识别程序,所述用户意图识别程序被处理器执行时实现如权利要求1至8中任一项所述的用户意图识别方法的步骤。
CN201811137113.0A 2018-09-27 2018-09-27 用户意图识别方法、设备及计算机可读存储介质 Active CN109388695B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811137113.0A CN109388695B (zh) 2018-09-27 2018-09-27 用户意图识别方法、设备及计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811137113.0A CN109388695B (zh) 2018-09-27 2018-09-27 用户意图识别方法、设备及计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN109388695A true CN109388695A (zh) 2019-02-26
CN109388695B CN109388695B (zh) 2022-11-25

Family

ID=65419106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811137113.0A Active CN109388695B (zh) 2018-09-27 2018-09-27 用户意图识别方法、设备及计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN109388695B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113422A (zh) * 2019-05-10 2019-08-09 南京硅基智能科技有限公司 一种基于云端的虚拟手机的意图识别方法及系统
CN110428184A (zh) * 2019-08-06 2019-11-08 深圳前海微众银行股份有限公司 待办事项分发方法、装置、设备及计算机可读存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030028451A1 (en) * 2001-08-03 2003-02-06 Ananian John Allen Personalized interactive digital catalog profiling
CN1627289A (zh) * 2003-12-10 2005-06-15 株式会社东芝 用于分析汉语的装置和方法
CN101086843A (zh) * 2006-06-07 2007-12-12 中国科学院自动化研究所 一种应用于语音问答系统中的句子相似度识别方法
US20080104061A1 (en) * 2006-10-27 2008-05-01 Netseer, Inc. Methods and apparatus for matching relevant content to user intention
CN101178705A (zh) * 2007-12-13 2008-05-14 中国电信股份有限公司 一种自然语言理解方法和人机交互智能系统
CN102368246A (zh) * 2011-09-15 2012-03-07 张德长 一种自动应答机器人系统
CN102571621A (zh) * 2010-12-25 2012-07-11 上海量明科技发展有限公司 即时通讯中汇集目标信息的方法及系统
CN102789464A (zh) * 2011-05-20 2012-11-21 陈伯妤 基于语意识别的自然语言处理方法、装置和系统
CN105389307A (zh) * 2015-12-02 2016-03-09 上海智臻智能网络科技股份有限公司 语句意图类别识别方法及装置
US20160132485A1 (en) * 2014-11-12 2016-05-12 Electronics And Telecommunications Research Institute System and method for constructing morpheme dictionary based on automatic extraction of non-registered word
CN106095950A (zh) * 2016-06-14 2016-11-09 中国科学院自动化研究所 一种人机对话中教授意图答案生成方法
CN107153672A (zh) * 2017-03-22 2017-09-12 中国科学院自动化研究所 基于言语行为理论的用户交互意图识别方法及系统
CN107798032A (zh) * 2017-02-17 2018-03-13 平安科技(深圳)有限公司 自助语音会话中的应答消息处理方法和装置
CN108021691A (zh) * 2017-12-18 2018-05-11 深圳前海微众银行股份有限公司 答案查找方法、客服机器人以及计算机可读存储介质
CN108053023A (zh) * 2017-12-01 2018-05-18 北京物灵智能科技有限公司 一种自动式意图分类方法及装置
CN108509477A (zh) * 2017-09-30 2018-09-07 平安科技(深圳)有限公司 语义识别方法、电子装置及计算机可读存储介质

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030028451A1 (en) * 2001-08-03 2003-02-06 Ananian John Allen Personalized interactive digital catalog profiling
CN1627289A (zh) * 2003-12-10 2005-06-15 株式会社东芝 用于分析汉语的装置和方法
CN101086843A (zh) * 2006-06-07 2007-12-12 中国科学院自动化研究所 一种应用于语音问答系统中的句子相似度识别方法
US20080104061A1 (en) * 2006-10-27 2008-05-01 Netseer, Inc. Methods and apparatus for matching relevant content to user intention
CN101178705A (zh) * 2007-12-13 2008-05-14 中国电信股份有限公司 一种自然语言理解方法和人机交互智能系统
CN102571621A (zh) * 2010-12-25 2012-07-11 上海量明科技发展有限公司 即时通讯中汇集目标信息的方法及系统
CN102789464A (zh) * 2011-05-20 2012-11-21 陈伯妤 基于语意识别的自然语言处理方法、装置和系统
CN102368246A (zh) * 2011-09-15 2012-03-07 张德长 一种自动应答机器人系统
US20160132485A1 (en) * 2014-11-12 2016-05-12 Electronics And Telecommunications Research Institute System and method for constructing morpheme dictionary based on automatic extraction of non-registered word
CN105389307A (zh) * 2015-12-02 2016-03-09 上海智臻智能网络科技股份有限公司 语句意图类别识别方法及装置
CN106095950A (zh) * 2016-06-14 2016-11-09 中国科学院自动化研究所 一种人机对话中教授意图答案生成方法
CN107798032A (zh) * 2017-02-17 2018-03-13 平安科技(深圳)有限公司 自助语音会话中的应答消息处理方法和装置
CN107153672A (zh) * 2017-03-22 2017-09-12 中国科学院自动化研究所 基于言语行为理论的用户交互意图识别方法及系统
CN108509477A (zh) * 2017-09-30 2018-09-07 平安科技(深圳)有限公司 语义识别方法、电子装置及计算机可读存储介质
CN108053023A (zh) * 2017-12-01 2018-05-18 北京物灵智能科技有限公司 一种自动式意图分类方法及装置
CN108021691A (zh) * 2017-12-18 2018-05-11 深圳前海微众银行股份有限公司 答案查找方法、客服机器人以及计算机可读存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110113422A (zh) * 2019-05-10 2019-08-09 南京硅基智能科技有限公司 一种基于云端的虚拟手机的意图识别方法及系统
CN110428184A (zh) * 2019-08-06 2019-11-08 深圳前海微众银行股份有限公司 待办事项分发方法、装置、设备及计算机可读存储介质

Also Published As

Publication number Publication date
CN109388695B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
US10853717B2 (en) Creating a conversational chat bot of a specific person
US20200395008A1 (en) Personality-Based Conversational Agents and Pragmatic Model, and Related Interfaces and Commercial Models
US11093711B2 (en) Entity-specific conversational artificial intelligence
CN106575293B (zh) 孤立话语检测系统和方法
CN104969173B (zh) 动态应用过滤运算器的自适应对话状态管理方法和系统
CN109656512A (zh) 基于语音助手的交互方法、装置、存储介质及终端
CN108595519A (zh) 热点事件分类方法、装置及存储介质
CN114556354A (zh) 自动确定和呈现来自事件的个性化动作项
Hashemi et al. Measuring user satisfaction on smart speaker intelligent assistants using intent sensitive query embeddings
CN106462608A (zh) 改进语言模型的知识源个性化
CN103941853A (zh) 确定用户情绪的电子设备和确定用户情绪的方法
CN105824799B (zh) 一种信息处理方法、设备和终端设备
CN108345612A (zh) 一种问题处理方法和装置、一种用于问题处理的装置
CN114706945A (zh) 意图识别方法、装置、电子设备及存储介质
CN109902146A (zh) 贷款信息获取方法、装置、终端及存储介质
WO2023129255A1 (en) Intelligent character correction and search in documents
CN115658889A (zh) 对话处理方法、装置、设备及存储介质
CN109388695A (zh) 用户意图识别方法、设备及计算机可读存储介质
CN113051384B (zh) 基于对话的用户画像抽取方法及相关装置
US20210110824A1 (en) Electronic apparatus and controlling method thereof
CN109359298A (zh) 表情符推荐方法、系统及电子设备
CN117370512A (zh) 回复对话的方法、装置、设备及存储介质
CN113901832A (zh) 人机对话方法、装置、存储介质及电子设备
US11295121B2 (en) Context-based shape extraction and interpretation from hand-drawn ink input
CN112527975A (zh) 人机交互方法、装置、智能机器人和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant