CN111241260A - 基于人机交互的数据处理方法、装置、设备及存储介质 - Google Patents

基于人机交互的数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN111241260A
CN111241260A CN202010017461.5A CN202010017461A CN111241260A CN 111241260 A CN111241260 A CN 111241260A CN 202010017461 A CN202010017461 A CN 202010017461A CN 111241260 A CN111241260 A CN 111241260A
Authority
CN
China
Prior art keywords
intention
question
standard
answer
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010017461.5A
Other languages
English (en)
Inventor
李江
王健宗
彭俊清
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202010017461.5A priority Critical patent/CN111241260A/zh
Publication of CN111241260A publication Critical patent/CN111241260A/zh
Priority to PCT/CN2020/118431 priority patent/WO2021139243A1/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3343Query execution using phonetics

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及大数据领域,公开了一种基于人机交互的数据处理方法,包括以下步骤:接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;在预置标准问答知识库中定位当前问题对应的节点;从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系;定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。本发明还公开了一种基于人机交互的数据处理装置、设备及存储介质。本发明解决了针对用于人机交互的数据处理繁杂,耗费时间大的技术问题。

Description

基于人机交互的数据处理方法、装置、设备及存储介质
技术领域
本发明涉及大数据领域,尤其涉及一种基于人机交互的数据处理方法、 装置、设备及存储介质。
背景技术
目前,人工智能作为新兴行业,近年来发展迅猛。随着人工智能技术的 发展,诞生了越来越多的智能机器人。有服务于闲聊的娱乐型机器人、有类 似于导购的前台机器人,也有服务于特定行业的业务型机器人。然而,传统 智能问答机器人的问答数据库都是以关系型数据库建立,随着问答数据的增 多,问题与答案之间的关系越复杂,查询效率越来越低。
因此,如何提高智能问答系统查询回复内容的效率是亟待解决的问题。
发明内容
本发明的主要目的在于提供一种基于人机交互的数据处理方法,旨在解 决如何提高智能问答系统查询回复内容的效率的技术问题。
为实现上述目的,本发明提供的一种基于人机交互的数据处理方法,所 述数据处理方法包括以下步骤:
接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用 户意图;
在预置标准问答知识库中定位当前问题对应的节点;
从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关 系,其中,一条所述连接关系对应问题的一个标准答案;
定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置 标准问答知识库中对应的问题。
可选地,所述当前用户意图包括主干意图和非主干意图,所述主干意图 表示用户正面答复所述当前问题,所述非主干意图表示用户侧面答复所述当 前问题。
可选地,接收用户针对当前问题答复的语音数据并进行意图解析,以确 定当前用户意图之前,包括:
获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一 个问题至少对应两个标准答案,所述标准答案为主干意图的标准文字表达;
分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接 关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各 问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
可选地,所述接收用户针对当前问题答复的语音数据并进行意图解析, 以确定当前用户意图包括:
接收语音数据并将所述语音数据输入预置语言识别模型进行语音识别, 输出所述语音数据对应的文本信息;
对所述文本信息进行切词处理,得到多个切词片段;
依次将每个切词片段与预置知识词表进行匹配,得到至少一个概念标签, 其中,所述概念标签用于映射切词片段的抽象概念;
对所述概念标签按照其对应的切词片段在所述文本信息中的表达顺序, 按序排列并组合得到概念标签序列;
基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前 用户意图,其中,所述预置意图知识网络由每个所述概念标签与每个所述概 念标签所对应的意图标签的关联关系构成。
可选地,所述基于预置意图知识网络,对所述概念标签序列进行意图匹 配,确定当前用户意图包括:
分别将所述概念标签序列中的单个概念标签,或相邻的至少两个概念标 签构成的组合标签,与所述预置意图知识网络进行匹配;
若存在概念标签匹配到意图标签,则获取所述意图标签并将所述意图标 签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新的概念标签 序列继续进行意图标签匹配,直到当前概念标签序列中的全部概念标签匹配 完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述最终匹配结 果为一个或多个意图标签组合而成的意图标签集;
以所述最终匹配结果确定当前用户意图。
可选地,所述数据处理方法还包括:
若匹配不出与当前用户意图对应的目标连接关系,则判定所述当前用户 意图为非主干意图,查询预置通用问答知识库是否存在与当前用户意图对应 的非标准答案,其中,所述预置通用问答知识库为存储预设应用场景关联的 非主干意图对应的非标准答案以及所述非标准答案关联的答复内容的数据 库,所述非标准答案表示用户非主干意图的标准文字表达;
若所述预置通用问答知识库存在与当前用户意图对应的非标准答案,则 输出与所述非标准答案关联的答复内容;
若所述预置通用问答知识库不存在与当前用户意图对应的非标准答案, 则输出预置应答内容。
进一步地,为实现上述目的,本发明还提供一种基于人机交互的数据处 理装置,所述数据处理装置包括:
解析模块,用于接收用户针对当前问题答复的语音数据并进行意图解析, 以确定当前用户意图;
定位模块,用于在预置标准问答知识库中定位当前问题对应的节点;
匹配模块,用于从所述节点对应的连接关系中,匹配与当前用户意图对 应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
第一输出模块,用于定位与所述目标连接关系相连的目标节点,并输出 所述目标节点在预置标准问答知识库中对应的问题。
可选地,所述数据处理装置包括:
获取模块,用于获取预设应用场景关联的问题以及所述问题对应的标准 答案,其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的 标准文字表达;
建立模块,用于分别以各问题为节点、以各问题对应的标准答案作为连 接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所 述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知 识库。
可选地,所述解析模块包括:
识别单元,用于接收语音数据并将所述语音数据输入预置语言识别模型 进行语音识别,输出所述语音数据对应的文本信息;
切词单元,用于对所述文本信息进行切词处理,得到多个切词片段;
标注单元,用于依次将每个切词片段与预置知识词表进行匹配,得到至 少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
排列单元,用于对所述概念标签按照其对应的切词片段在所述文本信息 中的表达顺序,按序排列并组合得到概念标签序列;
匹配单元,用于基于预置意图知识网络,对所述概念标签序列进行意图 匹配,确定当前用户意图,其中,所述预置意图知识网络由每个所述概念标 签与每个所述概念标签所对应的意图标签的关联关系构成。
可选地,所述匹配单元包括:
匹配子单元,用于分别将所述概念标签序列中的单个概念标签,或相邻 的至少两个概念标签构成的组合标签,与所述意图知识网络进行匹配;
输出子单元,用于若存在概念标签匹配到意图标签,则获取所述意图标 签并将所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列, 对该新的概念标签序列继续进行意图标签匹配,直到当前概念标签序列中的 全部概念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中, 所述最终匹配结果为一个或多个意图标签组合而成的意图标签集;
确定子单元,用于以所述最终匹配结果确定当前用户意图。。
可选地,所述数据处理装置包括:
查询模块,用于若匹配不出与当前用户意图对应的目标连接关系,则判 定所述当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当 前用户意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设 应用场景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答 复内容的数据库,所述非标准答案表示用户非主干意图的标准文字表达;
第二输出模块,用于若所述预置通用问答知识库存在与当前用户意图对 应的非标准答案,则输出与所述非标准答案关联的答复内容;
第三输出模块,用于若所述预置通用问答知识库不存在与当前用户意图 对应的非标准答案,则输出预置应答内容。
进一步地,为实现上述目的,本发明还提供一种基于人机交互的数据处 理设备,所述数据处理设备包括存储器、处理器以及存储在所述存储器上并 可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执 行时实现如上述任一项所述的数据处理方法的步骤。
进一步地,为实现上述目的,本发明还提供一种计算机可读存储介质, 所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理 器执行时实现如上述任一项所述的数据处理方法的步骤。
本发明基于预先以图库的构建方式建立问答知识库,接收用户针对当前 问题答复的语音数据并进行意图解析,以确定当前用户意图,在预置标准问 答知识库中定位当前问题的节点,从所述节点对应的连接关系中,匹配与当 前用户意图对应的连接关系,定位与所述连接关系相连的下一节点,并输出 该节点的文字描述信息作为回复用户的答复内容。本发明相比传统技术中以 关系表的形式构建问答知识库来说,查询回复内容不需要繁杂的关系表,只 需定位当前问题节点,匹配与用户意图对应连接关系的下一节点的文字描述 信息,更快速的输出回复内容,提升用户体验。
附图说明
图1为本发明实施例方案涉及的基于人机交互的数据处理设备运行环境 的结构示意图;
图2为本发明基于人机交互的数据处理方法第一实施例的流程示意图;
图3为本发明基于人机交互的数据处理方法第二实施例的流程示意图;
图4为图2中步骤S20一实施例的细化流程示意图;
图5为图4中步骤S205一实施例的细化流程示意图;
图6为本发明基于人机交互的数据处理方法第三实施例的流程示意图;
图7为本发明基于人机交互的数据处理装置一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定 本发明。
本发明提供一种数据处理设备。
参照图1,图1为本发明实施例方案涉及的基于人机交互的数据处理设备 运行环境的结构示意图。
如图1所示,该数据处理设备包括:处理器1001,例如CPU,通信总线 1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002 用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、 输入单元比如键盘(Keyboard),网络接口1004可选的可以包括标准的有线 接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也 可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005 可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的数据处理设备的硬件结构并不 构成对数据处理设备的限定,可以包括比图示更多或更少的部件,或者组合 某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操 作系统、网络通信模块、用户接口模块以及计算机程序。其中,操作系统是 管理和控制数据处理设备和软件资源的程序,支持数据处理程序以及其它软 件和/或程序的运行。
在图1所示的数据处理设备的硬件结构中,网络接口1004主要用于接入 网络;用户接口1003主要用于侦测确认指令和编辑指令等。而处理器1001 可以用于调用存储器1005中存储的数据处理程序,并执行以下数据处理方法 的各实施例的操作。
基于上述数据处理设备硬件结构,提出本发明数据处理方法的各个实施 例。
参照图2,图2为本发明基于人机交互的数据处理方法第一实施例的流程 示意图。本实施例中,所述数据处理方法包括以下步骤:
步骤S10:接收用户针对当前问题答复的语音数据并进行意图解析,以确 定当前用户意图;
人工智能作为新兴行业,进来发展迅猛。伴随着人工智能技术的发展与 进步,各大科技企业相继推出智能机器人产品,其中,用于问答的智能机器 人的核心技术是根据预置的问答知识库,输出对应的答复内容,而传统的问 答知识库是基于问答数据中问题与答案的关系按关系型数据库建立问答知识 库,这种方法建立的问答知识库随着问答数据的增加和问答关系的复杂,终 会变得不堪重负,导致需要花费较长时间才能做出应答。
本实施例中,接收用户针对所述第一问题的答复语音,对所述答复语音 进行意图解析,从意图解析数据中确定当前用户意图。进一步地,由于同一 个意图的表述形式有很多,例如,用户回答的内容存在正面回答该问题的肯 定意图“有”和否定意图“没有”等主干意图,也存在用户侧面答复该问题 的非主干意图,如“没时间了解保险产品”、“不知道自己是否需要”等。所 以需要预先根据具体业务场景,对用户针对每个问题可能出现的意图进行分 类,分别建立主干意图库和非主干意图所对应的标准问答知识库和非标准问 答知识库,然后根据用户意图,查询答复用户的应答内容。需要注意的是, 意图是指系统为了明确用户意愿而抽象提炼出来的,是在一个对话任务中要 理解的用户想法。
此外,在用户的话语中明确出现了表达意图的一类词汇,比如:“希望”、 “想要”、“需要”等等,因而只需要识别出这些固定的意图特征词汇,再与 句子中的其他成分作联系即可。比如用户输入“我想预定到北京的机票”,机 器人可以识别出“我想”和“北京的机票”,然后在预置的知识数据库进行相 关匹配处理。
例如,现在有些聊天机器人能够在用户的问题中识别出用户的意图,如 订机票或酒店的场景中,机器人与用户聊天时,机器人接收用户输入的语音 数据,将所述语音数据通过自然语言技术转化成文本信息,然后基于所述文 本信息,在预设标准问答知识库中进行比对,查询是否存在用户所表达的意 图对应的答案,然后输出查询结果。
步骤S20:在预置标准问答知识库中定位当前问题对应的节点;
本实施例中,在预置标准问答知识库中,首先确定当前所处流程环节, 然后确定当前输出的问题,进而定位当前问题的节点。在所述标准问答知识 库中,根据具体业务场景,由业务方长期的工作经验中统计并在得出初版后 根据实际机器人工作场景的情形对意图库做优化和补充,得到不同流程环节 的问答知识,其中,可能在不同流程环节中存在相同的问题题目,或存在相 同用户意图的连接关系,因而在查询回复当前用户意图对应关系的下一节点 内容时需先确定当前问题的节点。
步骤S30:从所述节点对应的连接关系中,匹配与当前用户意图对应的目 标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
本实施例中,针对每个问题,用户会有不同的意图,不同的意图对应该 问题不同的答案。一个问题的答案在预置的问答知识库以连接上下问题的连 接关系表示,所以在定位出当前问题所处节点后,在该节点的下属连接关系 中,匹配出与当前用户意图对应的目标连接关系。
例如,在咨询用户是否有购买车险的意向的场景中,预设问题的标准答 案有“有意愿”或“无意愿”两种意图,针对“有意愿”的意图,对应的标 准答案有“需要购买”、“想购买”等表达;针对“无意愿”对应的标准答案 有“不需要”、“不想”等表达,而具体的而两种常用答案也会引发不同的下 一个问题,如用户回答“有意愿”的意图表达,则获取与“有意愿”意图对 应的连接关系的下一节点的问题,如询问用户户“目前有时间吗,为您介绍 我司的最新车险产品”等;若用户表达“无意愿”,则获取与“无意愿”意图 对应的目标连接关系的下一节点的问题,如询问用户“有无其他保险需要” 或“那不打扰您了”。
步骤S40:定位与所述目标连接关系相连的目标节点,并输出所述目标节 点在预置标准问答知识库中对应的问题。
本实施例中,定位于所述连接关系相连的下一节点,该节点的文字描述 信息与上一个问题和当前用户意图存在因果关系。根据用户意图的不同,在 场景对话中会引发不同的问题,就像关于提问方提问“吃饭了吗”,对于标准 答案中,回答方会有“正要去吃”和“已经吃了”,那么当提问方收到第一个 意图“正要去吃”时,会引发提问方问回答方“打算或准备去吃什么”、“跟 谁去吃”、“去哪吃呢”等问题,而如果提问方收到第二个意图“已经吃了”时,那么会引发提问方提问“吃什么了”、“跟谁吃的”、“在哪吃的”等问题, 所以不同的意图,会引发不同的下一个问题,而引发的问题就会成为提问方 在收到回答方所回答的内容之后,接下来提问的内容,基于这种关系,从预 设的标准问答知识库中获取用户回答的所述第一答案关联的下一个节点设置 的应答内容或操作。
例如,关于智能机器人提问“吃饭了没”,收到用户回答“吃过了”的意 图表达,其中,“吃过了”的意图表达不限,则查询“吃饭了没”的问题所在 节点,若在标准问答知识库中查询到所述节点,则识别所述节点中与意图“吃 过了”相符的连接关系,获取所述连接关系对应的下一节点的文字描述内容 并输出。
本实施例基于预先以图库的构建方式建立问答知识库,接收用户针对当 前问题答复的语音数据并进行意图解析,以确定当前用户意图,在预置标准 问答知识库中定位当前问题的节点,从所述节点对应的连接关系中,匹配与 当前用户意图对应的连接关系,定位与所述连接关系相连的下一节点,并输 出该节点的文字描述信息作为回复用户的答复内容。本发明相比传统技术中 以关系表的形式构建问答知识库来说,查询回复内容不需要繁杂的关系表, 只需定位当前问题节点,匹配与用户意图对应连接关系的下一节点的文字描 述信息,更快速的输出回复内容,提升用户体验。
进一步地,在本发明基于人际交互的数据处理方法中,所述当前用户意 图包括主干意图和非主干意图,所述主干意图表示用户正面答复所述当前问 题,所述非主干意图表示用户侧面答复所述当前问题。
本实施例中,由于同一个意图的表述形式有很多,例如用户针对“有没 购买保险的需要”的问题,用户回答的内容存在正面回答该问题的肯定意图 “有”和否定意图“没有”等主干意图,也存在用户侧面答复该问题的非主 干意图,如“没时间了解保险产品”、“不知道自己是否需要”等。所以需要 预先根据具体业务场景,对用户针对每个问题可能出现的意图进行分类,分 别建立主干意图库和非主干意图所对应的标准问答知识库和非标准问答知识 库,然后根据用户意图,查询答复用户的应答内容。
参照图3,图3为本发明基于人机交互的数据处理方法第二实施例的流程 示意图。本实施例中,在上述步骤S10之前,还包括:
步骤S001:获取预设应用场景关联的问题以及所述问题对应的标准答案, 其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的标准文 字表达;
步骤S002:分别以各问题为节点、以各问题对应的标准答案作为连接各 节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标 准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
本实施例中,不同的应用场景存在不同的问答数据。例如,在房产销售 的应用场景中,销售人员与用户之间的问答内容会跟房产相关,如房子的类 型、价格、位置等;在保险销售的应用场景中销售人员与用户之间的问答内 容会跟保险相关,如保险的范围、理赔费率、保费保期等。随着智能问答机 器人的推出,以智能机器人代替销售人员,为用户提供咨询服务,其中,常 用问题及相关答复内容可从工作人员的日常工作中收集,然后由专家进行优 化,进而得到标准的常用问答数据。
需要注意的是,工作人员在为用户提供咨询服务或销售服务的时候,根 据用户答复内容所表达的意图,会引发销售人员回答或提出不一样的内容或 问题,所以基于应用场景的问题与对应用户意图的答案之间存在一定的逻辑 关系,整理每个常用问题与对应用户意图的答案之间的关系后,以各常用问 题作为节点,各常用问题对应的答案作为连接各问题节点的关系,构建标准 问答知识库。其中,所述标准问答知识库中,每个问题之间只有一个答案进 行连接,以表示下一问题是由上一个问题其中一个答案所引发出的,而一个问题存在多个答案,每个答案只能引发一个问题,用户意图对应一个答案。
参照图4,图4为图2中步骤S20的细化流程示意图。本实施例中,上述 步骤S30进一步包括:
步骤S201:接收语音数据并将所述语音数据输入预置语言识别模型进行 语音识别,输出所述语音数据对应的文本信息;
本实施例中,为方便通过识别用户的语音答复,预先获取工作人员日常 工作中与用户对话的语音训练数据,基于所述语音训练数据,训练一个语音 识别模型。基于训练好的语音识别模型,接收用户针对当前问题作出答复的 语音数据之后,将所语音数据输入语音识别模型进行语音识别,得到所述语 音数据的文本信息。
步骤S202:对所述文本信息进行切词处理,得到多个切词片段;
本实施例中,对所述文本信息进行切词,可以利用现有技术中的任一种 切词算法进行切词,得到多个切词片段。例如,通过n-gram切词算法对待自 然语言文本“张先生需不需要车险”进行切词,得到切词片段分别为“张先 生”、“需不需要”、“车险”。
步骤S203:依次将每个切词片段与预置知识词表进行匹配,得到至少一 个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
本实施例中,基于切词片段,查询预置知识词库,匹配每个切词片段的 概念,如果无法识别其中个别切词片段对应的概念,则跳过该切词片段,继 续识别下一个切词片段,至少识别出一个切词片段对应的概念,并对匹配得 到的概念对切词片段进行概念标注,得到分词片段的概念标签。需要注意的 是,一个分词在一个问题中对应的概念至少一个,因此最终可得到至少一个 概念标签,其中,所述概念标签用于映射切词片段的抽象概念。此外,由于 不可能将所有可能出现的切词片段对应的概念标签都存入预置的知识词表, 所以存在个别切词片段未能匹配到概念标签,因而会出现个别切词片段无法 识别。例如,切词片段“张先生”对应抽象的概念是用户,因此切词片段“张 先生”对应的概念标签即为“用户”,同理,“需不要要”对应的概念标签是 “需要”、“不需要”,“车险”对应的概念标签为“保险”。
步骤S204:对所述概念标签按照其对应的切词片段在所述文本信息中的 表达顺序,按序排列并组合得到概念标签序列;
本实施例中,对上述步骤得到的概念标签按照其对应的切词片段在所述 文本信息中的表达顺序,按序进行排列组合,得到多个不冲突的概念标签序 列,即为同一文本中,同一个序列中只能出现一个概念标签所覆盖的切词。 例如,切词片段“需不需要”对应的概念标签为“需要”、“不需要”,因此需 要将这两个概念标签分到不同的概念标签中。例如,切词片段“张先生”、“需 不需要”、“车险”对应的概念标签序列分别为“用户、需要、保险”和“用 户、不需要、保险”两种概念。
步骤S205:基于预置意图知识网络,对所述概念标签序列进行意图匹配, 确定当前用户意图,其中,所述所述预置意图知识网络由每个所述概念标签 与每个所述概念标签所对应的意图标签的关联关系构成。
本实施例中,所述预先建立的意图知识网络是将现实世界的意图通过人 的日常描述语言,映射生成的意图知识网络。具体的,意图知识网络中包括 当前应用场景不同问题对应的意图表达集合,每种意图表达以标签的形式存 储在意图知识网络中,且不同问题对应的意图标签集合之间相互关联。其中, 每个意图标签集合中会记载与问题相关的、可能存在的意图标签集合,以及 那些概念标签会与这些意图标签有关联。例如,对于保险,有询问保险保期、 险种、保费等意图。
因而,只需将每个概念标签序列中的概念标签分别与意图知识网络进行 匹配即可确定用户的真实意图。
参照图5,图5为图4中步骤S205一实施例的细化流程示意图。本实施 例中,上述步骤S205包括:
骤S2051:分别将所述概念标签序列中的单个概念标签,或相邻的至少两 个概念标签构成的组合标签,与所述意图知识网络进行匹配;
本实施例中,分别将概念标签序列中的单个概念标签,与意图知识网络 进行匹配,或将相邻多个概念标签与所述意图知识网络进行匹配。其中,考 虑到可能存在部分意图标签需要多个概念标签组合才能匹配得到,因而将相 邻多个概念标签组合,进而与所述意图知识网络进行匹配。例如,对于文本 “张先生需不需要车险”经过切词和概念标签后对应的概念标签序列分别为 “用户、需要、保险”和“用户、不需要、保险”。而“用户、不需要、保险” 还可能是“用户、不、需要、保险”,那么其中的“不、需要”的相邻概念标 签就需要组合,才能匹配出“不需要”的意图标签。将“用户、需要、保险” 与意图知识网络进行匹配,以便推导该概念标签序列对应的用户意图;再将 “用户、不需要、保险”与意图知识网络进行匹配,以便推导该概念标签序 列对应的用户意图。
需要注意的是,按照与所述文本相同的表达顺序,目的是正确匹配用户 意图,因为若将概念标签顺序打乱,则不符合人类自然语言的表达习惯,自 然地,对乱序的概念标签进行匹配也不会匹配出正确的意图结果。
步骤S2052:若存在概念标签匹配到意图标签,则获取所述意图标签并将 所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新 的概念标签序列继续进行意图标签匹配,直到所述概念标签序列中的全部概 念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述 最终匹配结果为一个或多个意图标签组合而成的意图标签集;
步骤S2053:以所述最终匹配结果确定当前用户意图。
本实施例中,对于第一个概念标签序列“用户、需要、保险”,根据概念 标签“用户”和“需要”与意图知识网络的匹配结果,确定有“需要”的意 图标签,则获取该意图标签,即“需要”意图标签,并返回用户对应的概念 标签“用户”;将概念标签“用户”、意图标签“需要”和未进行匹配的概念 标签“保险”合并为新的概念标签序列,并与意图知识网络进行匹配,得出 “用户需要保险”的意图标签。此时概念标签全部使用,无法继续匹配,则 确定最终意图为“需要保险”意图。
参照图6,图6为本发明基于人机交互的数据处理方法第三实施例的流程 示意图。
步骤S60:若匹配不出与当前用户意图对应的目标连接关系,则判定所述 当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当前用户 意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设应用场 景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答复内容 的数据库,所述非标准答案表示用户非主干意图的标准文字表达;
本实施例中,由于现实应用场景中,用户的意图表达非常多,不可能将 用户的所有意图都配置到标准问答知识库中,因此存在标准问答知识库中, 没有当前用户意图对应的目标连接关系,即表示用户所答复的内容所表达的 意图不是主干意图,则调用接口查询预置的通用问答知识库,所述通用问答 知识库中存储有用户对于标准问答知识库中每个问题可能出现的非主干意图 所对应的非标准答案,所述非标准答案即为非主干意图的标准文字表达。
进一步地,在现实应用场景中,用户针对一个问题除了主干意图之外, 还存在非主干意图,此处的非主干意图指主干意图之外的意图,如在“有无 意愿购买车险”的问题中,用户除了“有意愿”和“无意愿”两种主干意图 对应的标准答案之外,还可能会回答“没钱”、“没空了解”、“已购买”等非 主干意图对应的非标准答案,针对这种情况,将这类非主干意图的数据从常 用问答数据中抽离,并基于各非主干意图与对应问题之间的关系,建立关系 表作为通用问答知识库。
例如,在“有无意愿购买车险”的问题中,用户除了“有意愿”和“无 意愿”两种标准答案之外,还可能会回答“没钱”、“没空了解”、“已购买” 等非标准答案,筛选出“没钱”、“没空了解”、“已购买”等非标准答案,建 立非标准答案“没钱”、“没空了解”、“已购买”与问题“有无意愿购买车险” 的关联表,当用户答案在问答知识库中为匹配到相应答案时,则在所述通用 问答知识库。
步骤S70:若所述预置通用问答知识库存在与当前用户意图对应的非标准 答案,则输出与所述非标准答案关联的答复内容;
步骤S80:若所述预置通用问答知识库不存在与当前用户意图对应的非标 准答案,则输出预置应答内容。
本实施例中,若在标准问答知识库中查询不到与当前用户意图对应的连 接关系,表示用户当前答复内容所表达的意图为非主干意图,则查询所述通 用问答知识库,确定所述通用问答知识库中是否存在与当前用户意图对应的 非标准答案,若所述通用问答知识库存在与当前用户意图对应的非标准答案, 则输出与所述非标准答案关联的答复内容。若所述通用问答知识库中不存在 当前用户意图对应的非标准答案,则表明通用问答知识库中未配置与当前用 户意图对应的非标准答案,也即未配置有关联的回复内容,则输出预先设置 的统一应答内容。
例如,某一节点为询问用户“有无意愿购买车险”的问题,在标准问答 知识库中该节点的预设标准答案对应意图为“有意愿”和“无意愿”,若当前 接收到的用户意图为“没钱”,则所述标准问答知识库中当前问题节点不存在 与当前用户意图对应的答案,则查询通用问答知识库中是否存在与“没钱” 对应的非标准答案,而查询到通用问答知识库中询问用户“有无意愿购买车 险”问题的节点预设有“没钱”、“没空了解”、“已购买”等意图对应的非标 准答案,因而在通用问答知识库中匹配用户意图“没钱”的关联的应答内容, 其中应答内容可能是“这份保险不需要多少钱,这边有个优惠...”等,此外, 还可能是内容“那就不打扰您了”,结束本次服务。
本发明还提供一种数据处理装置。
参照图7,图7为本发明基于人机交互的数据处理装置一实施例的功能模 块示意图。本实施例中,所述数据处理装置包括:
解析模块10,用于接收用户针对当前问题答复的语音数据并进行意图解 析,以确定当前用户意图;
定位模块20,用于在预置标准问答知识库中定位当前问题对应的节点;
匹配模块30,用于从所述节点对应的连接关系中,匹配与当前用户意图 对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
第一输出模块40,用于定位与所述目标连接关系相连的目标节点,并输 出所述目标节点在预置标准问答知识库中对应的问题。
本实施例中,解析模块10接收用户针对当前问题答复的语音数据并进行 意图解析,以确定当前用户意图,定位模块20在预置标准问答知识库中定位 当前问题对应的节点,第一匹配模块30从所述节点对应的连接关系中,匹配 与当前用户意图对应的目标连接关系,第一输出模块40定位与所述目标连接 关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的 问题。
本发明还提供一种计算机可读存储介质。
本实施例中,所述计算机可读存储介质上存储有数据处理程序,所述数 据处理程序被处理器执行时实现如上述任一项实施例中所述的数据处理方法 的步骤。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM)中,包括 若干指令用以使得一台终端(可以是手机,计算机,服务器或者网络设备等) 执行本发明各个实施例所述的方法。
上面结合附图对本发明的实施例进行了描述,但是本发明并不局限于上 述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的, 本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨和权利要求 所保护的范围情况下,还可做出很多形式,凡是利用本发明说明书及附图内 容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领 域,这些均属于本发明的保护之内。

Claims (10)

1.一种基于人机交互的数据处理方法,其特征在于,所述数据处理方法包括:
接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图;
在预置标准问答知识库中定位当前问题对应的节点;
从所述节点对应的连接关系中,匹配与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
2.如权利要求1所述的数据处理方法,其特征在于,所述当前用户意图包括主干意图和非主干意图,所述主干意图表示用户正面答复所述当前问题,所述非主干意图表示用户侧面答复所述当前问题。
3.如权利要求2所述的数据处理方法,其特征在于,在所述接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图的步骤之前,还包括:
获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为主干意图的标准文字表达;
分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
4.如权利要求1所述的数据处理方法,其特征在于,所述接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图包括:
接收语音数据并将所述语音数据输入预置语言识别模型进行语音识别,输出所述语音数据对应的文本信息;
对所述文本信息进行切词处理,得到多个切词片段;
依次将每个切词片段与预置知识词表进行匹配,得到至少一个概念标签,其中,所述概念标签用于映射切词片段的抽象概念;
对所述概念标签按照其对应的切词片段在所述文本信息中的表达顺序,按序排列并组合得到概念标签序列;
基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图,其中,所述预置意图知识网络由每个所述概念标签与每个所述概念标签所对应的意图标签的关联关系构成。
5.如权利要求4所述的数据处理方法,其特征在于,所述基于预置意图知识网络,对所述概念标签序列进行意图匹配,确定当前用户意图包括:
分别将所述概念标签序列中的单个概念标签,或相邻的至少两个概念标签构成的组合标签,与所述预置意图知识网络进行匹配;
若存在概念标签匹配到意图标签,则获取所述意图标签并将所述意图标签与尚未进行匹配的概念标签合并为新的概念标签序列,对该新的概念标签序列继续进行意图标签匹配,直到所述概念标签序列中的全部概念标签匹配完毕或匹配不到意图标签为止,输出最终匹配结果,其中,所述最终匹配结果为一个或多个意图标签组合而成的意图标签集;
以所述最终匹配结果确定当前用户意图。
6.如权利要求2所述的数据处理方法,其特征在于,所述数据处理方法还包括:
若匹配不出与当前用户意图对应的目标连接关系,则判定所述当前用户意图为非主干意图,查询预置通用问答知识库是否存在与当前用户意图对应的非标准答案,其中,所述预置通用问答知识库为存储预设应用场景关联的非主干意图对应的非标准答案以及所述非标准答案关联的答复内容的数据库,所述非标准答案为非主干意图的文字表达;
若所述预置通用问答知识库存在与当前用户意图对应的非标准答案,则输出与所述非标准答案关联的答复内容;
若所述预置通用问答知识库不存在与当前用户意图对应的非标准答案,则输出预置应答内容。
7.一种基于人机交互的数据处理装置,其特征在于,所述数据处理装置包括:
解析模块,用于接收用户针对当前问题答复的语音数据并进行意图解析,以确定当前用户意图,所述用户意图包括主干意图和非主干意图,所述主干意图包括肯定意图和否定意图;
定位模块,用于在预置标准问答知识库中定位当前问题对应的节点;
匹配模块,用于从所述节点对应的连接关系中,匹配出与当前用户意图对应的目标连接关系,其中,一条所述连接关系对应问题的一个标准答案;
第一输出模块,用于定位与所述目标连接关系相连的目标节点,并输出所述目标节点在预置标准问答知识库中对应的问题。
8.如权利要求7所述的数据处理装置,其特征在于,所述数据处理装置还包括:
获取模块,用于获取预设应用场景关联的问题以及所述问题对应的标准答案,其中,一个问题至少对应两个标准答案,所述标准答案为表示用户主干意图的标准文字表达;
建立模块,用于分别以各问题为节点、以各问题对应的标准答案作为连接各节点的连接关系,根据每个问题在预设应用场景中的提问顺序,通过所述标准答案将各问题连接成有向图,将所述有向图作为所述预置标准问答知识库。
9.一种基于人机对话的数据处理设备,其特征在于,所述数据处理设备包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的数据处理程序,所述数据处理程序被所述处理器执行时实现如权利要求1-6中任一项所述的基于人机交互的数据处理方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有数据处理程序,所述数据处理程序被处理器执行时实现如权利要求1-6中任一项所述的基于人机交互的数据处理方法的步骤。
CN202010017461.5A 2020-01-08 2020-01-08 基于人机交互的数据处理方法、装置、设备及存储介质 Pending CN111241260A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010017461.5A CN111241260A (zh) 2020-01-08 2020-01-08 基于人机交互的数据处理方法、装置、设备及存储介质
PCT/CN2020/118431 WO2021139243A1 (zh) 2020-01-08 2020-09-28 基于人机交互的数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010017461.5A CN111241260A (zh) 2020-01-08 2020-01-08 基于人机交互的数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN111241260A true CN111241260A (zh) 2020-06-05

Family

ID=70880313

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010017461.5A Pending CN111241260A (zh) 2020-01-08 2020-01-08 基于人机交互的数据处理方法、装置、设备及存储介质

Country Status (2)

Country Link
CN (1) CN111241260A (zh)
WO (1) WO2021139243A1 (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737437A (zh) * 2020-06-30 2020-10-02 北京捷通华声科技股份有限公司 问答知识的提取方法、提取装置与计算机可读存储介质
CN111914073A (zh) * 2020-07-15 2020-11-10 中国联合网络通信集团有限公司 客服应答方法、装置、设备及存储介质
CN112035623A (zh) * 2020-09-11 2020-12-04 杭州海康威视数字技术股份有限公司 智能问答方法、装置、电子设备及存储介质
CN112417110A (zh) * 2020-10-27 2021-02-26 联想(北京)有限公司 一种信息处理方法及装置
CN112667790A (zh) * 2020-12-18 2021-04-16 平安科技(深圳)有限公司 智能问答方法、装置、设备及存储介质
WO2021139243A1 (zh) * 2020-01-08 2021-07-15 平安科技(深圳)有限公司 基于人机交互的数据处理方法、装置、设备及存储介质
CN113742480A (zh) * 2020-06-18 2021-12-03 北京汇钧科技有限公司 客服应答方法和装置
CN115186674A (zh) * 2022-06-20 2022-10-14 成都飞机工业(集团)有限责任公司 一种航空失效案例管理方法、装置、设备及存储介质
CN115860823A (zh) * 2023-03-03 2023-03-28 深圳市人马互动科技有限公司 人机互动问卷答题场景中的数据处理方法及相关产品
CN112667790B (zh) * 2020-12-18 2024-05-10 平安科技(深圳)有限公司 智能问答方法、装置、设备及存储介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108108340B (zh) * 2017-11-28 2021-07-23 北京光年无限科技有限公司 用于智能机器人的对话交互方法及系统
CN108090177B (zh) * 2017-12-15 2020-05-05 上海智臻智能网络科技股份有限公司 多轮问答系统的生成方法、设备、介质及多轮问答系统
US10148601B1 (en) * 2018-05-23 2018-12-04 Capital One Services, Llc Method and system of converting email message to AI chat
CN109543014B (zh) * 2018-11-05 2021-06-15 腾讯科技(深圳)有限公司 人机对话方法、装置、终端及服务器
CN111241260A (zh) * 2020-01-08 2020-06-05 平安科技(深圳)有限公司 基于人机交互的数据处理方法、装置、设备及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021139243A1 (zh) * 2020-01-08 2021-07-15 平安科技(深圳)有限公司 基于人机交互的数据处理方法、装置、设备及存储介质
CN113742480A (zh) * 2020-06-18 2021-12-03 北京汇钧科技有限公司 客服应答方法和装置
CN111737437A (zh) * 2020-06-30 2020-10-02 北京捷通华声科技股份有限公司 问答知识的提取方法、提取装置与计算机可读存储介质
CN111914073A (zh) * 2020-07-15 2020-11-10 中国联合网络通信集团有限公司 客服应答方法、装置、设备及存储介质
CN112035623A (zh) * 2020-09-11 2020-12-04 杭州海康威视数字技术股份有限公司 智能问答方法、装置、电子设备及存储介质
CN112417110A (zh) * 2020-10-27 2021-02-26 联想(北京)有限公司 一种信息处理方法及装置
CN112667790A (zh) * 2020-12-18 2021-04-16 平安科技(深圳)有限公司 智能问答方法、装置、设备及存储介质
CN112667790B (zh) * 2020-12-18 2024-05-10 平安科技(深圳)有限公司 智能问答方法、装置、设备及存储介质
CN115186674A (zh) * 2022-06-20 2022-10-14 成都飞机工业(集团)有限责任公司 一种航空失效案例管理方法、装置、设备及存储介质
CN115860823A (zh) * 2023-03-03 2023-03-28 深圳市人马互动科技有限公司 人机互动问卷答题场景中的数据处理方法及相关产品

Also Published As

Publication number Publication date
WO2021139243A1 (zh) 2021-07-15

Similar Documents

Publication Publication Date Title
CN111241260A (zh) 基于人机交互的数据处理方法、装置、设备及存储介质
US20200234700A1 (en) Method for conducting dialog between human and computer
CN107153965A (zh) 一种多终端的智能客服解决方法
JP2020537777A (ja) 発言のユーザ意図を識別するための方法および装置
JP2020521210A (ja) 情報処理方法及び端末、コンピュータ記憶媒体
CN112507139B (zh) 基于知识图谱的问答方法、系统、设备及存储介质
CN110795913A (zh) 一种文本编码方法、装置、存储介质及终端
CN111522966A (zh) 基于知识图谱的数据处理方法、装置、电子设备及介质
CN111259124A (zh) 对话管理方法、装置、系统及存储介质
CN112632239A (zh) 基于人工智能技术的类脑问答系统
CN113806503A (zh) 一种对话融合方法和装置及设备
CN117573834B (zh) 一种用于面向软件即服务平台的多机器人对话方法及系统
CN110990527A (zh) 自动问答方法及装置、存储介质及电子设备
CN110750633B (zh) 用于确定问题的答案的方法及装置
CN115658875B (zh) 基于聊天服务的数据处理方法及相关产品
CN111651554A (zh) 基于自然语言理解及处理的保险问答回答的方法和装置
CN107832342B (zh) 机器人聊天方法及系统
CN114186048A (zh) 基于人工智能的问答回复方法、装置、计算机设备及介质
CN110674275B (zh) 一种知识问答的方法及装置
CN111046151B (zh) 一种消息处理方法及装置
CN112307186A (zh) 基于情绪识别的问答服务方法、系统、终端设备及介质
CN111985248A (zh) 一种信息交互方法以及装置
CN111046161A (zh) 用于商品营销场景的智能对话方法和装置
CN111556096A (zh) 信息推送方法、装置、介质及电子设备
CN116453522B (zh) 语音识别方法、装置、电子设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40030817

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination