CN107704612A - 用于智能机器人的对话交互方法及系统 - Google Patents
用于智能机器人的对话交互方法及系统 Download PDFInfo
- Publication number
- CN107704612A CN107704612A CN201710990250.8A CN201710990250A CN107704612A CN 107704612 A CN107704612 A CN 107704612A CN 201710990250 A CN201710990250 A CN 201710990250A CN 107704612 A CN107704612 A CN 107704612A
- Authority
- CN
- China
- Prior art keywords
- topic
- dialogue
- information
- sub
- interaction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种用于智能机器人的对话交互方法及系统,该方法包括如下步骤:在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息;基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,所述子话题为主话题的多个直接属性之一;根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。在本发明实施例中,智能机器人基于主话题与子话题的交互框架与用户进行对话交互,保证了上下文对话的连贯性,增强了机器人对用户意图识别的准确度,提高了机器人的智能性和用户的兴趣,改善了用户体验。
Description
技术领域
本发明涉及智能机器人领域,尤其涉及一种用于智能机器人的对话交互方法及系统。
背景技术
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。因此,提升智能机器人的交互能力,改善机器人的类人性和智能性,是现在亟需解决的重要问题。
发明内容
本发明所要解决的技术问题之一是需要提供一种用于智能机器人的对话交互方法及系统,通过该方案能够使智能机器人与用户进行多轮对话且返回符合用户预期的应答,提高用户体验。
为了解决上述技术问题,本申请的实施例首先提供了一种用于智能机器人的对话交互方法,该方法包括如下步骤:在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息;基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,所述子话题为主话题的多个直接属性之一,所述话题信息中包括上下文对话中的主话题及子话题;根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。
优选地,若解析出对话交互信息中的实体信息为首次出现,且与上下文话题信息中的主话题和子话题并无关联,将所述实体信息作为当前对话交互的主话题,生成对话输出数据。
优选地,若当前对话交互信息的实体信息与上下文话题信息中的主话题一致,而与子话题不同,则在下一轮对话交互中,根据当前对话交互的子话题信息,生成对话输出数据。
优选地,若解析出对话交互信息中的实体信息为首次出现,且与之前对话过程中获取的话题信息为同一维度,将当前解析出的实体信息作为当前对话交互的主话题,生成对话输出数据。
优选地,若未解析出实体信息,且意图识别结果为用户欲结束当前话题,则结束对话交互或生成与其他话题相关的对话输出数据。
优选地,若经过设定时间未接收到用户发来的对话信息或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,则结束对话交互或生成与其他话题相关的对话输出数据。
根据本发明实施例的另一方面,还提供了一种用于智能机器人的对话交互系统,该系统包括如下模块:对话交互信息解析模块,其在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息;话题确定模块,其基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,所述子话题为主话题的多个直接属性之一,所述话题信息中包括上下文对话中的主话题及子话题;对话输出数据生成模块,其根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。
优选地,所述对话输出数据生成模块,其进一步在解析出对话交互信息中的实体信息为首次出现,且与上下文话题信息中的主话题和子话题并无关联时,将所述实体信息作为当前对话交互的主话题,生成对话输出数据。
优选地,在生成对话输出数据的步骤中,所述对话输出数据生成模块,其进一步在当前对话交互的主话题与上下文话题信息中的主话题一致而子话题不同时,在下一轮对话交互中,根据当前对话交互的子话题信息,生成对话输出数据。
优选地,所述对话输出数据生成模块,其进一步在解析出对话交互信息中的实体信息为首次出现,且与之前对话过程中获取的话题信息为同一维度时,将当前解析出的实体信息作为当前对话交互的主话题,生成对话输出数据。
优选地,该系统还包括:对话交互结束模块,其在意图识别结果为用户欲结束当前话题、或者经过设定时间未接收到用户发来的对话信息或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,则结束对话交互;或者,所述对话输出数据生成模块,其在意图识别结果为用户欲结束当前话题时或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,生成与其他话题相关的对话输出数据。
根据本发明实施例的另一方面,还提供了一种云端服务器,具备如上所述的对话交互系统。
与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:
本发明实施例通过智能机器人与用户对话交互的过程中,基于主话题与子话题的交互框架,与用户进行对话交互,保证了上下文对话的连贯性,增强了机器人对用户意图识别的准确度,提高了机器人的智能性和用户的兴趣,改善了用户体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明的技术方案而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构和/或流程来实现和获得。
附图说明
附图用来提供对本申请的技术方案或现有技术的进一步理解,并且构成说明书的一部分。其中,表达本申请实施例的附图与本申请的实施例一起用于解释本申请的技术方案,但并不构成对本申请技术方案的限制。
图1为本申请实施例的对话交互机器人的应用场景示意图。
图2为本申请实施例的对话交互机器人的功能结构示意图。
图3为本申请实施例的云端服务器(云端大脑)的对话交互系统的示例一的功能结构示意图。
图4为本申请实施例的以明星作为实体的话题图谱的组成结构示意图。
图5为本申请实施例的涉及基于话题交互的实现逻辑的示意图。
图6为本申请实施例的用于智能机器人的对话交互方法的示例一的流程示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成相应技术效果的实现过程能充分理解并据以实施。本申请实施例以及实施例中的各个特征,在不相冲突前提下可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
近年来,随着人工智能的迅速发展,聊天机器人也受到了学术界和工业界的广泛关注。聊天机器人是一种通过自然语言模拟人类进行对话的智能机器人。目前聊天机器人主要分为在线客服、娱乐、教育、个人助理和智能问答这五个种类。无论哪种机器人都能与用户进行一定程度地交互。然而,在当前聊天机器人应用场景中,机器人和用户的对话,往往是基于知识库的问答系统来实现的,没有进行话题的识别,这样容易导致对话总是在几个回合之后就很快结束。同时,这种基于单轮的聊天机制,没有话题的标记,忽略了当前用户前几轮的聊天主题,因此其返回的答案会存在一定的偏差,甚至返回错误的答案。因此,当前的智能机器人无法满足用户的需求,返回的应答结果也不能符合用户的预期,降低了用户使用聊天机器人的兴趣,需要提供一种方案来解决上述问题。
为了更好地理解本发明,在对实施例进行说明之前,先对本例中涉及的用语“话题”稍作说明。
话题:借用语言学上关于话题的狭义的界定,即一句话的中心主体即为这句话的话题。由于我们希望话题能够更好的延展,所有把围绕话题的中心主体相关属性界定为主话题下的子话题。例如:“你喜欢刘德华吗?”中心主体为刘德华,那这句话的话题为“刘德华”,如果这时我们界定讨论的主话题为“刘德华”,那么当下一句问到“你喜欢听他的《冰雨》吗?”中心主体为“刘德华的《冰雨》”,则为子话题。
话题分为主话题和子话题,需要识别哪些是主话题,哪些是子话题,主话题在明星这一领域下主要是指明星人物,子话题是他的直接属性,是围绕明星人物展开的。此外,如果问题是“你喜欢听《冰雨》吗?”,那这句话聊的话题是音乐,主话题是《冰雨》,如果接下来还问“这首歌是刘德华唱的,你知道刘德华吗?”,那这句话聊的“刘德华”则为子话题。综上,一句话可能有多个话题标签,在某一个话题下是主话题,在另一个话题下则可能为子话题,这样的界定主要跟之后的话题延展相关。
实施例
图1为本申请实施例的对话交互机器人的应用场景示意图。在该应用场景中,包括智能机器人(也称“对话机器人”)20和云端大脑(云端服务器)10,该对话机器人20基于主话题和子话题的模式与用户U进行语音对话交互。该对话机器人20除了可以为图1所示的实体机器人以外,还可以为搭载在智能设备上的机器人应用程序,智能设备可以为传统的PC个人电脑、LapTop笔记本电脑、全息投影设备等,也可以是能够随身携带且能通过无线局域网、移动通信网络等无线方式接入互联网的终端设备。本申请实施例中,无线终端包括但不限于手机、Netbook(上网本)等,无线终端一般具有多模态信息采集和数据传输等功能。云端大脑10作为智能机器人20的大脑端,其配置了对话交互系统100,该系统100用来处理智能机器人20传输的多模态输入数据,如解析视觉数据,完成视觉识别、视觉检测,以及,执行情感计算、认知计算和语义理解等,主要是对话交互过程中用户的语音数据,从而决策出机器人20待输出的对话语音或其他多模态输出数据。
需要指出的是,本智能机器人的对话交互方法及系统,也适用于适合儿童AI设备,如儿童故事机(一种能满足儿童人群听音乐、故事、国学等音视频的儿童AI设备,该设备可具备动物和人物的卡通IP形象)的对话应用场景,另外,所述故事机可受控于智能手持设备,以完成智能机器人的设置和指令执行。
下面先简要介绍一下智能机器人20的功能结构。如图2所示,智能机器人20主要包括:通信模块22、数据处理单元23和人机交互输入输出模块24。人机交互功能的输入输出模块24,其获取多模态输入数据以及输出来自云端大脑10的多模态数据(主要是语音数据);数据处理单元23,其对输入输出模块24采集到的多模态数据进行预处理;通信模块22,其将经数据处理单元23预处理后的多模态数据转发至云端大脑10。在对话机器人以应用程序的模式搭载在智能设备上时,智能设备除了具备上面的功能模块,还具备用户界面,在预设显示区域内显示对话机器人形象与用户进行对话。
下面对智能机器人20的各个单元模块的组成和功能进行具体说明。
先来说明人机交互输入输出模块24。人机交互输入输出模块24包括语音采集系统、图像采集系统和文本输入系统,还可以包括其他模态数据输入设备。由于本例中的智能机器人20多用在人机对话场景中,因此重点来说明语音采集系统的功能。语音采集系统主要包括麦克风、A/D转换器等设备。在用户发出语音信息后,语音采集系统经由麦克风采集该模拟语音信号,利用A/D转换器将将模拟语音信号转换成系统能够处理的语音信号,然后将数字语音信号输入至数据处理单元23进行语音信息的预处理,预处理主要包括滤波和放大等。图像采集系统主要包括图像传感器等设备,图像传感器可以为CCD摄像器件或CMOS摄像器件,主要对用户当前的面部图像、姿态图像进行采集。文本输入系统包括触屏输入设备、键盘、鼠标等,通过这些设备输入文本数据。其他模态数据输入设备,例如可以是触觉采集系统,该系统包括触觉传感器,触觉传感器接收来自用户的触摸信号。
接着对通信模块22进行说明。该通信模块22具备发送和接收功能,在本例中主要将本地人机交互输入输出模块24预处理后的语音数据转发至云端大脑10的对话交互系统中,以及接收来该对话交互系统100决策出的、响应用户的交互意图而得到的对话输出数据。
数据处理单元23,其主要对人机交互输入输出模块24采集的多模态数据进行预处理,针对语音数据,主要进行滤波和放大处理,针对图像来说则需要执行滤波去噪、灰度修正、图像增强和几何变换等。
下面对云端大脑10的对话交互系统100的各个组成部分和功能进行说明。
如图3所示,对话交互系统100包括对话交互信息解析模块110、话题确定模块120、话题输出数据生成模块130、话题图谱存储模块140和对话交互结束模块150。在话题图谱存储模块140预先存储有话题图谱,例如图4所示的话题图谱,其中,明星是主话题,是聊天的主体;基本信息、人物评价、作品、大事件/重要经历、社会活动、社交关系、相似艺人等分支是围绕明星这一主话题展开的,是它的子话题,而针对某些子话题下面的分支,例如子话题“作品”下的分支“代表作”,可以进一步作为该子话题的二级子话题。
另外,需要说明的是,在本例中,涉及基于话题交互的实现逻辑如图5所示,包括:话题的界定、话题的层级划分和话题的边界划分。简单来说,对话交互信息解析模块110完成了话题的界定,即确定对话交互信息中的中心主体;话题确定模块120完成了话题的层级确定,确定当前对话交互所属主话题及对应的子话题信息;而话题输出数据生成模块130实现了话题的边界确定,区分了话题开始、话题跳跃、话题转折和话题结束这四种模式,从而确定了下一轮输出的对话数据。
下面对上述各个模块的功能进行具体说明。
对话交互信息解析模块110,其在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息。
具体来说,对话交互信息解析模块110,其在接收到通信模块22转发后的语音信息后,响应该语音信息生成对应的文本信息。首先,对经例如去噪预处理后的语音信息进行语音识别的综合分析,生成与语音信息对应的文本信息。需要说明的是,语音识别,对于人来说接收到的语音可以立马转换为文字信息,但是对于机器人来说接收到的则是数字信号而已。当有人提问“你好吗?”时,“Ni”这个发音可以是“泥”也可以是“逆”,所以最终要确定是哪个字还需要语音识别技术来实现计算概率的最大化。在本例中,首先根据人的语音特点建立语音模型,对输入的语音信号进行分析,并抽取所需的特征,在此基础上建立语音识别所需的模板。在识别过程中要根据语音识别的模型,将预先存储的语音模板与输入的语音信号的特征进行比较,根据一定的搜索和匹配策略,找出一系列最优的与输入语音匹配的模板。然后根据此模板的定义,通过查表就可以给出识别结果。接着,对文本信息进行文本分析,即获取文本的具体语义内容。具体地,在获取识别结果之后,利用自然语言处理技术对识别结果进行语义解析。语义分析,指的是将给定的自然语言转化为反映其意义的某种形式化表示,也就是将人类能够理解的自然语言转化为计算机能够理解的形式语言。在获得解析结果后,计算该解析结果与已设定的知识库中的内容的语义相似度(问题和问题的相似度),从而在知识库中搜索与解析结果相匹配的数据。至此,完成了对对话交互信息的解析操作。
之后,判断得到的语音文本信息中是否存在与话题相关的实体信息,即与实体信息对应的特定词汇。“特定词汇”为事先已被设定好的与实体相关词汇或短语,在本例中,实体被认定为某一具体实体,具体为明星的名字。而且,本领域技术人员可以根据当前网络技术用语或用户需求更新或添加“特定词汇”,使数据库的内容更加丰富,提高用户体验。可以遍历“特定词汇”数据库中的特定词汇,将得到的语音文本信息与每个特定词汇进行词形相似度和/或语义相似度计算,判断语音文本信息中是否存在对应的特定词汇。当词形相似度大于阈值,且数值极大,则无需计算语义相似度即可判断语音文本存在特定词汇,否则,计算语义相似度和词形相似度的加权和来判断是否存在特定词汇。关于判断得到的语音文本信息中是否存在特定词汇的方法,还可以通过其他技术来实现,此处不做限定。
话题确定模块120,其基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,子话题为主话题的多个直接属性之一,所述话题信息中包括上下文对话中的主话题及子话题。
需要说明的是,每一轮人机对话交互都通过提取特定词汇的方式确定实体信息,进而确定该轮对话的话题信息,并对该轮对话标注话题标签存储到本地或云端大脑的存储器中,为下一轮对话选择并确定话题信息做好准备。
在解析出对话交互信息中的实体信息后,首先将该实体信息与之前对话出现的实体信息进行比对,判断该实体信息是否为首次出现,若为首次出现,则进一步通过话题图谱查询判断其与上下文话题信息中的主话题和子话题是否关联。若解析出对话交互信息中的实体信息为首次出现,且与上下文话题信息中的主话题和子话题并无关联,则将实体信息作为当前对话交互的主话题,进入话题开始模式。
例如,当用户作为对话发起者,输入第一个主体为明星的语句(简称“Q”),记为话题的开始,打上主话题的标记。话题一旦开始,在话题结束之前的一问一答(简称“A”)都要做话题的标记,同时标记子话题。如下例1所示:
例1:
Q:你知道刘德华吗?【主话题:刘德华】
若当前对话交互的主话题与上下文话题信息中的主话题一致而子话题不同,则在下一轮对话交互中,根据当前对话交互的子话题信息,生成对话输出数据。该情况可认为是话题的跳跃:对话开始之后,对话在子话题之间的转换称为话题的跳跃。如下例2所示:
例2:
Q:那你听过他的歌吗?【主话题:刘德华】【子话题:音乐】
A:《男人哭吧不是罪》当年很火呢。【主话题:刘德华】【子话题:音乐-《男人哭吧不是罪》】
Q:那你觉得好听吗?【主话题:刘德华】【子话题:音乐-《男人哭吧不是罪》】
A:好听,唱出了很多人的心声。【主话题:刘德华】【子话题:音乐-《男人哭吧不是罪》】
A:他在电影《暗战》里的表现也不错,你看过吗?【主话题:刘德华】【子话题:电影-《暗战》】
若解析出对话交互信息中的实体信息为首次出现,且与之前对话过程中获取的话题信息为同一维度,将当前解析出的实体信息作为当前对话交互的主话题。此处所说的“同一维度”是指在话题图谱中,处于主话题地位的话题信息。例如,前几轮对话交互的主话题为“刘德华”,而当前解析的实体信息为“刘青云”,通过查询话题图谱,了解到“刘青云”和“刘德华”均为主话题,则进行话题转折,即话题由一个主话题转向另一个主话题,将“刘青云”替换“刘德华”作为下一轮对话的主话题。如下例3所示:
例3:
A:他在电影《暗战》里的表现也不错,你看过吗?【主话题:刘德华】【子话题:电影-《暗战》】
Q:没有呢。【主话题:刘德华】【子话题:电影-《暗战》】
A:那我来给你介绍一下吧。《暗战》是中国星集团出品的一部警匪片,由杜琪峰执导,刘德华、刘青云、蒙嘉慧等主演。影片讲述了在72小时的时间里发生在一个警察和一个盗贼之间的故事。1999年9月23日,该片在香港上映,票房为1465万港币。【主话题:刘德华】【子话题:电影-《暗战》】
Q:刘青云也参演了这部电影啊?【主话题:刘青云】
对话输出数据生成模块130,其根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。
首先,在确定了主话题和子话题信息后,对话输出数据生成模块130根据这些信息对对话交互信息进行意图识别。例如,以上面的例3为例,通过语音识别得到的分析结果是“没有呢”,而上一对话内容的主题信息为:主话题-刘德华;子话题-电影《暗战》,因此,通过将二者结合能够确定本次对话交互的真实意图是“没有看过刘德华演的电影《暗战》”,以这些信息为指引从预设的有关刘德华的话题图谱中找到有关电影《暗战》的内容,根据预设的话题模版生成针对当前对话内容的应答内容,例如:那我来给你介绍一下吧。《暗战》是中国星集团出品的一部警匪片,由杜琪峰执导,刘德华、刘青云、蒙嘉慧等主演。影片讲述了在72小时的时间里发生在一个警察和一个盗贼之间的故事。1999年9月23日,该片在香港上映,票房为1465万港币。相比现有技术来说,如果单纯地依据当前对话内容的解析结果来生成下一轮对话数据,则根据意图“没有呢”获得的对话数据会多种多样,那么很容易导致回复的语音信息与实际意图存在较大的偏差,带来不好的用户体验,而本例通过结合上下文对话的主题信息来生成对话数据则能较好地解决上述问题。
如图5所示,除了话题开始、话题跳跃、话题转折这三种模式以外,还包括话题结束模式。在该例中,如图3所示,对话交互系统100还包括对话交互结束模块150,其识别话题结束模式,并在该模式下结束当前的对话交互。
话题结束模式包括主动结束和被动结束。在解析对话交互信息时,若未解析出实体信息,且意图识别结果为用户欲结束当前话题,则结束对话交互,此为主动结束的话题结束模式。容易理解,若在用户发出的语音信息中包括某些特定字眼,例如“聊到这吧”、“不聊了”、“聊点别的”,则都能确定用户的意图为结束当前话题。若经过设定时间未接收到用户发来的对话信息或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,则结束对话交互。如下例4所示:
例4:
主动结束:用户主动结束话题聊天。例如:
Q:今天聊到这吧。/不聊了。/聊点别的吧。
被动结束:连续两个Q没有话题相关内容,包括主体和属性;或者用户因故离开,10分钟内没有回应,则话题结束。
另一方面,还可以在此情况下(话题结束情况),例如用户发出“聊点别的吧”或者“连续设定个问题中没有该话题相关内容”,则对话输出数据生成模块130生成与其他话题相关的对话输出数据。
图6为本申请实施例的用于智能机器人的对话交互方法的示例一的流程示意图。下面结合图6来说明本交互系统的交互流程。
如图6所示,在步骤S610中,对话交互信息解析模块110在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息。在步骤S620中,话题确定模块120,其基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,所述子话题为主话题的多个直接属性之一,所述话题信息中包括上下文对话中的主话题及子话题。在步骤S630中,对话输出数据生成模块130,其根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。
在本发明实施例中,对话机器人在与用户对话交互的过程中,基于主话题与子话题的交互框架,与用户进行对话交互,保证了上下文对话的连贯性,能够实现机器人与用户进行连续多轮的对话交互。而且,通过确定本轮对话的话题信息,结合上一轮对话的话题、上下文场景信息,能够更加准确地判断用户的真实意图,增强了机器人对用户意图识别的准确度,提高了机器人的智能性和用户的兴趣,改善了用户体验。
由于本发明的方法描述的是在计算机系统中实现的。该计算机系统例如可以设置控制核心处理器中。例如,本文所述的方法可以实现为能以控制逻辑来执行的软件,其由操作系统中的CPU来执行。本文所述的功能可以实现为存储在非暂时性有形计算机可读介质中的程序指令集合。当以这种方式实现时,该计算机程序包括一组指令,当该组指令由计算机运行时其促使计算机执行能实施上述功能的方法。可编程逻辑可以暂时或永久地安装在非暂时性有形计算机可读介质中,例如只读存储器芯片、计算机存储器、磁盘或其他存储介质。除了以软件来实现之外,本文所述的逻辑可利用分立部件、集成电路、与可编程逻辑设备(诸如,现场可编程门阵列(FPGA)或微处理器)结合使用的可编程逻辑,或者包括它们任意组合的任何其他设备来体现。所有此类实施例旨在落入本发明的范围之内。
应该理解的是,本发明所公开的实施例不限于这里所公开的处理步骤,而应当延伸到相关领域的普通技术人员所理解的这些特征的等同替代。还应当理解的是,在此使用的术语仅用于描述特定实施例的目的,而并不意味着限制。
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
虽然本发明所公开的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所公开的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专利保护范围,仍须以所附的权利要求书所界定的范围为准。
Claims (12)
1.一种用于智能机器人的对话交互方法,该方法包括如下步骤:
在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息;
基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,所述子话题为主话题的多个直接属性之一,所述话题信息中包括上下文对话中的主话题及子话题;
根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。
2.根据权利要求1所述的方法,其特征在于,
若解析出对话交互信息中的实体信息为首次出现,且与上下文话题信息中的主话题和子话题并无关联,将所述实体信息作为当前对话交互的主话题,生成对话输出数据。
3.根据权利要求1所述的方法,其特征在于,
若当前对话交互信息的实体信息与上下文话题信息中的主话题一致,而与子话题不同,则在下一轮对话交互中,根据当前对话交互的子话题信息,生成对话输出数据。
4.根据权利要求1所述的方法,其特征在于,
若解析出对话交互信息中的实体信息为首次出现,且与之前对话过程中获取的主话题信息为同一维度,将当前解析出的实体信息作为当前对话交互的主话题,生成对话输出数据。
5.根据权利要求1~4中任一项所述的方法,其特征在于,
若未解析出实体信息,且意图识别结果为用户欲结束当前话题,则结束对话交互或生成与其他话题相关的对话输出数据。
6.根据权利要求1~4中任一项所述的方法,其特征在于,
若经过设定时间未接收到用户发来的对话信息或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,则结束对话交互或生成与其他话题相关的对话输出数据。
7.一种用于智能机器人的对话交互系统,该系统包括如下模块:
对话交互信息解析模块,其在智能机器人与用户对话交互的过程中,解析当前的对话交互信息,获取与话题相关的实体信息;
话题确定模块,其基于实体信息及上下文对话中获取的话题信息,确定当前对话交互所属主话题及对应的子话题信息,其中,所述子话题为主话题的多个直接属性之一,所述话题信息中包括上下文对话中的主话题及子话题;
对话输出数据生成模块,其根据确定的主话题及子话题信息对所述对话交互信息进行意图识别,结合意图识别结果,生成对话输出数据。
8.根据权利要求7所述的系统,其特征在于,
所述对话输出数据生成模块,其进一步在解析出对话交互信息中的实体信息为首次出现,且与上下文话题信息中的主话题和子话题并无关联时,将所述实体信息作为当前对话交互的主话题,生成对话输出数据。
9.根据权利要求7所述的系统,其特征在于,在生成对话输出数据的步骤中,
所述对话输出数据生成模块,其进一步在当前对话交互的主话题与上下文话题信息中的主话题一致而子话题不同时,在下一轮对话交互中,根据当前对话交互的子话题信息,生成对话输出数据。
10.根据权利要求7所述的系统,其特征在于,
所述对话输出数据生成模块,其进一步在解析出对话交互信息中的实体信息为首次出现,且与之前对话过程中获取的主话题信息为同一维度时,将当前解析出的实体信息作为当前对话交互的主话题,生成对话输出数据。
11.根据权利要求7~10中任一项所述的系统,其特征在于,
该系统还包括:对话交互结束模块,其在意图识别结果为用户欲结束当前话题、或者经过设定时间未接收到用户发来的对话信息或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,则结束对话交互;或者,
所述对话输出数据生成模块,其在意图识别结果为用户欲结束当前话题时或在连续设定轮对话交互中用户输出的对话信息与当前话题不关联时,生成与其他话题相关的对话输出数据。
12.一种云端服务器,其特征在于,具备如权利要求7~11中任一项所述的对话交互系统。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710990250.8A CN107704612A (zh) | 2017-10-23 | 2017-10-23 | 用于智能机器人的对话交互方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710990250.8A CN107704612A (zh) | 2017-10-23 | 2017-10-23 | 用于智能机器人的对话交互方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107704612A true CN107704612A (zh) | 2018-02-16 |
Family
ID=61181940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710990250.8A Pending CN107704612A (zh) | 2017-10-23 | 2017-10-23 | 用于智能机器人的对话交互方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107704612A (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109616108A (zh) * | 2018-11-29 | 2019-04-12 | 北京羽扇智信息科技有限公司 | 多轮对话交互处理方法、装置、电子设备及存储介质 |
CN110032625A (zh) * | 2019-03-28 | 2019-07-19 | 腾讯科技(上海)有限公司 | 一种人机对话方法及装置 |
CN110175226A (zh) * | 2019-05-09 | 2019-08-27 | 厦门邑通软件科技有限公司 | 一种基于多维度场景分析的对话决策方法 |
CN110457445A (zh) * | 2018-05-03 | 2019-11-15 | 微软技术许可有限责任公司 | 基于用户画像和上下文推理的答复生成技术 |
WO2019233219A1 (zh) * | 2018-06-07 | 2019-12-12 | 腾讯科技(深圳)有限公司 | 对话状态确定方法及装置、对话系统、计算机设备、存储介质 |
CN110704596A (zh) * | 2019-09-29 | 2020-01-17 | 北京百度网讯科技有限公司 | 基于话题的对话方法、装置和电子设备 |
CN110728356A (zh) * | 2019-09-17 | 2020-01-24 | 阿里巴巴集团控股有限公司 | 基于循环神经网络的对话方法、系统及电子设备 |
CN110765312A (zh) * | 2018-07-10 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 人机交互及内容搜索方法、装置、设备以及存储介质 |
CN111427993A (zh) * | 2019-11-15 | 2020-07-17 | 西安海的电子科技有限公司 | 一种基于安卓系统的多对话实现方法 |
CN112017629A (zh) * | 2020-07-15 | 2020-12-01 | 马上消费金融股份有限公司 | 语音机器人的会话控制方法及设备、存储介质 |
CN114265920A (zh) * | 2021-12-27 | 2022-04-01 | 北京易聊科技有限公司 | 一种基于信号和场景的智能机器人对话方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685454A (zh) * | 2008-09-28 | 2010-03-31 | 华为技术有限公司 | 人机交互方法及系统 |
CN104008160A (zh) * | 2014-05-29 | 2014-08-27 | 吴春尧 | 一种实现并行话题控制的模糊推理聊天机器人方法和系统 |
CN104836720A (zh) * | 2014-02-12 | 2015-08-12 | 北京三星通信技术研究有限公司 | 交互式通信中进行信息推荐的方法及装置 |
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106200962A (zh) * | 2016-07-08 | 2016-12-07 | 北京光年无限科技有限公司 | 面向智能机器人的交互方法及系统 |
-
2017
- 2017-10-23 CN CN201710990250.8A patent/CN107704612A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101685454A (zh) * | 2008-09-28 | 2010-03-31 | 华为技术有限公司 | 人机交互方法及系统 |
CN104836720A (zh) * | 2014-02-12 | 2015-08-12 | 北京三星通信技术研究有限公司 | 交互式通信中进行信息推荐的方法及装置 |
CN104008160A (zh) * | 2014-05-29 | 2014-08-27 | 吴春尧 | 一种实现并行话题控制的模糊推理聊天机器人方法和系统 |
CN105068661A (zh) * | 2015-09-07 | 2015-11-18 | 百度在线网络技术(北京)有限公司 | 基于人工智能的人机交互方法和系统 |
CN106200962A (zh) * | 2016-07-08 | 2016-12-07 | 北京光年无限科技有限公司 | 面向智能机器人的交互方法及系统 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110457445A (zh) * | 2018-05-03 | 2019-11-15 | 微软技术许可有限责任公司 | 基于用户画像和上下文推理的答复生成技术 |
WO2019233219A1 (zh) * | 2018-06-07 | 2019-12-12 | 腾讯科技(深圳)有限公司 | 对话状态确定方法及装置、对话系统、计算机设备、存储介质 |
CN110765312A (zh) * | 2018-07-10 | 2020-02-07 | 阿里巴巴集团控股有限公司 | 人机交互及内容搜索方法、装置、设备以及存储介质 |
CN109616108B (zh) * | 2018-11-29 | 2022-05-31 | 出门问问创新科技有限公司 | 多轮对话交互处理方法、装置、电子设备及存储介质 |
CN109616108A (zh) * | 2018-11-29 | 2019-04-12 | 北京羽扇智信息科技有限公司 | 多轮对话交互处理方法、装置、电子设备及存储介质 |
CN110032625A (zh) * | 2019-03-28 | 2019-07-19 | 腾讯科技(上海)有限公司 | 一种人机对话方法及装置 |
CN110032625B (zh) * | 2019-03-28 | 2023-01-13 | 腾讯科技(上海)有限公司 | 一种人机对话方法及装置 |
CN110175226A (zh) * | 2019-05-09 | 2019-08-27 | 厦门邑通软件科技有限公司 | 一种基于多维度场景分析的对话决策方法 |
CN110175226B (zh) * | 2019-05-09 | 2021-06-08 | 厦门邑通软件科技有限公司 | 一种基于多维度场景分析的对话决策方法 |
CN110728356A (zh) * | 2019-09-17 | 2020-01-24 | 阿里巴巴集团控股有限公司 | 基于循环神经网络的对话方法、系统及电子设备 |
CN110728356B (zh) * | 2019-09-17 | 2023-08-04 | 创新先进技术有限公司 | 基于循环神经网络的对话方法、系统及电子设备 |
CN110704596A (zh) * | 2019-09-29 | 2020-01-17 | 北京百度网讯科技有限公司 | 基于话题的对话方法、装置和电子设备 |
CN111427993A (zh) * | 2019-11-15 | 2020-07-17 | 西安海的电子科技有限公司 | 一种基于安卓系统的多对话实现方法 |
CN112017629A (zh) * | 2020-07-15 | 2020-12-01 | 马上消费金融股份有限公司 | 语音机器人的会话控制方法及设备、存储介质 |
CN114265920A (zh) * | 2021-12-27 | 2022-04-01 | 北京易聊科技有限公司 | 一种基于信号和场景的智能机器人对话方法及系统 |
CN114265920B (zh) * | 2021-12-27 | 2022-07-01 | 北京易聊科技有限公司 | 一种基于信号和场景的智能机器人对话方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107704612A (zh) | 用于智能机器人的对话交互方法及系统 | |
CN107870994A (zh) | 用于智能机器人的人机交互方法及系统 | |
CN108000526B (zh) | 用于智能机器人的对话交互方法及系统 | |
CN107797663A (zh) | 基于虚拟人的多模态交互处理方法及系统 | |
CN108197191B (zh) | 一种多轮对话的场景意图中断方法 | |
CN107765852A (zh) | 基于虚拟人的多模态交互处理方法及系统 | |
CN106985137B (zh) | 用于智能机器人的多模态交互方法及系统 | |
CN108108340A (zh) | 用于智能机器人的对话交互方法及系统 | |
CN106997243B (zh) | 基于智能机器人的演讲场景监控方法及装置 | |
CN107728780A (zh) | 一种基于虚拟机器人的人机交互方法及装置 | |
CN102298694A (zh) | 一种应用于远程信息服务的人机交互识别系统 | |
CN108228764A (zh) | 一种单轮对话和多轮对话的融合方法 | |
CN109522835A (zh) | 基于智能机器人的儿童读物阅读与交互方法及系统 | |
CN112101045B (zh) | 一种多模态语义完整性识别方法、装置及电子设备 | |
CN107894833A (zh) | 基于虚拟人的多模态交互处理方法及系统 | |
CN107423809A (zh) | 应用于视频直播平台的虚拟机器人多模态交互方法和系统 | |
CN110299152A (zh) | 人机对话的输出控制方法、装置、电子设备及存储介质 | |
CN108320738A (zh) | 语音数据处理方法及装置、存储介质、电子设备 | |
CN105244042B (zh) | 一种基于有限状态自动机的语音情感交互装置与方法 | |
CN107808191A (zh) | 虚拟人多模态交互的输出方法和系统 | |
CN109101663A (zh) | 一种基于互联网的机器人对话系统 | |
CN115083434B (zh) | 一种情绪识别方法、装置、计算机设备及存储介质 | |
WO2023226914A1 (zh) | 基于多模态数据的虚拟人物驱动方法、系统及设备 | |
CN107085717A (zh) | 一种家庭监控方法、服务端及计算机可读存储介质 | |
CN108052250A (zh) | 基于多模态交互的虚拟偶像演绎数据处理方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180216 |