CN108897848A

CN108897848A - 机器人互动方法、装置及设备

Info

Publication number: CN108897848A
Application number: CN201810686130.3A
Authority: CN
Inventors: 戴俊; 刘瑛
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2018-06-28
Filing date: 2018-06-28
Publication date: 2018-11-27
Also published as: US11551673B2; US20200005772A1

Abstract

本发明公开了一种机器人互动方法、装置及设备，其中，方法包括：获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图；根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息；将反馈信息合成被模拟用户的声音播放给交互对象。由此，实现了机器人对特定人物的高度仿真，提高了机器人互动的自由度和智能化程度。

Description

机器人互动方法、装置及设备

技术领域

本发明涉及人工智能技术领域，尤其涉及一种机器人互动方法、装置及设备。

背景技术

人工智能(Artificial Intelligence，简称AI)。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。

相关技术中，存在把一定生物特征用于某个特定场景下的机器人，例如高德地图的林志玲声音导航，通过语音合成技术为用户提供导航服务，再例如一些家庭陪伴机器人，可以录制父母的声音给孩子讲故事等，这类机器人互动能力有限，目前缺少一种能模拟特定人物与交互对象进行高自由度互动的机器人。

发明内容

本发明旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本发明的一个目的在于提出一种机器人互动方法，通过在声音、对话方式、知识库上高度模仿被模拟用户，实现了机器人对特定人物的高度仿真，并且，通过智能的识别交互对象的会话意图，并智能的获取反馈信息进行反馈，提高了机器人互动的自由度和智能化程度。

本发明的另一个目的在于提出一种机器人互动装置。

本发明的另一个目的在于提出一种电子设备。

本发明的又一个目的在于提出一种非临时性计算机可读存储介质。

为达上述目的，本发明第一方面实施例提出了一种机器人互动方法，包括：

获取交互对象输入的语音信息，对所述语音信息进行语义识别获取会话意图；

根据被模拟用户预先配置的会话场景知识库，获取与所述会话意图对应的反馈信息；

将所述反馈信息合成所述被模拟用户的声音播放给所述交互对象。

本发明实施例的机器人互动方法，通过获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图，进而根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息，进一步将反馈信息合成被模拟用户的声音播放给交互对象。由此，通过在声音、对话方式、知识库上高度模仿被模拟用户，实现了机器人对特定人物的高度仿真，并且，通过智能的识别交互对象的会话意图，并智能的获取反馈信息进行反馈，提高了机器人互动的自由度和智能化程度。

另外，根据本发明上述实施例的机器人互动方法还可以具有如下附加技术特征：

可选地，所述根据被模拟用户预先配置的会话场景知识库，获取与所述会话意图对应的反馈信息，包括：根据所述会话意图查询所述会话场景知识库获知查询路径；若所述查询路径显示预置路径，则查询所述被模拟用户预先配置的与用户特征相关的结构化知识，和/或，富媒体知识，获取与所述会话意图对应的反馈信息。

可选地，在所述根据所述会话意图查询所述会话场景知识库获知查询路径之后，还包括：若所述查询路径显示外接路径，则查询所述被模拟用户预先配置的与所述会话意图对应的第三方应用接口，或，搜索引擎，获取与所述会话意图对应的反馈信息。

可选地，所述将所述反馈信息合成所述被模拟用户的声音播放给所述交互对象，包括：查询所述被模拟用户预先录制的固定场景声音库，获取所述反馈信息的音频文件，播放给所述交互对象。

可选地，所述将所述反馈信息合成所述被模拟用户的声音播放给所述交互对象，包括：查询所述被模拟用户预先训练的会话场景声音库，合成所述反馈信息的音频文件，播放给所述交互对象。

可选地，所述的方法还包括：获取虚拟现实场景交互指令；调用所述被模拟用户预先绘制的用户3D模型，向所述交互对象展示所述被模拟用户。

可选地，所述的方法还包括：向所述被模拟用户上报与所述交互对象的多轮对话交互情况；接收所述被模拟用户发送的接管指令，停止与所述交互对象的交互行为。

为达上述目的，本发明第二方面实施例提出了一种机器人互动装置，包括：

第一获取模块，用于获取交互对象输入的语音信息，对所述语音信息进行语义识别获取会话意图；

第二获取模块，用于根据被模拟用户预先配置的会话场景知识库，获取与所述会话意图对应的反馈信息；

处理模块，用于将所述反馈信息合成所述被模拟用户的声音播放给所述交互对象。

本发明实施例的机器人互动装置，通过获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图，进而根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息，进一步将反馈信息合成被模拟用户的声音播放给交互对象。由此，通过在声音、对话方式、知识库上高度模仿被模拟用户，实现了机器人对特定人物的高度仿真，并且，通过智能的识别交互对象的会话意图，并智能的获取反馈信息进行反馈，提高了机器人互动的自由度和智能化程度。

另外，根据本发明上述实施例的机器人互动装置还可以具有如下附加技术特征：

可选地，所述第二获取模块具体用于：根据所述会话意图查询所述会话场景知识库获知查询路径；若所述查询路径显示预置路径，则查询所述被模拟用户预先配置的与用户特征相关的结构化知识，和/或，富媒体知识，获取与所述会话意图对应的反馈信息。

可选地，所述第二获取模块具体用于：若所述查询路径显示外接路径，则查询所述被模拟用户预先配置的与所述会话意图对应的第三方应用接口，或，搜索引擎，获取与所述会话意图对应的反馈信息。

可选地，所述处理模块具体用于：查询所述被模拟用户预先录制的固定场景声音库，获取所述反馈信息的音频文件，播放给所述交互对象。

可选地，所述处理模块具体用于：查询所述被模拟用户预先训练的会话场景声音库，合成所述反馈信息的音频文件，播放给所述交互对象。

可选地，所述的装置还包括：展示模块，用于获取虚拟现实场景交互指令；调用所述被模拟用户预先绘制的用户3D模型，向所述交互对象展示所述被模拟用户。

可选地，所述的装置还包括：接管模块，用于向所述被模拟用户上报与所述交互对象的多轮对话交互情况；接收所述被模拟用户发送的接管指令，停止与所述交互对象的交互行为。

为达上述目的，本发明第三方面实施例提出了一种电子设备，包括处理器和存储器；其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如第一方面实施例所述的机器人互动方法。

为达上述目的，本发明第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如第一方面实施例所述的机器人互动方法。

本发明附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

图1为本发明实施例所提供的一种机器人互动方法的流程示意图；

图2为本发明实施例所提供的另一种机器人互动方法的流程示意图；

图3为本发明实施例所提供的一种机器人互动实际应用示意图；

图4为本发明实施例所提供的一种机器人互动装置的结构示意图；

图5为本发明实施例所提供的另一种机器人互动装置的结构示意图；

图6示出了适于用来实现本发明实施例的示例性电子设备的框图。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本发明，而不能理解为对本发明的限制。

下面参考附图描述本发明实施例的机器人互动方法、装置及设备。

图1为本发明实施例所提供的一种机器人互动方法的流程示意图，如图1所示，该机器人互动方法包括：

步骤101，获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图。

本发明实施例中，机器人与交互对象进行互动时，需要获取交互对象输入的语音信息，进而根据语音信息获取会话意图。

在本发明的一个实施例中，可以通过语音识别技术获取交互对象输入的语音信息。例如，可以预先训练语音识别模型，进而，通过接收交互对象输入的语音信号并提取相应的特征信息，进一步将特征信息输入到语音识别模型中进行匹配，从而获取交互对象输入的语音信息。

进而，在获取交互对象输入的语音信息之后，可以对语音信息进行语义识别获取会话意图。

在本发明的一个实施例中，可以通过自然语言处理技术，对语音信息进行识别和分析，从而获取会话意图。例如，对语音信息“你好”进行语义识别，获取会话意图为问候。

在本发明的一个实施例中，还可以根据会话场景，针对性的训练语义识别模型，进而根据语义识别模型对语音信息进行识别和分析，从而获取会话意图。例如，会话场景为教学场景时，可以根据教学场景获取相应的训练样本数据，对语义识别模型进行训练，进而机器人在教学场景与交互对象互进行互动时，可以根据相应的语义识别模型对语音信息进行识别和分析，从而获取会话意图。由此，减少了训练模型的运算量，提高了产品的个性化程度。

其中，语音识别模型、语义识别模型可以为深度学习模型。

需要说明的是，上述对语音信息进行语义识别获取会话意图的方式仅仅是示例性的，可以根据其中一种方式获取会话意图，也可以结合多种方式获取会话意图，此处不作限制。

步骤102，根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息。

在本发明的一个实施例中，可以在设备本地或者云服务器预先配置会话场景知识库，将相关知识存储在会话场景知识库中，进而，在机器人与交互对象进行互动时，根据会话意图对会话场景知识库中的知识进行检索，进一步根据检索到的知识生成反馈信息。

例如，在教学场景中，可以将课程内容、教学动画等存储在教学场景知识库中，进而，在机器人模仿教师与学生进行授课答疑互动时，获取学生输入的语音信息并进行语义识别，以获取学生的会话意图，进而根据会话意图对教学场景知识库中的课程内容进行检索，进一步根据检索到的课程内容生成反馈信息。

其中，相关知识可以由被模拟用户自行设置。相关知识的格式可以为文本、图片、视频等，此处不作限制。

在本发明的一个实施例中，为了高度模仿被模拟用户，还可以将被模拟用户的对话数据作为样本数据，训练对话模型。进而，在获取会话意图之后，根据被模拟用户预先配置的会话场景知识库，结合预先训练好的对话模型，获取与会话意图对应的反馈信息，从而使得机器人可以模仿被模拟用户的对话方式与交互对象互动。

需要说明的是，可以根据样本数据训练对话模型，也可以由被模拟用户直接进行对话配置。

步骤103，将反馈信息合成被模拟用户的声音播放给交互对象。

在本发明的一个实施例中，可以针对会话场景，预先录制被模拟用户的语音音频文件，并存储在固定场景声音库中，以支持固定场景的互动。进而，在机器人与交互对象进行固定场景互动时，查询被模拟用户预先录制的固定场景声音库，获取反馈信息的音频文件，进一步将音频文件播放给交互对象。

作为一种可能的实现方式，可以设置反馈信息与音频文件的映射关系表，通过查询映射关系表获取反馈信息对应的音频文件。

其中，音频文件的格式包括但不限于mp3、WAV等，此处不作限制。

在本发明的一个实施例中，还可以获取被模拟用户的声音片段，进而通过语音合成技术(例如TTS语音技术)训练会话场景声音库，以支持高自由度场景的互动。进而，在机器人与交互对象进行互动时，查询被模拟用户预先训练的会话场景声音库，根据反馈信息和会话场景声音库中的声音信息，合成反馈信息的音频文件，进一步将音频文件播放给交互对象。

需要说明的是，上述将反馈信息合成被模拟用户的声音并播放给交互对象的实现方式仅仅是示例性的，用户可以根据实际需求任意选取或组合进行使用，此处不做限制。

本实施例中，通过合成被模拟用户声音、进行对话配置和会话场景知识库配置，使机器人可以在声音、对话方式、知识库上高度模仿被模拟用户，提高了机器人定制的个性化程度。并且，本发明实施例的机器人互动方法可以智能的识别交互对象的会话意图，并智能的获取反馈信息进行反馈，实现了机器人与交互对象的高自由度互动。

综上所述，本发明实施例的机器人互动方法，通过获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图，进而根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息，进一步将反馈信息合成被模拟用户的声音播放给交互对象。由此，通过在声音、对话方式、知识库上高度模仿被模拟用户，实现了机器人对特定人物的高度仿真，并且，通过智能的识别交互对象的会话意图，并智能的获取反馈信息进行反馈，提高了机器人互动的自由度和智能化程度。

图2为本发明实施例所提供的另一种机器人互动方法的流程示意图，如图2所示，该机器人互动方法包括：

步骤201，获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图。

需要说明的是，前述实施例针对步骤101的解释说明同样适用于步骤201，此处不再赘述。

步骤202，根据会话意图查询会话场景知识库获知查询路径。

可选地，可以在会话场景知识库中设置查询路径，根据会话意图与查询路径进行匹配，进而获取匹配成功的查询路径。

其中，查询路径可以为预置路径，也可以为外接路径，具体可以根据需要自行设置，此处不作限制。

步骤203，根据查询路径获取与会话意图对应的反馈信息。

作为一种示例，查询路径显示预置路径时，查询被模拟用户预先配置的与用户特征相关的结构化知识，获取与会话意图对应的反馈信息。

其中，与用户特征相关的结构化知识可以根据需要自行设置。例如，教师可以预先配置课程内容，再例如，明星可以预先配置自己的个人信息等。

作为另一种示例，查询路径显示预置路径时，查询被模拟用户预先配置的富媒体知识，获取与会话意图对应的反馈信息。

其中，富媒体知识包括但不限于图片、视频等。

在实际应用中，可能存在根据预置路径查询到的知识不能满足需求的情况，因此，还可以根据外接路径获取与会话意图对应的反馈信息。

作为一种示例，查询路径显示外接路径时，查询被模拟用户预先配置的与会话意图对应的第三方应用接口，获取与会话意图对应的反馈信息。比如，交互对象想要了解天气信息时，可以查询天气应用接口，获取对应的天气信息。再比如，交互对象想要了解当前股票信息时，可以查询证券应用接口，获取对应的实时股票信息。

作为另一种示例，查询路径显示外接路径时，查询被模拟用户预先配置的搜索引擎，获取与会话意图对应的反馈信息。例如，可以根据会话意图提取关键字，进而在查询路径显示外接路径时，查询被模拟用户预先配置的搜索引擎，进一步通过搜索引擎对关键字进行搜索，获取与会话意图对应的反馈信息。

需要说明的是，上述根据查询路径获取与会话意图对应的反馈信息是示例性的，可以通过一种方式获取反馈信息，也可以多种方式结合获取反馈信息，此处不作限制。

步骤204，将反馈信息合成被模拟用户的声音播放给交互对象。

前述实施例针对步骤103的解释说明同样适用于步骤204，此处不再赘述。

步骤205，获取虚拟现实场景交互指令。

其中，虚拟现实场景交互指令的实现方式包括但不限于语音形式、预设触摸轨迹形式、按键触发形式等。

步骤206，调用被模拟用户预先绘制的用户3D模型，向交互对象展示被模拟用户。

在本发明的一个实施例中，可以通过相关3D模型绘制软件绘制被模拟用户的3D模型，进而在获取虚拟现实场景交互指令时，在虚拟现实场景中向交互对象展示被模拟用户的3D模型。

需要说明的是，可以在虚拟现实场景中向交互对象展示被模拟用户，也可以通过其他方式例如增强现实技术展示被模拟用户，此处不作限制。

步骤207，向被模拟用户上报与交互对象的多轮对话交互情况。

本实施例中，机器人可以智能的与交互对象进行多轮对话，并向被模拟用户上报与交互对象的多轮对话交互情况。

其中，可以实时向被模拟用户上报多轮对话交互情况，也可以每隔预设时间向被模拟用户上报多轮对话交互情况。

步骤208，接收被模拟用户发送的接管指令，停止与交互对象的交互行为。

可选地，被模拟用户可以根据多轮对话交互情况决定是否发送接管指令，进而机器人接收被模拟用户发送的接管指令，并停止与交互对象的交互行为，进一步由被模拟用户与交互对象进行互动。

其中，接管指令的实现方式包括但不限于语音形式、预设触摸轨迹形式、按键触发形式等。

本实施例中，通过调用被模拟用户预先绘制的用户3D模型，向交互对象展示被模拟用户，使得机器人在外观上高度模仿被模拟用户。通过向被模拟用户上报与交互对象的多轮对话交互情况，并在接收被模拟用户发送的接管指令时，停止与交互对象的交互行为，实现了被模拟用户对机器人交互情况的监控，并且被模拟用户可以随时接管互动，扩展了产品的功能。

为了更加清楚的解释本发明，下面结合实际应用场景进行说明。

如图3所示，通过机器人a模仿被模拟用户A，与交互对象进行互动。

其中，机器人a包括：语音识别模块，通过训练语音识别模型，使机器人a可以识别交互对象输入的语音信息。语义识别模块，被模拟用户A可以根据需要互动的场景，针对性的训练语义识别模型，从而对语音信息进行语义识别获取会话意图。知识库模块，机器人a根据会话意图对预设的知识库进行检索，获取相应的知识并生成反馈信息，其中，知识库包含的内容可以为被模拟用户A预置的结构化知识、富媒体知识、期望对接的第三方应用接口、非预置的知识库搜索的知识等。语音合成模块，使机器人a在互动过程中，将反馈信息以声音的方式播放给交互对象，其中，合成的声音是被模拟用户A的声音。被模拟用户A的声音合成库可以被训练，支持高自由度互动；也可以录制好放在录音库支持固定场景互动。3D成像模块，可以预先绘制被模拟用户A的3D模型，进而在虚拟现实场景中展示被模拟用户A的3D模型。多轮对话模块，被模拟用户A可以进行多轮对话配置，机器人a可以根据多轮对话配置和多轮对话模型与交互对象进行互动。

交互对象可以通过客户端与机器人a进行互动，其中，客户端包括但不限于手机应用、呼叫中心、虚拟现实应用、即时通讯应用等，机器人a可以为实体机器人，也可以为虚拟机器人。交互对象可以通过语音流、文本流向机器人a发送信息，机器人a通过语音流、文本流向交互对象发送反馈信息，并通过图像流向交互对象展示被模拟用户A的3D模型。机器人a实时向被模拟用户a上报交互情况，被模拟用户A可以随时根据互动情况发送接管指令，以接管互动。本发明实施例的机器人互动方法可以有广泛的应用场景，例如：为明星定制这样的机器人，可以和大量粉丝同时进行对话互动；教师可以定制这样的机器人在网络上进行授课或答疑；外出务工人员可以定制这样的机器人随时陪伴在远方的亲人；商务人士可以定制这样的机器人，应付一些琐碎的事务。

为了实现上述实施例，本发明还提出一种机器人互动装置。图4为本发明实施例所提供的一种机器人互动装置的结构示意图，如图4所示，该机器人互动装置包括：第一获取模块100，第二获取模块200，处理模块300。

其中，第一获取模块100，用于获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图。

第二获取模块200，用于根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息。

处理模块300，用于将反馈信息合成被模拟用户的声音播放给交互对象。

进一步地，第二获取模块200具体用于：

根据会话意图查询会话场景知识库获知查询路径；

若查询路径显示预置路径，则查询被模拟用户预先配置的与用户特征相关的结构化知识，和/或，富媒体知识，获取与会话意图对应的反馈信息。

进一步地，第二获取模块200具体用于：若查询路径显示外接路径，则查询被模拟用户预先配置的与会话意图对应的第三方应用接口，或，搜索引擎，获取与会话意图对应的反馈信息。

进一步地，处理模块300具体用于：查询被模拟用户预先录制的固定场景声音库，获取反馈信息的音频文件，播放给交互对象。

进一步地，处理模块300具体用于：查询被模拟用户预先训练的会话场景声音库，合成反馈信息的音频文件，播放给交互对象。

在图4的基础上，图5所示的机器人互动装置还包括：展示模块400，接管模块500。

其中，展示模块400，用于获取虚拟现实场景交互指令；调用被模拟用户预先绘制的用户3D模型，向交互对象展示被模拟用户。

接管模块500，用于向被模拟用户上报与交互对象的多轮对话交互情况；接收被模拟用户发送的接管指令，停止与交互对象的交互行为。

需要说明的是，前述实施例对机器人互动方法的解释说明同样适用于本实施例的机器人互动装置，此处不再赘述。

综上所述，本发明实施例的机器人互动装置，通过获取交互对象输入的语音信息，对语音信息进行语义识别获取会话意图，进而根据被模拟用户预先配置的会话场景知识库，获取与会话意图对应的反馈信息，进一步将反馈信息合成被模拟用户的声音播放给交互对象。由此，通过在声音、对话方式、知识库上高度模仿被模拟用户，实现了机器人对特定人物的高度仿真，并且，通过智能的识别交互对象的会话意图，并智能的获取反馈信息进行反馈，提高了机器人互动的自由度和智能化程度。

为了实现上述实施例，本发明还提出一种电子设备，包括处理器和存储器；其中，处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序，以用于实现如前述任一实施例所述的机器人互动方法。

为了实现上述实施例，本发明还提出一种计算机程序产品，当计算机程序产品中的指令被处理器执行时实现如前述任一实施例所述的机器人互动方法。

为了实现上述实施例，本发明还提出一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如前述任一实施例所述的机器人互动方法。

图6示出了适于用来实现本发明实施例的示例性电子设备的框图。图6显示的电子设备12仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图6所示，电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于：一个或者多个处理器或者处理单元16，系统存储器28，连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(Industry StandardArchitecture；以下简称：ISA)总线，微通道体系结构(Micro Channel Architecture；以下简称：MAC)总线，增强型ISA总线、视频电子标准协会(Video Electronics StandardsAssociation；以下简称：VESA)局域总线以及外围组件互连(Peripheral ComponentInterconnection；以下简称：PCI)总线。

电子设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被电子设备12访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(Random Access Memory；以下简称：RAM)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储系统34可以用于读写不可移动的、非易失性磁介质(图6未显示，通常称为“硬盘驱动器”)。尽管图6中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如：光盘只读存储器(Compact Disc Read OnlyMemory；以下简称：CD-ROM)、数字多功能只读光盘(Digital Video Disc Read OnlyMemory；以下简称：DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40，可以存储在例如存储器28中，这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

电子设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信，还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信，和/或与使得该计算机系统/服务器12能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且，电子设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(Local Area Network；以下简称：LAN)，广域网(Wide Area Network；以下简称：WAN)和/或公共网络，例如因特网)通信。如图所示，网络适配器20通过总线18与电子设备12的其它模块通信。应当明白，尽管图中未示出，可以结合电子设备12使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序，从而执行各种功能应用以及数据处理，例如实现前述实施例中提及的方法。

在本发明的描述中，需要理解的是，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中，“多个”的含义是至少两个，例如两个，三个等，除非另有明确具体的限定。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

尽管上面已经示出和描述了本发明的实施例，可以理解的是，上述实施例是示例性的，不能理解为对本发明的限制，本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。

Claims

1.一种机器人互动方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，所述根据被模拟用户预先配置的会话场景知识库，获取与所述会话意图对应的反馈信息，包括：

根据所述会话意图查询所述会话场景知识库获知查询路径；

若所述查询路径显示预置路径，则查询所述被模拟用户预先配置的与用户特征相关的结构化知识，和/或，富媒体知识，获取与所述会话意图对应的反馈信息。

3.如权利要求2所述的方法，其特征在于，在所述根据所述会话意图查询所述会话场景知识库获知查询路径之后，还包括：

若所述查询路径显示外接路径，则查询所述被模拟用户预先配置的与所述会话意图对应的第三方应用接口，或，搜索引擎，获取与所述会话意图对应的反馈信息。

4.如权利要求1所述的方法，其特征在于，所述将所述反馈信息合成所述被模拟用户的声音播放给所述交互对象，包括：

查询所述被模拟用户预先录制的固定场景声音库，获取所述反馈信息的音频文件，播放给所述交互对象。

5.如权利要求1所述的方法，其特征在于，所述将所述反馈信息合成所述被模拟用户的声音播放给所述交互对象，包括：

查询所述被模拟用户预先训练的会话场景声音库，合成所述反馈信息的音频文件，播放给所述交互对象。

6.如权利要求1所述的方法，其特征在于，还包括：

获取虚拟现实场景交互指令；

调用所述被模拟用户预先绘制的用户3D模型，向所述交互对象展示所述被模拟用户。

7.如权利要求1所述的方法，其特征在于，还包括：

向所述被模拟用户上报与所述交互对象的多轮对话交互情况；

接收所述被模拟用户发送的接管指令，停止与所述交互对象的交互行为。

8.一种机器人互动装置，其特征在于，包括：

9.如权利要求8所述的装置，其特征在于，所述第二获取模块具体用于：

根据所述会话意图查询所述会话场景知识库获知查询路径；

10.如权利要求9所述的装置，其特征在于，所述第二获取模块具体用于：

11.如权利要求8所述的装置，其特征在于，所述处理模块具体用于：

12.如权利要求8所述的装置，其特征在于，所述处理模块具体用于：

13.如权利要求8所述的装置，其特征在于，还包括：

展示模块，用于获取虚拟现实场景交互指令；

14.如权利要求8所述的装置，其特征在于，还包括：

接管模块，用于向所述被模拟用户上报与所述交互对象的多轮对话交互情况；

15.一种电子设备，其特征在于，包括处理器和存储器；

其中，所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序，以用于实现如权利要求1-7中任一项所述的机器人互动方法。

16.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-7中任一项所述的机器人互动方法。