CN206892866U

CN206892866U - 具有情景分析功能的智能对话装置

Info

Publication number: CN206892866U
Application number: CN201720429765.6U
Authority: CN
Inventors: 舒昆; 林艺春; 曹汝浪
Original assignee: Shanghai Mxchip Information Technology Co Ltd
Current assignee: Shanghai Mxchip Information Technology Co Ltd
Priority date: 2017-04-21
Filing date: 2017-04-21
Publication date: 2018-01-16
Anticipated expiration: 2027-04-21

Abstract

本实用新型公开了一种具有情景分析功能的智能对话装置，智能对话装置包括语音输入模块、GPS定位装置、摄像装置、通信模块、数据处理服务器、内容服务器、输出模块：所述语音输入模块、GPS定位装置、摄像装置与所述通信模块电连接，所述通信模块分别与所述数据处理服务器及所述输出模块通信连接，所述数据处理服务器与所述内容服务器电连接；过设置GPS定位装置、摄像头，并将语音输入模块与声纹识别装置、语音识别装置、语音转换装置进行灵活连接，能够从声音、表情、地理位置等多方面明确用户在进行人机对话时的情景，从而增加了人机对话的准确性和针对性，从而可以对用户进行针对性的回答和反馈，提高了人机对话的准确性。

Description

具有情景分析功能的智能对话装置

技术领域

本实用新型涉及智能对话领域，特别是涉及一种具有情景分析功能的智能对话装置。

背景技术

随着科学技术的不断发展，信息技术、计算机技术以及人工智能技术的引入，机器人的研究已经逐步走出工业领域，逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人，人机交互也就成为决定智能机器人发展的重要因素。

人机交互系统作为智能领域核心模块，扮演着举足轻重的角色。在日常的人机交互过程中，机器往往是根据输入的信息进行语义分析、分类，然后进而确定反馈语句。参见CN106202270A。这样的分析相对人类对话而言，智能程度远远不如。精准不够，就可能产生过多的确认、反复流程，或者造成过多的错误。因此提升智能机器人的语言交互能力，是亟待解决的问题。

实用新型内容

本实用新型要解决的技术问题是为了克服现有技术中人机对话装置没有对用户进行个性化分析，导致难以做到有针对性的对用户进行准确回答和反馈的缺陷，提供一种具有情景分析功能的智能对话装置。

本实用新型是通过下述技术方案来解决上述技术问题的：

本实用新型提供了一种具有情景分析功能的智能对话装置，包括语音输入模块、GPS定位装置、摄像装置、通信模块、数据处理服务器、内容服务器、输出模块：

所述语音输入模块、GPS定位装置、摄像装置与所述通信模块电连接，所述通信模块分别与所述数据处理服务器及所述输出模块通信连接，所述数据处理服务器与所述内容服务器电连接；

所述语音输入模块接收的用户语音信息、所述GPS定位装置获取的用户位置信息、所述摄像装置获取的用户图像信息经由所述通信模块传输至所述数据处理服务器；

所述数据处理服务器至少包括以下之一或其任意组合：声纹识别装置、语音识别装置、或语音转换装置，所述数据处理服务器还包括多媒体数据调用装置；

所述内容服务器中的多媒体数据经由所述通信模块输出至输出模块，所述输出模块输出所述多媒体数据。

较佳的，所述数据处理服务器包括表情识别装置。

较佳的，所述数据处理服务器还包括情绪识别装置。

较佳的，所述数据处理服务器还包括虹膜识别装置。

较佳的，所述智能对话装置为故事机或点读机。

本实用新型的积极进步效果在于：本实用新型通过设置GPS定位装置、摄像头，并将语音输入模块与声纹识别装置、语音识别装置、语音转换装置进行灵活连接，能够从声音、表情、地理位置等多方面明确用户在进行人机对话时的情景，从而增加了人机对话的准确性和针对性，从而可以对用户进行针对性的回答和反馈，提高了人机对话的准确性。

附图说明

图1为本实用新型的实施例1的具有情景分析功能的智能对话装置的模块示意图。

图2为本实用新型的实施例1的具有情景分析功能的智能对话装置的数据处理服务器的结构示意图。

图3为本实用新型的实施例2的具有情景分析功能的智能对话装置的模块示意图。

图4为本实用新型的实施例3的具有情景分析功能的智能对话装置的模块示意图。

图5为本实用新型的实施例3的具有情景分析功能的智能对话装置的数据处理服务器的结构示意图。

具体实施方式

下面通过实施例的方式进一步说明本实用新型，但并不因此将本实用新型限制在所述的实施例范围之中。

实施例1

如图1所示，本实施例的具有情景分析功能的智能对话装置包括语音输入模块1、通信模块2、数据处理服务器3、内容服务器4以及输出模块5；

其中，所述语音输入模块1与所述通信模块2(可以为有线通信模块，也可以为无线通信模块，如Wi-Fi通信模块等)电连接，所述通信模块2分别与所述数据处理服务器3及所述输出模块5通信连接，所述数据处理服务器3与所述内容服务器4电连接；

所述语音输入模块1具体可包括麦克风，用于采集用户输入的语音信息，并通过所述通信模块2传输至所述数据处理服务器3；

所述数据处理服务器3于根据所述语音信息获取用户的当前情景信息，在本实施例中，如图2所示，所述数据服务处理器3具体可包括声纹识别装置31、语音识别装置32、语音转换装置33及多媒体数据调用装置；所述声纹识别装置31用于根据所述语音信息识别用户的声纹特征，所述当前情景信息可包括所述声纹特征，所述语音识别装置32用于根据所述语音信息识别用户的语义信息，所述当前情景信息包括所述语义信息，即利用所述语音识别装置32可以识别出用户输入的语音所表达的语义；所述语音转换装置33用于将所述语音信息转换为文本信息，所述当前情景信息包括所述文本信息，即可以将用户发出的语音转换为对应的文字；声纹识别装置31、语音识别装置32以及语音转换装置33均可以为现有模块或装置。

所述内容服务器4中则可以预先存储用户不同的情景信息以及与情景信息所对应的多媒体数据，这样所述数据处理服务器3中的多媒体数据调用装置在获取用户的当前情景信息后，就可以从所述内容服务器4中调取与所述当前情景信息相对应的多媒体数据，并通过所述通信模块2将所述多媒体数据传输至所述输出模块5；该多媒体数据调用装置同样可以选择现有模块或装置来实现。

在本实施例的具体实施过程中，所述智能对话装置具体可以为故事机或点读机，所述多媒体数据具体可以为音频数据、视频数据，这样，所述内容服务器4具体就可以存储音频数据、视频数据(例如相应的故事、图片、视频等)，在本实施例中，用户的情景信息具体通过语音体现，即包括上述的声纹特征、语义信息及转换后的文本信息等，这样通过用户语音就可以反映出用户的口音、用户的性别、用户的年龄、用户的情绪等等情景信息，从而所述数据处理服务器3的多媒体数据调用装置就可以通过上述这些情景信息从所述内容服务器4中获取到相匹配的多媒体数据；

所述输出模块4则用于向用户输出所述多媒体数据，所述输出模块4具体可以包括扬声器、显示屏等输出装置。

举一个具体的例子，例如，如果一名广东中年男子向本实施例的智能对话装置说“我要听一首歌”，这样所述数据处理服务器3就可以从用户的语音分析出用户的口音、用户的年龄段、用户的性别等情景信息，从而就会从所述内容服务器4中查询出相匹配的多媒体数据，例如查询出一首粤语经典歌曲，而所述输出模块4就可以向用户播放所述粤语经典歌曲。

而如果是一名北京年轻女孩同样向本实施例的智能对话装置说“我要听一首歌”，这样所述数据处理服务器3的多媒体数据调用装置就可以从用户的语音分析出用户的口音、用户的年龄段、用户的性别等情景信息，从而就会从所述内容服务器4中查询出相匹配的多媒体数据，例如查询出一首适合女生的歌曲，如花仙子主题曲，而所述输出模块4就可以向用户播放花仙子主题曲。

实施例2

本实施例的具有情景分析功能的智能对话装置与实施例1基本相同，主要区别在于：如图3所示，本实施例的智能对话装置还包括GPS定位装置5，所述GPS定位装置5与所述通信模块2电连接；

所述GPS定位装置5用于获取用户的位置信息，并通过所述通信模块2传输至所述数据处理服务器3；

在本实施例中，所述数据处理服务器3的多媒体数据调用装置可以结合用户的语音及用户的位置来获取用户的当前情景信息，然后从所述内容服务器4中获取相应的多媒体数据。

例如，同样是用户向本实施例的智能对话装置说“我要听一段文艺节目”，如果所述GPS定位装置5定位到用户位于东北，则所述数据处理服务器3就从所述内容服务器4中获取东北的二人转节目，然后播放给用户；如果所述GPS定位装置5定位到用户位于天津，则所述数据处理服务器3就从所述内容服务器4中获取天津的相声节目，然后播放给用户。

实施例3

本实施例的具有情景分析功能的智能对话装置与实施例2基本相同，主要区别在于：如图4所示，本实施例的智能对话装置还包括摄像装置7，所述摄像装置7与所述通信模块2电连接；

所述摄像装置7用于获取用户的图像信息，并通过所述通信模块2传输至所述数据处理服务器3；

在本实施例中，所述数据处理服务器3的多媒体数据调用装置可以同时结合用户的语音、用户的位置以及用户的图像信息来获取用户的当前情景信息，然后从所述内容服务器4中获取相应的多媒体数据。

在本实施例的具体实施过程中，如图5所示，所述数据处理服务器3还包括表情识别装置34、情绪识别装置35、虹膜识别装置36；

所述图像信息具体可包括用户的面部图像信息，所述表情识别装置34用于根据所述面部图像信息识别用户的面部表情信息，所述当前情景信息可包括所述面部表情信息；所述情绪识别装置35用于根据所述面部表情信息识别用户的情绪信息，所述当前情景信息包括所述情绪信息；所述虹膜分析装置36用于根据所述面部表情信息识别用户的虹膜信息，所述当前情景信息包括所述虹膜信息。同样，表情识别装置34、情绪识别装置35、虹膜识别装置36可以是现有的模块或装置。

在本实施例中，在获取用户的语音、位置信息的基础上，还会考虑到用户的图像信息，通过分析用户的面部表情来获取用户的情绪以及通过用户的虹膜信息(包括瞳孔的缩放变化等)来获取用户的情绪，从而通过用户的面部表情来获知用户的情绪、兴趣关注度、专注度等，进而可以同时结合用户的语音、位置以及面部表情来获取用户的当前情景信息。

从而本实施例可以通过对用户的语音、照片、位置进行综合判断，对用户发出的语音进行准确性和针对性的分析，从而对用户进行针对性的回答，提高了人机对话的精准性。

虽然以上描述了本实用新型的具体实施方式，但是本领域的技术人员应当理解，这些仅是举例说明，本实用新型的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本实用新型的原理和实质的前提下，可以对这些实施方式做出多种变更或修改，但这些变更和修改均落入本实用新型的保护范围。

Claims

1.一种具有情景分析功能的智能对话装置，其特征在于，包括语音输入模块、GPS定位装置、摄像装置、通信模块、数据处理服务器、内容服务器、输出模块：

2.如权利要求1所述的具有情景分析功能的智能对话装置，其特征在于，所述数据处理服务器包括表情识别装置。

3.如权利要求1所述的具有情景分析功能的智能对话装置，其特征在于，所述数据处理服务器还包括情绪识别装置。

4.如权利要求1所述的具有情景分析功能的智能对话装置，其特征在于，所述数据处理服务器还包括虹膜识别装置。

5.如权利要求1至4中任意一项所述的具有情景分析功能的智能对话装置，其特征在于，所述智能对话装置为故事机或点读机。