CN206892866U - 具有情景分析功能的智能对话装置 - Google Patents

具有情景分析功能的智能对话装置 Download PDF

Info

Publication number
CN206892866U
CN206892866U CN201720429765.6U CN201720429765U CN206892866U CN 206892866 U CN206892866 U CN 206892866U CN 201720429765 U CN201720429765 U CN 201720429765U CN 206892866 U CN206892866 U CN 206892866U
Authority
CN
China
Prior art keywords
data processing
processing server
user
intelligent dialogue
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201720429765.6U
Other languages
English (en)
Inventor
舒昆
林艺春
曹汝浪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Mxchip Information Technology Co Ltd
Original Assignee
Shanghai Mxchip Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Mxchip Information Technology Co Ltd filed Critical Shanghai Mxchip Information Technology Co Ltd
Priority to CN201720429765.6U priority Critical patent/CN206892866U/zh
Application granted granted Critical
Publication of CN206892866U publication Critical patent/CN206892866U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本实用新型公开了一种具有情景分析功能的智能对话装置,智能对话装置包括语音输入模块、GPS定位装置、摄像装置、通信模块、数据处理服务器、内容服务器、输出模块:所述语音输入模块、GPS定位装置、摄像装置与所述通信模块电连接,所述通信模块分别与所述数据处理服务器及所述输出模块通信连接,所述数据处理服务器与所述内容服务器电连接;过设置GPS定位装置、摄像头,并将语音输入模块与声纹识别装置、语音识别装置、语音转换装置进行灵活连接,能够从声音、表情、地理位置等多方面明确用户在进行人机对话时的情景,从而增加了人机对话的准确性和针对性,从而可以对用户进行针对性的回答和反馈,提高了人机对话的准确性。

Description

具有情景分析功能的智能对话装置
技术领域
本实用新型涉及智能对话领域,特别是涉及一种具有情景分析功能的智能对话装置。
背景技术
随着科学技术的不断发展,信息技术、计算机技术以及人工智能技术的引入,机器人的研究已经逐步走出工业领域,逐渐扩展到了医疗、保健、家庭、娱乐以及服务行业等领域。而人们对于机器人的要求也从简单重复的机械动作提升为具有拟人问答、自主性及与其他机器人进行交互的智能机器人,人机交互也就成为决定智能机器人发展的重要因素。
人机交互系统作为智能领域核心模块,扮演着举足轻重的角色。在日常的人机交互过程中,机器往往是根据输入的信息进行语义分析、分类,然后进而确定反馈语句。参见CN106202270A。这样的分析相对人类对话而言,智能程度远远不如。精准不够,就可能产生过多的确认、反复流程,或者造成过多的错误。因此提升智能机器人的语言交互能力,是亟待解决的问题。
实用新型内容
本实用新型要解决的技术问题是为了克服现有技术中人机对话装置没有对用户进行个性化分析,导致难以做到有针对性的对用户进行准确回答和反馈的缺陷,提供一种具有情景分析功能的智能对话装置。
本实用新型是通过下述技术方案来解决上述技术问题的:
本实用新型提供了一种具有情景分析功能的智能对话装置,包括语音输入模块、GPS定位装置、摄像装置、通信模块、数据处理服务器、内容服务器、输出模块:
所述语音输入模块、GPS定位装置、摄像装置与所述通信模块电连接,所述通信模块分别与所述数据处理服务器及所述输出模块通信连接,所述数据处理服务器与所述内容服务器电连接;
所述语音输入模块接收的用户语音信息、所述GPS定位装置获取的用户位置信息、所述摄像装置获取的用户图像信息经由所述通信模块传输至所述数据处理服务器;
所述数据处理服务器至少包括以下之一或其任意组合:声纹识别装置、语音识别装置、或语音转换装置,所述数据处理服务器还包括多媒体数据调用装置;
所述内容服务器中的多媒体数据经由所述通信模块输出至输出模块,所述输出模块输出所述多媒体数据。
较佳的,所述数据处理服务器包括表情识别装置。
较佳的,所述数据处理服务器还包括情绪识别装置。
较佳的,所述数据处理服务器还包括虹膜识别装置。
较佳的,所述智能对话装置为故事机或点读机。
本实用新型的积极进步效果在于:本实用新型通过设置GPS定位装置、摄像头,并将语音输入模块与声纹识别装置、语音识别装置、语音转换装置进行灵活连接,能够从声音、表情、地理位置等多方面明确用户在进行人机对话时的情景,从而增加了人机对话的准确性和针对性,从而可以对用户进行针对性的回答和反馈,提高了人机对话的准确性。
附图说明
图1为本实用新型的实施例1的具有情景分析功能的智能对话装置的模块示意图。
图2为本实用新型的实施例1的具有情景分析功能的智能对话装置的数据处理服务器的结构示意图。
图3为本实用新型的实施例2的具有情景分析功能的智能对话装置的模块示意图。
图4为本实用新型的实施例3的具有情景分析功能的智能对话装置的模块示意图。
图5为本实用新型的实施例3的具有情景分析功能的智能对话装置的数据处理服务器的结构示意图。
具体实施方式
下面通过实施例的方式进一步说明本实用新型,但并不因此将本实用新型限制在所述的实施例范围之中。
实施例1
如图1所示,本实施例的具有情景分析功能的智能对话装置包括语音输入模块1、通信模块2、数据处理服务器3、内容服务器4以及输出模块5;
其中,所述语音输入模块1与所述通信模块2(可以为有线通信模块,也可以为无线通信模块,如Wi-Fi通信模块等)电连接,所述通信模块2分别与所述数据处理服务器3及所述输出模块5通信连接,所述数据处理服务器3与所述内容服务器4电连接;
所述语音输入模块1具体可包括麦克风,用于采集用户输入的语音信息,并通过所述通信模块2传输至所述数据处理服务器3;
所述数据处理服务器3于根据所述语音信息获取用户的当前情景信息,在本实施例中,如图2所示,所述数据服务处理器3具体可包括声纹识别装置31、语音识别装置32、语音转换装置33及多媒体数据调用装置;所述声纹识别装置31用于根据所述语音信息识别用户的声纹特征,所述当前情景信息可包括所述声纹特征,所述语音识别装置32用于根据所述语音信息识别用户的语义信息,所述当前情景信息包括所述语义信息,即利用所述语音识别装置32可以识别出用户输入的语音所表达的语义;所述语音转换装置33用于将所述语音信息转换为文本信息,所述当前情景信息包括所述文本信息,即可以将用户发出的语音转换为对应的文字;声纹识别装置31、语音识别装置32以及语音转换装置33均可以为现有模块或装置。
所述内容服务器4中则可以预先存储用户不同的情景信息以及与情景信息所对应的多媒体数据,这样所述数据处理服务器3中的多媒体数据调用装置在获取用户的当前情景信息后,就可以从所述内容服务器4中调取与所述当前情景信息相对应的多媒体数据,并通过所述通信模块2将所述多媒体数据传输至所述输出模块5;该多媒体数据调用装置同样可以选择现有模块或装置来实现。
在本实施例的具体实施过程中,所述智能对话装置具体可以为故事机或点读机,所述多媒体数据具体可以为音频数据、视频数据,这样,所述内容服务器4具体就可以存储音频数据、视频数据(例如相应的故事、图片、视频等),在本实施例中,用户的情景信息具体通过语音体现,即包括上述的声纹特征、语义信息及转换后的文本信息等,这样通过用户语音就可以反映出用户的口音、用户的性别、用户的年龄、用户的情绪等等情景信息,从而所述数据处理服务器3的多媒体数据调用装置就可以通过上述这些情景信息从所述内容服务器4中获取到相匹配的多媒体数据;
所述输出模块4则用于向用户输出所述多媒体数据,所述输出模块4具体可以包括扬声器、显示屏等输出装置。
举一个具体的例子,例如,如果一名广东中年男子向本实施例的智能对话装置说“我要听一首歌”,这样所述数据处理服务器3就可以从用户的语音分析出用户的口音、用户的年龄段、用户的性别等情景信息,从而就会从所述内容服务器4中查询出相匹配的多媒体数据,例如查询出一首粤语经典歌曲,而所述输出模块4就可以向用户播放所述粤语经典歌曲。
而如果是一名北京年轻女孩同样向本实施例的智能对话装置说“我要听一首歌”,这样所述数据处理服务器3的多媒体数据调用装置就可以从用户的语音分析出用户的口音、用户的年龄段、用户的性别等情景信息,从而就会从所述内容服务器4中查询出相匹配的多媒体数据,例如查询出一首适合女生的歌曲,如花仙子主题曲,而所述输出模块4就可以向用户播放花仙子主题曲。
实施例2
本实施例的具有情景分析功能的智能对话装置与实施例1基本相同,主要区别在于:如图3所示,本实施例的智能对话装置还包括GPS定位装置5,所述GPS定位装置5与所述通信模块2电连接;
所述GPS定位装置5用于获取用户的位置信息,并通过所述通信模块2传输至所述数据处理服务器3;
在本实施例中,所述数据处理服务器3的多媒体数据调用装置可以结合用户的语音及用户的位置来获取用户的当前情景信息,然后从所述内容服务器4中获取相应的多媒体数据。
例如,同样是用户向本实施例的智能对话装置说“我要听一段文艺节目”,如果所述GPS定位装置5定位到用户位于东北,则所述数据处理服务器3就从所述内容服务器4中获取东北的二人转节目,然后播放给用户;如果所述GPS定位装置5定位到用户位于天津,则所述数据处理服务器3就从所述内容服务器4中获取天津的相声节目,然后播放给用户。
实施例3
本实施例的具有情景分析功能的智能对话装置与实施例2基本相同,主要区别在于:如图4所示,本实施例的智能对话装置还包括摄像装置7,所述摄像装置7与所述通信模块2电连接;
所述摄像装置7用于获取用户的图像信息,并通过所述通信模块2传输至所述数据处理服务器3;
在本实施例中,所述数据处理服务器3的多媒体数据调用装置可以同时结合用户的语音、用户的位置以及用户的图像信息来获取用户的当前情景信息,然后从所述内容服务器4中获取相应的多媒体数据。
在本实施例的具体实施过程中,如图5所示,所述数据处理服务器3还包括表情识别装置34、情绪识别装置35、虹膜识别装置36;
所述图像信息具体可包括用户的面部图像信息,所述表情识别装置34用于根据所述面部图像信息识别用户的面部表情信息,所述当前情景信息可包括所述面部表情信息;所述情绪识别装置35用于根据所述面部表情信息识别用户的情绪信息,所述当前情景信息包括所述情绪信息;所述虹膜分析装置36用于根据所述面部表情信息识别用户的虹膜信息,所述当前情景信息包括所述虹膜信息。同样,表情识别装置34、情绪识别装置35、虹膜识别装置36可以是现有的模块或装置。
在本实施例中,在获取用户的语音、位置信息的基础上,还会考虑到用户的图像信息,通过分析用户的面部表情来获取用户的情绪以及通过用户的虹膜信息(包括瞳孔的缩放变化等)来获取用户的情绪,从而通过用户的面部表情来获知用户的情绪、兴趣关注度、专注度等,进而可以同时结合用户的语音、位置以及面部表情来获取用户的当前情景信息。
从而本实施例可以通过对用户的语音、照片、位置进行综合判断,对用户发出的语音进行准确性和针对性的分析,从而对用户进行针对性的回答,提高了人机对话的精准性。
虽然以上描述了本实用新型的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本实用新型的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本实用新型的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本实用新型的保护范围。

Claims (5)

1.一种具有情景分析功能的智能对话装置,其特征在于,包括语音输入模块、GPS定位装置、摄像装置、通信模块、数据处理服务器、内容服务器、输出模块:
所述语音输入模块、GPS定位装置、摄像装置与所述通信模块电连接,所述通信模块分别与所述数据处理服务器及所述输出模块通信连接,所述数据处理服务器与所述内容服务器电连接;
所述语音输入模块接收的用户语音信息、所述GPS定位装置获取的用户位置信息、所述摄像装置获取的用户图像信息经由所述通信模块传输至所述数据处理服务器;
所述数据处理服务器至少包括以下之一或其任意组合:声纹识别装置、语音识别装置、或语音转换装置,所述数据处理服务器还包括多媒体数据调用装置;
所述内容服务器中的多媒体数据经由所述通信模块输出至输出模块,所述输出模块输出所述多媒体数据。
2.如权利要求1所述的具有情景分析功能的智能对话装置,其特征在于,所述数据处理服务器包括表情识别装置。
3.如权利要求1所述的具有情景分析功能的智能对话装置,其特征在于,所述数据处理服务器还包括情绪识别装置。
4.如权利要求1所述的具有情景分析功能的智能对话装置,其特征在于,所述数据处理服务器还包括虹膜识别装置。
5.如权利要求1至4中任意一项所述的具有情景分析功能的智能对话装置,其特征在于,所述智能对话装置为故事机或点读机。
CN201720429765.6U 2017-04-21 2017-04-21 具有情景分析功能的智能对话装置 Active CN206892866U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201720429765.6U CN206892866U (zh) 2017-04-21 2017-04-21 具有情景分析功能的智能对话装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201720429765.6U CN206892866U (zh) 2017-04-21 2017-04-21 具有情景分析功能的智能对话装置

Publications (1)

Publication Number Publication Date
CN206892866U true CN206892866U (zh) 2018-01-16

Family

ID=61324893

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201720429765.6U Active CN206892866U (zh) 2017-04-21 2017-04-21 具有情景分析功能的智能对话装置

Country Status (1)

Country Link
CN (1) CN206892866U (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515952A (zh) * 2021-08-18 2021-10-19 内蒙古工业大学 一种用于蒙古语对话模型联合建模方法、系统及设备
CN113596572A (zh) * 2021-07-28 2021-11-02 Oppo广东移动通信有限公司 一种语音识别方法、装置、存储介质及电子设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113596572A (zh) * 2021-07-28 2021-11-02 Oppo广东移动通信有限公司 一种语音识别方法、装置、存储介质及电子设备
CN113515952A (zh) * 2021-08-18 2021-10-19 内蒙古工业大学 一种用于蒙古语对话模型联合建模方法、系统及设备
CN113515952B (zh) * 2021-08-18 2023-09-12 内蒙古工业大学 一种用于蒙古语对话模型联合建模方法、系统及设备

Similar Documents

Publication Publication Date Title
CN107038241A (zh) 具有情景分析功能的智能对话装置及方法
CN108000526B (zh) 用于智能机器人的对话交互方法及系统
CN109074806A (zh) 控制分布式音频输出以实现语音输出
RU2653283C2 (ru) Способ диалога между машиной, такой как гуманоидный робот, и собеседником-человеком, компьютерный программный продукт и гуманоидный робот для осуществления такого способа
CN110313151A (zh) 来自共享设备的消息传送
CN107870977A (zh) 基于用户状态形成聊天机器人输出
CN105244042B (zh) 一种基于有限状态自动机的语音情感交互装置与方法
KR20190108523A (ko) 음성신호 기반 인공지능을 이용한 감정분석을 제공하는 감성일기 서비스 제공 서버 및 방법
US20230370549A1 (en) Systems and methods for smart dialogue communication
CN106959839A (zh) 一种人机交互装置及方法
CN109101663A (zh) 一种基于互联网的机器人对话系统
KR20200113105A (ko) 응답을 제공하는 전자 장치와 이의 동작 방법
WO2008049834A2 (en) Virtual assistant with real-time emotions
TW201821946A (zh) 數據發送系統及其方法
CN112016367A (zh) 一种情绪识别系统、方法及电子设备
JP2016103081A (ja) 会話分析装置、会話分析システム、会話分析方法及び会話分析プログラム
CN108139988A (zh) 信息处理系统和信息处理方法
CN107808191A (zh) 虚拟人多模态交互的输出方法和系统
CN112581015B (zh) 基于ai检验的咨询师质量评估系统及评估方法
JP6291303B2 (ja) コミュニケーション支援ロボットシステム
CN109346057A (zh) 一种智能儿童玩具的语音处理系统
CN116229977A (zh) 基于虚拟数字人实现智能化实时交互问答的系统及其处理方法
CN106209141A (zh) 全自动智能呼救机以及其呼救系统
CN206892866U (zh) 具有情景分析功能的智能对话装置
CN113033245A (zh) 一种功能调节方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant