CN214955998U - 一种基于深度学习的语音互动设备 - Google Patents
一种基于深度学习的语音互动设备 Download PDFInfo
- Publication number
- CN214955998U CN214955998U CN202120899799.8U CN202120899799U CN214955998U CN 214955998 U CN214955998 U CN 214955998U CN 202120899799 U CN202120899799 U CN 202120899799U CN 214955998 U CN214955998 U CN 214955998U
- Authority
- CN
- China
- Prior art keywords
- deep learning
- module
- equipment body
- voice
- display screen
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Electrically Operated Instructional Devices (AREA)
Abstract
本实用新型公开的属于互动设备技术领域,具体为一种基于深度学习的语音互动设备,包括设备本体和智能互动控制器,所述设备本体眼部和嘴部设置有显示屏,所述设备本体中间内腔设置有智能互动控制器,所述智能互动器控制器包括深度学习模块、语音采集模块、电源模块、存储模块和语音播放器,通过设备本体眼部和嘴部设置的显示屏可以显示各种表情,结构简单,制作方便,方便后期维护。
Description
技术领域
本实用新型涉及互动设备技术领域,具体为一种基于深度学习的语音互动设备。
背景技术
深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即模仿人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。最早的神经网络的思想起源于1943年的MCP人工神经元模型,当时是希望能够用计算机来模拟人的神经元反应的过程,但直到最近,它才真正让人工智能火起来。主要原因在于:算法的突破、数据量的激增和计算机能力/成本的下降。其中计算能力的提升的作为人工智能实现的物理基础,对人工智能发展的意义不言而喻。
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。近年来,其所取得的前所未有的突破掀起了人工智能新一轮的发展热潮。目前,研发出来的基于深度学习技术的主流芯片有CPU、GPU、FPGA、ASIC。投放市场的深度学习芯片有中国科学院计算技术研究所研发的“寒武纪”芯片、麻省理工学院研发的Eyeriss芯片等。
随着科技的发展,人们对智能设备与人的互动交流有了更高的要求。例如:智能设备能够“听懂”人说话而做出相应的反应。市场上已经有能够识别人声并进行互动的智能设备,但此类设备存在以下缺陷,设备表情呆板不够生动,且控制表情的结构复杂不利于制作。
实用新型内容
本部分的目的在于概述本实用新型的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和实用新型名称中可能会做些简化或省略以避免使本部分、说明书摘要和实用新型名称的目的模糊,而这种简化或省略不能用于限制本实用新型的范围。
鉴于现有互动设备中存在的问题,提出了本实用新型。
因此,本实用新型的目的是提供一种基于深度学习的语音互动设备,通过设备本体眼部和嘴部设置的显示屏可以显示各种表情,结构简单,制作方便,方便后期维护。
为解决上述技术问题,根据本实用新型的一个方面,本实用新型提供了如下技术方案:
一种基于深度学习的语音互动设备,其包括设备本体和智能互动控制器,所述设备本体眼部和嘴部设置有显示屏,所述设备本体中间内腔设置有智能互动控制器,所述智能互动控制器包括深度学习模块、语音采集模块、电源模块、存储模块和语音播放器。
作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述深度学习模块包括处理器和深度学习芯片,所述语音采集模块通过深度学习芯片与处理器电性连接。
作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述处理器还分别与语音播放器、驱动电机、存储模块、电源模块和显示屏电性连接。
作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述深度学习芯片包括依次进行信号传输的ASR语音识别器单元、MFCC提取器单元、MSDA多特征栈式去燥自编码器单元、分类器单元;所述ASR语音识别器单元与语音采集模块连接以接收人声语音数据;所述分类器单元向处理器输入分类的情感信息。
作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述显示屏前部设置有透明防护层。
与现有技术相比,本实用新型的有益效果是:通过该一种基于深度学习的语音互动设备的设置,结构设计合理,通过设备本体眼部和嘴部设置的显示屏可以显示各种表情,结构简单,制作方便,方便后期维护。
附图说明
为了更清楚地说明本实用新型实施方式的技术方案,下面将结合附图和详细实施方式对本实用新型进行详细说明,显而易见地,下面描述中的附图仅仅是本实用新型的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:
图1为本实用新型结构示意图;
图2为本实用新型系统框图。
图中;100设备本体、110显示屏、200智能互动控制器、210驱动电机、211深度学习模块、212处理器、213语音采集模块、214语音播放器、215电源模块、216存储模块。
具体实施方式
为使本实用新型的上述目的、特征和优点能够更加明显易懂,下面结合附图对本实用新型的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本实用新型,但是本实用新型还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本实用新型内涵的情况下做类似推广,因此本实用新型不受下面公开的具体实施方式的限制。
其次,本实用新型结合示意图进行详细描述,在详述本实用新型实施方式时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本实用新型保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。
为使本实用新型的目的、技术方案和优点更加清楚,下面将结合附图对本实用新型的实施方式作进一步地详细描述。
本实用新型提供如下技术方案:一种基于深度学习的语音互动设备,在使用过程中,通过设备本体眼部和嘴部设置的显示屏可以显示各种表情,结构简单,制作方便,方便后期维护,请参阅图1,包括设备本体100和智能互动控制器200;
请再次参阅图1,所述设备本体100眼部和嘴部设置有显示屏110,所述设备本体100中间内腔设置有智能互动控制器200,所述智能互动控制器200包括深度学习模块211、语音采集模块213、电源模块215、存储模块216和语音播放器214,具体的,所述设备本体100眼部和嘴部粘接有显示屏110,所述设备本体100中间内腔螺丝固定有智能互动控制器200,所述智能互动控制器200包括深度学习模块211、语音采集模块213、电源模块215、存储模块216和语音播放器214,显示屏110用于显示互动时的表情,智能互动控制器200用于控制语音播放模块,显示屏110和驱动电机210,深度学习模块211用于模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,语音采集模块213用于采集使用者的声音数据,电源模块215用于为设备本体100提供电能,存储模块216用于存储数据,语音播放模块用于播放设备本体100互动产生的声音,驱动电机210用于控制设备本体100手部的动作。
工作原理:通过声音采集器采集使用者声音,通过深度学习模块211,处理器212、显示屏110、驱动电机210和语音播放器214,做出相应的表情动作和声音。
虽然在上文中已经参考实施方式对本实用新型进行了描述,然而在不脱离本实用新型的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本实用新型所披露的实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本实用新型并不局限于文中公开的特定实施方式,而是包括落入权利要求的范围内的所有技术方案。
Claims (5)
1.一种基于深度学习的语音互动设备,其特征在于:包括设备本体(100)和智能互动控制器(200),所述设备本体(100)眼部和嘴部设置有显示屏(110),所述设备本体(100)中间内腔设置有智能互动控制器(200),所述智能互动控制器(200)包括深度学习模块(211)、语音采集模块(213)、电源模块(215)、存储模块(216)和语音播放器(214)。
2.根据权利要求1所述的一种基于深度学习的语音互动设备,其特征在于:所述深度学习模块(211)包括处理器(212)和深度学习芯片,所述语音采集模块(213)通过深度学习芯片与处理器(212)电性连接。
3.根据权利要求2所述的一种基于深度学习的语音互动设备,其特征在于:所述处理器(212)还分别与语音播放器(214)、驱动电机(210)、存储模块(216)、电源模块(215)和显示屏(110)电性连接。
4.根据权利要求2所述的一种基于深度学习的语音互动设备,其特征在于:所述深度学习芯片包括依次进行信号传输的ASR语音识别器单元、MFCC提取器单元、MSDA多特征栈式去燥自编码器单元、分类器单元;所述ASR语音识别器单元与语音采集模块(213)连接以接收人声语音数据;所述分类器单元向处理器(212)输入分类的情感信息。
5.根据权利要求1所述的一种基于深度学习的语音互动设备,其特征在于:所述显示屏(110)前部设置有透明防护层。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202120899799.8U CN214955998U (zh) | 2021-04-28 | 2021-04-28 | 一种基于深度学习的语音互动设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202120899799.8U CN214955998U (zh) | 2021-04-28 | 2021-04-28 | 一种基于深度学习的语音互动设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN214955998U true CN214955998U (zh) | 2021-11-30 |
Family
ID=79064638
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202120899799.8U Expired - Fee Related CN214955998U (zh) | 2021-04-28 | 2021-04-28 | 一种基于深度学习的语音互动设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN214955998U (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114220431A (zh) * | 2021-12-22 | 2022-03-22 | 成都理工大学 | 一种基于深度学习的语音互动设备 |
-
2021
- 2021-04-28 CN CN202120899799.8U patent/CN214955998U/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114220431A (zh) * | 2021-12-22 | 2022-03-22 | 成都理工大学 | 一种基于深度学习的语音互动设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103366618B (zh) | 基于人工智能与虚拟现实用于汉语学习培训的场景设备 | |
CN104217226B (zh) | 基于深度神经网络与条件随机场的对话行为识别方法 | |
WO2021012929A1 (zh) | 通道间特征提取方法、音频分离方法和装置、计算设备 | |
CN104720748B (zh) | 一种睡眠阶段确定方法和系统 | |
CN101618280A (zh) | 具有人机交互功能的仿人头像机器人装置及行为控制方法 | |
CN105807925A (zh) | 一种基于柔性电子皮肤的唇语识别系统及方法 | |
CN110838286A (zh) | 一种模型训练的方法、语种识别的方法、装置及设备 | |
CN107358951A (zh) | 一种语音唤醒方法、装置以及电子设备 | |
CN107392255A (zh) | 少数类图片样本的生成方法、装置、计算设备及存储介质 | |
CN107221320A (zh) | 训练声学特征提取模型的方法、装置、设备和计算机存储介质 | |
CN104484644B (zh) | 一种手势识别方法和装置 | |
CN107066514A (zh) | 老年人的情绪识别方法和系统 | |
CN106997243A (zh) | 基于智能机器人的演讲场景监控方法及装置 | |
CN109410974A (zh) | 语音增强方法、装置、设备及存储介质 | |
WO2023284435A1 (zh) | 生成动画的方法及装置 | |
CN107729882A (zh) | 基于图像识别的情绪识别判定方法 | |
CN112037822B (zh) | 基于ICNN与Bi-LSTM的语音情感识别方法 | |
CN214955998U (zh) | 一种基于深度学习的语音互动设备 | |
CN108364662A (zh) | 基于成对鉴别任务的语音情感识别方法与系统 | |
CN106847271A (zh) | 一种用于对话交互系统的数据处理方法及装置 | |
CN106959946A (zh) | 一种基于深度学习的文本语义特征生成优化方法 | |
CN109324688A (zh) | 基于虚拟人行为标准的交互方法及系统 | |
CN107066979A (zh) | 一种基于深度信息和多维度卷积神经网络的人体动作识别方法 | |
CN110478593A (zh) | 基于vr技术的脑电注意力训练系统 | |
CN116883608A (zh) | 一种多模态数字人社交属性控制方法及相关装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20211130 |