CN214955998U

CN214955998U - 一种基于深度学习的语音互动设备

Info

Publication number: CN214955998U
Application number: CN202120899799.8U
Authority: CN
Inventors: 付雪峰; 赵嘉; 刘东晓
Original assignee: Nanchang Institute of Technology
Current assignee: Nanchang Institute of Technology
Priority date: 2021-04-28
Filing date: 2021-04-28
Publication date: 2021-11-30
Anticipated expiration: 2031-04-28

Abstract

本实用新型公开的属于互动设备技术领域，具体为一种基于深度学习的语音互动设备，包括设备本体和智能互动控制器，所述设备本体眼部和嘴部设置有显示屏，所述设备本体中间内腔设置有智能互动控制器，所述智能互动器控制器包括深度学习模块、语音采集模块、电源模块、存储模块和语音播放器，通过设备本体眼部和嘴部设置的显示屏可以显示各种表情，结构简单，制作方便，方便后期维护。

Description

一种基于深度学习的语音互动设备

技术领域

本实用新型涉及互动设备技术领域，具体为一种基于深度学习的语音互动设备。

背景技术

深度学习全称深度神经网络，本质上是多层次的人工神经网络算法，即模仿人脑的神经网络，从最基本的单元上模拟了人类大脑的运行机制。最早的神经网络的思想起源于1943年的MCP人工神经元模型，当时是希望能够用计算机来模拟人的神经元反应的过程，但直到最近，它才真正让人工智能火起来。主要原因在于：算法的突破、数据量的激增和计算机能力/成本的下降。其中计算能力的提升的作为人工智能实现的物理基础，对人工智能发展的意义不言而喻。

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像，声音和文本。近年来，其所取得的前所未有的突破掀起了人工智能新一轮的发展热潮。目前，研发出来的基于深度学习技术的主流芯片有CPU、GPU、FPGA、ASIC。投放市场的深度学习芯片有中国科学院计算技术研究所研发的“寒武纪”芯片、麻省理工学院研发的Eyeriss芯片等。

随着科技的发展，人们对智能设备与人的互动交流有了更高的要求。例如：智能设备能够“听懂”人说话而做出相应的反应。市场上已经有能够识别人声并进行互动的智能设备，但此类设备存在以下缺陷，设备表情呆板不够生动，且控制表情的结构复杂不利于制作。

实用新型内容

本部分的目的在于概述本实用新型的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和实用新型名称中可能会做些简化或省略以避免使本部分、说明书摘要和实用新型名称的目的模糊，而这种简化或省略不能用于限制本实用新型的范围。

鉴于现有互动设备中存在的问题，提出了本实用新型。

因此，本实用新型的目的是提供一种基于深度学习的语音互动设备，通过设备本体眼部和嘴部设置的显示屏可以显示各种表情，结构简单，制作方便，方便后期维护。

为解决上述技术问题，根据本实用新型的一个方面，本实用新型提供了如下技术方案：

一种基于深度学习的语音互动设备，其包括设备本体和智能互动控制器，所述设备本体眼部和嘴部设置有显示屏，所述设备本体中间内腔设置有智能互动控制器，所述智能互动控制器包括深度学习模块、语音采集模块、电源模块、存储模块和语音播放器。

作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案，其中：所述深度学习模块包括处理器和深度学习芯片，所述语音采集模块通过深度学习芯片与处理器电性连接。

作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案，其中：所述处理器还分别与语音播放器、驱动电机、存储模块、电源模块和显示屏电性连接。

作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案，其中：所述深度学习芯片包括依次进行信号传输的ASR语音识别器单元、MFCC提取器单元、MSDA多特征栈式去燥自编码器单元、分类器单元；所述ASR语音识别器单元与语音采集模块连接以接收人声语音数据；所述分类器单元向处理器输入分类的情感信息。

作为本实用新型所述的一种基于深度学习的语音互动设备的一种优选方案，其中：所述显示屏前部设置有透明防护层。

与现有技术相比，本实用新型的有益效果是：通过该一种基于深度学习的语音互动设备的设置，结构设计合理，通过设备本体眼部和嘴部设置的显示屏可以显示各种表情，结构简单，制作方便，方便后期维护。

附图说明

为了更清楚地说明本实用新型实施方式的技术方案，下面将结合附图和详细实施方式对本实用新型进行详细说明，显而易见地，下面描述中的附图仅仅是本实用新型的一些实施方式，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其它的附图。其中：

图1为本实用新型结构示意图；

图2为本实用新型系统框图。

图中；100设备本体、110显示屏、200智能互动控制器、210驱动电机、211深度学习模块、212处理器、213语音采集模块、214语音播放器、215电源模块、216存储模块。

具体实施方式

为使本实用新型的上述目的、特征和优点能够更加明显易懂，下面结合附图对本实用新型的具体实施方式做详细的说明。

在下面的描述中阐述了很多具体细节以便于充分理解本实用新型，但是本实用新型还可以采用其他不同于在此描述的其它方式来实施，本领域技术人员可以在不违背本实用新型内涵的情况下做类似推广，因此本实用新型不受下面公开的具体实施方式的限制。

其次，本实用新型结合示意图进行详细描述，在详述本实用新型实施方式时，为便于说明，表示器件结构的剖面图会不依一般比例作局部放大，而且所述示意图只是示例，其在此不应限制本实用新型保护的范围。此外，在实际制作中应包含长度、宽度及深度的三维空间尺寸。

为使本实用新型的目的、技术方案和优点更加清楚，下面将结合附图对本实用新型的实施方式作进一步地详细描述。

本实用新型提供如下技术方案：一种基于深度学习的语音互动设备，在使用过程中，通过设备本体眼部和嘴部设置的显示屏可以显示各种表情，结构简单，制作方便，方便后期维护，请参阅图1，包括设备本体100和智能互动控制器200；

请再次参阅图1，所述设备本体100眼部和嘴部设置有显示屏110，所述设备本体100中间内腔设置有智能互动控制器200，所述智能互动控制器200包括深度学习模块211、语音采集模块213、电源模块215、存储模块216和语音播放器214，具体的，所述设备本体100眼部和嘴部粘接有显示屏110，所述设备本体100中间内腔螺丝固定有智能互动控制器200，所述智能互动控制器200包括深度学习模块211、语音采集模块213、电源模块215、存储模块216和语音播放器214，显示屏110用于显示互动时的表情，智能互动控制器200用于控制语音播放模块，显示屏110和驱动电机210，深度学习模块211用于模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，语音采集模块213用于采集使用者的声音数据，电源模块215用于为设备本体100提供电能，存储模块216用于存储数据，语音播放模块用于播放设备本体100互动产生的声音，驱动电机210用于控制设备本体100手部的动作。

工作原理：通过声音采集器采集使用者声音，通过深度学习模块211，处理器212、显示屏110、驱动电机210和语音播放器214，做出相应的表情动作和声音。

虽然在上文中已经参考实施方式对本实用新型进行了描述，然而在不脱离本实用新型的范围的情况下，可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是，只要不存在结构冲突，本实用新型所披露的实施方式中的各项特征均可通过任意方式相互结合起来使用，在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此，本实用新型并不局限于文中公开的特定实施方式，而是包括落入权利要求的范围内的所有技术方案。

Claims

1.一种基于深度学习的语音互动设备，其特征在于：包括设备本体(100)和智能互动控制器(200)，所述设备本体(100)眼部和嘴部设置有显示屏(110)，所述设备本体(100)中间内腔设置有智能互动控制器(200)，所述智能互动控制器(200)包括深度学习模块(211)、语音采集模块(213)、电源模块(215)、存储模块(216)和语音播放器(214)。

2.根据权利要求1所述的一种基于深度学习的语音互动设备，其特征在于：所述深度学习模块(211)包括处理器(212)和深度学习芯片，所述语音采集模块(213)通过深度学习芯片与处理器(212)电性连接。

3.根据权利要求2所述的一种基于深度学习的语音互动设备，其特征在于：所述处理器(212)还分别与语音播放器(214)、驱动电机(210)、存储模块(216)、电源模块(215)和显示屏(110)电性连接。

4.根据权利要求2所述的一种基于深度学习的语音互动设备，其特征在于：所述深度学习芯片包括依次进行信号传输的ASR语音识别器单元、MFCC提取器单元、MSDA多特征栈式去燥自编码器单元、分类器单元；所述ASR语音识别器单元与语音采集模块(213)连接以接收人声语音数据；所述分类器单元向处理器(212)输入分类的情感信息。

5.根据权利要求1所述的一种基于深度学习的语音互动设备，其特征在于：所述显示屏(110)前部设置有透明防护层。