CN206741933U - 一种便携式多路并行智能语音识别一体机 - Google Patents

一种便携式多路并行智能语音识别一体机 Download PDF

Info

Publication number
CN206741933U
CN206741933U CN201720238381.6U CN201720238381U CN206741933U CN 206741933 U CN206741933 U CN 206741933U CN 201720238381 U CN201720238381 U CN 201720238381U CN 206741933 U CN206741933 U CN 206741933U
Authority
CN
China
Prior art keywords
module
phonetic entry
main processing
processing block
data storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201720238381.6U
Other languages
English (en)
Inventor
邹文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Manwu Electronic Technology Co.,Ltd.
Original Assignee
Zhejiang Man Electronics Polytron Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Man Electronics Polytron Technologies Inc filed Critical Zhejiang Man Electronics Polytron Technologies Inc
Priority to CN201720238381.6U priority Critical patent/CN206741933U/zh
Application granted granted Critical
Publication of CN206741933U publication Critical patent/CN206741933U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Calculators And Similar Devices (AREA)

Abstract

本实用新型涉及一种便携式多路并行智能语音识别一体机,包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块。该一体机,采用专业的多路音频采集模块进行语音输入,抗干扰能力强,支持多路同步语音输入转换识别;便携性能强大,重量轻,无需固定安装,只需依据现场需要随时携带,快速部署能力强大,适用于越来越多的移动应用场景;系统扩展性超强,其中所有模块都可以很方便的进行硬件升级,产品生命周期长;增加了数据存储及冗余备份模块,数据安全性高,保密性强;系统可靠性高,散热能力强。

Description

一种便携式多路并行智能语音识别一体机
技术领域
本实用新型属于计算机技术领域,具体涉及一种便携式多路并行智能语音识别一体机。
背景技术
随着信息科技的飞速发展,智能语音识别、语音合成、语音编码等技术已经越来越成熟,并且在各行业得到了实际应用,极大的方便了人们的生产和生活,提高了工作效率。而且随着移动互联网技术的发展,手机上网速度越来越快,这也给语音识别技术的发展和应用带来了新的平台。
随着硬件设备越来越廉价以及云计算技术的出现,也大大的推动了语音识别的研究和应用。在技术应用方面,语音识别的应用主要有三种模式:(1)“单机模式”,即一台IT设备安装一套语音识别软件。利用设备本身的运算、存储资源,以软件模块方式实现,这种模式主要应用于工控机、PC机或笔记本电脑、手机上;(2)“嵌入式模式”,属于软硬件一体解决方案,通过以嵌入式语音识别模块芯片(如ARM芯片)为核心的硬件单元实现语音识别功能,采用嵌入式操作系统来实现统一的任务调度和外围设备管理,这种模式主要应用于智能机器人、智能家居和消费电子产品等多个领域;(3)“云模式”,即设备上仅仅保留识别的前端,真正的识别解码放置到云端服务器。这样做的好处是,云端服务器可以随时学习并更新语言及声学模型(深度置信神经网络),同时用户无需保留非常大的各种模型,也获得了实惠和方便,其中最出名的莫过于苹果iPhone手机的Siri语音助手和Google的语音搜索系统。这种模式主要应用于智能手机和车载设备。
以上现有的同类技术存在的问题:(1)“单机模式”主要通过普通麦克风输入语音信号,声卡采集后利用设备本身的运算资源进行处理,这种方法的优点是成本低,操作简单,运算速度和内存容量有一定保障,软件升级方便,但是缺点也很明显:不支持多路同步输入和抗干扰能力差;(2)“嵌入式模式”主要通过普通麦克风输入语音信号,声卡采集后利用设备本身的运算资源进行处理,这种方法的优点是体积小、功耗低、可靠性高、安装灵活、稳定性好,但是缺点也很明显:开发周期较长,研发成本高,不支持多路同步输入,扩展性差,只能使用专用硬件处理芯片,并且不能进行硬件升级;(3)“云模式”主要通过前端设备(如手机)输入语音信号,所有的识别解码都由云端服务 器来处理,这样做的好处是,云端服务器可以随时学习并更新语言及声学模型(通过深度置信神经网络),语音识别准确率高,用户使用方便,但是缺点也很明显:识别速度慢,在单个设备上不支持多路同步输入,设备必须联网。
实用新型内容
本实用新型的目的在于提供一种便携式多路并行智能语音识别一体机,采用X86和ARM芯片作为核心处理器,采用专业的多路音频采集模块进行语音录入,采用云分布式软件技术实现智能语音识别功能,经过合理的软硬件设计,该系统可以很好地实现对输入语音信号的接收、识别和判断及转换和其他产品相比支持多路同步输入、抗干扰能力强、硬件升级和扩展性强、兼容性强、对网络依赖性弱、便携性超强,具有很高的推广价值。
为了实现上述目的,本实用新型的技术方案如下。
一种便携式多路并行智能语音识别一体机,包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块,其中,电源管理模块分别与语音输入输出模块、语音识别主处理模块、显示模块连接;语音输入输出模块分别与语音控制模块、电源管理模块连接;语音控制模块分别与语音输入输出模块、语音识别主处理模块连接;语音识别主处理模块分别与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接。
进一步地,电源管理模块包括电源、开关面板、显示屏电源、声卡电源;语音输入输出模块包括音频输入输出接口,输入输出数字接口、声卡;语音控制模块包括控制面板;语音识别主处理模块包括主板、内存、CPU;显示模块包括显示屏;键盘模块包括集成键盘、触摸板;数据存储及冗余备份模块包括硬盘;通信模块包括网卡;系统散热模块包括水冷散热器、风扇。
上述一体机,包括一体机本体,一体机本体顶部安装有可翻折的液晶显示屏;一体机本体正面设有与液晶显示屏固定的扣子用以固定液晶显示屏,正面还设有两个固定模块,分别与便携式把手连接便于携带;液晶显示屏下部、一体机本体顶部设有键盘、触摸板、开关和语音控制面板;一体机本体底部设有安放底座;一体机本体左右两侧各有两个散热孔,利于一体机散热,其中左侧设有两个USB接口用以外接鼠标键盘、两个网络接口用以连接网络;一体机本体后面设有语音输入输出外接口及电源插口;一体机本体内部安装有主板芯片,主板芯片上设有硬件电路,硬件电路包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储 及冗余备份模块、通信模块、系统散热模块;语音识别主处理模块与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接,且位于语音输入输出模块底部;电源管理模块供一体机供电;语音输入输出模块采集输入和输出音频信息;语音控制模块控制音频识别效果;语音识别主处理模块处理音频信息;显示模块显示正在接收或已接收的音频信息;键盘模块操作控制显示在显示屏中的音频数据;数据存储及冗余备份模块储存数据;系统散热模块散热作用提高系统稳定性及可持续工作时间。
该一体机工作原理为:语音信息通过语音输入输出模块进行声音的采集,并通过语音控制模块过滤干扰信号,提取人说话的最佳语音特征,控制音频识别效果,然后进入语音主处理模块对语音进行处理,并在显示模块中进行显示,通过键盘模块进行操作,把数据储存在数据存储及冗余备份模块中,当需要时,可从数据存储及冗余备份模块中提取数据,并通过语音输入输出模块进行播放。
上述一体机中,支持多路语音同时识别,最大支持8路模拟输入和10路数字输入,有18进20出音频接口,包含8路XLR/TRS混合输入话放且均带幻相供电,1、2通道可切换为高阻输入连接及10dB衰减开关。24BIT、192kHzAD/DA转换器带来极高的动态范围,另外有一个ADAT数字输入/输出接口可传输8路数字音频,还有S/PDIF输入和输出数字接口,双独立的耳机输出,独立的监听输出带衰减和静音按钮;英特尔至强芯片结合配套的阿里云分布式软件技术,软硬件结合;采用X86和ARM芯片作为核心处理器,性能强大;既可使用联网“云模式”又可使用无网络的“单机模式”,不依赖网络;体积小、便携性超强,可随时随地快速部署,适用更多场景;所有模块可升级扩展性强,维护方便;软件兼容性强,支持主流操作系统如WINDOWS,LINUX、MAC;数据存储及冗余备份,保密性强,数据更安全;散热模块采用水冷散热器和风扇,散热系统强大,可7*24小时持续工作,并且功耗低。
本系统硬件由显示屏、控制面板、音频输入输出接口、通信板、主处理模块、电源、硬盘、散热器等组成。其主要功能是实现语音输入的同时,实现实时观察、控制、存储的作用。软件兼容性强,支持主流操作系统如WINDOWS,LINUX、MAC,方便操作者操作。阵列保护,是数据更安全,保密性强大。
本系统突破了以往单路语音输入的限制,抗干扰能力差的问题,实现了多路同步输出,增强系统抗干扰能力。由于采用了主流操作系统和阵列保护,增加了对数据的保护措施,使得系统工作更加稳定,所得到的数据较为安全,保密性强大,同时能实现对语音数据的实时记录,这有利于对语音数据的研究。使用常用的X86和ARM芯片,大大增 强了系统的兼容性及可扩展性。该系统既可使用联网“云模式”又可使用无网络的“单机模式”。可见该系统具有广大的应用前景。
该系统具有以下功能:(1)可以使用常用的X86和ARM芯片,兼容性强大,限制性小;(2)系统扩展性强,其中所有模块都可以很方便的进行硬件升级;(3)采用专业的多路音频采集模块进行语音输入,抗干扰能力强,极大的提高了语音输入质量,且支持多路同步语音输入采集;(4)增加了数据存储及备份模块,数据安全性高,保密性强;(5)使用X86和ARM芯片,对多路语音信号的同步识别转换处理能力超强;(6)系统可靠性高,可持续7*24工作。(7)便携性强大,集成显示屏和键鼠,体积小,重量轻,方便携带,无需固定安装,只需依据现场需要随时携带,快速部署能力强大,适用于越来越多的移动应用场景;(8)不依赖网络,既可使用联网“云模式”又可使用无网络的“单机模式”。以上功能解决了现有同类技术存在的不支持多路同步输入、抗干扰能力差、硬件升级和扩展性差、兼容性差、开发周期较长,研发成本高、对网络依赖性强、便携性弱等缺点。
该实用新型的有益效果在于:该一体机,采用专业的多路音频采集模块进行语音输入,抗干扰能力强,支持多路同步语音输入转换识别;便携性能强大,优秀的工业结构设计实现了将电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块集成到一台体积小巧的一体机上,重量轻,无需固定安装,只需依据现场需要随时携带,快速部署能力强大,适用于越来越多的移动应用场景;主处理模块可采用X86或ARM芯片作为核心处理器,语音转换处理性能强大,而且对软件兼容性强,可支持主流操作系统如WINDOWS,LINUX、MAC;系统扩展性超强,其中所有模块都可以很方便的进行硬件升级,产品生命周期长;增加了数据存储及冗余备份模块,数据安全性高,保密性强;系统可靠性高,散热能力强,系统散热模块可保证系统可持续7*24工作。
附图说明
图1是本实用新型实施例中所使用系统模块框图。
具体实施方式
下面结合附图对本实用新型的具体实施方式进行描述,以便更好的理解本实用新型。
如图1所示的便携式多路并行智能语音识别一体机,包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块,其中,电源管理模块分别与语音输入输出模块、 语音识别主处理模块、显示模块连接;语音输入输出模块分别与语音控制模块、电源管理模块连接;语音控制模块分别与语音输入输出模块、语音识别主处理模块连接;语音识别主处理模块分别与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接。
电源管理模块包括电源、开关面板、显示屏电源、声卡电源;语音输入输出模块包括音频输入输出接口,输入输出数字接口、声卡;语音控制模块包括控制面板;语音识别主处理模块包括主板、内存、CPU;显示模块包括显示屏;键盘模块包括集成键盘、触摸板;数据存储及冗余备份模块包括硬盘;通信模块包括网卡;系统散热模块包括水冷散热器、风扇。
上述一体机,包括一体机本体,一体机本体顶部安装有可翻折的液晶显示屏;一体机本体正面设有与液晶显示屏固定的扣子用以固定液晶显示屏,正面还设有两个固定模块,分别与便携式把手连接便于携带;液晶显示屏下部、一体机本体顶部设有键盘、触摸板、开关和语音控制面板;一体机本体底部设有安放底座;一体机本体左右两侧各有两个散热孔,利于一体机散热,其中左侧设有两个USB接口用以外接鼠标键盘、两个网络接口用以连接网络;一体机本体后面设有语音输入输出外接口及电源插口;一体机本体内部安装有主板芯片,主板芯片上设有硬件电路,硬件电路包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块;语音识别主处理模块与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接,且位于语音输入输出模块底部;电源管理模块供一体机供电;语音输入输出模块采集输入和输出音频信息;语音控制模块控制音频识别效果;语音识别主处理模块处理音频信息;显示模块显示正在接收或已接收的音频信息;键盘模块操作控制显示在显示屏中的音频数据;数据存储及冗余备份模块储存数据;系统散热模块散热作用提高系统稳定性及可持续工作时间。
该一体机工作原理为:语音信息通过语音输入输出模块进行声音的采集,并通过语音控制模块过滤干扰信号,提取人说话的最佳语音特征,控制音频识别效果,然后进入语音主处理模块对语音进行处理,并在显示模块中进行显示,通过键盘模块进行操作,把数据储存在数据存储及冗余备份模块中,当需要时,可从数据存储及冗余备份模块中提取数据,并通过语音输入输出模块进行播放。
上述一体机中,支持多路语音同时识别,最大支持8路模拟输入和10路数字输入,有18进20出音频接口,包含8路XLR/TRS混合输入话放且均带幻相供电,1、2通道可 切换为高阻输入连接及10dB衰减开关。24BIT、192kHzAD/DA转换器带来极高的动态范围,另外有一个ADAT数字输入/输出接口可传输8路数字音频,还有S/PDIF输入和输出数字接口,双独立的耳机输出,独立的监听输出带衰减和静音按钮;英特尔至强芯片结合配套的阿里云分布式软件技术,软硬件结合;采用X86和ARM芯片作为核心处理器,性能强大;既可使用联网“云模式”又可使用无网络的“单机模式”,不依赖网络;体积小、便携性超强,可随时随地快速部署,适用更多场景;所有模块可升级扩展性强,维护方便;软件兼容性强,支持主流操作系统如WINDOWS,LINUX、MAC;数据存储及冗余备份,保密性强,数据更安全;散热模块采用水冷散热器和风扇,散热系统强大,可7*24小时持续工作,并且功耗低。
以上所述是本实用新型的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本实用新型原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本实用新型的保护范围。

Claims (3)

1.一种便携式多路并行智能语音识别一体机,其特征在于:包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块,其中,电源管理模块分别与语音输入输出模块、语音识别主处理模块、显示模块连接;语音输入输出模块分别与语音控制模块、电源管理模块连接;语音控制模块分别与语音输入输出模块、语音识别主处理模块连接;语音识别主处理模块分别与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接。
2.根据权利要求1所述的便携式多路并行智能语音识别一体机,其特征在于:所述电源管理模块包括电源、开关面板、显示屏电源、声卡电源;语音输入输出模块包括音频输入输出接口,输入输出数字接口、声卡;语音控制模块包括控制面板;语音识别主处理模块包括主板、内存、CPU;显示模块包括显示屏;键盘模块包括集成键盘、触摸板;数据存储及冗余备份模块包括硬盘;通信模块包括网卡;系统散热模块包括水冷散热器、风扇。
3.根据权利要求1所述的便携式多路并行智能语音识别一体机,其特征在于:所述一体机,包括一体机本体,一体机本体顶部安装有可翻折的液晶显示屏;一体机本体正面设有与液晶显示屏固定的扣子用以固定液晶显示屏,正面还设有两个固定模块,分别与便携式把手连接便于携带;液晶显示屏下部、一体机本体顶部设有键盘、触摸板、开关和语音控制面板;一体机本体底部设有安放底座;一体机本体左右两侧各有两个散热孔,利于一体机散热,其中左侧设有两个USB接口用以外接鼠标键盘、两个网络接口用以连接网络;一体机本体后面设有语音输入输出外接口及电源插口;一体机本体内部安装有主板芯片,主板芯片上设有硬件电路,硬件电路包括电源管理模块、语音输入输出模块、语音控制模块、语音识别主处理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块;语音识别主处理模块与电源管理模块、显示模块、键盘模块、数据存储及冗余备份模块、通信模块、系统散热模块连接,且位于语音输入输出模块底部;电源管理模块供一体机供电;语音输入输出模块采集输入和输出音频信息;语音控制模块控制音频识别效果;语音识别主处理模块处理音频信息;显示模块显示正在接收或已接收的音频信息;键盘模块操作控制显示在显示屏中的音频数据;数据存储及冗余备份模块储存数据;系统散热模块散热作用提高系统稳定性及可持续工作时间。
CN201720238381.6U 2017-03-13 2017-03-13 一种便携式多路并行智能语音识别一体机 Active CN206741933U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201720238381.6U CN206741933U (zh) 2017-03-13 2017-03-13 一种便携式多路并行智能语音识别一体机

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201720238381.6U CN206741933U (zh) 2017-03-13 2017-03-13 一种便携式多路并行智能语音识别一体机

Publications (1)

Publication Number Publication Date
CN206741933U true CN206741933U (zh) 2017-12-12

Family

ID=60557488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201720238381.6U Active CN206741933U (zh) 2017-03-13 2017-03-13 一种便携式多路并行智能语音识别一体机

Country Status (1)

Country Link
CN (1) CN206741933U (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573705A (zh) * 2018-07-17 2018-09-25 上海应用技术大学 智能语音聊天器
CN111862949A (zh) * 2020-07-30 2020-10-30 北京小米松果电子有限公司 自然语言的处理方法及装置、电子设备及存储介质
CN113055312A (zh) * 2019-12-26 2021-06-29 浙江蓝鸽科技有限公司 基于同步以太网的多路音频拾音方法和系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108573705A (zh) * 2018-07-17 2018-09-25 上海应用技术大学 智能语音聊天器
CN113055312A (zh) * 2019-12-26 2021-06-29 浙江蓝鸽科技有限公司 基于同步以太网的多路音频拾音方法和系统
CN113055312B (zh) * 2019-12-26 2022-06-24 浙江蓝鸽科技有限公司 基于同步以太网的多路音频拾音方法和系统
CN111862949A (zh) * 2020-07-30 2020-10-30 北京小米松果电子有限公司 自然语言的处理方法及装置、电子设备及存储介质
CN111862949B (zh) * 2020-07-30 2024-04-02 北京小米松果电子有限公司 自然语言的处理方法及装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN103578474B (zh) 一种语音控制方法、装置和设备
CN206741933U (zh) 一种便携式多路并行智能语音识别一体机
CN103442147A (zh) 智能手机通用型功能扩展支持底座装置
CN102915726A (zh) 一种平板电脑卡拉ok系统及实现方法
CN203482274U (zh) 通用型智能手机扩展支持底座
CN205486698U (zh) 基于单片机控制的语音识别寻物系统
CN107424605A (zh) 一种基于x86和arm芯片的便携式多路并行智能语音识别一体机
CN201725246U (zh) 便携式计算机
CN206460412U (zh) 基于键盘的桌面式多功能电脑外设输入装置
CN104078042B (zh) 一种电子设备及一种信息处理的方法
CN203482416U (zh) 一种局域网络无线路由器
CN207924676U (zh) 一种计算机多功能控制卡
CN204795181U (zh) 一种多功能手机
CN203596881U (zh) 一种新型多功能蓝牙音箱
CN203825547U (zh) 计算机云终端设备
CN201138483Y (zh) 移动彩票机
CN204790760U (zh) 计算机机箱
CN206209708U (zh) 一种智能数学计算装置
CN202276415U (zh) 多功能数码投影仪
CN206341353U (zh) 一种与智能家居配套的多功能无线麦克风
CN202583962U (zh) 无线云终端用户桌面连接器
CN209708626U (zh) 一种具有语音控制功能的移动硬盘
CN201749420U (zh) 无线连接设备
CN203503184U (zh) 一种语音交互式气象知识科普装置
CN203761535U (zh) 一种电子数字点歌式的便携插卡音箱

Legal Events

Date Code Title Description
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 201, block a, building 3, No.18 Haishu Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee after: Zhejiang Manwu Electronic Technology Co.,Ltd.

Address before: 310000 Room 201, block a, building 3, 18 Haishu Road, Cangqian street, Yuhang District, Hangzhou City, Zhejiang Province

Patentee before: ZHEJIANG MANWU ELECTRONIC TECHNOLOGY Co.,Ltd.

CP03 Change of name, title or address
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of utility model: A portable multi-channel parallel intelligent speech recognition machine

Effective date of registration: 20210524

Granted publication date: 20171212

Pledgee: Jiangcun sub branch of Hangzhou United Rural Commercial Bank Co.,Ltd.

Pledgor: Zhejiang Manwu Electronic Technology Co.,Ltd.

Registration number: Y2021330000439

PE01 Entry into force of the registration of the contract for pledge of patent right