CN204990296U - 一种基于fpga的语音手势转换装置 - Google Patents

一种基于fpga的语音手势转换装置 Download PDF

Info

Publication number
CN204990296U
CN204990296U CN201520743955.6U CN201520743955U CN204990296U CN 204990296 U CN204990296 U CN 204990296U CN 201520743955 U CN201520743955 U CN 201520743955U CN 204990296 U CN204990296 U CN 204990296U
Authority
CN
China
Prior art keywords
fpga
module
speech
conversion equipment
display module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201520743955.6U
Other languages
English (en)
Inventor
杨鸿武
白祖仕
甘振业
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northwest Normal University
Original Assignee
Northwest Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northwest Normal University filed Critical Northwest Normal University
Priority to CN201520743955.6U priority Critical patent/CN204990296U/zh
Application granted granted Critical
Publication of CN204990296U publication Critical patent/CN204990296U/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • User Interface Of Digital Computer (AREA)

Abstract

本实用新型公开了一种基于FPGA的语音手势转换装置,包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的NiosII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。本实用新型旨在解决言语障碍者与外界交流困难,以及现有语音手势转换装置功耗高、存在转换延时的问题。

Description

一种基于FPGA的语音手势转换装置
技术领域
本实用新型涉及语音识别装置,具体涉及在正常人与言语障碍者之间相互交流的一种基于FPGA的语音手势转换装置。
背景技术
根据国家计委统计,我国目前有听力障碍2780万,每年都在剧增,这些人在工作、生活以及外界的交流上出现了严重的障碍,为了解决这些问题,人们制造了许多类型的助听器,它一个小型扩音器,把原本听不到的声音加以扩大,再利用听障者的残余听力,使声音能送到大脑听觉中枢,而感觉到声音。虽然给言语障碍者带来极大方便,但还存在以下不足:
存在探测语音盲区,在外界环境复杂时干扰多,接受效果不佳,不能满足听力损失严重者的需求;
外形惹人注目且笨重,需用口袋或挂式耳戴,有损于他们的自尊心;
当今市场急需一种新型方式来解决以上存在的不足,解决言语障碍者与正常人交流问题。
申请号为“CN201310033370.0”的中国专利中,公开了名称为“一种语音手势交互翻译装置及其控制方法”的发明专利,包括手势翻译器和语音翻译器;所述手势翻译器,用于获取第一用户的手势动作,与预存的手语数据进行匹配、输出该手势动作对应的词语信息,转换为语音信号进行播放;所述语音翻译器与所述手势翻译器通信连接,用于获取第二用户的语音信号,将所述语音信号转换为文字信息后与预存的手语数据进行匹配、生成该文字信息对应的手势动作,将手势动作按顺序进行显示。该语音翻译器并没有说明其采用何种处理器,而实现同步翻译对处理的处理能力有一定要求,采用普通处理器易存在功耗高、翻译存在一定延时的问题。
实用新型内容
针对上述存在的技术问题,本实用新型提供了一种基于FPGA的语音手势转换装置,以解决言语障碍者与外界交流困难,以及现有语音手势转换装置功耗高、存在转换延时的问题,设计了一种语音手势转换装置,通过FPGA的功能专一性能够有效提高语音转化成手势及文字的速度,实现同时翻译,且该装置功耗低,可持续运行时间长。
一种基于FPGA的语音手势转换装置,包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的NiosII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。
进一步的,所述语音输入装置为MIC输入器。
进一步的,所述显示模块为LCD显示屏。
进一步的,所述存储模块包括同步动态随机存储器和静态随机存储器。
进一步的,所述语音编/解码芯片与所述FPGA模块通过I2C总线完成数据的传输。
本实用新型设置了FPGA模块作为本语音手势转换装置的处理模块,有效地提高了数据之间转化的速度,通过NiosII处理器实现语音的识别和处理,对应的文字和手势显示于LCD显示屏上,有效地解决言语障碍者与正常人交流问题,且本装置操作方便,识别率高,通过语音识别,手势图像的显示,在正常人和言语障碍的人交流中相当于交流过程中加入一个中枢纽带,带来极大的帮助,具有重大现实价值和意义。
附图说明
为了更清楚地说明本实用新型实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本实用新型的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一种基于FPGA的语音手势转换装置的模块示意图;
图3为一种基于FPGA的语音手势转换装置的功能流程图;
图2为训练HMM模型的流程图。
具体实施方式
本实用新型公开了一种基于FPGA的语音手势转换装置,通过FPGA的功能专一性能够有效提高语音转化成手势及文字的速度,实现同时翻译,且该装置功耗低,可持续运行时间长。
下面将结合本实用新型中的附图,对本实用新型中的技术方案进行清楚、完整地描述,显然,所描述的仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本实用新型中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本实用新型保护的范围。
参见图1所示,本实用新型公开了一种基于FPGA的语音手势转换装置(FPGA:Field-ProgrammableGateArray,即现场可编程门阵列),包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的NiosII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。
所述语音输入装置为MIC输入器,(MIC:microphone,即麦克风)所述显示模块为LCD显示屏,所述存储模块包括同步动态随机存储器和静态随机存储器,所述语音编/解码芯片与所述FPGA模块通过I2C总线完成数据的传输。
MIC输入器接受非特定人的说话语音并将语音信号传送给语音编/解码芯片;
通过语音编/解码芯片的感应器获得实时的语音数字信号,然后将其送至FPGA,在FPGA中采用NiosII处理器实现语音的识别和处理,语音输入后进行预处理和HMM训练,在预处理阶段对音库中的语音数据进行分析,提取相应的语音参数(基频和谱参数),根据提取的语音参数进行建模,建立HMM模型,根据观察状态序列找到产生这一序列的潜在的隐含状态序列,算出每一种隐状态序列组合对应的观察状态序列的概率,概率最大的那个组合对应的就是隐状态序列组合。识别出语音的结果,将语音数字信号转化成文字;
将文字转换为预先存入存储模块中的手势图像内容,并在LCD上显示手势图像和文字。
参见图2所示,本装置基于HMM进行语音识别(HMM:hiddenMarkovmodel,即隐马尔科夫模型),其识别流程如下:
(1)进行语音输入,将输入语音的特征矢量序列和参考模式库中的模式进行相似性度量比较,将相似度最高的模式所属的类别作为识别的中间候选结果输出;
(2)利用最大似然估计法Viterbi解码器来识别语音的数字码,输入的语音采样值通过预处理提取出特征向量,将每一帧的紧邻矢量指针被送到数字模型,系统选择最大匹配概率的模型;
(3)HTK训练工具使用训练语料和相应的标注文件来估计HMM模型集的参数,最后将语音转换成文字,通过FPGA的处理,将文字内容对应的手势图像和文字在液晶屏LCD上显示。
参见图3所示,训练HMM模型的流程为:
(1)用户输入若干次语音训练,用户对着麦克风说话,将用于的录音送入语音识别模块;
(2)语音识别模块接受到录音后,系统经过上述预处理和特征提取后得到特征矢量序列,然后通过特征建模模块建立训练语音的参考模式库;
(3)对词汇中的0-10这11个阿拉伯数字和50个简单孤立词进行HMM训练。将不同用户和阿拉伯数字的相同加权梅尔倒谱矩阵与编码本进行比较,其相对应的HMM模型的观察矢量被发送到Baum-Welch算法来训练输入指针序列模型。通过不同用户寻找P1、P2、Pn的平均值使得到的模型通用化。
以上内容是结合具体的优选实施方式对本实用新型所作的进一步详细说明,不能认定本实用新型的具体实施只局限于这些说明。对于本实用新型所属技术领域的普通技术人员来说,在不脱离本实用新型构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本实用新型的保护范围。

Claims (5)

1.一种基于FPGA的语音手势转换装置,其特征在于,包括语音输入装置、语音编/解码芯片、FPGA模块、存储模块和显示模块,所述语音输入装置与语音编/解码芯片连接,所述FPGA模块设置输入端和输出端,所述语音编/解码芯片与输入端连接,所述FPGA模块配置有用于语音信号识别转换的NiosII处理器,所述存储模块与所述FPGA模块连接,所述输出端与显示模块连接,所述显示模块包括文字显示模块和手势显示模块。
2.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述语音输入装置为MIC输入器。
3.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述显示模块为LCD显示屏。
4.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述存储模块包括同步动态随机存储器和静态随机存储器。
5.根据权利要求1所述的一种基于FPGA的语音手势转换装置,其特征在于,所述语音编/解码芯片与所述FPGA模块通过I2C总线完成数据的传输。
CN201520743955.6U 2015-09-23 2015-09-23 一种基于fpga的语音手势转换装置 Expired - Fee Related CN204990296U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201520743955.6U CN204990296U (zh) 2015-09-23 2015-09-23 一种基于fpga的语音手势转换装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201520743955.6U CN204990296U (zh) 2015-09-23 2015-09-23 一种基于fpga的语音手势转换装置

Publications (1)

Publication Number Publication Date
CN204990296U true CN204990296U (zh) 2016-01-20

Family

ID=55124644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201520743955.6U Expired - Fee Related CN204990296U (zh) 2015-09-23 2015-09-23 一种基于fpga的语音手势转换装置

Country Status (1)

Country Link
CN (1) CN204990296U (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114995626A (zh) * 2021-02-24 2022-09-02 常州星宇车灯股份有限公司 一种车载系统及控制方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114995626A (zh) * 2021-02-24 2022-09-02 常州星宇车灯股份有限公司 一种车载系统及控制方法

Similar Documents

Publication Publication Date Title
CN108766414B (zh) 用于语音翻译的方法、装置、设备和计算机可读存储介质
CN103971675B (zh) 自动语音识别方法和系统
CN102723078B (zh) 基于自然言语理解的语音情感识别方法
CN103578464B (zh) 语言模型的建立方法、语音辨识方法及电子装置
CN110675854B (zh) 一种中英文混合语音识别方法及装置
CN103426428B (zh) 语音识别方法及系统
CN109036391A (zh) 语音识别方法、装置及系统
CN103680498A (zh) 一种语音识别方法和设备
CN108711421A (zh) 一种语音识别声学模型建立方法及装置和电子设备
CN105206271A (zh) 智能设备的语音唤醒方法及实现所述方法的系统
CN109377981B (zh) 音素对齐的方法及装置
CN105261246A (zh) 一种基于大数据挖掘技术的英语口语纠错系统
CN102063900A (zh) 克服混淆发音的语音识别方法及系统
CN110517668B (zh) 一种中英文混合语音识别系统及方法
CN111144102B (zh) 用于识别语句中实体的方法、装置和电子设备
CN103020048A (zh) 一种语言翻译方法及系统
US20230127787A1 (en) Method and apparatus for converting voice timbre, method and apparatus for training model, device and medium
CN108628859A (zh) 一种实时语音翻译系统
CN112463942A (zh) 文本处理方法、装置、电子设备及计算机可读存储介质
CN104239579A (zh) 构建多语言音标数据库的方法、多语言注音的方法及装置
CN110503956A (zh) 语音识别方法、装置、介质及电子设备
CN109448458A (zh) 一种英语口语训练装置、数据处理方法及存储介质
CN104361787A (zh) 信号转换系统和信号转换方法
CN108304391A (zh) 一种基于gps定位的自适应翻译机
Li et al. Integrating knowledge in end-to-end automatic speech recognition for Mandarin-English code-switching

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20160120

Termination date: 20160923