CN205582481U - 可加载个性化特征模型的语音识别系统 - Google Patents

可加载个性化特征模型的语音识别系统 Download PDF

Info

Publication number
CN205582481U
CN205582481U CN201620203184.6U CN201620203184U CN205582481U CN 205582481 U CN205582481 U CN 205582481U CN 201620203184 U CN201620203184 U CN 201620203184U CN 205582481 U CN205582481 U CN 205582481U
Authority
CN
China
Prior art keywords
chip
speech recognition
signal processor
digital signal
recognition system
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201620203184.6U
Other languages
English (en)
Inventor
郎立国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Air China (shanghai) Co Ltd
Original Assignee
Air China (shanghai) Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Air China (shanghai) Co Ltd filed Critical Air China (shanghai) Co Ltd
Priority to CN201620203184.6U priority Critical patent/CN205582481U/zh
Application granted granted Critical
Publication of CN205582481U publication Critical patent/CN205582481U/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Computer And Data Communications (AREA)

Abstract

本实用新型提供了一种可加载个性化特征模型的语音识别系统,该系统包括:语音编解码芯片,用于将接收到的模拟语音信号进行A/D转换得到数字音频信号,及将数字音频信号进行D/A转换为模拟语音信号;数字信号处理器,用于对输入的数字音频信号进行语音识别算法处理;FLASH芯片,用于存储数字信号处理器的语音识别程序及通用语音模型数据,上电启动后,程序及通用语音模型数据从FLASH芯片加载到DDR RAM芯片中;DDR RAM芯片,用于运行语音识别程序,存储通用语音模型数据及个性化特征模型数据,数字信号处理器分别与语音编解码芯片、FLASH芯片、DDR RAM芯片、串口芯片、网络芯片连接。

Description

可加载个性化特征模型的语音识别系统
技术领域
本实用新型涉及嵌入式语音识别技术领域,具体地,涉及一种可加载个性化特征模型的语音识别系统。
背景技术
基于按键及触摸屏的人机接口技术已经非常成熟,并且大大提高了人们操作设备便利性,而语音作为人类的自然界面,利用语音识别来控制操作设备的技术才开始起步,一方面是因为语音识别技术非常复杂,另一方面是嵌入式计算能力不足,即使在PC机上验证的算法很难移植到嵌入式系统中。
实用新型内容
针对现有技术中的缺陷,本实用新型的目的是提供一种可加载个性化特征模型的语音识别系统,其可以用于语音控制UI的技术,且可以加载个性化特征模型,大大提高识别率及识别的可靠性。
根据本实用新型提供一种可加载个性化特征模型的语音识别系统,所述可加载个性化特征模型的语音识别系统包括:
语音编解码芯片,用于将接收到的模拟语音信号进行A/D转换得到数字音频信号,及将数字音频信号进行D/A转换为模拟语音信号;
数字信号处理器,用于对输入的数字音频信号进行语音识别算法处理,识别完成后将识别的结果语音合成为输出数字音频信号,发送给语音编解码芯片进行语音输出;
FLASH芯片,用于存储数字信号处理器的语音识别程序及通用语音模型数据,上电启动后,程序及通用语音模型数据从FLASH芯片加载到DDR RAM芯片中;
DDR RAM芯片,用于运行语音识别程序,存储通用语音模型数据及个性化特征模型数据;
串口芯片,数字信号处理器通过串口芯片和外部通信,数字信号处理器通过串 口芯片和外部通信,通过串口给出识别出的词汇对应的汉字码;
网络芯片,用于加载个性化特征模型数据,以提高其识别率。
优选地,所述数字信号处理器选用高性能低功耗的浮点型TMS320C6748数字信号处理器。
优选地,所述语音编解码芯片需要支持多种采样率。
优选地,所述网络芯片选择LAN8710A型芯片。
优选地,所述数字信号处理器的通信和语音编解码芯片的通信都采取DMA方式通信。
与现有技术相比,本实用新型具有如下的有益效果:本实用新型可以用于语音控制UI的技术,且可以加载个性化特征模型,大大提高识别率及识别的可靠性。
附图说明
通过阅读参照以下附图对非限制性实施例所作的详细描述,本实用新型的其它特征、目的和优点将会变得更明显:
图1为本实用新型可加载个性化特征模型的语音识别系统的原理框图。
图2为本实用新型实施例的可加载个性化特征模型的语音识别系统的识别方法的流程图。
具体实施方式
下面结合具体实施例对本实用新型进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本实用新型,但不以任何形式限制本实用新型。应当指出的是,对本领域的普通技术人员来说,在不脱离本实用新型构思的前提下,还可以做出若干变形和改进。这些都属于本实用新型的保护范围。
如图1所示,本实用新型可加载个性化特征模型的语音识别系统包括:
语音编解码芯片104,用于将接收到的模拟语音信号进行A/D转换得到数字音频信号,及将数字音频信号进行D/A转换为模拟语音信号;
数字信号处理器(Digital Signal Processor,DSP)101,用于对输入的数字音频信号进行语音识别算法处理,识别完成后将识别的结果语音合成为输出数字音频信号,发送给语音编解码芯片进行语音输出;
FLASH芯片102,用于存储数字信号处理器的语音识别程序及通用语音模型数 据,上电启动后,程序及通用语音模型数据从FLASH芯片加载到DDR RAM芯片中;
DDR RAM芯片103,用于运行语音识别程序,存储通用语音模型数据及个性化特征模型数据;
串口芯片105,DSP通过串口芯片和外部通信,数字信号处理器通过串口芯片和外部通信,通过串口给出识别出的词汇对应的汉字码;
网络芯片106,用于加载个性化特征模型数据,以提高其识别率。
本实用新型可加载个性化特征模型的语音识别系统还可以包括锂电池107,锂电池用于给本实用新型可加载个性化特征模型的语音识别系统供电。
作为一种实施方式,数字信号处理器101可以选用高性能低功耗的浮点型TMS320C6748DSP,同时,为了降低功耗,尽量减少处理器各接口的使用,在满足算法处理的情况下,尽量降低处理器工作频率。FLASH芯片102及DDR RAM芯片103选用市场上通用的并且本款数字信号处理器能够支持的芯片即可。串口芯片105可以选择RS232、RS422、RS485任意一种标准的芯片。语音编解码芯片104需要支持多种采样率,如8KHz、16KHz、44.1KHz等,采样精度支持16bit、24bit。网络芯片106可以选择LAN8710A型芯片。
作为一种实施方式,语音编解码芯片被配置为16KHz的采样率,采样精度为24bit。数字信号处理器和语音编解码芯片之间可以采用IIS方式通信,每秒传输字节数位48K字节,为了降低数字信号处理器的负担,使数字信号处理器主要运行识别程序,数字信号处理器的通信和语音编解码芯片的通信都采取DMA(Direct Memory Access,直接内存存取)方式通信。
如图2所示,本实用新型实施例的可加载个性化特征模型的语音识别系统的识别方法,包括如下步骤:
步骤一,系统上电后,首先将语音识别程序从FLASH芯片加载到DDR RAM芯片中,然后将通用语音模型数据加载到DDR RAM芯片中(如果有个性化语音模型数据,将个性化语音模型数据加载到DDR RAM芯片中),开始运行准备语音识别;
步骤二,语音识别模块上电程序运行后,系统进行识别按键检测,检测到识别按键按下后,开始控制音频编解码芯片,进行AD转换接收语音信号,然后通过语音识别算法进行语音识别,同时系统检测到识别按键抬起后,通过串口给出识别出的词汇对应的汉字码,同时将识别的词汇进行语音合成,控制音频编解码芯片将合成的结果DA转换为模拟语音信号进行输出;
步骤三,语音识别模块运行中,如果检测到模型切换按键按下,加载下一条个性化语音模型数据到DDR RAM芯片,如果没有下一条个性化语音模型数据,加载通用语音模型数据到DDR RAM芯片中,后续语音识别将会使用新加载的模型进行语音识别;
步骤四,语音识别模块运行中,如果接收到网络加载的个性化语音模型数据,则将收到的个性化语音模型数据存储到FLASH芯片中及DDR RAM芯片中,后续语音识别将会使用新加载的模型进行语音识别。
以上对本实用新型的具体实施例进行了描述。需要理解的是,本实用新型并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本实用新型的实质内容。

Claims (6)

1.一种可加载个性化特征模型的语音识别系统,其特征在于,包括:
语音编解码芯片,用于将接收到的模拟语音信号进行A/D转换得到数字音频信号,及将数字信号处理器后的数字音频信号进行D/A转换为模拟语音信号;
数字信号处理器,用于对输入的数字音频信号进行语音识别算法处理,识别完成后将识别的结果语音合成为输出数字音频信号,发送给语音编解码芯片进行语音输出;
FLASH芯片,用于存储数字信号处理器的语音识别程序及通用语音模型数据,上电启动后,程序及通用语音模型数据从FLASH芯片加载到DDR RAM芯片中;
DDR RAM芯片,用于运行语音识别程序,存储通用语音模型数据及个性化特征模型数据;
串口芯片,数字信号处理器通过串口芯片和外部通信,通过串口给出识别出的词汇对应的汉字码;
网络芯片,用于加载个性化特征模型数据,以提高其识别率;
数字信号处理器分别与语音编解码芯片、FLASH芯片、DDR RAM芯片、串口芯片、网络芯片连接。
2.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述可加载个性化特征模型的语音识别系统还包括锂电池,锂电池用于给所述可加载个性化特征模型的语音识别系统供电。
3.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述数字信号处理器选用高性能低功耗的浮点型TMS320C6748数字信号处理器。
4.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述语音编解码芯片需要支持多种采样率。
5.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述网络芯片选择LAN8710A型芯片。
6.根据权利要求1所述的可加载个性化特征模型的语音识别系统,其特征在于,所述数字信号处理器的通信和语音编解码芯片的通信都采取DMA方式通信。
CN201620203184.6U 2016-03-16 2016-03-16 可加载个性化特征模型的语音识别系统 Active CN205582481U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201620203184.6U CN205582481U (zh) 2016-03-16 2016-03-16 可加载个性化特征模型的语音识别系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201620203184.6U CN205582481U (zh) 2016-03-16 2016-03-16 可加载个性化特征模型的语音识别系统

Publications (1)

Publication Number Publication Date
CN205582481U true CN205582481U (zh) 2016-09-14

Family

ID=56869246

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201620203184.6U Active CN205582481U (zh) 2016-03-16 2016-03-16 可加载个性化特征模型的语音识别系统

Country Status (1)

Country Link
CN (1) CN205582481U (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107204189A (zh) * 2016-03-16 2017-09-26 中航华东光电(上海)有限公司 可加载个性化特征模型的语音识别系统及方法
CN107358963A (zh) * 2017-07-14 2017-11-17 中航华东光电(上海)有限公司 一种实时去呼吸声装置及方法
CN109003603A (zh) * 2017-10-30 2018-12-14 上海寒武纪信息科技有限公司 语音识别方法及相关产品
US11990137B2 (en) 2018-09-13 2024-05-21 Shanghai Cambricon Information Technology Co., Ltd. Image retouching method and terminal device

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107204189A (zh) * 2016-03-16 2017-09-26 中航华东光电(上海)有限公司 可加载个性化特征模型的语音识别系统及方法
CN107358963A (zh) * 2017-07-14 2017-11-17 中航华东光电(上海)有限公司 一种实时去呼吸声装置及方法
CN109003603A (zh) * 2017-10-30 2018-12-14 上海寒武纪信息科技有限公司 语音识别方法及相关产品
US11922132B2 (en) 2017-10-30 2024-03-05 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
US12050887B2 (en) 2017-10-30 2024-07-30 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
US11990137B2 (en) 2018-09-13 2024-05-21 Shanghai Cambricon Information Technology Co., Ltd. Image retouching method and terminal device
US11996105B2 (en) 2018-09-13 2024-05-28 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
US12057110B2 (en) 2018-09-13 2024-08-06 Shanghai Cambricon Information Technology Co., Ltd. Voice recognition based on neural networks
US12057109B2 (en) 2018-09-13 2024-08-06 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and terminal device
US12094456B2 (en) 2018-09-13 2024-09-17 Shanghai Cambricon Information Technology Co., Ltd. Information processing method and system

Similar Documents

Publication Publication Date Title
CN205582481U (zh) 可加载个性化特征模型的语音识别系统
CN110706690B (zh) 语音识别方法及其装置
CN101315770B (zh) 语音识别片上系统及采用其的语音识别方法
CN104038864B (zh) 带有语音识别的麦克风电路总成和系统
CN102543071B (zh) 用于移动设备的语音识别系统和方法
WO2019096056A1 (zh) 语音识别方法、装置及系统
CN110570873B (zh) 声纹唤醒方法、装置、计算机设备以及存储介质
CN107527614B (zh) 语音控制系统及其方法
CN100521708C (zh) 移动信息终端的语音识别与语音标签记录和调用方法
CN101017428A (zh) 一种嵌入式语音交互装置及交互方法
CN103838714A (zh) 一种语音信息转换方法及装置
TW201743319A (zh) 語音控制系統及其方法
CN101794576A (zh) 一种脏话检测助手及其使用方法
CN107210037A (zh) 始终开启部件中的时钟切换
US20230127787A1 (en) Method and apparatus for converting voice timbre, method and apparatus for training model, device and medium
US11250854B2 (en) Method and apparatus for voice interaction, device and computer-readable storage medium
CN105976808A (zh) 一种智能语音识别系统及方法
CN101825953A (zh) 一种语音输入和拼音输入相结合的中文输入法产品
CN110503962A (zh) 语音识别和设定方法、装置、计算机设备和存储介质
CN107204189A (zh) 可加载个性化特征模型的语音识别系统及方法
CN103955149A (zh) Dsp语音识别用于激光大屏幕拼接控制系统
CN212675912U (zh) 一种基于fpga的语音自动识别系统
CN100375084C (zh) 一种带有语言复读功能的计算机及其实现方法
CN202677367U (zh) Dsp语音识别用于激光大屏幕拼接控制系统
CN202854986U (zh) 实现语音识别功能的门铃装置

Legal Events

Date Code Title Description
C14 Grant of patent or utility model
GR01 Patent grant