CN1831941A - 一种语音处理系统 - Google Patents

一种语音处理系统 Download PDF

Info

Publication number
CN1831941A
CN1831941A CNA2006100118028A CN200610011802A CN1831941A CN 1831941 A CN1831941 A CN 1831941A CN A2006100118028 A CNA2006100118028 A CN A2006100118028A CN 200610011802 A CN200610011802 A CN 200610011802A CN 1831941 A CN1831941 A CN 1831941A
Authority
CN
China
Prior art keywords
dsp
signal
digital
analog
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006100118028A
Other languages
English (en)
Other versions
CN100589182C (zh
Inventor
周政军
房汝明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vimicro Corp
Original Assignee
Vimicro Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vimicro Corp filed Critical Vimicro Corp
Priority to CN200610011802A priority Critical patent/CN100589182C/zh
Publication of CN1831941A publication Critical patent/CN1831941A/zh
Application granted granted Critical
Publication of CN100589182C publication Critical patent/CN100589182C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种语音处理系统,包括麦克风、主处理器和语音信号处理装置,所述语音信号处理装置接收麦克风输出的语音信号,经过处理后输入主处理器,主处理器通过控制信号接口实现对所述语音信号处理装置的过程控制和参数设置。采用本发明提供的语音处理系统,语音处理任务由一个专门的语音信号处理装置来完成,不需要和其他任务共用主处理器。增加新的语音处理功能不会增加主处理器的复杂度,也不需要大量修改主处理器的软件和硬件。另外,该语音信号处理装置可以工作在“直通模式”下,确保和现有系统结构的主处理器的兼容,同时该语音信号处理装置还可以支持多路麦克风输入。

Description

一种语音处理系统
技术领域
本发明涉及语音信号的处理,尤其涉及一种实现语音信号处理的系统。
背景技术
现有的包含语音处理功能的系统多采用图1所显示的结构,该结构将麦克风采集到的载有语音的电信号输入主处理器。随着电子技术的发展,目前主处理器除了要完成麦克风信号的处理还要完成语音信号的压缩、传输以及很多其他工作。我们已手机为例,目前的手机大多使用上面的结构,手机主处理器直接接收麦克风输入的语音信号,并对其进行处理。与此同时,主处理器还要完成很多其他任务如:接受键盘输入、输出图像到液晶显示屏、访问SD卡或闪存等外部存储器、处理GSM通讯协议等。
随着语音处理技术的发展,需要对麦克风输入的电信号做越来越多的处理。例如,人们经常在马路或超市等嘈杂环境使用手机,为了抑制环境噪音,需要用复杂的噪音消除方法对麦克风输入的电信号进行处理。在现有结构下,这些处理全部由主处理器完成,使得主处理器越来越复杂。另外语音处理任务需要与其他任务共享处理器,任务切换频繁且风险较高,很难确保语音处理工作实时、精确完成。
还有,为了将新的语音处理技术应用到旧的系统,在现有系统结构下很难实现。要在现有结构下添加新的语音处理技术,需要大量更改旧系统的主处理器上的处理软件。有时新技术对硬件的要求很高,原来的主处理器硬件不能满足要求,这时需要修改主处理器的硬件,这在很多时候是不能够实现的。
发明内容
本发明要解决的技术问题是提供了一种语音处理系统,对现有系统结构进行改进,将语音处理从主处理器分离出来,在完成现有系统的功能的同时,避免现有系统结构造成的问题。
为了解决上述技术问题,本发明提供了一种语音处理系统包括麦克风和主处理器,其特点是,还包括一语音信号处理装置,所述语音信号处理装置接收麦克风输出的语音信号,经过处理后交主处理器进行后续处理,所述主处理器通过控制信号接口实现对所述语音信号处理装置的过程控制和参数设置。
进一步地,上述系统还可具有以下特点:所述语音信号处理装置包括数据部分和控制部分,所述数据部分进一步包括模数变换模块、数字信号处理器接口模块DSP_IF、数字信号处理器DSP、存储模块和数模变换模块,其中:
所述模数变换模块用于接收麦克输入的模拟语音信号,变换为数字信号后输出到所述存储模块进行缓存;
所述存储模块用于缓存要输入DSP和DSP要输出的数据,DSP要运行的程序指令以及处理过程中使用和得到的数据;
所述DSP_IF用于提供DSP与所述存储模块之间,以及DSP与控制部分之间的通讯接口;
所述DSP用于运行程序指令,完成对输入语音信号的处理;
所述数模变换模块用于将处理后的语音数字信号取出并转换为模拟信号输出;
所述控制部分包括主控制接口,用于提供主处理器访问所述模数变换模块、数模变换模块,以及DSP_IF中的寄存器的接口。
进一步地,上述系统还可具有以下特点:所述存储模块进一步分为:输入缓存,用于缓存模数变换模块输出的数字信号;程序存储器,用于保存DSP要运行的程序指令;数据存储器,用于暂存DSP处理过程中从输入缓存取出的数据以及处理产生的结果数据;输出缓存,用于缓存DSP处理后的要输出的结果数据。
进一步地,上述系统还可具有以下特点:所述数据部分还包括一多路选择器,用于接收数模变换模块输出的处理后的模拟信号以及麦克输入的模拟语音信号,根据一旁路控制信号选择输出信号,在不需要语音信号处理装置工作时直接输出麦克输入的语音信号。
进一步地,上述系统还可具有以下特点:所述DSP用于实现以下功能中的一种或任意组合:A,消除平稳的背景噪声;B,消除背景语音或音乐;C,添加背景噪声或语音;D,改变语音的语调;E,适应语音输入距离的变化。
进一步地,上述系统还可具有以下特点:所述控制部分还包括一电源开通复位模块,用于为整个装置提供复位信号。
进一步地,上述系统还可具有以下特点:所述DSP_IF中还包括命令寄存器组,供DSP访问以及供主处理器通过主控制接口访问,实现DSP与主处理器的通讯。
进一步地,上述系统还可具有以下特点:所述DSP_IF还用于进行总线切换,将所述主控制接口输出的外部程序或数据下载到所述存储模块中。
进一步地,上述系统还可具有以下特点:所述模数变换模块设置有多个,以接收多路麦克输入的语音信号。
采用本发明提供的语音处理系统,语音处理任务由一个专门的语音信号处理装置来完成,不需要和其他任务共用主处理器。增加新的语音处理功能不会增加主处理器的复杂度,也不需要大量修改主处理器的软件和硬件。另外,该语音信号处理装置可以工作在“直通模式”下,确保和现有系统结构的主处理器的兼容,同时该语音信号处理装置还可以支持多路麦克风输入。
附图说明
图1为现有语音处理系统结构图;
图2为本发明实施例语音处理系统结构图;
图3是本发明实施例语音信号处理装置的电路图;
图4为本发明实施例多麦克风输入的结构图;
图5为本发明实施例语音处理系统直通模式工作示意图;
图6是利用图3中的语音信号处理装置实现背景音乐或语音消除过程的示意图。
具体实施方式
下面结合附图和具体实施方式对本发明作进一步详细说明。
参见图2,本实施例中语音处理系统包括麦克风、语音信号处理装置和主处理器。麦克风输出的语音信号输入到语音信号处理装置,该语音信号处理装置输出经过处理的语音信号给主处理器,主处理器通过语音信号处理装置的控制信号接口来实现对语音信号处理装置的过程控制和参数设置。
其中,语音信号处理装置包括数据部分和控制部分,参见图3。
数据部分包括模数变换(ADC)模块(带有存储器ADC MEM)、数字信号处理器接口(DSP_IF)模块、数字信号处理器(DSP)、程序存储器(P-MEM)、数据存储器(X-MEM)、输入缓存(In BUFFER)、输出缓存(Out BUFFER)、数模变换(DAC)模块(带有存储器DAC MEM),以及多路选择器(MUX)。图中为了表示方便,将P-MEM、X-MEM、InBUFFER、Out BUFFER统一用P,X,Y MEM In&Out Buffer框表示。Y MEM表示DSP的另一数据存储器,在控制部分将会涉及。数字信号处理器接口模块可以根据需要选用现有产品,当有多路语音输入时,模数变换模块可以有多个。因此,该语音信号处理装置可以接收一个麦克风的输入也可以接收多个麦克风的输入,即使主处理器只能对一个麦克风的输入进行处理,该语音信号处理装置仍然可以接收多个麦克风的输入并将其合成为一个麦克风输出,参见图4。这样可以使语音信号处理装置完成复杂的麦克风阵列的处理,确保一些高效复杂语音处理算法可以在语音信号处理装置上实现。
麦克输入MIC IN经模数变换模块变换为16BIT的数字数据ADC OUT;该数据通过数字信号处理器接口模块存到输入缓存中;DSP通过DSP_IF模块与各存储器和控制部分通讯,从程序存储器中取指令,DSP运行取数据指令,将输入缓存中的数据取出并存到数据存储器中;DSP按数据处理算法运行指令,将处理后的数据存在数据存储器中的另一位置;DSP按一定速率将此数据通过DSP_IF存到输出缓存中;数模变换模块按输出采样率的频率周期性地将输出数据DSP_IF OUT从输出缓存中取出并将它变换成模拟信号输出到多路选择器;多路选择器的另一路输入为麦克输入MIC IN,并以主处理器提供的旁路信号BYPASS为控制信号,如果BYPASS信号为0,将数模变换模块的输出作为语音信号处理装置的输出信号DAC OUT,否则,将麦克输入MIC IN作为语音信号处理装置的输出信号DAC OUT交给主处理器处理。其作用是在不需要语音信号处理装置工作时直接输出语音,此时的语音信号处理装置工作于“直通模式”下,该语音信号处理装置不对麦克风信号做处理而直接将交给主处理器处理,如图5所示。
控制部分主要包括主控制接口(HIF)和电源开通复位(POR)模块。
主控制接口(HIF)提供了主处理器(HOST)访问ADC、DAC和DSP_IF模块中的寄存器的接口,达到控制各模块的目的;主处理器可通过主控制接口进行总线切换,将程序或数据下载到P MEM、X MEM或DSP的另一数据存储器Y MEM中;主处理器还可以通过主控制接口访问DSP_IF中的命令寄存器组,该组寄存器也可以被DSP访问,从而能实现与DSP的通讯;电源开通复位(POR)模块在1.8V电源上电时,为整个装置提供复位信号。
该控制信号接口可以使用多种方法实现,例如,可以用串行外设接口(SPI)、串口、内存接口等等。只要主处理器与语音信号处理装置之间有一个双方认可的协议,该协议能完成控制命令的发送和处理参数的设置即可。
根据DSP软件的不同,该语音信号处理装置能实现全部或部分的如下功能:(1)ONE-MIC算法:能消除平稳的背景噪声。(2)TWO-MIC算法:能消除背景语音或音乐。(3)ADD-NOISE算法:能添加背景噪声或语音。(4)PITCH-SCALE算法:能改变语音的语调,如将男声变女声,女声变男声。(5)DISTANCE-ADOPT算法:能适应语音输入距离的变化。不过,本发明的重点在语音信号处理装置的结构上,并不关心这些算法的具体处理流程。
下面以TWO-MIC算法为例介绍一下利用本装置实现背景音乐或语音消除的过程,如图6所示。
TWO-MIC算法利用一个麦克主要拾取说话者的语音信号VOICE,另一个麦克主要是拾取背景语音或音乐噪声NOISE;声波振动信号经过麦克拾取后变为模拟电信号MIC1 IN和MIC2 IN,此两路电信号经过模数变换模块ADC1和ADC2分别变换为数字信号ADC1 OUT和ADC2 OUT;DSP执行TWO-MIC算法,将语音和噪声数据处理后,生成清楚的无噪声数据并送给数模变换模块DAC;DAC将数字数据变换为模拟信号DAC OUT并送给说话者手机(MOBILE FOR TALKER)中的主处理器;说话者手机将信号通过无线方式(WIRELESS)传给听话者手机,这样听话者就清楚地听到了经过噪声去除的说话者语音。

Claims (9)

1、一种语音处理系统,包括麦克风和主处理器,其特征在于,还包括一语音信号处理装置,所述语音信号处理装置接收麦克风输出的语音信号,经过处理后交主处理器进行后续处理,所述主处理器通过控制信号接口实现对所述语音信号处理装置的过程控制和参数设置。
2、如权利要求1所述的系统,其特征在于,所述语音信号处理装置包括数据部分和控制部分,所述数据部分进一步包括模数变换模块、数字信号处理器接口模块DSP_IF、数字信号处理器DSP、存储模块和数模变换模块,其中:
所述模数变换模块用于接收麦克输入的模拟语音信号,变换为数字信号后输出到所述存储模块进行缓存;
所述存储模块用于缓存要输入DSP和DSP要输出的数据,DSP要运行的程序指令以及处理过程中使用和得到的数据;
所述DSP_IF用于提供DSP与所述存储模块之间,以及DSP与控制部分之间的通讯接口;
所述DSP用于运行程序指令,完成对输入语音信号的处理;
所述数模变换模块用于将处理后的语音数字信号取出并转换为模拟信号输出;
所述控制部分包括主控制接口,用于提供主处理器访问所述模数变换模块、数模变换模块,以及DSP_IF中的寄存器的接口。
3、如权利要求2所述的系统,其特征在于,所述存储模块进一步分为:输入缓存,用于缓存模数变换模块输出的数字信号;程序存储器,用于保存DSP要运行的程序指令;数据存储器,用于暂存DSP处理过程中从输入缓存取出的数据以及处理产生的结果数据;输出缓存,用于缓存DSP处理后的要输出的结果数据。
4、如权利要求2所述的系统,其特征在于,所述数据部分还包括一多路选择器,用于接收数模变换模块输出的处理后的模拟信号以及麦克输入的模拟语音信号,根据一旁路控制信号选择输出信号,在不需要语音信号处理装置工作时直接输出麦克输入的语音信号。
5、如权利要求2所述的系统,其特征在于,所述DSP用于实现以下功能中的一种或任意组合:A,消除平稳的背景噪声;B,消除背景语音或音乐;C,添加背景噪声或语音;D,改变语音的语调;E,适应语音输入距离的变化。
6、如权利要求2所述的系统,其特征在于,所述控制部分还包括一电源开通复位模块,用于为整个装置提供复位信号。
7、如权利要求2所述的系统,其特征在于,所述DSP_IF中还包括命令寄存器组,供DSP访问以及供主处理器通过主控制接口访问,实现DSP与主处理器的通讯。
8、如权利要求2所述的系统,其特征在于,所述DSP_IF还用于进行总线切换,将所述主处理器通过主控制接口输出的外部程序或数据下载到所述存储模块中。
9、如权利要求2所述的系统,其特征在于,所述模数变换模块设置有多个,以接收多路麦克输入的语音信号。
CN200610011802A 2006-04-27 2006-04-27 一种语音处理系统 Expired - Fee Related CN100589182C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200610011802A CN100589182C (zh) 2006-04-27 2006-04-27 一种语音处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200610011802A CN100589182C (zh) 2006-04-27 2006-04-27 一种语音处理系统

Publications (2)

Publication Number Publication Date
CN1831941A true CN1831941A (zh) 2006-09-13
CN100589182C CN100589182C (zh) 2010-02-10

Family

ID=36994199

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610011802A Expired - Fee Related CN100589182C (zh) 2006-04-27 2006-04-27 一种语音处理系统

Country Status (1)

Country Link
CN (1) CN100589182C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079265B (zh) * 2007-07-11 2011-06-08 无锡中星微电子有限公司 一种语音信号处理系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3577798B2 (ja) * 1995-08-31 2004-10-13 ソニー株式会社 ヘッドホン装置
JP2000214866A (ja) * 1999-01-26 2000-08-04 Kobe Steel Ltd 小型音響情報処理装置
CN2424513Y (zh) * 2000-05-22 2001-03-21 清华大学 多功能语音识别记事本及大容量数字录音一体机
CN2453514Y (zh) * 2000-12-08 2001-10-10 姚远 数字集中语音记录设备
CN2507212Y (zh) * 2001-09-28 2002-08-21 北京安可尔通讯技术有限公司 抗噪声车载声控移动电话
CN2669314Y (zh) * 2003-11-12 2005-01-05 中国人民解放军总参谋部第六十三研究所 语音处理板

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101079265B (zh) * 2007-07-11 2011-06-08 无锡中星微电子有限公司 一种语音信号处理系统

Also Published As

Publication number Publication date
CN100589182C (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
CN1235160C (zh) 在专用信号处理器中用于饱和乘法和累加的方法和装置
CN108461081B (zh) 语音控制的方法、装置、设备和存储介质
US5857000A (en) Time domain aliasing cancellation apparatus and signal processing method thereof
Kim et al. Efficient implementation of the room simulator for training deep neural network acoustic models
CN100589182C (zh) 一种语音处理系统
Sinha Speech processing in embedded systems
CN113782044A (zh) 一种语音增强方法及装置
US11415658B2 (en) Detection device and method for audio direction orientation and audio processing system
CN1831942A (zh) 一种实现语音信号处理的装置
CN1664727A (zh) 多通道有源控制器
CN114863944B (zh) 一种低时延音频信号超定盲源分离方法及分离装置
CN1822092A (zh) 一种消除语音输入中背景噪声的方法及其装置
CN101977031B (zh) 一种时空均衡的数字滤波器优化设计方法
CN1812614A (zh) 于移动音讯平台下载固件的装置及方法
CN101288614A (zh) 基于谱扩展技术的电子耳蜗电话适配装置及方法
CN1440217A (zh) 一种基于fpga的5.1声道虚拟声重放方法以及装置
CN204480660U (zh) 一种计算机语音识别系统
Bandyopadhyay et al. Fpga based high frequency noise elimination system from speech signal using xilinx system generator
CN1741657A (zh) 具备内置记忆卡耳机的移动通信终端及其应用方法
CN100480985C (zh) 一种实现多路输入双路输出的数字信号选择合成电路
Martínez et al. Implementation of an adaptive noise canceller on the TMS320C31-50 for non-stationary environments
WO2023182765A1 (en) Speech enhancement method and device using fast fourier convolution
CN1595393A (zh) 实时音频编码器接口预处理软硬件系统及方法和用途
Rombouts et al. Fast QRD-lattice-based unconstrained optimal filtering for acoustic noise reduction
Krüger et al. A pc based platform for multichannel real-time audio processing

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100210

Termination date: 20120427