CN1831941A

CN1831941A - 一种语音处理系统

Info

Publication number: CN1831941A
Application number: CNA2006100118028A
Authority: CN
Inventors: 周政军; 房汝明
Original assignee: Vimicro Corp
Current assignee: Vimicro Corp
Priority date: 2006-04-27
Filing date: 2006-04-27
Publication date: 2006-09-13
Anticipated expiration: 2026-04-27
Also published as: CN100589182C

Abstract

本发明公开了一种语音处理系统，包括麦克风、主处理器和语音信号处理装置，所述语音信号处理装置接收麦克风输出的语音信号，经过处理后输入主处理器，主处理器通过控制信号接口实现对所述语音信号处理装置的过程控制和参数设置。采用本发明提供的语音处理系统，语音处理任务由一个专门的语音信号处理装置来完成，不需要和其他任务共用主处理器。增加新的语音处理功能不会增加主处理器的复杂度，也不需要大量修改主处理器的软件和硬件。另外，该语音信号处理装置可以工作在“直通模式”下，确保和现有系统结构的主处理器的兼容，同时该语音信号处理装置还可以支持多路麦克风输入。

Description

一种语音处理系统

技术领域

本发明涉及语音信号的处理，尤其涉及一种实现语音信号处理的系统。

背景技术

现有的包含语音处理功能的系统多采用图1所显示的结构，该结构将麦克风采集到的载有语音的电信号输入主处理器。随着电子技术的发展，目前主处理器除了要完成麦克风信号的处理还要完成语音信号的压缩、传输以及很多其他工作。我们已手机为例，目前的手机大多使用上面的结构，手机主处理器直接接收麦克风输入的语音信号，并对其进行处理。与此同时，主处理器还要完成很多其他任务如：接受键盘输入、输出图像到液晶显示屏、访问SD卡或闪存等外部存储器、处理GSM通讯协议等。

随着语音处理技术的发展，需要对麦克风输入的电信号做越来越多的处理。例如，人们经常在马路或超市等嘈杂环境使用手机，为了抑制环境噪音，需要用复杂的噪音消除方法对麦克风输入的电信号进行处理。在现有结构下，这些处理全部由主处理器完成，使得主处理器越来越复杂。另外语音处理任务需要与其他任务共享处理器，任务切换频繁且风险较高，很难确保语音处理工作实时、精确完成。

还有，为了将新的语音处理技术应用到旧的系统，在现有系统结构下很难实现。要在现有结构下添加新的语音处理技术，需要大量更改旧系统的主处理器上的处理软件。有时新技术对硬件的要求很高，原来的主处理器硬件不能满足要求，这时需要修改主处理器的硬件，这在很多时候是不能够实现的。

发明内容

本发明要解决的技术问题是提供了一种语音处理系统，对现有系统结构进行改进，将语音处理从主处理器分离出来，在完成现有系统的功能的同时，避免现有系统结构造成的问题。

为了解决上述技术问题，本发明提供了一种语音处理系统包括麦克风和主处理器，其特点是，还包括一语音信号处理装置，所述语音信号处理装置接收麦克风输出的语音信号，经过处理后交主处理器进行后续处理，所述主处理器通过控制信号接口实现对所述语音信号处理装置的过程控制和参数设置。

进一步地，上述系统还可具有以下特点：所述语音信号处理装置包括数据部分和控制部分，所述数据部分进一步包括模数变换模块、数字信号处理器接口模块DSP_IF、数字信号处理器DSP、存储模块和数模变换模块，其中：

所述模数变换模块用于接收麦克输入的模拟语音信号，变换为数字信号后输出到所述存储模块进行缓存；

所述存储模块用于缓存要输入DSP和DSP要输出的数据，DSP要运行的程序指令以及处理过程中使用和得到的数据；

所述DSP_IF用于提供DSP与所述存储模块之间，以及DSP与控制部分之间的通讯接口；

所述DSP用于运行程序指令，完成对输入语音信号的处理；

所述数模变换模块用于将处理后的语音数字信号取出并转换为模拟信号输出；

所述控制部分包括主控制接口，用于提供主处理器访问所述模数变换模块、数模变换模块，以及DSP_IF中的寄存器的接口。

进一步地，上述系统还可具有以下特点：所述存储模块进一步分为：输入缓存，用于缓存模数变换模块输出的数字信号；程序存储器，用于保存DSP要运行的程序指令；数据存储器，用于暂存DSP处理过程中从输入缓存取出的数据以及处理产生的结果数据；输出缓存，用于缓存DSP处理后的要输出的结果数据。

进一步地，上述系统还可具有以下特点：所述数据部分还包括一多路选择器，用于接收数模变换模块输出的处理后的模拟信号以及麦克输入的模拟语音信号，根据一旁路控制信号选择输出信号，在不需要语音信号处理装置工作时直接输出麦克输入的语音信号。

进一步地，上述系统还可具有以下特点：所述DSP用于实现以下功能中的一种或任意组合：A，消除平稳的背景噪声；B，消除背景语音或音乐；C，添加背景噪声或语音；D，改变语音的语调；E，适应语音输入距离的变化。

进一步地，上述系统还可具有以下特点：所述控制部分还包括一电源开通复位模块，用于为整个装置提供复位信号。

进一步地，上述系统还可具有以下特点：所述DSP_IF中还包括命令寄存器组，供DSP访问以及供主处理器通过主控制接口访问，实现DSP与主处理器的通讯。

进一步地，上述系统还可具有以下特点：所述DSP_IF还用于进行总线切换，将所述主控制接口输出的外部程序或数据下载到所述存储模块中。

进一步地，上述系统还可具有以下特点：所述模数变换模块设置有多个，以接收多路麦克输入的语音信号。

采用本发明提供的语音处理系统，语音处理任务由一个专门的语音信号处理装置来完成，不需要和其他任务共用主处理器。增加新的语音处理功能不会增加主处理器的复杂度，也不需要大量修改主处理器的软件和硬件。另外，该语音信号处理装置可以工作在“直通模式”下，确保和现有系统结构的主处理器的兼容，同时该语音信号处理装置还可以支持多路麦克风输入。

附图说明

图1为现有语音处理系统结构图；

图2为本发明实施例语音处理系统结构图；

图3是本发明实施例语音信号处理装置的电路图；

图4为本发明实施例多麦克风输入的结构图；

图5为本发明实施例语音处理系统直通模式工作示意图；

图6是利用图3中的语音信号处理装置实现背景音乐或语音消除过程的示意图。

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细说明。

参见图2，本实施例中语音处理系统包括麦克风、语音信号处理装置和主处理器。麦克风输出的语音信号输入到语音信号处理装置，该语音信号处理装置输出经过处理的语音信号给主处理器，主处理器通过语音信号处理装置的控制信号接口来实现对语音信号处理装置的过程控制和参数设置。

其中，语音信号处理装置包括数据部分和控制部分，参见图3。

数据部分包括模数变换(ADC)模块(带有存储器ADC MEM)、数字信号处理器接口(DSP_IF)模块、数字信号处理器(DSP)、程序存储器(P-MEM)、数据存储器(X-MEM)、输入缓存(In BUFFER)、输出缓存(Out BUFFER)、数模变换(DAC)模块(带有存储器DAC MEM)，以及多路选择器(MUX)。图中为了表示方便，将P-MEM、X-MEM、InBUFFER、Out BUFFER统一用P，X，Y MEM In&Out Buffer框表示。Y MEM表示DSP的另一数据存储器，在控制部分将会涉及。数字信号处理器接口模块可以根据需要选用现有产品，当有多路语音输入时，模数变换模块可以有多个。因此，该语音信号处理装置可以接收一个麦克风的输入也可以接收多个麦克风的输入，即使主处理器只能对一个麦克风的输入进行处理，该语音信号处理装置仍然可以接收多个麦克风的输入并将其合成为一个麦克风输出，参见图4。这样可以使语音信号处理装置完成复杂的麦克风阵列的处理，确保一些高效复杂语音处理算法可以在语音信号处理装置上实现。

麦克输入MIC IN经模数变换模块变换为16BIT的数字数据ADC OUT；该数据通过数字信号处理器接口模块存到输入缓存中；DSP通过DSP_IF模块与各存储器和控制部分通讯，从程序存储器中取指令，DSP运行取数据指令，将输入缓存中的数据取出并存到数据存储器中；DSP按数据处理算法运行指令，将处理后的数据存在数据存储器中的另一位置；DSP按一定速率将此数据通过DSP_IF存到输出缓存中；数模变换模块按输出采样率的频率周期性地将输出数据DSP_IF OUT从输出缓存中取出并将它变换成模拟信号输出到多路选择器；多路选择器的另一路输入为麦克输入MIC IN，并以主处理器提供的旁路信号BYPASS为控制信号，如果BYPASS信号为0，将数模变换模块的输出作为语音信号处理装置的输出信号DAC OUT，否则，将麦克输入MIC IN作为语音信号处理装置的输出信号DAC OUT交给主处理器处理。其作用是在不需要语音信号处理装置工作时直接输出语音，此时的语音信号处理装置工作于“直通模式”下，该语音信号处理装置不对麦克风信号做处理而直接将交给主处理器处理，如图5所示。

控制部分主要包括主控制接口(HIF)和电源开通复位(POR)模块。

主控制接口(HIF)提供了主处理器(HOST)访问ADC、DAC和DSP_IF模块中的寄存器的接口，达到控制各模块的目的；主处理器可通过主控制接口进行总线切换，将程序或数据下载到P MEM、X MEM或DSP的另一数据存储器Y MEM中；主处理器还可以通过主控制接口访问DSP_IF中的命令寄存器组，该组寄存器也可以被DSP访问，从而能实现与DSP的通讯；电源开通复位(POR)模块在1.8V电源上电时，为整个装置提供复位信号。

该控制信号接口可以使用多种方法实现，例如，可以用串行外设接口(SPI)、串口、内存接口等等。只要主处理器与语音信号处理装置之间有一个双方认可的协议，该协议能完成控制命令的发送和处理参数的设置即可。

根据DSP软件的不同，该语音信号处理装置能实现全部或部分的如下功能：(1)ONE-MIC算法：能消除平稳的背景噪声。(2)TWO-MIC算法：能消除背景语音或音乐。(3)ADD-NOISE算法：能添加背景噪声或语音。(4)PITCH-SCALE算法：能改变语音的语调，如将男声变女声，女声变男声。(5)DISTANCE-ADOPT算法：能适应语音输入距离的变化。不过，本发明的重点在语音信号处理装置的结构上，并不关心这些算法的具体处理流程。

下面以TWO-MIC算法为例介绍一下利用本装置实现背景音乐或语音消除的过程，如图6所示。

TWO-MIC算法利用一个麦克主要拾取说话者的语音信号VOICE，另一个麦克主要是拾取背景语音或音乐噪声NOISE；声波振动信号经过麦克拾取后变为模拟电信号MIC1 IN和MIC2 IN，此两路电信号经过模数变换模块ADC1和ADC2分别变换为数字信号ADC1 OUT和ADC2 OUT；DSP执行TWO-MIC算法，将语音和噪声数据处理后，生成清楚的无噪声数据并送给数模变换模块DAC；DAC将数字数据变换为模拟信号DAC OUT并送给说话者手机(MOBILE FOR TALKER)中的主处理器；说话者手机将信号通过无线方式(WIRELESS)传给听话者手机，这样听话者就清楚地听到了经过噪声去除的说话者语音。

Claims

1、一种语音处理系统，包括麦克风和主处理器，其特征在于，还包括一语音信号处理装置，所述语音信号处理装置接收麦克风输出的语音信号，经过处理后交主处理器进行后续处理，所述主处理器通过控制信号接口实现对所述语音信号处理装置的过程控制和参数设置。

2、如权利要求1所述的系统，其特征在于，所述语音信号处理装置包括数据部分和控制部分，所述数据部分进一步包括模数变换模块、数字信号处理器接口模块DSP_IF、数字信号处理器DSP、存储模块和数模变换模块，其中：

所述DSP用于运行程序指令，完成对输入语音信号的处理；

3、如权利要求2所述的系统，其特征在于，所述存储模块进一步分为：输入缓存，用于缓存模数变换模块输出的数字信号；程序存储器，用于保存DSP要运行的程序指令；数据存储器，用于暂存DSP处理过程中从输入缓存取出的数据以及处理产生的结果数据；输出缓存，用于缓存DSP处理后的要输出的结果数据。

4、如权利要求2所述的系统，其特征在于，所述数据部分还包括一多路选择器，用于接收数模变换模块输出的处理后的模拟信号以及麦克输入的模拟语音信号，根据一旁路控制信号选择输出信号，在不需要语音信号处理装置工作时直接输出麦克输入的语音信号。

5、如权利要求2所述的系统，其特征在于，所述DSP用于实现以下功能中的一种或任意组合：A，消除平稳的背景噪声；B，消除背景语音或音乐；C，添加背景噪声或语音；D，改变语音的语调；E，适应语音输入距离的变化。

6、如权利要求2所述的系统，其特征在于，所述控制部分还包括一电源开通复位模块，用于为整个装置提供复位信号。

7、如权利要求2所述的系统，其特征在于，所述DSP_IF中还包括命令寄存器组，供DSP访问以及供主处理器通过主控制接口访问，实现DSP与主处理器的通讯。

8、如权利要求2所述的系统，其特征在于，所述DSP_IF还用于进行总线切换，将所述主处理器通过主控制接口输出的外部程序或数据下载到所述存储模块中。

9、如权利要求2所述的系统，其特征在于，所述模数变换模块设置有多个，以接收多路麦克输入的语音信号。