CN1314000C

CN1314000C - 基于盲信号分离的语音增强装置

Info

Publication number: CN1314000C
Application number: CNB2004100670724A
Authority: CN
Inventors: 方勇; 刘盛鹏; 梁越
Original assignee: University of Shanghai for Science and Technology
Current assignee: Shanghai University; University of Shanghai for Science and Technology
Priority date: 2004-10-12
Filing date: 2004-10-12
Publication date: 2007-05-02
Anticipated expiration: 2024-10-12
Also published as: CN1648995A

Abstract

本发明涉及一种基于盲信号分离的语音增强装置。它主要由处理器，语音采集单元、语音输出单元和电源单元组成，语音采集单元为两路语音输入的混合语音输入单元，由一个时序合控制单元向各单元提供时钟信号和控制信号，混合语音采集单元采集的两路语音信号进入处理器，由处理器进行特征提取、语音对比分离、分离完成后，将分离语音输送到语音输出单元。移动终端采用本发明的装置，则一旦移动终端在嘈杂环境下进行语音通讯，可保持较好的通讯质量。

Description

基于盲信号分离的语音增强装置

技术领域

本发明涉及一种移动终端语音信号处理装置，特别是一种基于盲信号分离的语音增强装置。

背景技术

目前的移动终端(如手机)对语音信号非常敏感，人们在进行语音通信时，只需要较小的音量就可获得较好的语音通信。但移动终端对语音信号特别敏感这一优点有时也成为缺点，移动终端会容易受到来自周围环境乃包括其他讲话者的干扰，如果人们在嘈杂的声音环境中进行语音通信，接听者将接收到的是非常嘈杂的声音，从而使语音通信系统的质量和性能大大下降。如人们在商店里使用手机，除其他背景噪音外尤其要受到商店广播声和近距离其他讲话人的讲话声的干扰。

当待传输的语音受到环境噪声(包括其他讲话者)的影响时，就构成了混合语音。很多背景噪音由于与语音信号的频谱有比较明显的差异，可以用一般的滤波方法进行处理，然而，如果待传语音受到其他语音干扰时，由于各语音信号频谱特征相近，一般的语音减噪方法难以实现从混合语音中提取所需的原始语音信号。

发明内容

本发明的目的在于针对已有技术中存在的问题，提供一种基于盲信号分离的语音增强装置，能去除包括其他语音在内的各种干扰噪音的影响，使接收者接收到尽可能纯净的原始语音信号，保持较好的通话质量。

本发明的构思是：设计出的装置，能够针对现有的移动终端当待传输的语音信号受到其他语音信号干扰时，对此语音信号在传输之前对其进行去噪处理，通过语音分离和语音比对的方法从混合语音信号中提取纯净的待传输的语音信号，然后再进行传输，这样可去除包括其他语音在内的各种干扰噪音的影响，使接收者接收到尽可能纯净的原始语音信号。一旦移动终端在嘈杂环境中进行语音通信，可保持较好的通话质量。

在现有的移动终端语音信号被传输前进行预处理，尽可能去除包括其他语音在内的各种干扰噪音的影响，使移动终端即使在受到其他语音干扰时也能获得较好的语音通信质量。该预处理装置包括如下内容：

1)为满足混合语音实现盲分离的条件，用两个尽可能远离的麦克风，使移动终端具有双路混合语音接收的能力。

2)为解决盲分离问题当中的不确定性，在处理过程中采用了利用语音特征进行辅助分离的方法，语音特征存储器预先存储说话人特定的语音特征，它的使用使得处理更加快捷有效。

3)混合语音信号进入语音增强芯片处理器进行语音去噪处理，输出处理后的语音信号进行传输，使接收者接收到的信号的信噪比提高5dB以上。

根据上述的发明构思，本发明采用下述技术方案：

一种基于盲信号分离的语音增强装置，包括一个处理器，对语音信号分离去噪处理、一个语音采集单元、一个语音输出单元、一个电源单元，对装置的各单元提供直流工作电源，其特征在于：语音采集单元为混合语音采集单元，其输入端与两路语音输入相连，而输出端经一个输入缓冲器与处理器相连；处理器的输出经一个输入缓冲器与语音输出单元相连；一个时序和控制单元分别与混合语音采集单元、处理器和语音输出单元相连；处理器连接一个数据存储器、一个FIASH存贮器和一个装置调试用的JTAG接口，时序和控制单元同时分别与输入缓冲器、数据存储器、FIASH存贮器和输出缓冲器相连；在时序和控制单元产生的时钟信号和控制信号作用下，混合语音采集单元采集的两路语音信号进入处理器，处理器进行特征提取、语音对比分离、分离完成后，将分离语音输送到语音输出单元。

上述的处理器采用TMS320C6416处理器，其数据总线BED[0-7]和AED[32-63]连接存储器数据线，其地址总线BEA[1-20]和AEA[3-22]连接存储器地址线，其引脚E2(DXO)连接语音输出单元、引脚D2(DRO)连接混合语音采集单元，TMS320C6416处理器分别连通从时序和控制单元来的时序和控制信号及从电源单元来的电源信号；混合语音信号在TMS320C6416进行特征提取和半盲信号分离，特征提取和语音对比分离过程中的中间数据经地址线寻址，由数据总线存储到存储器中。

上述的混合语音采集单元的结构是：两个麦克风通过各自的放大器分别连到一块PCM3002型芯片的引脚和6脚，PCM3002型芯片的12脚连接到TMS320C6416处理器的D2引脚，从时序和控制单元来的信号连接到PCM3002型芯片上；在时序和控制单元来的时钟和控制信号作用下，两支麦克风产生的电信号分别经过放大输入PCM3002型芯片，在其内进行A/D转换，然后输出到TMS320C6416处理器的D2引脚。

上述的时序和控制单元采用EPM3128ATC100芯片，向整个装置的各单元提供时钟和控制信号，接入3V电源供其工作。

上述的数据存储器采用MT48LC32B2T6型存储器，FLASH存储器采用AM29LV400型存储器；FLASH存储器的AM29LV400数据总线PD[7-0]连接TMS320C6416处理器的数据线，地址总线PA[19-0]连接TMS320C6416处理器的地址线，数据存储器MT48LC32B2TG数据总线DD[31-0]连接TMS320C6416处理器的数据线，地址总线DA[19-0]连接TMS320C6416处理器的地址线；两存储器与时序和控制单元相连；在系统程序下载的时候，程序代码通过地址线PA[19-0]寻址，经数据总线PD[7-0]下载到FIASH存储器AM29LV400中；处理过程中的中间数据则通过地址总线DA[9-0]寻址，经数据总线DD[31-0]存放到数据存储器MT48LC2M32B2TG中。

上述的语音输出单元采用一块PCM3002型芯片，其引脚15连接TMS320C6416处理器的E2输出，而输出引脚19经一个放大器同语音输出设备相连；从时序和控制单元来的信号同PCM3002芯片相连；在时序和控制单元提供的时序和控制信号作用下，TMS320C6416处理器的E2输出的分离语音信号经PCM3002芯片的引脚15输入，在002芯片中进行D/A转换，然后从19引脚输出，经放大器放大后输到语音输出设备。

本发明与现有技术相比，具有如下显而易见的突出的实质性特点和显著的优点：在本发明中采用混合语音采集单元，由两个保持有效距离的麦克风对混合语音采集单元输入传输的语音信号和周围其它语音干扰信号，在处理器中先进行语音分离，再通过输入语音与语音特征存储器中存储的语音特征进行语音对比方法，从混合语音信号中提取纯净的待传输信号，然后进行传输，这样就去除包括其他语音在内的各种干扰噪音的影响，使接收者收到尽可能纯净的原始语音信号。采用本发明的移动终端，一旦移动终端在嘈杂环境中进行语音通讯，可保持较好的通讯质量。

附图说明

图1是本发明的一个实施例的装置系统框图。

图2是图1示例中混合语音采集单元的电路框图

图3是图1示例中处理器的电路框图

图4是1示例中时序和控制单元的电路框图

图5是1示例中存储器的电路框图

图6是1示例中电源单元的电路框图

图7是1示例中语音输出单元的电路框图

具体实施方式

本发明的一个优选实施例是：参见图1，本基于盲信号分离的语音增强装置主要由混合语音采集单元1、处理器5、存储器单元(包括数据存储器3和FLASH存储器9)、时序和控制单元8、电源单元10和语音输出单元7组成。

语音采集单元1一端与两路语音输入相连，另一端连到输入缓冲器4；TMS320C6416处理器5分别与JTAG接口2、数据存储器3、FLASH存储器9、输入缓冲器4和输出缓冲器7相连；语音输出单元7一端与输出缓冲器7相连，另一端产生语音输出；时序和控制单元8分别和语音采集单元1、数据存储器3、FLASH存储器9、语音输出单元7、TMS320C6416处理器5、输入缓冲器4和输出缓冲器7相连。

在时序和控制单元8产生的时钟信号和控制信号作用下，语音采集单元1采集的两路语音信号进入输入缓冲器4后，再进入TMS320C6416处理器5，在此进行特征提取、语音对比分离，分离完成后，将分离语音经输出缓冲器6输出到语音输出单元7。另外，JTAG接口2是系统调试用的，而电源单元10则向所有单元提供所需要的电源信号。

混合语音采集单元1从两个传声器(麦克风)采集两路混合语音信号，为后面的语音对比半盲分离提供两路混合信号；处理器5是整个系统的核心部分，通过语音对比分离方法和语音特征存储器提供的语音特征进行信号分离。；存储器单元3、9是存储处理器送来的预先提取的纯正语音信号特征以及分离过程中的中间数据；时序和控制单元8是为TMS320C6146处理器5及其外围设备和其他各部分提供时钟和控制信号，使系统协同一致工作；电源单元10提供系统所需的各种电源信号；语音输出单元7输出分离后的语音信号。

参见图2，混合语音采集单元1的结构是：两个麦克风通过各自的放大器分别连到PCM3002芯片的3脚和6脚，PCM3002芯片的12脚连接到TMS320C6416处理器5的D2引脚；从时序和控制单元8来的信号连接到PCM3002芯片上。

两个麦克风产生的电信号分别经过10倍放大器的放大，然后在时序和控制单元8来的时钟和控制信号的作用下，输入到PCM3002芯片的的3脚和6脚，在PCM3002芯片内进行A/D转换，转换后的数字信号输出到TMS320C6416处理器5的D2引脚。

参见图3，TMS320C6416处理器5的数据总线BED[0-7]和AED[32-63]连接存储器单元3、9中数据线；地址总线BEA(1-20)和AEA(3-22)连接存储器单元3、9中地址线；引脚E2(DXO)连接语音输出单元7中PCM3002芯片的15引脚；引脚D2(DRO)连接语音采集单元1中PCM3002芯片的12引脚；从时序和逻辑控制单元8来的时序和控制信号和从电源单元10来的电源信号分别和TMS320C6416处理器5相连。

在时序和逻辑控制单元8来的时序和控制信号的作用下，语音采集单元1中PCM3002芯片的12引脚输出的数字信号经TMS320C6416处理器5引脚D2(DRO)进入TMS320C6416处理器5，混合语音信号在这里进行特征提取和语音对比分离。特征提取和语音对比分离过程中的中间数据经地址总线寻址，由数据总线存储到存储单元3、9中。

参见图4，到输入和输出单元PCM3002芯片的时序和控制信号、到TMS302C6416处理器5的时序和控制信号、到存储器单元3、9的时序和控制信号和3.3V电源10分别与时序和控制单元8的EPM3128ATC100芯片相连。

时序和控制单元主要是向整个装置提供时钟和控制信号。该单元需要3.3V电源，产生输入和输出单元PCM3002芯片所需要的时序和控制信号、TMS302C6416处理器5所需要的时序和控制信号和存储器单元3、9所需要的时序和控制信号。

参见图5，FLASH存储器9的AM29LV400芯片的数据总线PD[7..0]连接TMS320C6416处理器5中的数据线，地址总线PA[19..0]连接TMS320C6416处理器5中的地址线；数据存储器3的MT48LC2M32B2TG芯片的数据总线DD[31..0]连接TMS320C6416处理器5中的数据线，地址总线DA[19..0]连接TMS320C6416处理器5中的地址线。本单元还和时序和控制单元8相连。

在系统程序下载的时候，程序代码通过地址总线PA[19..0]寻址，经数据总线PD[7..0]下载到FLASH存储器9的AM29LV400芯片中。而处理过程中的中间数据则是通过地址总线DA[19..0]寻址，经数据总线DD[31..0]存放到数据存储器3的MT48LC2M32B2TG芯片中的。当然了，这些都是在时序和控制单元8提供的时序和控制信号作用下进行的。

参见图6，电源单元10的电路是：电源芯片PT6392C的引脚[4、5、6]连接5V输入电源，引脚[12、13、14、15]连接3.3V输出，引脚[18、19、20、21]连接1.2V输出。

本单元10主要是由这一PT6392C电源芯片组成。有外部电源向本电源单元10提供5V电源信号，经本单元10转换，输出装置所需要的3.3V和1.2V电源信号。

参见图7，语音输出单元7的电路是：一块PCM3002芯片的引脚15连接从TMS320C6416处理器5的E2输出的信号，引脚19通过一个放大器同语音输出设备相连；从时序和控制单元8来的信号同PCM3002芯片相连。

在时序和控制单元8向本单元7提供的时序和控制信号作用下，从TMS320C6416处理器5的E2输出的分离语音信号(数字信号)经PCM3002芯片的引脚15进入语音输出单元7，在PCM3002芯片中进行D/A转换，然后从19引脚输出，输出信号再经放大器放大后输出到语音输出设备。

Claims

1.一种基于盲信号分离的语音增强装置，包括：一个处理器(5)，对语音信号分离去噪处理；一个语音采集单元(1)、一个语音输出单元(7)、一个电源单元(10)，对装置的各单元提供直流工作电源，其特征在于：语音采集单元(1)为混合语音采集单元，其输入端与两路语音输入相连，而输出端经一个输入缓冲器(4)与处理器(5)相连；处理器(5)的输出经一个输入缓冲器(6)与语音输出单元(7)相连；一个时序和控制单元(8)分别与混合语音采集单元(1)、处理器(5)和语音输出单元(7)相连；处理器(5)连接一个数据存储器(3)、一个FIASH存贮器(9)和一个装置调试用的JTAG接口，时序和控制单元(8)同时分别与输入缓冲器(4)、数据存储器(3)、FIASH存贮器(9)和输出缓冲器(4)相连；在时序和控制单元(8)产生的时钟信号和控制信号作用下，混合语音采集单元(1)采集的两路语音信号进入处理器(5)，处理器(5)进行特征提取、语音对比分离、分离完成后，将分离语音输送到语音输出单元(7)。

2.根据权利要求1所述的基于盲信号分离的语音增强装置，其特征在于处理器(5)采用TMS320C6416处理器，其数据总线BED[0-7]和AED[32-63]连接存储器(3、9)数据线，其地址总线BEA[1-20]和AEA[3-22]连接存储器(3、9)地址线，其引脚E2(DXO)连接语音输出单元(7)、引脚D2(DRO)连接混合语音采集单元(1)，TMS320C6416处理器(5)分别连通从时序和控制单元(8)来的时序和控制信号及从电源单元(10)来的电源信号；混合语音信号在TMS320C6416处理器(5)进行特征提取和半盲信号分离，特征提取和语音对比分离过程中的中间数据经地址线寻址，由数据总线存储到存储器(3、9)中。

3.根据权利要求1所述的基于盲信号分离的语音增强装置，其特征在于混合语音采集单元(1)的结构是：两个麦克风通过各自的放大器分别连到一块PCM3002型芯片的3脚和6脚，PCM3002型芯片的12脚连接到TMS320C6416处理器(5)的D2引脚，从时序和控制单元(8)来的信号连接到PCM3002型芯片上；在时序和控制单元(8)来的时钟和控制信号作用下，两支麦克风产生的电信号分别经过放大输入PCM3002型芯片，在其内进行A/D转换，然后输出到TMS320C6416处理器(5)的D2引脚。

4.根据权利要求1所述的基于盲信号分离的语音增强装置，其特征在于时序和控制单元(8)采用EPM3128ATC100芯片，向整个装置的各单元提供时钟和控制信号，接入3V电源供其工作。

5.根据权利要求1所述的基于盲信号分离的语音增强装置，其特征在于数据存储器(3)采用MT48LC32B2TG型存储器，FLASH存储器(9)采用AM29LV400型存储器；FLASH存储器(9)AM29LV400数据总线PD[7-0]连接TMS320C6416处理器(5)的数据线，地址总线PA[19-0]连接TMS320C6416处理器(5)的地址线，数据存储器(3)MT48LC32B2TG数据总线DD[31-0]连接TMS320C6416处理器(5)的数据线，地址总线DA[19-0]连接TMS320C6416处理器(5)的地址线；两存储器(3、9)与时序和控制单元相连；在系统程序下载的时候，程序代码通过地址线PA[19-0]寻址，经数据总线PD[7-0]下载到FIASH存储器AM29LV400(9)中；处理过程中的中间数据则通过地址总线DA[9-0]寻址，经数据总线DD[31-0]存放到数据存储器MT48LC2M32B2TG(3)中。

6.根据权利要求1所述的基于盲信号分离的语音增强装置，其特征在于语音输出单元(7)采用一块PCM3002型芯片，其引脚15连接TMS320C6416处理器(5)的E2输出，而输出引脚19经一个放大器同语音输出设备相连；从时序和控制单元(8)来的信号同PCM3002芯片相连；在时序和控制单元(8)提供的时序和控制信号作用下，TMS320C6416处理器(5)的E2输出的分离语音数字信号经PCM3002芯片的引脚15输入，在PCM3002芯片中进行D/A转换，然后从19引脚输出，经放大器放大后输到语音输出设备。