CN101315772A - 基于维纳滤波的语音混响消减方法 - Google Patents
基于维纳滤波的语音混响消减方法 Download PDFInfo
- Publication number
- CN101315772A CN101315772A CNA200810040707XA CN200810040707A CN101315772A CN 101315772 A CN101315772 A CN 101315772A CN A200810040707X A CNA200810040707X A CN A200810040707XA CN 200810040707 A CN200810040707 A CN 200810040707A CN 101315772 A CN101315772 A CN 101315772A
- Authority
- CN
- China
- Prior art keywords
- reverberation
- signal
- voice
- dereverberation
- frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
Abstract
基于维纳滤波的语音混响消减方法,属于语音信号处理技术领域。本发明方法包括输入处理、混响分析、混响处理和输出处理四个步骤,输入处理是对语音信号进行采样、端点检测和分帧。混响分析是对起始音及其混响信号进行第一次反卷积运算,得到混响环境的房间冲击响应信息。混响处理是基于房间冲击响应信息对混响信号进行滤波,即第二次反卷积运算,得到去混响信号。输出处理是对去混响信号进行语音重构并进行数模转换、信号传输,以及记录去混响评测指标。本发明去混响效果良好,计算强度较低,且具有较好的实时性。
Description
技术领域
本发明涉及一种语音混响消减方法,特别是一种基于维纳滤波的语音混响消减方法,属于语音信号处理技术领域。
背景技术
声音易受到混响的影响。例如,在房间中,语音信号由墙、天花板或地板反射,因此房间中存在的麦克风将接收到直接信号和通过反射面接收到的间接信号组合的声信号。该间接信号被称为所接收信号的混响部分。在手机的使用中,当通话环境比较狭小时,比如在浴室,电梯里,容易产生混响,混响严重时,会导致说话不清,导致通讯障碍。在许多其它场合,混响往往也带来干扰,导致声学接收系统性能变差。例如,混响会导致语音识别系统性能显著下降,在远程会议、振动声学、声纳通信和海洋声学中,混响也主要带来负面影响。当混响严重时,这些系统甚至无法正常发挥功能。因此,如何减少混响对声音接收系统的影响是一个非常重要的课题。
现有的信号处理系统试图通过盲反卷积来降低混响。盲反卷积(blinddeconvolution)试图估计房间、办公室或其它混响信号环境的传递函数。感知的信号被用于一个反向滤波器(inverse filter)以估计原始信号。盲反卷积试图通过确定的信号环境传递函数,正确地恢复原始信号。该处理是极其复杂的,是高强度的计算技术。同样地,它不能适用于如提供了实时响应的移动电话的一些设备,或不能适用于不能为盲反卷积提供足够的处理资源的一些设备。
已有技术中,申请号为200510125838.4、名称为“混响估计和抑制系统”的发明专利,提出一种信号处理系统检测混响,并对混响信号进行抑制。它对输入信号的频带进行分析以确定混响特征是否存在。当检测到混响时,便衰减混响频带,以降低或消除混响。申请号为200580024631.6、名称为“音频信号去混响”的发明专利,提出一种估计声信号中混响的方法。它首先确定信号的频谱,通过提供指示所述信号的混响部分随时间衰减的第一参数,提供指示所述信号的直接部分对于混响部分的幅值的第二参数,使用先前帧的频谱、第一参数和第二参数产生混响信号的估计频谱。上述两种发明专利均是对混响信号的频谱进行分析,确定混响特征,以达到对混响的消减,在处理、计算的的简易程度上要好于盲反卷积去混响,但是从混响消减的效果上来讲,仅依靠对混响信号频谱的分析,去混响效果仍需进一步改善。
发明内容
为了克服现有技术的不足和缺陷,本发明提供一种语音信号去混响的新方法,该方法能有效消减房间环境中产生的混响信号。适用信号包括在封闭浴室、电梯、大型空旷礼堂等混响环境下的语音信号,特别适用于移动通讯中的去混响。
该混响消减方法包括两次反卷积运算,分别求出混响环境的房间冲击响应和去混响后的语音信号。不同于盲反卷积,该去混响系统计算强度较低,且有较好的时效性,故本发明可被实现为实时信号处理系统或脱机的系统。
该混响消减方法是一种基于维纳滤波来进行语音去混响的新方法。由于每次在进行移动通信时,一般都会以“喂”或者“hi”、“hello”开始,因此,便可以在移动通讯器材中预存纯净语音信号“喂”、“hi”等,在混响环境下进行通信,如打手机时,也以“喂”、“hi”等字开始,这样便知道“喂”字等的纯净语音信号和混响语音信号,通过维纳滤波反卷积运算可得混响环境的房间冲击响应;然后当说话者对着手机发出其他声音时,就已知混响环境的冲击响应和混响语音信号,利用已知混响的房间冲击响应信息,经过第二次反卷积运算就可以获得去混响后的语音信号。
本发明是通过下述技术方案实现的,本发明方法包括输入处理、混响分析、混响处理和输出处理四个步骤,具体说明如下:
1、输入处理:首先预存纯净起始语音信号,然后接收混响信号,混响信号可以是一个麦克风输入信号或表现出声混响效果的其它输入信号。在具体实施中,可采用麦克风等语音采集工具采集语音信号。在此步骤中,输入处理主要执行预处理任务,即对该信号采样、端点检测和分帧,为后续分析和处理做准备。
2、混响分析:混响分析主要是根据经过预处理的纯净起始音及其混响信号,基于维纳滤波反卷积算法得出混响环境的房间冲击响应信息,以维纳反滤波因子的形式输出到下一步混响处理单元中进行滤波去混响,其中每输入一次纯净起始音的混响信号就能得到一组维纳反滤波因子,当对语音质量要求较高,或者一组维纳反滤波因子不能达到去混响要求,即不能获得足够多房间冲击响应信息时,可将房间冲击响应信息进行整合,信息整合可采用平均或加权方法。
3、混响处理:用于消减混响信号中的混响。利用步骤2混响分析中得到的反滤波因子,对混响信号进行滤波得到去混响信号。
4、输出处理:输出处理主要对去混响后的信号进行语音重构和后处理,如混响消减信号进行数模转换、信号传输,以及记录去混响评测指标。
本发明的有益效果:本发明方法的计算强度较低,且混响消减效果较为理想,这是因为已知纯净起始音和起始音的房间混响,可求得较为完整的房间冲击响应信息,即维纳反滤波因子。另外,由于本方法基于维纳滤波,有较快的递推解法,故有较好的实时性。整个语音混响消减方法目前可在个人电脑中由计算机程序实现。该方法可被实现为执行存储器上存储指令的一个数字信号处理器。可处理信号的数字样本,或可自己将模拟输入信号数字化,用于混响消减,使硬件执行混响消减的指令可被存储在机器可读介质上,如磁盘,闪存或其它存储器。
附图说明
图1是本发明混响消减方法的流程框图;
图2是本发明输入处理流程框图;
图3是本发明混响分析流程框图;
图4是本发明混响处理和输出处理流程框图;
图5是″one″语音大型空旷礼堂混响环境下去混响效果图:
具体实施方式
下面结合附图,以大型空旷礼堂为混响环境,纯净语音信号“hi”为起始音,对混响信号“one”进行去混响,对本发明的具体实施作进一步描述。
如图1、图2、图3、图4所示,本发明去混响方法包括下述四个步骤:
1、输入处理1:预存纯净语音信号“hi”,然后通过麦克风采集语音信号“hi”的混响信号和语音信号“one”的混响信号。信息采集后即执行预处理,对“hi”、“one”信号采样、端点检测和分帧。
采样单元100以选择的采样频率把语音信号“hi”及其混响信号、以及混响信号“one”的模拟信号通过模数转换模块转化为数字信号。采样频率的选择以能捕捉足够多的语音信息为标准,对于语音,采样频率是8KHz到11KHz或更高。
端点检测单元102对数字形式的语音信号“hi”及其混响信号,以及混响信号“one”进行端点检测,识别每个字节的起始点位置,排除无语音段,仅保留包含有语音段信息的单个字节信号,传送到字存储单元104中,分别存放。这是因为,经过研究,排除语音信号的无语音段,而仅对有语音段进行分析处理,去混响效果可以明显改进。该步骤使用计算机由软件实现。
分帧单元112接收来自字存储单元104中的语音信息,将端点检测后的语音信号“hi”及其混响信号,以及混响信号“one”进行分帧。帧长大约为20到30ms,相邻两帧起始点之间间隔为10ms,即两帧之间有10到20ms的交叠。对于10KHz采样频率,30ms的帧长对应300点,10ms的帧移为100点。分帧时加汉明窗。
2、混响分析2:混响分析单元根据经过预处理的纯净语音信号“hi”和其混响信号,基于维纳滤波算法,即第一次反卷积运算214得出混响环境的房间冲击响应信息,以维纳反滤波因子216的形式储存,维纳反滤波因子216由下式求得:
其中ht即为维纳反滤波因子216,(m+1)为滤波因子ht的长度,上式的左端为“hi”混响信号的自相关函数rxx(l)组成的矩阵,称为托布里兹矩阵。右端rsx(l)为“hi”语音混响信号和纯净信号的互相关函数。上式即称为托布里兹方程212,有较快递推解法。
然后,将维纳反滤波因子ht216输送到混响处理3进行去混响处理。当对语音质量要求较高,即单组维纳反滤波因子ht216不能满足去混响要求时,可多次输入“hi”语音的混响信号或其它起始音,诸如“hello”、“喂”的混响信号,求得多组维纳反滤波因子ht216,然后将维纳反滤波因子ht216传送至信息整合5,对混响环境的房间冲击响应信息进行整合,再将房间冲击响应信息,即维纳反滤波因子ht216传送到混响处理3进行去混响处理。信息整合可采用平均或加权方法。
3、混响处理3:混响处理3利用混响分析2中得到的维纳反滤波因子ht216对混响信号“one”进行滤波,即第二次反卷积运算322,滤波时以维纳反滤波因子ht216作为滤波器系数,使用滤波程序myfilter函数滤波,得到去混响信号“one”输入输出处理单元4然后执行后处理。其中滤波程序myfilter函数是基于差分方程的递推解法,参考MATLAB内部程序filter函数编出。
4、输出处理4:输出处理4用于对去混响后的信号“one”进行语音重构和后处理。由于经过混响处理后的信号是一组组的帧信号,因此需要对语音进行重构,恢复原始信号。后处理主要是对混响消减信号的数模转换或信号传输,以及记录去混响评测指标。
经混响处理3滤波后的语音信号“one”进入输出处理4,经语音重构402重构语音,主要是帧与帧之间的串接,如果是多字节语音的去混响,语音重构402还包括字节与字节之间的连接。该步骤是分帧和端点检测的逆运算,由计算机软件实现。输出处理4经由信息输出404进入数模转换模块传输去混响后的语音信号,并由扬声器或耳机等发出去混响后的语音,该步骤可由计算机实现。评测单元406中储存去混响度评测指标的一些信息,包括时域信混噪比改善指标ΔSRNR,线性预测倒谱系数距离改善指标ΔLPCC、MEL频率倒谱系数距离改善指标ΔMFCC,其中ΔLPCC、ΔMFCC为两种频域客观评测系数,是谱失真测度。由这些指标可以更好的了解语音的去混响效果,指标由显示屏显示。
图5是以“hi”为起始音,“one”为混响信号,在大型空旷礼堂混响情况下的去混响效果波形图。
由图5可以看出,本方法的混响消减效果较为理想,这是因为已知纯净起始音和起始音的房间混响,可求得较为完整的房间冲击响应信息,即维纳反滤波因子ht216。另外,由于本方法基于维纳滤波,有较快的递推解法,故本方法有较好的实时性。
Claims (5)
1.一种基于维纳滤波的语音混响消减方法,其特征在于,该方法包括下述步骤:
步骤1、输入处理(1):首先预存纯净起始语音信号,采集混响信号,通过采样单元(100)、端点检测单元(102)、字存储单元(104)和分帧单元(112)对该信号采样、端点检测、存储和分帧;
步骤2、混响分析(2):对经过预处理的纯净起始音及其混响信号,基于维纳滤波反卷积,即第一次反卷积运算(214)得出混响环境的房间冲击响应信息,以维纳反滤波因子(216)的形式输出,每输入一次纯净起始音的混响信号就能得到一组维纳反滤波因子(216),房间冲击响应信息通过平均或加权方法进行整合;
步骤3、混响处理(3):利用步骤2混响分析中得到的维纳反滤波因子(216),进行第二次反卷积运算(322),通过滤波单元(320)对混响信号进行滤波得到去混响信号;
步骤4、输出处理(4):对去混响信号进行语音重构(402),并进行数模转换、信号传输,以及记录去混响评测指标。
2.根据权利要求1所述的基于维纳滤波的语音混响消减方法,其特征是所述的步骤1中,采样单元(100)中采样频率的选择以能捕捉足够多的语音信息为标准,对于语音,采样频率在8KHz到11KHz范围内或更高;端点检测单元(102)识别每个字节的起始点位置,排除无语音段,保留包含有语音段信息的单个字节信息,并将单个字节信息送入字存储单元(104);分帧单元(112)将端点检测后的语音信号进行分帧,并将子帧信息送入帧存储单元(204),帧长大约为20到30ms,相邻两帧起始点之间间隔为10ms,即两帧之间有10到20ms的交叠,对于10KHz采样频率,30ms的帧长对应300点,10ms的帧移为100点,分帧时加汉明窗。
3.根据权利要求1所述的基于维纳滤波的语音混响消减方法,其特征是所述的步骤2中,维纳反滤波因子(216)由托布里兹方程(212)求得。
4.根据权利要求1所述的基于维纳滤波的语音混响消减方法,其特征是所述的步骤3中,滤波时以维纳反滤波因子(216)作为滤波器系数,使用myfilter函数滤波,其中myfilter函数是基于差分方程的递推解法,参考MATLAB内部程序filter函数编出。
5.根据权利要求1所述的基于维纳滤波的语音混响消减方法,其特征是所述的步骤4中,语音重构(402),主要是帧与帧之间的串接,如果是多字节语音的去混响,语音重构还包括字节与字节之间的连接,该步骤是分帧和端点检测的逆运算;经过数模转换模块处理后的语音信号,由扬声器或耳机传至人耳;评测单元(406)对去混响度进行评测,评测指标包括时域信混噪比改善指标ΔSRNR,线性预测倒谱系数距离改善指标ΔLPCC、MEL频率倒谱系数距离改善指标ΔMFCC,其中ΔLPCC、ΔMFCC为两种频域客观评测系数,是谱失真测度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810040707XA CN101315772A (zh) | 2008-07-17 | 2008-07-17 | 基于维纳滤波的语音混响消减方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CNA200810040707XA CN101315772A (zh) | 2008-07-17 | 2008-07-17 | 基于维纳滤波的语音混响消减方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101315772A true CN101315772A (zh) | 2008-12-03 |
Family
ID=40106755
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200810040707XA Pending CN101315772A (zh) | 2008-07-17 | 2008-07-17 | 基于维纳滤波的语音混响消减方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101315772A (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101950563A (zh) * | 2010-08-20 | 2011-01-19 | 东南大学 | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 |
CN102158199A (zh) * | 2010-12-31 | 2011-08-17 | 意法·爱立信半导体(北京)有限公司 | 时变系统中预存储滤波器系数组的选择方法及装置 |
WO2013189199A1 (zh) * | 2012-06-18 | 2013-12-27 | 歌尔声学股份有限公司 | 一种单通道语音去混响的方法和装置 |
CN105245991A (zh) * | 2015-10-26 | 2016-01-13 | 汪国印 | 一种头戴式k歌耳机及k歌处理方法 |
CN105989850A (zh) * | 2016-06-29 | 2016-10-05 | 北京捷通华声科技股份有限公司 | 一种回声对消方法及装置 |
CN106558315A (zh) * | 2016-12-02 | 2017-04-05 | 深圳撒哈拉数据科技有限公司 | 异质麦克风自动增益校准方法及系统 |
CN108141691A (zh) * | 2015-10-14 | 2018-06-08 | 华为技术有限公司 | 自适应混响消除系统 |
CN108986799A (zh) * | 2018-09-05 | 2018-12-11 | 河海大学 | 一种基于倒谱滤波的混响参数估计方法 |
CN109712637A (zh) * | 2018-12-21 | 2019-05-03 | 珠海慧联科技有限公司 | 一种混响抑制系统及方法 |
CN112562740A (zh) * | 2020-11-25 | 2021-03-26 | 厦门亿联网络技术股份有限公司 | 一种噪声消除测试方法、系统、音视频设备和存储介质 |
CN112820311A (zh) * | 2021-04-16 | 2021-05-18 | 成都启英泰伦科技有限公司 | 一种基于空间预测的回声消除方法及装置 |
CN112863536A (zh) * | 2020-12-24 | 2021-05-28 | 深圳供电局有限公司 | 环境噪声提取方法、装置、计算机设备和存储介质 |
CN112997249A (zh) * | 2018-11-30 | 2021-06-18 | 深圳市欢太科技有限公司 | 语音处理方法、装置、存储介质及电子设备 |
-
2008
- 2008-07-17 CN CNA200810040707XA patent/CN101315772A/zh active Pending
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101950563A (zh) * | 2010-08-20 | 2011-01-19 | 东南大学 | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 |
CN101950563B (zh) * | 2010-08-20 | 2012-04-11 | 东南大学 | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 |
CN102158199A (zh) * | 2010-12-31 | 2011-08-17 | 意法·爱立信半导体(北京)有限公司 | 时变系统中预存储滤波器系数组的选择方法及装置 |
WO2012089140A1 (zh) * | 2010-12-31 | 2012-07-05 | 意法·爱立信半导体(北京)有限公司 | 时变系统中预存储滤波器系数组的选择方法及装置 |
WO2013189199A1 (zh) * | 2012-06-18 | 2013-12-27 | 歌尔声学股份有限公司 | 一种单通道语音去混响的方法和装置 |
CN108141691A (zh) * | 2015-10-14 | 2018-06-08 | 华为技术有限公司 | 自适应混响消除系统 |
CN108141691B (zh) * | 2015-10-14 | 2020-12-01 | 华为技术有限公司 | 自适应混响消除系统 |
CN105245991A (zh) * | 2015-10-26 | 2016-01-13 | 汪国印 | 一种头戴式k歌耳机及k歌处理方法 |
CN105989850A (zh) * | 2016-06-29 | 2016-10-05 | 北京捷通华声科技股份有限公司 | 一种回声对消方法及装置 |
CN106558315A (zh) * | 2016-12-02 | 2017-04-05 | 深圳撒哈拉数据科技有限公司 | 异质麦克风自动增益校准方法及系统 |
CN108986799A (zh) * | 2018-09-05 | 2018-12-11 | 河海大学 | 一种基于倒谱滤波的混响参数估计方法 |
CN112997249A (zh) * | 2018-11-30 | 2021-06-18 | 深圳市欢太科技有限公司 | 语音处理方法、装置、存储介质及电子设备 |
CN112997249B (zh) * | 2018-11-30 | 2022-06-14 | 深圳市欢太科技有限公司 | 语音处理方法、装置、存储介质及电子设备 |
CN109712637A (zh) * | 2018-12-21 | 2019-05-03 | 珠海慧联科技有限公司 | 一种混响抑制系统及方法 |
CN109712637B (zh) * | 2018-12-21 | 2020-09-22 | 珠海慧联科技有限公司 | 一种混响抑制系统及方法 |
CN112562740A (zh) * | 2020-11-25 | 2021-03-26 | 厦门亿联网络技术股份有限公司 | 一种噪声消除测试方法、系统、音视频设备和存储介质 |
CN112863536A (zh) * | 2020-12-24 | 2021-05-28 | 深圳供电局有限公司 | 环境噪声提取方法、装置、计算机设备和存储介质 |
CN112820311A (zh) * | 2021-04-16 | 2021-05-18 | 成都启英泰伦科技有限公司 | 一种基于空间预测的回声消除方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101315772A (zh) | 基于维纳滤波的语音混响消减方法 | |
CN1197422C (zh) | 用于移动终端和其他设备的声音接近检测 | |
US9666183B2 (en) | Deep neural net based filter prediction for audio event classification and extraction | |
EP1547061B1 (en) | Multichannel voice detection in adverse environments | |
CN108447496B (zh) | 一种基于麦克风阵列的语音增强方法及装置 | |
CN110782910B (zh) | 一种高检出率的啸叫音频检测系统 | |
CN103903612B (zh) | 一种实时语音识别数字的方法 | |
CN1271593C (zh) | 一种语音信号检测方法 | |
US11295761B2 (en) | Method for constructing voice detection model and voice endpoint detection system | |
JP2007004202A (ja) | 音声活動に基づくゲイン制限による音声強化についての方法、記録媒体、及び装置 | |
JP2009522942A (ja) | 発話改善のためにマイク間レベル差を用いるシステム及び方法 | |
CN101193139B (zh) | 一种可滤除环境音的方法及其手机 | |
CN104335600A (zh) | 多麦克风移动装置中检测及切换降噪模式的方法 | |
US20130016854A1 (en) | Microphone array processing system | |
CN105118522A (zh) | 噪声检测方法及装置 | |
JP2011033717A (ja) | 雑音抑圧装置 | |
CN101233561B (zh) | 通过根据背景噪声控制振动器的操作来增强移动通信设备中的语音可懂度 | |
CN105427868A (zh) | 一种对voip系统双向双工免提语音进行噪音消除的方法 | |
CN110364175B (zh) | 语音增强方法及系统、通话设备 | |
US8165872B2 (en) | Method and system for improving speech quality | |
Gamper et al. | Predicting word error rate for reverberant speech | |
CN1768555A (zh) | 用于减少麦克风信号中的干扰噪声信号部分的方法和装置 | |
CN116312561A (zh) | 一种电力调度系统人员声纹识别鉴权降噪和语音增强方法、系统及装置 | |
JP5193130B2 (ja) | 電話音声区間検出装置およびそのプログラム | |
CN1946105A (zh) | 基于语音信号分离模型的立体声回波消除方法及其系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Open date: 20081203 |