CN108986799A - 一种基于倒谱滤波的混响参数估计方法 - Google Patents

一种基于倒谱滤波的混响参数估计方法 Download PDF

Info

Publication number
CN108986799A
CN108986799A CN201811031342.4A CN201811031342A CN108986799A CN 108986799 A CN108986799 A CN 108986799A CN 201811031342 A CN201811031342 A CN 201811031342A CN 108986799 A CN108986799 A CN 108986799A
Authority
CN
China
Prior art keywords
cepstrum
room
reverberation
parameter
reverberation parameters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811031342.4A
Other languages
English (en)
Inventor
吕勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hohai University HHU
Original Assignee
Hohai University HHU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hohai University HHU filed Critical Hohai University HHU
Priority to CN201811031342.4A priority Critical patent/CN108986799A/zh
Publication of CN108986799A publication Critical patent/CN108986799A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/24Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/84Detection of presence or absence of voice signals for discriminating voice from noise

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)

Abstract

本发明公开了一种基于倒谱滤波的混响参数估计方法,首先用内置的扬声器发出1000Hz的激励信号;其次,对麦克风接收的音频信号做快速傅里叶变换、对数运算和离散余弦变换,得到混响信号的倒谱参数;然后,对倒谱参数进行滤波,从混响信号的倒谱参数中分离出房间滤波器的倒谱参数;最后,通过逆离散余弦变换、指数变换和快速傅里叶逆变换,得到房间的混响参数。本发明可以快速测量房间的混响参数,构建逆滤波器,减小室内混响对语音处理系统的影响。

Description

一种基于倒谱滤波的混响参数估计方法
技术领域
本发明属于语音处理技术领域,具体涉及到将房间混响看作数字滤波器,通过倒谱滤波将激励信号与混响参数分离的混响参数估计方法。
背景技术
当声波在室内传播时,要被墙壁、天花板、地板等障碍物反射,而且每反射一次,声波的能量都要被障碍物吸收一些。当声源停止发声后,声波在室内要经过多次反射和吸收,持续一段时间才消失。这种室内声源停止发声后,反射声仍然存在的声延续现象叫做混响,这段时间叫做混响时间。
当语音处理系统位于室内时,也会受到室内混响的影响。此时,麦克风不仅收到说话人或扬声器发出的直达语音,还会收到由房间墙壁反射得到的语音的各次反射声。这会给语音识别、说话人识别等应用系统带来不利影响。
发明内容
发明目的:针对现有技术中存在的问题,本发明提供一种基于倒谱滤波的混响参数估计方法,将混响对室内声波的影响,看作是数字滤波的过程,直射声和反射声分别相当于输入信号及其时域延迟信号,各次反射声的反射系数相当于滤波器的系数。因此,只要能估计出房间滤波器的系数,就可以构建逆滤波器,消除室内混响的影响。
技术方案:一种基于倒谱滤波的混响参数估计方法,首先用内置的扬声器发出1000Hz的激励信号;其次,对麦克风接收的音频信号做快速傅里叶变换(FFT:Fast FourierTransform)、对数运算和离散余弦变换(DCT:Discrete Cosine Transform),得到混响信号的倒谱参数;然后,对倒谱参数进行滤波,从混响信号的倒谱参数中分离出房间滤波器的倒谱参数;最后,通过逆离散余弦变换(IDCT:Inverse Discrete Cosine Transform)、指数变换和快速傅里叶逆变换(IFFT:Inverse Fast Fourier Transform),得到房间的混响参数。
本发明的具体步骤如下:
(1)用系统内置的扬声器发出1000Hz的激励信号,激励信号经过房间调制后,生成混响音频信号,激励信号可以是单频正弦信号,也可以是其他周期信号;
(2)对麦克风接收的混响音频信号加窗,分帧,得到帧信号;
(3)对每一帧混响音频信号进行快速傅里叶变换,得到其幅度谱和相位谱;
(4)对混响音频信号的幅度谱进行对数变换和离散余弦变换,得到其倒谱特征参数;
(5)对混响音频信号的倒谱特征参数进行滤波,分离出房间滤波器的倒谱参数;
(6)对房间滤波器的倒谱参数进行IDCT,指数变换和IFFT,得到房间的混响参数。
本发明采用上述技术方案,具有以下有益效果:
本发明可以快速测量房间的混响参数,构建逆滤波器,减小室内混响对语音处理系统的影响。
附图说明
图1为本发明实施例的基于倒谱滤波的混响参数估计方法的总体框架图。
具体实施方式
下面结合具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
如图1所示,一种基于倒谱滤波的混响参数估计方法,包括预处理、FFT、取对数、DCT、倒谱滤波、IDCT、取指数和IFFT几个部分。下面详细说明本发明的具体实施方案。
1、预处理
系统的采样扬声器发出1000Hz的激励信号,窗口类型为海明窗,窗口长度为5000,帧移为2000。窗口长度应该与混响时间相匹配。
2、FFT
对混响音频信号进行快速傅里叶变换,得到其幅度谱和相位谱。
设周期激励信号为s(n),则其经过房间滤波器h(n)滤波后,可以得到混响音频信号x(n):
x(n)=s(n)*h(n) (1)
其中,符号“*”表示离散卷积。
对x(n)做FFT,可以得到混响音频信号x(n)的频谱X(k):
X(k)=S(k)·H(k) (2)
其中,S(k)和H(k)分别表示s(n)和h(n)的频谱。
3、取对数与DCT
对混响音频信号的幅度谱进行对数变换和离散余弦变换,得到其倒谱特征参数。
在式(2)两边分别取模,并取对数,可得:
log|X(k)|=log|S(k)|+log|H(k)| (3)
在式(3)两边分别进行离散余弦变换,可得:
其中,分别表示激励信号s(n)和房间滤波器h(n)的倒谱特征参数;表示混响音频信号x(n)的倒谱特征参数。
4、倒谱滤波
因为激励信号s(n)是周期信号,所以其倒谱具有脉冲特性,即只在基音的离散周期Ns的整数倍处有非零值;在其他n处,的值都等于0。因为s(n)的基频为1000Hz,采样频率为10000Hz,所以Ns=10。
房间滤波器的倒谱通常具有快速衰减的特性,在区间[-10,10]之外的值已经很小。因此,只需要用一个低时域滤波器,保留中[-10,10]之间的值,将该区间以外的值全部置零,即可得到房间滤波器的倒谱的近似值。
5、混响参数估计
首先对估得的房间滤波器的倒谱特征进行IDCT运算,得到其对数谱;然后,对混响对数谱进行指数运算,得到其幅度谱;最后,对混响幅度谱和相位谱进行IFFT运算,得到房间的混响参数。

Claims (5)

1.一种基于倒谱滤波的混响参数估计方法,其特征在于,对麦克风接收的混响音频信号的倒谱参数进行滤波,分离出房间滤波器的倒谱参数,再对房间滤波器的倒谱参数进行逆变换,得到房间的混响参数。
2.根据权利要求1所述的一种基于倒谱滤波的混响参数估计方法,其特征在于,用系统内置的扬声器发出1000Hz的激励信号;对麦克风接收的混响音频信号加窗,分帧,得到帧信号;对每一帧混响音频信号进行快速傅里叶变换,得到其幅度谱和相位谱;对混响音频信号的幅度谱进行对数变换和离散余弦变换,得到其倒谱特征参数;对混响音频信号的倒谱特征参数进行滤波,分离出房间滤波器的倒谱参数。
3.根据权利要求1所述的一种基于倒谱滤波的混响参数估计方法,其特征在于,对房间滤波器的倒谱参数进行IDCT,指数变换和IFFT,得到房间的混响参数。
4.根据权利要求2所述的一种基于倒谱滤波的混响参数估计方法,其特征在于,对混响音频信号的倒谱特征参数进行低时域滤波,保留低时域的倒谱值,将高时域的倒谱值置零,得到房间滤波器的倒谱近似值。
5.根据权利要求2所述的一种基于倒谱滤波的混响参数估计方法,其特征在于,所述激励信号为单频正弦信号。
CN201811031342.4A 2018-09-05 2018-09-05 一种基于倒谱滤波的混响参数估计方法 Pending CN108986799A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811031342.4A CN108986799A (zh) 2018-09-05 2018-09-05 一种基于倒谱滤波的混响参数估计方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811031342.4A CN108986799A (zh) 2018-09-05 2018-09-05 一种基于倒谱滤波的混响参数估计方法

Publications (1)

Publication Number Publication Date
CN108986799A true CN108986799A (zh) 2018-12-11

Family

ID=64544852

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811031342.4A Pending CN108986799A (zh) 2018-09-05 2018-09-05 一种基于倒谱滤波的混响参数估计方法

Country Status (1)

Country Link
CN (1) CN108986799A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111341345A (zh) * 2020-05-21 2020-06-26 深圳市友杰智新科技有限公司 语音设备的控制方法、装置、语音设备和存储介质
CN112735443A (zh) * 2020-12-25 2021-04-30 浙江弄潮儿智慧科技有限公司 一种具有自动分类的海洋空间资源管理系统及其自动分类方法
WO2021196905A1 (zh) * 2020-04-01 2021-10-07 腾讯科技(深圳)有限公司 语音信号去混响处理方法、装置、计算机设备和存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719512A (zh) * 2005-07-15 2006-01-11 北京中星微电子有限公司 数字音频混响模拟系统
CN101315772A (zh) * 2008-07-17 2008-12-03 上海交通大学 基于维纳滤波的语音混响消减方法
CN101416237A (zh) * 2006-05-01 2009-04-22 日本电信电话株式会社 基于源和室内声学的概率模型的语音去混响方法和设备
CN102750956A (zh) * 2012-06-18 2012-10-24 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
CN103440869A (zh) * 2013-09-03 2013-12-11 大连理工大学 一种音频混响的抑制装置及其抑制方法
JP2015037239A (ja) * 2013-08-13 2015-02-23 日本電信電話株式会社 残響抑圧装置とその方法と、プログラムとその記録媒体
CN106233751A (zh) * 2014-04-14 2016-12-14 雅马哈株式会社 声音发射和采集装置及声音发射和采集方法
CN106688247A (zh) * 2014-09-26 2017-05-17 Med-El电气医疗器械有限公司 确定房间混响以用于信号增强
US20190080709A1 (en) * 2016-03-17 2019-03-14 Nuance Communications, Inc. Spectral Estimation Of Room Acoustic Parameters

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1719512A (zh) * 2005-07-15 2006-01-11 北京中星微电子有限公司 数字音频混响模拟系统
CN101416237A (zh) * 2006-05-01 2009-04-22 日本电信电话株式会社 基于源和室内声学的概率模型的语音去混响方法和设备
CN101315772A (zh) * 2008-07-17 2008-12-03 上海交通大学 基于维纳滤波的语音混响消减方法
CN102750956A (zh) * 2012-06-18 2012-10-24 歌尔声学股份有限公司 一种单通道语音去混响的方法和装置
JP2015037239A (ja) * 2013-08-13 2015-02-23 日本電信電話株式会社 残響抑圧装置とその方法と、プログラムとその記録媒体
CN103440869A (zh) * 2013-09-03 2013-12-11 大连理工大学 一种音频混响的抑制装置及其抑制方法
CN106233751A (zh) * 2014-04-14 2016-12-14 雅马哈株式会社 声音发射和采集装置及声音发射和采集方法
CN106688247A (zh) * 2014-09-26 2017-05-17 Med-El电气医疗器械有限公司 确定房间混响以用于信号增强
US20190080709A1 (en) * 2016-03-17 2019-03-14 Nuance Communications, Inc. Spectral Estimation Of Room Acoustic Parameters

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
张德会: "声混响消减方法研究", 《中国优秀硕士学位论文全文数据库(月刊)》 *
牛莉莉: "语音信号去混响技术研究", 《中国优秀硕士学位论文全文数据库(月刊》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021196905A1 (zh) * 2020-04-01 2021-10-07 腾讯科技(深圳)有限公司 语音信号去混响处理方法、装置、计算机设备和存储介质
CN111341345A (zh) * 2020-05-21 2020-06-26 深圳市友杰智新科技有限公司 语音设备的控制方法、装置、语音设备和存储介质
CN112735443A (zh) * 2020-12-25 2021-04-30 浙江弄潮儿智慧科技有限公司 一种具有自动分类的海洋空间资源管理系统及其自动分类方法

Similar Documents

Publication Publication Date Title
WO2014177084A1 (zh) 激活音检测方法和装置
TWI463488B (zh) 包含晚期混響成分模型化之回聲抑制技術
Sadjadi et al. Hilbert envelope based features for robust speaker identification under reverberant mismatched conditions
CN108986799A (zh) 一种基于倒谱滤波的混响参数估计方法
CN108172231A (zh) 一种基于卡尔曼滤波的去混响方法及系统
RU2684194C1 (ru) Способ получения кадра модификации речевой активности, устройство и способ обнаружения речевой активности
CN103440869A (zh) 一种音频混响的抑制装置及其抑制方法
CN105308985A (zh) 声反馈消除器
CN102750956A (zh) 一种单通道语音去混响的方法和装置
CN106384588B (zh) 基于矢量泰勒级数的加性噪声与短时混响的联合补偿方法
WO2010108458A1 (zh) 音频信号的分类方法及装置
CN110706719A (zh) 一种语音提取方法、装置、电子设备及存储介质
Al-Karawi et al. Early reflection detection using autocorrelation to improve robustness of speaker verification in reverberant conditions
CN106356058B (zh) 一种基于多频带特征补偿的鲁棒语音识别方法
Yasuraoka et al. Music dereverberation using harmonic structure source model and wiener filter
Chen et al. A dual-stream deep attractor network with multi-domain learning for speech dereverberation and separation
Kaneda et al. Noise suppression signal processing using 2‐point received signals
Nelke Wind noise reduction: signal processing concepts
CN109102823A (zh) 一种基于子带谱熵的语音增强方法
CN111161753B (zh) 基于智能终端的安全语音交互方法及系统
Karimian-Azari et al. Fast joint DOA and pitch estimation using a broadband MVDR beamformer
Nabi et al. A dual-channel noise reduction algorithm based on the coherence function and the bionic wavelet
CN110246516B (zh) 一种语音通信中小空间回声信号的处理方法
JP2002062900A (ja) 収音装置及び受信装置
CN109346106B (zh) 一种基于子带信噪比加权的倒谱域基音周期估计方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20181211