CN101950563B - 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 - Google Patents
基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 Download PDFInfo
- Publication number
- CN101950563B CN101950563B CN2010102598280A CN201010259828A CN101950563B CN 101950563 B CN101950563 B CN 101950563B CN 2010102598280 A CN2010102598280 A CN 2010102598280A CN 201010259828 A CN201010259828 A CN 201010259828A CN 101950563 B CN101950563 B CN 101950563B
- Authority
- CN
- China
- Prior art keywords
- fourier transform
- epsiv
- fractional fourier
- wiener filtering
- noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
- Filters That Use Time-Delay Elements (AREA)
Abstract
本发明公布了一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,包括以下步骤:(1)分数傅里叶变换域;(2)取模;(3)加二维汉明窗;(4)二维维纳滤波;(5)分数傅里叶逆变换;(6)线性合并。本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景。
Description
技术领域
本发明涉及一种语音增强方法,特别涉及一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。
背景技术
音频取证是指对录音信号进行获取、分析和评价以作为法庭或其他行政部门认可的证据。音频证据可作为民事或刑事强制调查、行政调查或其他民事事件的一部分。音频取证技术融合了音频数字信号处理领域内的诸多技术如语音识别、说话人识别和语音增强等技术。从上个世纪六十年代开始,特别是1974年的水门事件以后,音频取证技术开始在法庭取证中得到了应用,但是由于当初语音信号处理理论和技术还处于起步发展阶段,音频取证技术的研究一度处于停顿状态,近年来随着语音信号处理技术的日益发展成熟和犯罪手段的不断高技术化,最近几年对音频取证技术的研究得到了语音信号处理人员的广泛关注。
由于取证所用的音频信号经常受到来自噪声、其他声音、紊乱和其他妨碍正常音频取证分析的信号处理手段的影响。而且绝大部分音频信号都来自于采用隐藏的麦克风进行的私下录音,因此信号通常也受到风和其他环境声音的干扰。因此,在分析之前应当采用语音增强技术以提高感知信噪比。通常的语音增强算法大多基于平稳随机噪声理论,不能有效地降低非平稳噪声的影响,分数阶傅里叶变换的旋转特性显示,通过选择合适的分数阶因子a,可以在分数傅里叶变换域上实现语音与噪声的最大分离,也可以通过多次旋转以进一步分离消除噪声。
发明内容
本发明目的是针对现有技术存在的缺陷提供一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法。
本发明为实现上述目的,采用如下技术方案:
本发明基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤:
(1)分数傅里叶变换域
输入语音序列s(n)的ai阶分数傅里叶变换算法如下:
式中,0<|p|<2,i=1,2,...,16,m为整数,j为虚数单位;
(2)取模
(3)二维汉明窗
二维汉明窗h(l,k):
上式中l∈[O,255],k∈[O,15];
(4)二维维纳滤波
则可得二维维纳滤波如下:
上式中β≥0,以保证传输H(u,v)>0,
上式中:
(5)分数傅里叶逆变换
为ai阶分数傅里叶变换域上的估计语音:
=Si(u)exp(-jΔθi(u))
Δθi(u)=εiu/sinai
εi为均值较小的随机变量,则有:
(6)线性合并
令n′=n-εi,代入上式并化简整理可得:
由于εi为均值较小的随机变量,则有:
那么线性合并后可得:
当信号路数M→∞时,则有:
由于语音信号为短时平稳随机过程,则有:
式中τ0为时延常数。
本发明的优点和效果在于:
本发明基于分数傅里叶变换的旋转特性提出了分数傅里叶变换域上二维维纳滤波的新方法,理论分析和实验结果表明该模型能够进一步降低非平稳噪声的影响,在分数傅里叶变换域的二维幅度谱上显示的一些非平稳噪声如pink噪声、Volvo汽车噪声和factory噪声呈现一定的分形特性,可以利用这一特性进行降噪或其他语音信号处理。研究表明本发明在取证语音增强领域具有较高的应用价值和广阔的应用前景,从而开启了一维语音二维处理的新途径。
附图说明
图1是分数傅里叶变换域上二维语音增强模型。
图2是分数域纯净语音二维图。
图3是分数域含5dB高斯白噪声语音二维图。
图4是分数域高斯白噪声二维图。
图5是分数域pink噪声二维图。
图6是分数域factory1噪声二维图。
图7是分数域factory2噪声二维图。
图8是分数域volvo噪声二维图。
图9是分数域二维维纳滤波与普通滤波对比1。
图10是分数域二维维纳滤波与普通滤波对比2。
图11是分数域二维维纳滤波与普通滤波对比3。
图12是分数域二维维纳滤波与普通滤波对比4。
具体实施方式
本发明基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,如图1所示,其包括以下步骤:
(1)分数傅里叶变换域;
输入语音序列占s(n)的ai阶分数傅里叶变换算法如下:
(2)取模
(3)二维汉明窗
图1给出了分数傅里叶变换域上二维语音增强的一般模型,输入语音序列帧长N=256,50%的帧重叠,经过M(M=16)个并行的不同阶数的分数傅里叶变换并取模后,进入二维汉明窗。二维汉明窗h(l,k):
上式中l∈[0,255],k∈[0,15]。
(4)二维维纳滤波
分数傅里叶变换域上二维滤波具体推导如下:
则可得二维维纳滤波如下:
上式中β≥0,以保证H(u,v)>0。
上式中:
(5)分数傅里叶逆变换
=Si(u)exp(-jΔθi(u)),
Δθi(u)=εiu/sinai,
εi为均值较小的随机变量。则有:
(6)线性合并
令n′=n-εi,代入上式并化简整理可得:
由于εi为均值较小的随机变量。则有:
那么线性合并后可得:
当信号路数M→∞时,则有:
由于语音信号为短时平稳随机过程,则有:
式中τ0为时延常数。
为了分析上提出的分数傅里叶变换域上二维维纳滤波的性能,下面针对不同噪声环境下的语音进行分析。在下面分析中,语音数据为在实验室内录制的青年男女的语音,采样频率是8kHz,量化比特数为8bit。在原始纯净语音上叠加由英国TNO感知学会所属的荷兰RSRE语音研究中心提供的高斯白噪声和非平稳噪声。维纳滤波在平稳噪声环境下可以取得良好的性能,下面将其作为基线系统,将本发明提出的分数傅里叶变换域上二维维纳滤波与之比较。
图2至图8分别给出了分数傅里叶变换域上纯净语音、含噪语音、高斯白噪声、pink噪声、factory1噪声、factory2噪声、volvo噪声的二维幅度谱特性,从图中可以看出高斯白噪声在二维分数傅里叶变换域上其幅度谱也基本呈现出平稳特性,其他噪声则不然,但volvo噪声、factory2噪声呈现出较强的分形特性,factory1噪声、pink噪声也呈现出弱分形特性,关于这一特性可在以后的降噪和其他语音信号处理中加以应用。四种非平稳噪声与含噪语音随着分数阶因子接近1基本趋于集中,高斯白噪声则均匀分布在整个二维平面。
图9中:(a)纯净语音;(b)5dB含噪语音(高斯白噪声);(c)普通维纳滤波;(d)分数傅里叶变换域二维维纳滤波。从图中可看出,分数傅里叶变换域二维维纳滤波对于高斯白噪声滤波性能要优于普通维纳滤波。
图10中:(a)纯净语音;(b)5dB含噪语音(pink噪声);(c)普通维纳滤波;(d)分数傅里叶变换域二维维纳滤波。从图中可看出,普通维纳滤波法在语音段波形有些失真,而二维维纳滤波比较接近于原始纯净语音。因此,分数傅里叶变换域二维维纳滤波对于pink噪声滤波性能要优于普通维纳滤波。
图11中:(a)纯净语音;(b)5dB含噪语音(factory1噪声);(c)普通维纳滤波;(d)分数傅里叶变换域二维维纳滤波。图12中:(a)纯净语音;(b)0dB含噪语音(volvo噪声);(c)普通维纳滤波;(d)分数傅里叶变换域二维维纳滤波。从图11、图12可看出,普通维纳滤波要比分数域二维维纳滤波波形更失真一些,主要原因不仅是非平稳噪声导致噪声谱估计值与当前噪声谱差异较大,而且由于相位噪声的影响导致时域波形产生随机时延从而导致波形失真较大。
表1给出了分数傅里叶变换域上二维维纳滤波和普通维纳滤波在高斯白噪声、pink噪声、Volvo汽车噪声和factory噪声下的取证语音增强性能比较。从表1中可以看出,分数傅里叶变换域上二维维纳滤波要明显优于普通维纳滤波,其中分数傅里叶变换域上二维维纳滤波对于高斯白噪声效果最好,对于volvo汽车噪声效果其次,对factory噪声的效果最差,实验结果显示,分数傅里叶变换域上二维维纳滤波能够有效的降低非平稳噪声的影响。
表1
Claims (1)
1.一种基于分数傅里叶变换的二维维纳滤波的取证语音增强方法,其特征在于包括以下步骤:
(1)分数傅里叶变换域
输入语音序列s(n)的ai阶分数傅里叶变换算法如下:
(2)取模
(3)二维汉明窗
二维汉明窗h(l,k):
上式中l∈[0,255],k∈[0,15];
(4)二维维纳滤波
则可得二维维纳滤波如下:
上式中β≥0,以保证传输函数H(u,v)>0,
上式中:
(5)分数傅里叶逆变换
Δθi(u)=εiu/sinai,
εi为均值较小的随机变量,则有:
(6)线性合并
令n′=n-εi,代入上式并化简整理可得:
,式中,RES为取实部;
由于εi为均值较小的随机变量,则有:
那么线性合并后可得:
当信号路数M→∞时,则有:
由于语音信号为短时平稳随机过程,则有:
式中τ0为时延常数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102598280A CN101950563B (zh) | 2010-08-20 | 2010-08-20 | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2010102598280A CN101950563B (zh) | 2010-08-20 | 2010-08-20 | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101950563A CN101950563A (zh) | 2011-01-19 |
CN101950563B true CN101950563B (zh) | 2012-04-11 |
Family
ID=43454033
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010102598280A Expired - Fee Related CN101950563B (zh) | 2010-08-20 | 2010-08-20 | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101950563B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103854662B (zh) * | 2014-03-04 | 2017-03-15 | 中央军委装备发展部第六十三研究所 | 基于多域联合估计的自适应语音检测方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1132896A1 (en) * | 2000-03-08 | 2001-09-12 | Motorola, Inc. | Frequency filtering method using a Wiener filter applied to noise reduction of acoustic signals |
CN1967659A (zh) * | 2005-11-14 | 2007-05-23 | 北京大学科技开发部 | 用于助听器的语音增强方法 |
CN101251446A (zh) * | 2008-04-16 | 2008-08-27 | 邓艾东 | 基于离散分数余弦变换的碰摩声发射信号降噪方法 |
CN101315772A (zh) * | 2008-07-17 | 2008-12-03 | 上海交通大学 | 基于维纳滤波的语音混响消减方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10137348A1 (de) * | 2001-07-31 | 2003-02-20 | Alcatel Sa | Verfahren und Schaltungsanordnung zur Geräuschreduktion bei der Sprachübertragung in Kommunikationssystemen |
US7376241B2 (en) * | 2003-08-06 | 2008-05-20 | The Boeing Company | Discrete fourier transform (DFT) watermark |
-
2010
- 2010-08-20 CN CN2010102598280A patent/CN101950563B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1132896A1 (en) * | 2000-03-08 | 2001-09-12 | Motorola, Inc. | Frequency filtering method using a Wiener filter applied to noise reduction of acoustic signals |
CN1967659A (zh) * | 2005-11-14 | 2007-05-23 | 北京大学科技开发部 | 用于助听器的语音增强方法 |
CN101251446A (zh) * | 2008-04-16 | 2008-08-27 | 邓艾东 | 基于离散分数余弦变换的碰摩声发射信号降噪方法 |
CN101315772A (zh) * | 2008-07-17 | 2008-12-03 | 上海交通大学 | 基于维纳滤波的语音混响消减方法 |
Non-Patent Citations (1)
Title |
---|
包永强等.分数傅里叶变换域上含噪语音的联合滤波.《信号处理》.2006,第22卷(第6期),第899-902页. * |
Also Published As
Publication number | Publication date |
---|---|
CN101950563A (zh) | 2011-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107274908A (zh) | 基于新阈值函数的小波语音去噪方法 | |
CN103871418A (zh) | 一种扩声系统啸叫频点的检测方法及装置 | |
Jangjit et al. | A new wavelet denoising method for noise threshold | |
CN101853665A (zh) | 语音中噪声的消除方法 | |
Chavan et al. | Studies on implementation of wavelet for denoising speech signal | |
CN102314883B (zh) | 一种判断音乐噪声的方法以及语音消噪方法 | |
Thanhikam et al. | Stationary and non-stationary wide-band noise reduction using zero phase signal | |
CN112233657B (zh) | 一种基于低频音节识别的语音增强方法 | |
CN101950563B (zh) | 基于分数傅里叶变换的二维维纳滤波的取证语音增强方法 | |
CN112185405B (zh) | 一种基于差分运算和联合字典学习的骨导语音增强方法 | |
CN110909827A (zh) | 一种适用于风机叶片声音信号的降噪方法 | |
Lu et al. | Speech enhancement using spectral subtraction algorithm with over-subtraction and reservation factors adapted by harmonic properties | |
Rao et al. | Speech enhancement using sub-band cross-correlation compensated Wiener filter combined with harmonic regeneration | |
CN111968627B (zh) | 一种基于联合字典学习和稀疏表示的骨导语音增强方法 | |
CN101527037B (zh) | 基于邻域加窗的平稳小波图像去噪方法 | |
TWI749547B (zh) | 應用深度學習的語音增強系統 | |
CN111341331B (zh) | 基于局部注意力机制的语音增强方法、装置及介质 | |
Yang et al. | A speech enhancement algorithm combining spectral subtraction and wavelet transform | |
Kumari et al. | Audio signal classification based on optimal wavelet and support vector machine | |
Liu | A new wavelet threshold denoising algorithm in speech recognition | |
Sudheer Kumar et al. | Noise Reduction in Audio File Using Spectral Gatting and FFT by Python Modules | |
Seyedin et al. | Robust MVDR-based feature extraction for speech recognition | |
Santhoshkumar et al. | Speech enhancement using super soft thresholding in wavelet domain | |
Zhang et al. | A restoration method of the clipped audio signals based on MDCT | |
Kaliraman et al. | Speech enhancement by end point detection and signal subspace method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120411 Termination date: 20140820 |
|
EXPY | Termination of patent right or utility model |