CN109102818B - 一种基于信号频率概率密度函数分布的去噪音频采样算法 - Google Patents

一种基于信号频率概率密度函数分布的去噪音频采样算法 Download PDF

Info

Publication number
CN109102818B
CN109102818B CN201810996355.9A CN201810996355A CN109102818B CN 109102818 B CN109102818 B CN 109102818B CN 201810996355 A CN201810996355 A CN 201810996355A CN 109102818 B CN109102818 B CN 109102818B
Authority
CN
China
Prior art keywords
audio
audio signal
resampling
sampling
probability density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810996355.9A
Other languages
English (en)
Other versions
CN109102818A (zh
Inventor
龙华
杨明亮
邵玉斌
杜庆治
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kunming University of Science and Technology
Original Assignee
Kunming University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kunming University of Science and Technology filed Critical Kunming University of Science and Technology
Priority to CN201810996355.9A priority Critical patent/CN109102818B/zh
Publication of CN109102818A publication Critical patent/CN109102818A/zh
Application granted granted Critical
Publication of CN109102818B publication Critical patent/CN109102818B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

本发明涉及一种基于信号频率概率密度函数的去噪音频重采样算法,属于音频信号处理技术领域。本发明利用卡尔曼滤波器优良的去噪能力和前向预测功能对采集的音频信号进行处理以获得带有短时预测功能的去噪音频。对处理后的音频信号进行傅里叶变换获得音频信号的频谱函数,在概率密度函数p(f)的控制条件下对音频信号进行重采样。本发明减少了冗余采样点。卡尔曼滤波处理采对集到的音频信号进行滤波处理得到的重采样数据相对其他算法处理结果更为平滑,复原出的音频信号质量更高,提高了音频信号处理的实时性。本算法理论简单,编程也易于实现,实际工程应用也具有强大的稳定性和鲁棒性。

Description

一种基于信号频率概率密度函数分布的去噪音频采样算法
技术领域
本发明涉及一种基于信号频率概率密度函数分布的去噪音频采样算法,属于音频特征信号处理技术领域。
背景技术
目前对于音频信号的采样大多使用均匀采样,所设置的采样频率过低,信息传输后所复原出的信号有很大程度的失真,若设置的采样频率高来满足精度要求,但大量的数据处理对信息处理系统又造成了极大的挑战,很难选择一个折中恰当的采样频率满足无失真采样并能剔除多余的冗余信息。本发明提出的重采样算法首先是利用卡尔曼滤波器对信号进行去噪处理以获得具有一定短时预测功能的去噪信号,然后对处理后信号进行傅里叶变换获得音频信号的频谱函数,最后基于频谱的概率密度函数对信号进行重采样以获得最优采样序列,剔除不必要的冗余采样数据,从而提高整个系统的数据处理速率和实时性。
发明内容
本发明是利用卡尔曼滤波器优良的去噪能力和短时预测功能,对采集到的音频数据进行处理以获得具有短时预测的去噪信号,其目的是提高音频信息系统的实时性。对处理后的音频信号进行傅里叶变换获得其频谱函数,然后利用音频信号频谱的概率密度函数作为重采样的控制量进行重采样,剔除了原始采样序中的噪声和冗余数据量,使得后续所提取的音频特征更能表征原始音频信号,提高整个系统的实时处理能力。本算理论也相对简单,编程易于实现,大部分编程软件中也有相应的卡尔曼滤波器的包函数为仿真等研究提高极大便利,本算法针对当今的大数据音频信号处理更具有明显的实时、高效优势。其算法可用于音频特征提取、音频信号信息传输、音频识别等领域。
本发明的技术方案如是:一种基于信号频率概率密度函数分布的去噪音频采样算法。该方法具体包括以下步骤:
(1)音频信号采集:采集音频信号,获得音频样本。
(2)音频信号的去噪处理:将上述获取的音频样本送入搭建好的卡尔曼滤波器模型中,获得去噪并带有前向预测的音频信号。
(3)音频信号的时频变换:将处理好的音频信号进行傅里叶变换以获得频谱函数。
(4)重采样模型搭建:依据音频信号频谱的概率密度函数搭建重采样模型。
(5)重采样结果对比:用不同的采样算法对同一音频信号进行采样,根据采样信号复原出的原始音频信号失真率与采用序列大小作为指标进行对标检验。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(1)所述音频采集是通过音频采集装置采集音频样本,音频采集器对音频信号采集时设置好采样频率(采样频率满足奈奎斯特采样定理)、采样声道数、量化精度,采样环境为带噪环境。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(2)中音频信号的去噪处理在卡尔曼滤波器强大的去噪能力以及前向预测功能的基础上做进一步扩展,对音频信号去噪的同时进行的音频信号短时前向预测。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(3)音频信号的时频变换是将经过卡尔曼滤波器处理后的去噪信号进行傅里叶变换,获得音频信号的频谱函数以供后续基于频谱概率密度函数实现重采样。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(4)重采样模型搭建包括以下步骤:
(1)重采样模型搭建中使用重要性采样实现重采样,即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分,即
E[f(x)]=∫f(x)p(x)dx (1)
音频信号频谱函数的概率密度函数p(x)难以求解,这里用易抽样的分布q(x)代替,并令
Figure BDA0001781927450000021
即有
E[f(x)]=∫f(x)w(x)q(x)dx (2)
w(x)为采样权重。音频信号的采样是离散的,先针对q(x)分布采N个样本点,然后根据样本点对应的w(x)权重进行重采样,即
Figure BDA0001781927450000022
(2)用易于计算的
Figure BDA0001781927450000031
Figure BDA0001781927450000032
代替难以求解的分布p(x),q(x),并有
Figure BDA0001781927450000033
Figure BDA0001781927450000034
Zp,Zq为标准化项(常数),使得
Figure BDA0001781927450000035
等比例变化为一个概率分布。即有
Figure BDA0001781927450000036
对于上述的积分式变为
Figure BDA0001781927450000037
通过求
Figure BDA0001781927450000038
倒数表达式求上述积分式。假设很方便从
Figure BDA0001781927450000039
进行采样,即有
Figure BDA00017819274500000310
这里采样点表示为m。最终上述问题成为
Figure BDA00017819274500000311
其中
Figure BDA00017819274500000312
至此获得了基于音频信号频谱概率密度函数的的重采样模型。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(5)采样序列对比即利用不用的采样算法对同一段音频信号进行重采样根据复原音频信号的失真率和采样序列大小作为指标比较,检验本算法重采样序列的有效性。
本发明与现有的采样算法相比其优点有:
(1)本发明用卡尔曼滤波器对采集音频信号处理,不仅可以去噪,重点是卡尔曼滤波器具有短时预测能力,可以提高整个系统的数据处理实时性。
(2)传统的音频信号采样是采用均匀采样或是基于频率的自适应采样,本发明是基于频谱的概率密度函数进行控制采样,极大的剔除了冗余采样点,更便于后续的音频特征提取和音频信号传输。
(3)本发明针对大数据音频信号表现更强的优势,即音频数据量越大,剔除的冗余数据量越多,在信息处理方面表现更强的鲁棒性,满足当前大数据信息发展的趋势需求。
附图说明
图1本发明基于信号频率概率密度函数分布的去噪音频采样算法流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
如图1所示:一种基于信号频率概率密度函数分布的去噪音频采样算法。所述方法的具体步骤如下:
(1)音频信号采集:音频信号采集,获得音频样本。
(2)卡尔曼滤波器的模型搭建与音频处理:因为音频信号易受外界干扰存在过程噪声,而测量时候由于各方面因素又存在测量噪声,故利用卡尔曼滤波器进行去噪处理,由于音频信号处理要求实时性,故利用其卡尔曼滤波器的前向预测功能可以提高后续音频信号处理的实时性,进而以获得去噪并带有一定前向预测的音频信号。
(3)音频信号的时频变换:将处理好的音频信号进行傅里叶变换以获得音频信号的频谱函数用于后续信号处理使用。
(4)重要性采样模型搭建:依据音频频谱的概率密度函数搭建重采样模型,其中分为代替概率密度函数易求解和不易求解进行讨论。
(5)采样序列对比:用不同的采样算法对同一音频信号进行采样并且复原原始音频信号,对比其采用序列大小、复原信号失真度等。
所述音频采集是通过麦克风收录样音频信号,设置的采样频率为44.1KHz,采样模式为单声道语音信号采集,量化级为16bit,因本发明研究的是对音频信号的去噪以及重采样故采样环境为带噪环境。
所述音频信号的去噪处理在卡尔曼滤波器强大的去噪能力以及前向预测功能的基础上做进一步扩展,对音频信号去噪的同时进行的音频信号短时前向预测。
所述音频信号的时频变换是将经过卡尔曼滤波器处理后的去噪数字信号进行傅里叶变换,获得频域信号以供后续基于音频频谱的概率密度函数实现重采样。
所述重采样模型搭建包括以下步骤:
(1)重采样模型搭建中使用重要性采样实现重采样,即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分,即
E[f(x)]=∫f(x)p(x)dx (1)
音频信号频谱函数的概率密度函数p(x)难以求解,这里用易抽样的分布q(x)代替,并令
Figure BDA0001781927450000051
即有
E[f(x)]=∫f(x)w(x)q(x)dx (2)
w(x)为采样权重。音频信号的采样是离散的,先针对q(x)分布采N个样本点,然后根据样本点对应的w(x)权重进行重采样,即
Figure BDA0001781927450000052
(2)用易于计算的
Figure BDA0001781927450000053
Figure BDA0001781927450000054
代替难以求解的分布p(x),q(x),并有
Figure BDA0001781927450000055
Figure BDA0001781927450000056
Zp,Zq为标准化项(常数),使得
Figure BDA0001781927450000057
等比例变化为一个概率分布。即有
Figure BDA0001781927450000058
对于上述的积分式变为
Figure BDA0001781927450000059
通过求
Figure BDA0001781927450000061
倒数表达式求上述积分式。假设很方便从
Figure BDA0001781927450000062
进行采样,即有
Figure BDA0001781927450000063
这里采样点表示为m。最终上述问题成为
Figure BDA0001781927450000064
其中
Figure BDA0001781927450000065
至此获得便是基于音频信号频谱概率密度函数的的重采样模型。
所述重采样结果对比即用不用的重采样算法对同一段音频信号进行采样处理所获得的采样序列进行量的对比,以重采样序列恢复出的原始音频信号的失真率与重采样序列大小作为检验指标,验证本算法所得到的重采样音频信号具有更好的有效性。
上面结合附图对本发明的具体实施方式作了详细说明,但本发明并不限于上述实施方式,在本领域科技研究人员所具备的知识范围内,不脱离或背离本发明宗旨的前提下可以应用于其他相关领域,如音频特征提取、音频信号信息传输、音频识别等。

Claims (3)

1.一种基于信号频率概率密度函数分布的去噪音频采样算法,所述音频采样算法步骤具体如下:
(1)音频信号采集:采集音频信号,获得音频样本;
(2)音频信号的去噪处理:将上述获取的音频样本送入卡尔曼滤波器模型中,获得去噪并带有前向预测的音频信号;
(3)音频信号的时频变换:将处理好的音频信号进行傅里叶变换以获得音频信号的频谱函数;
(4)重采样模型搭建:依据音频信号的频谱的概率密度函数搭建重采样模型;
所述重采样模型搭建包括以下步骤:
重采样模型搭建中使用重要性采样实现重采样,即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分为:
E[f(x)]=∫f(x)p(x)dx
音频信号频谱函数的概率密度函数p(x)难以求解,这里用易抽样的分布q(x)代替,并令
Figure FDA0003737633280000011
即有
E[f(x)]=∫f(x)w(x)q(x)dx
w(x)为采样权重,音频信号的采样是离散的,先针对q(x)分布采N个样本点,然后根据样本点对应的w(x)权重进行重采样,即
Figure FDA0003737633280000012
用易于计算的
Figure FDA0003737633280000013
Figure FDA0003737633280000014
代替难以求解的分布p(x),q(x),并有
Figure FDA0003737633280000015
Figure FDA0003737633280000016
Zp,Zq为标准化项,使得
Figure FDA0003737633280000021
Figure FDA0003737633280000022
等比例变化为一个概率分布,即有
Figure FDA0003737633280000023
音频信号频谱函数f(x)在概率密度分布p(x)上的积分变为
Figure FDA0003737633280000024
通过求
Figure FDA0003737633280000025
倒数表达式求上述积分式,假设很方便从
Figure FDA0003737633280000026
进行采样,即有
Figure FDA0003737633280000027
其中xi~q
这里采样点表示为m,最终上述问题成为
Figure FDA0003737633280000028
其中
Figure FDA0003737633280000029
至此获得的便是基于音频信号频谱概率密度函数的重采样模型;
(4)重采样结果对比:用不同的采样算法对同一音频信号进行重采样,根据重采样序列大小、信号复原失真度指标进行对比。
2.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法,其特征在于:所述音频采集是通过音频采集装置进行采样,音频采集器对音频信号采集时设置好采样频率、采样声道数和量化精度,采样环境为带噪环境。
3.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法,其特征在于:所述重采样结果对比即采用不用的重采样算法对同一段音频信号进行重采样处理,根据对重采样信号复原原始信号失真率和重采样序列大小进行对比,检验本算法所获得重采样信号的有效性。
CN201810996355.9A 2018-08-29 2018-08-29 一种基于信号频率概率密度函数分布的去噪音频采样算法 Active CN109102818B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810996355.9A CN109102818B (zh) 2018-08-29 2018-08-29 一种基于信号频率概率密度函数分布的去噪音频采样算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810996355.9A CN109102818B (zh) 2018-08-29 2018-08-29 一种基于信号频率概率密度函数分布的去噪音频采样算法

Publications (2)

Publication Number Publication Date
CN109102818A CN109102818A (zh) 2018-12-28
CN109102818B true CN109102818B (zh) 2022-10-21

Family

ID=64864066

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810996355.9A Active CN109102818B (zh) 2018-08-29 2018-08-29 一种基于信号频率概率密度函数分布的去噪音频采样算法

Country Status (1)

Country Link
CN (1) CN109102818B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113314144A (zh) * 2021-05-19 2021-08-27 中国南方电网有限责任公司超高压输电公司广州局 声音识别及电力设备故障预警方法、系统、终端及介质
CN113688027B (zh) * 2021-10-26 2022-02-22 深圳市永达电子信息股份有限公司 工控设备的检测数据处理方法和系统
CN115798502B (zh) * 2023-01-29 2023-04-25 深圳市深羽电子科技有限公司 一种用于蓝牙耳机的音频去噪方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104715146A (zh) * 2015-03-04 2015-06-17 西安邮电大学 一种水声信号的粒子滤波降噪方法
CN106338651A (zh) * 2016-08-31 2017-01-18 长沙理工大学 应用于电力系统低频振荡模式识别的粒子滤波分析方法
CN107102295A (zh) * 2017-04-13 2017-08-29 杭州电子科技大学 基于glmb滤波的多传感器tdoa无源定位方法
CN108877826A (zh) * 2018-08-29 2018-11-23 昆明理工大学 一种基于多窗谱的语音减噪方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201619724D0 (en) * 2016-11-22 2017-01-04 Microsoft Technology Licensing Llc Trained data input system
US20190385628A1 (en) * 2017-02-28 2019-12-19 The University Of Electro-Communications Voice conversion / voice identity conversion device, voice conversion / voice identity conversion method and program

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104715146A (zh) * 2015-03-04 2015-06-17 西安邮电大学 一种水声信号的粒子滤波降噪方法
CN106338651A (zh) * 2016-08-31 2017-01-18 长沙理工大学 应用于电力系统低频振荡模式识别的粒子滤波分析方法
CN107102295A (zh) * 2017-04-13 2017-08-29 杭州电子科技大学 基于glmb滤波的多传感器tdoa无源定位方法
CN108877826A (zh) * 2018-08-29 2018-11-23 昆明理工大学 一种基于多窗谱的语音减噪方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
Improved Dual Tone Multi Frequency identification Using Adaptive Resampling Particle Filter;Nattapol Aunsri;《2018 21st International Symposium on Wireless Personal Multimedia Communications (WPMC)》;20190513;全文 *
Nonlinear Acoustic Echo Cancellation Using Elitist Resampling Particle Filter;Mhd Modar Halimeh,等;《2018 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)》;20180913;全文 *
Particle Filter Enhancement of Speech Spectral Amplitudes;Brady N. M. Laska,等;《IEEE Transactions on Audio, Speech, and Language Processing》;20100205;全文 *
基于粒子滤波技术的电机信号降噪方法;原菊梅;《火力与指挥控制》;20160115;全文 *
基于非均匀采样的信号频谱检测和参数估计方法研究;杨鹏;《中国优秀硕士学位论文全文数据库》;20160115;全文 *

Also Published As

Publication number Publication date
CN109102818A (zh) 2018-12-28

Similar Documents

Publication Publication Date Title
CN107305774B (zh) 语音检测方法和装置
CN109102818B (zh) 一种基于信号频率概率密度函数分布的去噪音频采样算法
TWI480855B (zh) 聲音訊號之特徵指紋擷取與匹配
CN108335694B (zh) 远场环境噪声处理方法、装置、设备和存储介质
CN107392123B (zh) 一种基于相参积累消噪的射频指纹特征提取和识别方法
CN108594161B (zh) 一种电能表内异物声音信号降噪方法、系统
CN110647656B (zh) 一种利用变换域稀疏化和压缩降维的音频检索方法
CN106328151A (zh) 一种环噪消除系统及其应用方法
CN103594093A (zh) 基于信噪比软掩蔽语音增强方法
CN108198558B (zh) 一种基于csi数据的语音识别方法
CN110767248B (zh) 一种抗变调干扰的音频指纹提取方法
CN107592600B (zh) 一种基于分布式麦克风的拾音筛选方法及拾音装置
CN114234061A (zh) 一种基于神经网络的带压运行供水管道漏水音智能判别方法
CN106656201B (zh) 一种基于采样数据幅频特性的压缩方法
CN107993666B (zh) 语音识别方法、装置、计算机设备及可读存储介质
CN111524531A (zh) 一种用于对高音质的双通道视频语音的实时降噪的方法
CN101533642B (zh) 一种语音信号处理方法及装置
CN110909827A (zh) 一种适用于风机叶片声音信号的降噪方法
CN107919136B (zh) 一种基于高斯混合模型的数字语音采样频率估计方法
CN112116917B (zh) 基于相位跃变度的电抗器本体与风机声信号分离方法
CN105513587B (zh) 一种mfcc提取方法及装置
CN113948088A (zh) 基于波形模拟的语音识别方法及装置
CN108877816B (zh) 基于qmdct系数的aac音频重压缩检测方法
CN117253501B (zh) 基于voip呼叫的安防音视频数据增强方法及系统
CN117037834B (zh) 一种会议语音数据智能采集方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant