CN109102818A - 一种基于信号频率概率密度函数分布的去噪音频采样算法 - Google Patents
一种基于信号频率概率密度函数分布的去噪音频采样算法 Download PDFInfo
- Publication number
- CN109102818A CN109102818A CN201810996355.9A CN201810996355A CN109102818A CN 109102818 A CN109102818 A CN 109102818A CN 201810996355 A CN201810996355 A CN 201810996355A CN 109102818 A CN109102818 A CN 109102818A
- Authority
- CN
- China
- Prior art keywords
- audio signal
- resampling
- audio
- sample
- probability density
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 claims abstract description 77
- 238000012952 Resampling Methods 0.000 claims abstract description 44
- 238000005070 sampling Methods 0.000 claims abstract description 29
- 238000001228 spectrum Methods 0.000 claims abstract description 24
- 238000000034 method Methods 0.000 claims abstract description 10
- 230000009466 transformation Effects 0.000 claims abstract description 8
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 230000010354 integration Effects 0.000 claims description 5
- 230000000052 comparative effect Effects 0.000 claims description 4
- 238000011084 recovery Methods 0.000 claims 1
- 230000003595 spectral effect Effects 0.000 claims 1
- 238000012545 processing Methods 0.000 abstract description 16
- 238000001914 filtration Methods 0.000 abstract 1
- 230000005540 biological transmission Effects 0.000 description 4
- 238000000605 extraction Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明涉及一种基于信号频率概率密度函数的去噪音频重采样算法,属于音频信号处理技术领域。本发明利用卡尔曼滤波器优良的去噪能力和前向预测功能对采集的音频信号进行处理以获得带有短时预测功能的去噪音频。对处理后的音频信号进行傅里叶变换获得音频信号的频谱函数,在概率密度函数p(f)的控制条件下对音频信号进行重采样。本发明减少了冗余采样点。卡尔曼滤波处理采对集到的音频信号进行滤波处理得到的重采样数据相对其他算法处理结果更为平滑,复原出的音频信号质量更高,提高了音频信号处理的实时性。本算法理论简单,编程也易于实现,实际工程应用也具有强大的稳定性和鲁棒性。
Description
技术领域
本发明涉及一种基于信号频率概率密度函数分布的去噪音频采样算法,属于音频特征信号处理技术领域。
背景技术
目前对于音频信号的采样大多使用均匀采样,所设置的采样频率过低,信息传输后所复原出的信号有很大程度的失真,若设置的采样频率高来满足精度要求,但大量的数据处理对信息处理系统又造成了极大的挑战,很难选择一个折中恰当的采样频率满足无失真采样并能剔除多余的冗余信息。本发明提出的重采样算法首先是利用卡尔曼滤波器对信号进行去噪处理以获得具有一定短时预测功能的去噪信号,然后对处理后信号进行傅里叶变换获得音频信号的频谱函数,最后基于频谱的概率密度函数对信号进行重采样以获得最优采样序列,剔除不必要的冗余采样数据,从而提高整个系统的数据处理速率和实时性。
发明内容
本发明是利用卡尔曼滤波器优良的去噪能力和短时预测功能,对采集到的音频数据进行处理以获得具有短时预测的去噪信号,其目的是提高音频信息系统的实时性。对处理后的音频信号进行傅里叶变换获得其频谱函数,然后利用音频信号频谱的概率密度函数作为重采样的控制量进行重采样,剔除了原始采样序中的噪声和冗余数据量,使得后续所提取的音频特征更能表征原始音频信号,提高整个系统的实时处理能力。本算理论也相对简单,编程易于实现,大部分编程软件中也有相应的卡尔曼滤波器的包函数为仿真等研究提高极大便利,本算法针对当今的大数据音频信号处理更具有明显的实时、高效优势。其算法可用于音频特征提取、音频信号信息传输、音频识别等领域。
本发明的技术方案如是:一种基于信号频率概率密度函数分布的去噪音频采样算法。该方法具体包括以下步骤:
(1)音频信号采集:采集音频信号,获得音频样本。
(2)音频信号的去噪处理:将上述获取的音频样本送入搭建好的卡尔曼滤波器模型中,获得去噪并带有前向预测的音频信号。
(3)音频信号的时频变换:将处理好的音频信号进行傅里叶变换以获得频谱函数。
(4)重采样模型搭建:依据音频信号频谱的概率密度函数搭建重采样模型。
(5)重采样结果对比:用不同的采样算法对同一音频信号进行采样,根据采样信号复原出的原始音频信号失真率与采用序列大小作为指标进行对标检验。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(1)所述音频采集是通过音频采集装置采集音频样本,音频采集器对音频信号采集时设置好采样频率(采样频率满足奈奎斯特采样定理)、采样声道数、量化精度,采样环境为带噪环境。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(2)中音频信号的去噪处理在卡尔曼滤波器强大的去噪能力以及前向预测功能的基础上做进一步扩展,对音频信号去噪的同时进行的音频信号短时前向预测。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(3)音频信号的时频变换是将经过卡尔曼滤波器处理后的去噪信号进行傅里叶变换,获得音频信号的频谱函数以供后续基于频谱概率密度函数实现重采样。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(4)重采样模型搭建包括以下步骤:
(1)重采样模型搭建中使用重要性采样实现重采样,即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分,即
E[f(x)]=∫f(x)p(x)dx (1)
音频信号频谱函数的概率密度函数p(x)难以求解,这里用易抽样的分布q(x)代替,并令即有
E[f(x)]=∫f(x)w(x)q(x)dx (2)
w(x)为采样权重。音频信号的采样是离散的,先针对q(x)分布采N个样本点,然后根据样本点对应的w(x)权重进行重采样,即
(2)用易于计算的和代替难以求解的分布p(x),q(x),并有
Zp,Zq为标准化项(常数),使得等比例变化为一个概率分布。即有对于上述的积分式变为
通过求倒数表达式求上述积分式。假设很方便从进行采样,即有
这里采样点表示为m。最终上述问题成为
其中至此获得了基于音频信号频谱概率密度函数的的重采样模型。
上述的一种基于信号频率概率密度函数分布的去噪音频采样算法,步骤(5)采样序列对比即利用不用的采样算法对同一段音频信号进行重采样根据复原音频信号的失真率和采样序列大小作为指标比较,检验本算法重采样序列的有效性。
本发明与现有的采样算法相比其优点有:
(1)本发明用卡尔曼滤波器对采集音频信号处理,不仅可以去噪,重点是卡尔曼滤波器具有短时预测能力,可以提高整个系统的数据处理实时性。
(2)传统的音频信号采样是采用均匀采样或是基于频率的自适应采样,本发明是基于频谱的概率密度函数进行控制采样,极大的剔除了冗余采样点,更便于后续的音频特征提取和音频信号传输。
(3)本发明针对大数据音频信号表现更强的优势,即音频数据量越大,剔除的冗余数据量越多,在信息处理方面表现更强的鲁棒性,满足当前大数据信息发展的趋势需求。
附图说明
图1本发明基于信号频率概率密度函数分布的去噪音频采样算法流程图。
具体实施方式
下面结合附图和实施例对本发明进一步说明。
如图1所示:一种基于信号频率概率密度函数分布的去噪音频采样算法。所述方法的具体步骤如下:
(1)音频信号采集:音频信号采集,获得音频样本。
(2)卡尔曼滤波器的模型搭建与音频处理:因为音频信号易受外界干扰存在过程噪声,而测量时候由于各方面因素又存在测量噪声,故利用卡尔曼滤波器进行去噪处理,由于音频信号处理要求实时性,故利用其卡尔曼滤波器的前向预测功能可以提高后续音频信号处理的实时性,进而以获得去噪并带有一定前向预测的音频信号。
(3)音频信号的时频变换:将处理好的音频信号进行傅里叶变换以获得音频信号的频谱函数用于后续信号处理使用。
(4)重要性采样模型搭建:依据音频频谱的概率密度函数搭建重采样模型,其中分为代替概率密度函数易求解和不易求解进行讨论。
(5)采样序列对比:用不同的采样算法对同一音频信号进行采样并且复原原始音频信号,对比其采用序列大小、复原信号失真度等。
所述音频采集是通过麦克风收录样音频信号,设置的采样频率为44.1KHz,采样模式为单声道语音信号采集,量化级为16bit,因本发明研究的是对音频信号的去噪以及重采样故采样环境为带噪环境。
所述音频信号的去噪处理在卡尔曼滤波器强大的去噪能力以及前向预测功能的基础上做进一步扩展,对音频信号去噪的同时进行的音频信号短时前向预测。
所述音频信号的时频变换是将经过卡尔曼滤波器处理后的去噪数字信号进行傅里叶变换,获得频域信号以供后续基于音频频谱的概率密度函数实现重采样。
所述重采样模型搭建包括以下步骤:
(1)重采样模型搭建中使用重要性采样实现重采样,即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分,即
E[f(x)]=∫f(x)p(x)dx (1)
音频信号频谱函数的概率密度函数p(x)难以求解,这里用易抽样的分布q(x)代替,并令即有
E[f(x)]=∫f(x)w(x)q(x)dx (2)
w(x)为采样权重。音频信号的采样是离散的,先针对q(x)分布采N个样本点,然后根据样本点对应的w(x)权重进行重采样,即
(2)用易于计算的和代替难以求解的分布p(x),q(x),并有
Zp,Zq为标准化项(常数),使得等比例变化为一个概率分布。即有对于上述的积分式变为
通过求倒数表达式求上述积分式。假设很方便从进行采样,即有
这里采样点表示为m。最终上述问题成为
其中至此获得便是基于音频信号频谱概率密度函数的的重采样模型。
所述重采样结果对比即用不用的重采样算法对同一段音频信号进行采样处理所获得的采样序列进行量的对比,以重采样序列恢复出的原始音频信号的失真率与重采样序列大小作为检验指标,验证本算法所得到的重采样音频信号具有更好的有效性。
上面结合附图对本发明的具体实施方式作了详细说明,但本发明并不限于上述实施方式,在本领域科技研究人员所具备的知识范围内,不脱离或背离本发明宗旨的前提下可以应用于其他相关领域,如音频特征提取、音频信号信息传输、音频识别等。
Claims (4)
1.一种基于信号频率概率密度函数分布的去噪音频采样算法,所述音频采样算法步骤具体如下:
(1)音频信号采集:采集音频信号,获得音频样本;
(2)音频信号的去噪处理:将上述获取的音频样本送入卡尔曼滤波器模型中,获得去噪并带有前向预测的音频信号;
(3)音频信号的时频变换:将处理好的音频信号进行傅里叶变换以获得音频信号的频谱函数;
(4)重采样模型搭建:依据音频信号的频谱的概率密度函数搭建重采样模型;
(5)重采样结果对比:用不同的采样算法对同一音频信号进行重采样,根据重采样序列大小、信号复原失真度指标进行对比。
2.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法,其特征在于:所述音频采集是通过音频采集装置进行采样,音频采集器对音频信号采集时设置好采样频率、采样声道数和量化精度,采样环境为带噪环境。
3.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法,其特征在于:所述重采样模型搭建包括以下步骤:
(1)重采样模型搭建中使用重要性采样实现重采样,即计算音频信号频谱函数f(x)在概率密度分布p(x)上的积分为:
E[f(x)]=∫f(x)p(x)dx
音频信号频谱函数的概率密度函数p(x)难以求解,这里用易抽样的分布q(x)代替,并令即有
E[f(x)]=∫f(x)w(x)q(x)dx
w(x)为采样权重,音频信号的采样是离散的,先针对q(x)分布采N个样本点,然后根据样本点对应的w(x)权重进行重采样,即
(2)用易于计算的和代替难以求解的分布p(x),q(x),并有
Zp,Zq为标准化项,使得等比例变化为一个概率分布,即有音频信号频谱函数f(x)在概率密度分布p(x)上的积分变为
通过求倒数表达式求上述积分式,假设很方便从进行采样,即有
其中xi~q
这里采样点表示为m,最终上述问题成为
其中至此获得的便是基于音频信号频谱概率密度函数的的重采样模型。
4.根据权利要求1所述的基于信号频率概率密度函数分布的去噪音频采样算法,其特征在于:所述重采样结果对比即采用不用的重采样算法对同一段音频信号进行重采样处理,根据对重采样信号复原原始信号失真率和重采样序列大小进行对比,检验本算法所获得重采样信号的有效性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810996355.9A CN109102818B (zh) | 2018-08-29 | 2018-08-29 | 一种基于信号频率概率密度函数分布的去噪音频采样算法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810996355.9A CN109102818B (zh) | 2018-08-29 | 2018-08-29 | 一种基于信号频率概率密度函数分布的去噪音频采样算法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109102818A true CN109102818A (zh) | 2018-12-28 |
CN109102818B CN109102818B (zh) | 2022-10-21 |
Family
ID=64864066
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810996355.9A Active CN109102818B (zh) | 2018-08-29 | 2018-08-29 | 一种基于信号频率概率密度函数分布的去噪音频采样算法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109102818B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113314144A (zh) * | 2021-05-19 | 2021-08-27 | 中国南方电网有限责任公司超高压输电公司广州局 | 声音识别及电力设备故障预警方法、系统、终端及介质 |
CN113688027A (zh) * | 2021-10-26 | 2021-11-23 | 深圳市永达电子信息股份有限公司 | 工控设备的检测数据处理方法和系统 |
CN115798502A (zh) * | 2023-01-29 | 2023-03-14 | 深圳市深羽电子科技有限公司 | 一种用于蓝牙耳机的音频去噪方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715146A (zh) * | 2015-03-04 | 2015-06-17 | 西安邮电大学 | 一种水声信号的粒子滤波降噪方法 |
CN106338651A (zh) * | 2016-08-31 | 2017-01-18 | 长沙理工大学 | 应用于电力系统低频振荡模式识别的粒子滤波分析方法 |
CN107102295A (zh) * | 2017-04-13 | 2017-08-29 | 杭州电子科技大学 | 基于glmb滤波的多传感器tdoa无源定位方法 |
US20180143965A1 (en) * | 2016-11-22 | 2018-05-24 | Microsoft Technology Licensing, Llc | Trained data input system |
CN108877826A (zh) * | 2018-08-29 | 2018-11-23 | 昆明理工大学 | 一种基于多窗谱的语音减噪方法 |
US20190385628A1 (en) * | 2017-02-28 | 2019-12-19 | The University Of Electro-Communications | Voice conversion / voice identity conversion device, voice conversion / voice identity conversion method and program |
-
2018
- 2018-08-29 CN CN201810996355.9A patent/CN109102818B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104715146A (zh) * | 2015-03-04 | 2015-06-17 | 西安邮电大学 | 一种水声信号的粒子滤波降噪方法 |
CN106338651A (zh) * | 2016-08-31 | 2017-01-18 | 长沙理工大学 | 应用于电力系统低频振荡模式识别的粒子滤波分析方法 |
US20180143965A1 (en) * | 2016-11-22 | 2018-05-24 | Microsoft Technology Licensing, Llc | Trained data input system |
US20190385628A1 (en) * | 2017-02-28 | 2019-12-19 | The University Of Electro-Communications | Voice conversion / voice identity conversion device, voice conversion / voice identity conversion method and program |
CN107102295A (zh) * | 2017-04-13 | 2017-08-29 | 杭州电子科技大学 | 基于glmb滤波的多传感器tdoa无源定位方法 |
CN108877826A (zh) * | 2018-08-29 | 2018-11-23 | 昆明理工大学 | 一种基于多窗谱的语音减噪方法 |
Non-Patent Citations (5)
Title |
---|
BRADY N. M. LASKA,等: "Particle Filter Enhancement of Speech Spectral Amplitudes", 《IEEE TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING》 * |
MHD MODAR HALIMEH,等: "Nonlinear Acoustic Echo Cancellation Using Elitist Resampling Particle Filter", 《2018 IEEE INTERNATIONAL CONFERENCE ON ACOUSTICS, SPEECH AND SIGNAL PROCESSING (ICASSP)》 * |
NATTAPOL AUNSRI: "Improved Dual Tone Multi Frequency identification Using Adaptive Resampling Particle Filter", 《2018 21ST INTERNATIONAL SYMPOSIUM ON WIRELESS PERSONAL MULTIMEDIA COMMUNICATIONS (WPMC)》 * |
原菊梅: "基于粒子滤波技术的电机信号降噪方法", 《火力与指挥控制》 * |
杨鹏: "基于非均匀采样的信号频谱检测和参数估计方法研究", 《中国优秀硕士学位论文全文数据库》 * |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113314144A (zh) * | 2021-05-19 | 2021-08-27 | 中国南方电网有限责任公司超高压输电公司广州局 | 声音识别及电力设备故障预警方法、系统、终端及介质 |
CN113688027A (zh) * | 2021-10-26 | 2021-11-23 | 深圳市永达电子信息股份有限公司 | 工控设备的检测数据处理方法和系统 |
CN113688027B (zh) * | 2021-10-26 | 2022-02-22 | 深圳市永达电子信息股份有限公司 | 工控设备的检测数据处理方法和系统 |
CN115798502A (zh) * | 2023-01-29 | 2023-03-14 | 深圳市深羽电子科技有限公司 | 一种用于蓝牙耳机的音频去噪方法 |
CN115798502B (zh) * | 2023-01-29 | 2023-04-25 | 深圳市深羽电子科技有限公司 | 一种用于蓝牙耳机的音频去噪方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109102818B (zh) | 2022-10-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110322891B (zh) | 一种语音信号的处理方法、装置、终端及存储介质 | |
CN109102818A (zh) | 一种基于信号频率概率密度函数分布的去噪音频采样算法 | |
CN111540347A (zh) | 基于音频的电缆隧道监测方法及系统 | |
CN103514884A (zh) | 通话音降噪方法及终端 | |
JP2007065659A5 (zh) | ||
CN105206270A (zh) | 一种组合pca和rbm的孤立数字语音识别分类系统及方法 | |
CN103730112A (zh) | 语音多信道模拟与采集方法 | |
CN102646415B (zh) | 一种语音识别中的特征参数提取方法 | |
CN110767248B (zh) | 一种抗变调干扰的音频指纹提取方法 | |
CN101594527B (zh) | 从音频视频流中高精度检测模板的两阶段方法 | |
CN105304091B (zh) | 一种基于dct的语音篡改恢复方法 | |
CN103297590A (zh) | 一种基于音频实现设备解锁的方法和系统 | |
CN108564967B (zh) | 面向哭声检测系统的Mel能量声纹特征提取方法 | |
CN112420079B (zh) | 语音端点检测方法和装置、存储介质及电子设备 | |
CN114234061A (zh) | 一种基于神经网络的带压运行供水管道漏水音智能判别方法 | |
CN101533642B (zh) | 一种语音信号处理方法及装置 | |
CN115101076B (zh) | 一种基于多尺度通道分离卷积特征提取的说话人聚类方法 | |
CN101814289A (zh) | 低码率dra数字音频多声道编码方法及其系统 | |
CN114613391A (zh) | 一种基于半带滤波器的鼾声识别方法及装置 | |
CN111292748B (zh) | 一种可适应多种频率的语音录入系统 | |
CN115329893A (zh) | 基于配对特征融合的声学场景分类方法 | |
CN107993666A (zh) | 语音识别方法、装置、计算机设备及可读存储介质 | |
CN112309404B (zh) | 机器语音的鉴别方法、装置、设备及存储介质 | |
CN112233693B (zh) | 一种音质评估方法、装置和设备 | |
CN111477248B (zh) | 一种音频噪声检测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |